您的当前位置:首页 > 综合 > 用AI數據訓練AI效果怎樣?國際最新研究稱可能最終導致崩潰 這個概念稱為「模型崩潰」 正文
时间:2024-11-24 13:13:32 来源:网络整理 编辑:综合
國際學術期刊《自然》最新發表一篇計算機科學論文指出,用人工智能(AI)生成的數據集訓練未來幾代機器學習模型可能會污染它們的輸出,這個概念稱為「模型崩潰」。該研究顯示,原始內容會在AI數代內變成不相關的
國際學術期刊《自然》最新發表一篇計算機科學論文指出,用A研究用人工智能(AI)生成的據訓數據集訓練未來幾代機器學習模型可能會污染它們的輸出,這個概念稱為「模型崩潰」。果樣國際
該研究顯示,最新終導致崩原始內容會在AI數代內變成不相關的用A研究胡言亂語,顯示出使用可靠數據訓練AI模型的據訓重要性。
生成式AI工具越來越受歡迎,果樣國際如大語言模型等,最新終導致崩這類工具主要用人類生成的用A研究輸入進行訓練。不過,據訓隨着這些AI模型在互聯網不斷壯大,果樣國際計算機生成內容可能會以遞歸循環的最新終導致崩形式被用於訓練其他AI模型或其自身。
論文第一作者兼共同通訊作者、用A研究英國牛津大學Ilia Shumailov和同事及合作者一起,據訓用數學模型演示了AI模型可能會如何出現模型崩潰。果樣國際他們證明了一個AI可能會忽略訓練數據中的某些輸出(如不太常見的文本),導致其只用一部分數據集來自我訓練。
隨後,論文作者還研究了AI模型會如何應對主要用人工智能生成的訓練數據集。他們發現,給模型輸入AI生成的數據會減弱今後幾代模型的學習能力,最終導致模型崩潰。他們測試的幾乎所有遞歸訓練語言模型都容易出現重複短語。比如,一個用中世紀建築文本作為原始輸入的測試到第九代的輸出已經是一串野兔的名字。
論文作者指出,為了讓人工智能成功使用其自身輸出進行訓練,本次研究認為用AI生成數據訓練一個模型並非不可能,但必須對數據進行嚴格過濾。與此同時,依賴人類生成內容的科技公司或許能比競爭對手訓練出更高效的AI模型。
(來源:中國新聞網)
責任編輯: 宋得書兼顾高速处理和多像素 索尼半导体发布面向工业设备的全局快门CMOS图像传感器2024-11-24 12:56
外媒大赞《GTA6》女主形象:打破GTA系列对女性偏见2024-11-24 12:54
两部作品同时入选竞争杂志封面 漫画家西修感叹高光受不起2024-11-24 12:50
《上古卷轴:城堡》手游最新宣传片 现已全球上线2024-11-24 12:24
绝味食品x腾讯智慧零售战略合作 推动餐饮零售连锁与AI大模型深度融合2024-11-24 11:59
卡塔爾稱加沙停火談判仍處於「近乎僵局」狀態2024-11-24 11:59
科技动作第一人称射击游戏《RetroBlazer》Steam页面开放 不支持中文2024-11-24 11:38
外媒又抹黑《黑神话》歧视女性:虽没法核实但就是辱女2024-11-24 11:16
企业如何利用AI技术加速数字化革新 华为云CIO领航班第二期给出答案2024-11-24 11:10
韓國陸軍部隊發生手榴彈爆炸事故 致1死1傷2024-11-24 10:42
索尼等品牌节节败退 中国品牌电视席卷日本!已占据过半份额2024-11-24 13:06
外交部:願同美方加強人工智能領域的交流合作2024-11-24 12:59
習近平向乍得當選總統穆罕默德致賀電2024-11-24 12:47
印尼伊布火山發生噴發 火山灰柱高達5000米2024-11-24 12:38
三个多月撞坏两台吉利:歌手刘乐妍获赠银河星舰72024-11-24 12:14
卡塔爾稱加沙停火談判仍處於「近乎僵局」狀態2024-11-24 11:09
伊朗新一屆專家會議成員宣誓就職2024-11-24 10:58
《幸福工厂》正式版Steam同时在线玩家峰值创新高2024-11-24 10:46
曝苹果高密度电池研发失败:iPhone 17 Air将会变厚2024-11-24 10:43
快节奏第一人称动作射击游戏《我是你的野兽》正式推出 获特别好评2024-11-24 10:33