用AI数据训练AI效果怎样?国际最新研究称可能最终导致崩溃
▓WSOP金手链▓GGPoker[—ggn178.com—]为亚洲最具备实力的一间国际扑克竞技赛事平台,提供一个正规安全有保障的扑克游戏环境,加入立即玩与GGPoker全球玩家一起同乐德国央行:德国经济春季复苏速度低于预期
本文转自:中新网
遇见你丨“好好”好!11岁滑板少女逐梦巴黎奥运
中新网北京7月27日电 (记者 孙自法)国际学术期刊《自然》最新发表一篇计算机科学论文指出%#@@%,用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出*#,这个概念称为“模型崩溃”#**#*。
该研究显示%#**%,原始内容会在AI数代内变成不相关的胡言乱语#@%#,显示出使用可靠数据训练AI模型的重要性#%@**。
生成式AI工具越来越受欢迎**#%,如大语言模型等#%,这类工具主要用人类生成的输入进行训练@%#%#。不过@@%*@,随着这些AI模型在互联网不断壮大@*@#,计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身@%。
论文第一作者兼共同通讯作者、英国牛津大学Ilia Shumailov和同事及合作者一起@#@,用数学模型演示了AI模型可能会如何出现模型崩溃#**%@。他们证明了一个AI可能会忽略训练数据中的某些输出(如不太常见的文本)@%#@,导致其只用一部分数据集来自我训练*@@*。
随后@**##,论文作者还研究了AI模型会如何应对主要用人工智能生成的训练数据集%*@#。他们发现*@***,给模型输入AI生成的数据会减弱今后几代模型的学习能力%**,最终导致模型崩溃#@。他们测试的几乎所有递归训练语言模型都容易出现重复短语#@#。比如@#*,一个用中世纪建筑文本作为原始输入的测试到第九代的输出已经是一串野兔的名字*@%#@。
论文作者指出*%*,为了让人工智能成功使用其自身输出进行训练**#*@,本次研究认为用AI生成数据训练一个模型并非不可能###*@,但必须对数据进行严格过滤%*@*#。与此同时%@,依赖人类生成内容的科技公司或许能比竞争对手训练出更高效的AI模型@@*。(完)
分享让更多人看到
热门排行
- 1“碳”路先行|山西晋中“碳”寻绿色经济发展新路径
- 2广州天河升级重点人才激励办法
- 3华裔青少年探访鲁迅故里走近课本中的“大先生”
- 4突发!日本小林制药公司会长和社长辞职
- 5突发!韩国IT巨头Kakao创始人涉嫌操纵股价被批捕
- 6【图片故事】江西杂技少年的夏日
- 7探访四川稻城镶嵌在草原上“千眼天珠”
- 8南非自然保护区部分生物死亡疑与骚乱点燃化学品仓库有关
- 9陕西柞水高速公路桥梁发生垮塌灾害各方救援持续进行
- 10外交部:中方已全面启动上合组织轮值主席国工作
- 11“渝可”“渝爱”两岁啦重庆动物园为龙凤胎大熊猫举办两周岁生日趴
- 12香港将为第十五届全运会等招募一万名义工
- 13俄罗斯学生在吉林长春“CityWalk”
- 14北京海淀警方通报“一高校在读学生举报其导师涉嫌违法”情况
- 15银行能提供哪些远程金融服务?中银协:至少有这七种
- 16中新网原创专题节目《中国风》
- 17德国央行:德国经济春季复苏速度低于预期
- 18阳江核电累计向粤港澳大湾区送电超3630亿度
- 19两项家具领域“绿色”标准发布促进家具领域转型升级
- 20南亚商品如何出口中国?专家支招