反复使用 AI 生成的内容来训练 AI - 来自Aubrey的数说

2024-09-05

反复使用 AI 生成的内容来训练 AI 可造成“模型崩溃” 当地时间 9 月 4 日，据《福布斯》报道，牛津大学的伊利亚・舒梅洛夫博士和他的团队发现，当生成式 AI 软件仅依赖于由 AI 生成的内容时，回答的质量开始恶化。这项研究已经发表在《自然 (https://www.nature.com/articles/s41586-024-07566-y)》杂志上。在最初的两次查询后，答案逐渐偏离准确性，到第五次时，质量显著下降，到了第九次连续查询时，回答已完全退化为无意义的胡言乱语。研究人员将这种生成式 AI 内容的循环过度使用称为“模型崩溃”，即 AI 在不断污染自己的训练集后，输出的内容逐渐偏离现实，最终变得毫无价值。根据亚马逊网络服务（Amazon Web Services）团队在 6 月发布的另一项研究，大约 57% 的网络文本都经过了 AI 算法的翻译。如果互联网上的人类生成数据迅速被 AI 过滤内容覆盖，且舒梅洛夫的研究发现属实，那么 AI 可能正在“自我毁灭”—— 并同时“毁灭”互联网。研究得出结论，要实现 AI 的长期可持续发展，唯一方法是确保其能够访问现有的非 AI 生成内容，并持续引入新的人工生成内容。来源 1 (https://www.ithome.com/0/793/528.htm)，2 (https://www.nature.com/articles/s41586-024-07566-y)

165

热门数说

评论