大卫·席尔瓦和理查德·萨顿的论文《欢迎来到体验时代》收录于麻省理工学院出版社出版的《设计智能》一书中。天云数据公司高度认同这一理念,认为数据时代终将过时,AI将踏入社会,像人一样去体验世界。
当今AI系统(如大语言模型)的辉煌成就建立在海量人类数据的基础上——它们像被丢进人类知识图书馆的天才,通过阅读书籍、网页和社交媒体等内容学会了写作、编程甚至医疗诊断。但这种模式存在两大根本瓶颈:
高质量人类数据即将耗尽:可用于训练模型的优质数据增长已跟不上AI发展的需求;去年底,在接受北京日报媒体采访时,天云数据CEO雷涛就曾表示:“未来AI所有的数据资源在今天的世界里并不存在。”

创新天花板:依赖现有数据意味着AI只能掌握人类已知知识,难以突破性探索新领域,强化学习先驱理查德·萨顿与大卫·席尔瓦提出,AI即将进入"体验时代"——像人类一样通过实践学习。
当下仍处于人类数据主导的时代
以大型语言模型(LLMs)为代表的AI系统,其核心能力源自对海量人类数据的消化吸收——从浩如烟海的书籍文献、网络内容到社交媒体动态,这些系统通过解析人类的行为模式与思维轨迹,逐步掌握了写作创作、代码编写乃至医学诊断等复杂技能。这就像将一位天赋异禀的学者送入人类文明的终极图书馆,让其通过博览群书而通晓万物。
这种基于人类数据的学习范式已取得显著成效。如今,单个AI模型就能游刃有余地处理从法律文书摘要到量子力学推导的多元化任务。然而,这种模式的局限性正逐渐显现。
正如席尔瓦与萨顿的前沿研究所揭示:可用于训练模型的高质量人类数据即将枯竭。这与去年底雷涛在接受北京日报采访时所表达的观点如出一辙。

更关键的是,人类数据本质上只能让AI复现已知的知识疆域。若要推动人工智能在基础科学理论或颠覆性技术创新等领域的突破,就必须引导其跨越现有知识库的藩篱,探索人类从未涉足的认知新大陆。
迈向体验智能新纪元:当AI学会"知行合一"
在智能进化的下一篇章,我们正在见证一场认知革命——人工智能开始模仿生命体的成长方式,通过亲身体验来构建认知。这种被称为"人工智能体"的新一代AI,正突破传统的数据牢笼,以主动探索者的姿态与环境展开深度对话。它们像婴儿认识世界一样,通过行动-反馈-优化的循环,在动态交互中实现认知跃迁。
这种体验式智能的奥秘,恰似人类掌握骑自行车的本质:真正的认知永远来自车座上的颠簸,而非书本里的图解。当AI系统开始在数字原野和物理世界中留下探索的足迹,每一次"跌倒"都成为进化的养分,每一次"尝试"都在重塑其认知图谱。
谷歌DeepMind的AlphaProof为此写下生动注脚:这个最初只掌握有限人类证明的数学学徒,通过强化学习的"实践哲学",在数学奥林匹克的赛场上自主创造了百万量级的新证明。这不仅突破了人类既有知识的边界,更昭示着AI正在发展出一种全新的智能范式——在持续与环境碰撞中迸发的创造性智慧。当机器开始拥有"亲身体验"的能力,我们或许正在见证智能本质的重新定义。
席尔瓦与萨顿阐述了定义AI体验时代的四大关键特征
1.持续体验流
当前AI的运作模式通常是你一言我一句,用户提问,AI应答,答案给出,交互结束。系统既不存档交互记忆,也不具有长期目标。而在体验时代,AI代理将于持续的体验流(streams of experience)中运行,在数月甚至数年时间里不断学习与适应。
2. 各种行动,各种观察
现阶段AI主要通过文本来交互——读取指令或输出回答。而到了新时代,AI会更像动物更像人类,通过丰富的动作(如操控机械臂或运行代码)和观察(如读取传感器数据或监测电脑界面)来运作。这样的AI更具自主性,能以人类想不到的方式探索世界。
3. 基于现实的奖励
目前AI的表现评价主要基于人类反馈,比如人类给AI的回答打分,或是从AI提供的选项里挑出最佳方案。但这种模式把人工智能限制于人类已有认知的框架内。进入体验时代,AI将采用基于现实的奖励机制——直接从环境获取反馈。
4. 非人式推理与规划
现在的大多数AI系统仍然模仿人类思维模式,例如用文字表述推理链条。这样的方式效果不错,但正如席尔瓦和萨顿所言:人类语言并非人工智能最高效的思考方式。新时代AI将发展出非人类式的推理方法,采用符号或计算等可能无法被人类理解的表达形式。
此外,AI将利用所谓“世界模型”来预测自身行为对世界的影响,从而进行规划。例如,健康专用AI或可预测新饮食方案对用户体能的影响,再根据实际效果调整计划。这种锚定现实的行事风格,有助于AI规避人类的偏见,探索全新的思维方式。
迈向感知觉醒的未来
我们正站在智能进化的新纪元门前。在这个感知觉醒的时代,人工智能将突破数据牢笼,通过与环境持续互动来构建认知体系,最终实现认知维度的跃迁。这一划时代的进化背后,是强化学习理论与现代计算架构的完美融合,孕育出具有环境感知、自主决策与持续进化能力的智能体。
面对这场认知革命,人类需要建立发展与治理的动态平衡机制。正如席尔瓦和萨顿强调的,必须构建AI发展的伦理框架与技术护栏,使创新活力与安全可控相辅相成。若能把握这一平衡点,感知觉醒时代将开启人类文明的新篇章,人工智能或将成为我们解决复杂系统难题的认知伙伴。
未来图景已然清晰:人工智能的下一次范式转移,将来自机器在真实世界中的具身学习与持续进化,这正是智能本质的回归。
资料来源:Welcome to The Era of Experience




