
当前,大多数关于智能体系统的研发,依然集中在“自动化”上——不仅仅是传统意义上的流程自动化或代码生成,更是向智能管理各类用户界面的方向延伸。
在编程自动化领域,Devin 实现了几乎全流程的代码生成,Cursor 提供半自动化的编程协作,Windsurf 则结合了 Copilot 辅助与自主决策;与此同时,OpenAI 的 Operators、Claude Desktop 和 Manus 等通用任务代理正在扩展对电脑和浏览器的操作能力,开源项目如 OWL 和 CRAB 则代表了协同式自动化的探索方向。
尽管当前焦点几乎都集中在自动化上,但“基于智能体的模拟”这一方向仍处于相对冷门的状态,鲜有研究者和开发者投入其中。但我们认为,模拟系统的应用场景远比想象中广泛——从营销活动建模,到疾病传播分析、用户行为预测等,都能找到模拟的用武之地。其中,基于智能体的模拟尤其有潜力催生革命性的产品,甚至重塑整个市场格局。在通向通用人工智能(AGI)的路径上,OpenAI 曾提出最终阶段(Level 5)将是由 AI 构成的“完整组织”,本质上就是一个超大规模、高保真的多智能体模拟系统。
而要实现这样的系统,模拟才是真正的关键。但目前的模拟系统仍处于早期阶段,距离真正能用于现实场景,还有较大的差距——最关键的缺口在于“真实感环境”的缺失。为此,我们推出了 🏝️ OASIS:一个开源的社会模拟环境,包含数百万基于大语言模型的智能体,旨在高度还原 Twitter、Reddit 等平台上数百万用户的真实行为。这或许是推动下一次智能体突破的关键一步。
🏝️ OASIS:支持百万智能体的社交媒体模拟环境
想象一下,你可以“观察”一百万个 Twitter 用户是如何互动、传播消息、相互影响的——而且还是在一个完全可控的环境中。这正是 OASIS 所实现的。
这些智能体可不只是“脚本机器人”那么简单。它们是由大语言模型驱动的复杂个体,能够发帖、转发内容、关注其他用户、参与讨论。每个智能体都有自己独特的“性格”、兴趣和行为模式,使得整个模拟过程不仅真实,而且富有生命力。
核心功能亮点
以下是 OASIS 的四大关键特性:
📈 高度可扩展性: OASIS 支持最多一百万个智能体的模拟运行,使研究者可以在接近真实平台规模下研究社交网络动态。
📲 动态模拟环境: 支持社交关系与内容的实时变动,真实再现如 Twitter、Reddit 等平台的动态演化过程。
👍🏼 多样化操作空间: 智能体可执行 21 种操作,包括关注、评论、转发等,为交互行为提供了丰富维度。
🔥 集成推荐系统: 内置兴趣导向和热度评分推荐算法,能够模拟社交平台中用户发现内容、互动传播的真实机制。

OASIS 的系统由五大核心模块协同运行,每一部分都对应着现实社交平台的关键机制:
🗃️ 环境服务器(Environment Server)
这是整个模拟系统的大脑与中枢。它像一个庞大的数据库,持续记录模拟世界中的一切:包括帖子内容、用户资料、关注关系、点赞评论等互动数据。可以将它理解为模拟版的“Twitter 后台”,维持着整个平台的实时状态。
🔍 推荐系统(Recommendation System)
决定每个智能体能看到哪些内容,就像现实中的社交平台那样:
在类 Twitter 平台中,它展示关注用户的动态和个性化推荐内容;
在类 Reddit 平台中,它采用类似“热度算法”,根据点赞、点踩和发布时间综合排序;
同时,它还使用基于社交媒体数据训练的 AI 模型来判断内容相似度,让推荐更加贴近用户兴趣。
🤖 智能体模块(Agent Module)
这是 AI 用户真正“居住”的地方。每个智能体都具备以下特征:
能存储过往互动和兴趣偏好;
利用大语言模型(LLM)决定下一步行为;
拥有 23 种可执行操作,包括发帖、评论、关注他人等;
并且能够“思考”自己行为背后的动机。
⚡ 高性能推理模块(Scalable Inferencer)
OASIS 需要处理海量智能体的决策与行为,这一模块的作用是:
高效管理多张 GPU;
并行处理大量智能体的动作;
动态分配算力资源,保证运行流畅。
⏳ 时间引擎(Time Engine)
现实中人不会全天在线,OASIS 也考虑了时间因素:
每个智能体有自己的“作息时间表”,决定他们在一天中的活跃时段;
所有事件按照合理顺序发生,并带有真实的时间戳,确保模拟世界的节奏自然可信。
那这些模块在实际运行中是如何协同工作的呢?
当模拟开始时,时间引擎会根据每个智能体的“作息表”唤醒对应用户。被激活的智能体首先会从推荐系统接收到内容,这些内容则来自环境服务器中存储的数据库。
接着,智能体的“大脑”(由大语言模型驱动)会根据当前的内容和历史偏好做出决策——也许是点个赞、写一条评论,或者直接发布一条新内容。这些行为会被实时记录到环境服务器中,进而影响其他智能体之后所看到的内容。
举个例子:
如果某个智能体发布了一条突发新闻——
这条帖子会被写入环境服务器;
推荐系统会基于算法为其他用户个性化推荐这条内容;
当其他用户上线后,就可能刷到这条新闻;
有些用户会转发或评论,从而形成一条“信息传播链”;
所有互动过程都会被追踪,并反过来影响之后的推荐结果。
这个循环不断推进,逐渐形成一个复杂的社交动态系统,研究者可以据此观察信息如何扩散、群体如何分化、甚至模拟舆情如何演变。更重要的是,OASIS 并不局限于某一种平台。它的模块可以灵活调整,比如更换推荐算法、添加新的用户行为,从而适配不同的社交平台结构。这种高度可配置性,为研究各类社交媒体现象提供了强大工具支持。
重现真实社会现象
OASIS 最引人注目的能力之一,是它能够高度还原现实社交媒体中的关键行为模式。研究人员已成功利用该系统复现了三项经典社会科学研究:
👥 从众效应(The Herd Effect):在类似 Reddit 的平台上,OASIS 能够复现用户判断受到他人观点影响的机制。具体而言,当一条帖文获得初始点赞或点踩后,后续用户更倾向于沿着这一趋势继续评价。
我们在模拟中设置了不同场景,将部分帖子提前进行“虚拟点赞”或“虚拟点踩”,以模拟现实中用户可能受到的从众行为倾向。通过将这些模拟结果与人类行为数据对比,我们发现智能体比人类更容易受到从众效应的影响——也就是说,它们更容易被他人的观点所左右。

💬 谣言与真相(Rumor vs. Truth):OASIS 能够模拟虚假信息与官方消息在社交媒体上的传播路径。研究人员分析了超过 73 万条帖子,追踪了哪些内容更容易受到不同类型信息的影响。
我们发现,虚假信息在数量上始终超过官方消息。在传播初期,用户对新话题的迅速反应使得二者扩散速度相当;但随着时间推移,官方消息的传播势头明显减弱,而虚假信息则能持续活跃、更长时间地流传。这一结果表明,虚假信息往往具有更强的“滞留效应”——即使其他话题逐渐消退,它仍然能够在平台上不断循环传播。

规模扩大是否会显著影响模拟效果?
智能体数量越多,群体动态越明显:
我们在 Reddit 模拟环境中引入了大量反事实内容(counterfactual posts),并在不同智能体规模下分析了从众效应的表现。结果发现:智能体数量越多,群体行为趋势越明显。换言之,群体在行为上的一致性与规模成正比,行为模式更易于被观察和量化。

🌟 一百万智能体的网络动态:
在 OASIS 模拟运行过程中,我们追踪了用户之间新建立的关注关系。结果显示,这些连接并不是均匀分布的,而是呈现出明显的“聚集”特征:部分用户形成了高度紧密的关系网络中心(hubs),而另一些用户则保持相对孤立的状态。
这一网络结构表明,无论是虚假信息还是新闻内容,其传播往往集中在特定社群内部,而非在整个网络中平均扩散。

使用强化学习构建更真实的 OASIS 环境
未来,OASIS 的潜力还可以通过 强化学习 进一步释放。举个例子:我们可以将不同社交媒体上的真实用户行为数据引入系统,并将其作为参考信号,对智能体的行为进行“奖励”——当某个智能体的行为更接近真实人类时,就给予正向反馈。这样一来,智能体会逐步学习如何表现得更像“真人”,其行为模式也将更加自然、可信。
进一步来看,如果我们将 OASIS 和其中的 LLM 智能体视为一个统一的环境,就可以在其中设计出真正可用的强化学习实验。
比如,我们可以指定某个智能体在特定时间点发布内容或点赞,随后观察其他智能体的反应。这些反应本质上就是环境的“反馈信号”。通过精心设计的奖励函数,我们甚至可以训练这些“用户智能体”达成特定目标,比如:
在模拟环境中执行一场营销策略
优化信息传播路径
探索如何在不同社交结构中影响用户观点
这将为研究者和开发者提供一个前所未有的沙盒平台,让他们在不影响真实用户的情况下,探索社交系统中的复杂动态机制,甚至提前预测可能出现的舆情变化和群体行为。

// Matrix:基于 OASIS 构建的社交媒体模拟产品
在 OASIS 构建的 “Matrix” 宇宙中,我们打造了一个类似于 X(原 Twitter)的社交媒体环境,具备实时热搜榜单,并精准模拟了用户智能体的注意力分配与行为决策。
在 Matrix 中,我们的目标是构建一个高度真实的“世界模拟器”——你可以像做实验一样,不断运行营销文案的 A/B 测试,找出最有效的策略;对于产品经理来说,Matrix 也可以在新产品或服务开发阶段,模拟用户、投资人、技术团队等多方反馈;你甚至可以模拟 “Elon Musk” 探讨火星殖民计划,或邀请硅谷工程师团队批判性地点评你的技术方案……更多有趣的玩法,等你来解锁。
如果你也想一窥多智能体系统的未来潜力,欢迎来体验这场模拟的狂想之旅
matrix.eigent.ai
// 结语
OASIS 的最大优势在于高度的灵活性与可扩展性。无论是 Twitter 式的高速信息流互动,还是 Reddit 式的社区驱动讨论,它都能胜任建模。同时,它还能承载规模庞大的智能体群体,模拟多样化的数字世界。
虽然要完全复刻现实社交媒体仍具挑战,但 OASIS 提供了一个可控的实验环境,让我们有机会系统性地探索社交动态、测试模型边界、发现现实系统的局限性。
你可以尝试不同的 Matrix 配置,推演各种社会场景,甚至单纯地享受这场“用 AI 模拟社会”的过程。
这只是个开始。
如果你对构建更强大的智能体环境也充满热情,欢迎加入我们,一起推动 OASIS 的未来发展。我们期待你的想法、实验与贡献!
💻 查看 GitHub 开源仓库:https://github.com/camel-ai/oasis
📝 阅读论文:https://arxiv.org/abs/2411.11581
🌐 了解更多项目详情:https://oasis.camel-ai.org/
😎 产品Matrix:https://matrix.eigent.ai/x
如果您对智能体模拟感兴趣,想要贡献或加入探讨,欢迎扫码进去交流!



CAMEL微信群


加入CAMEL微信群,请添加CAMEL官方微信号CamelAIOrg,会有工作人员通过您的好友申请并邀请您加入我们的微信群~
Join CAMEL Community
www.camel-ai.org
https://github.com/camel-ai/camel
https://discord.camel-ai.org







