为什么 Meta 力挺开源 LLM，而微软却想围剿

向量检索实验室 2023-12-14

150

原文链接：

https://medium.datadriveninvestor.com/why-meta-is-fighting-for-open-source-llms-while-microsoft-wants-to-regulate-them-a8f598ff0abf

前段时间 Google 发布的 Gemini 激起了舆论巨浪，与此同时欧盟对人工智能法案进行了更新。

Meta 首席科学家 Yann Lecun 在 X 上表示：“该立法包括对大模型的限制，但对‘开源模型’给予了广泛的豁免，‘开源模型’是使用开发人员可以免费使用的代码开发的，可以根据自己的产品和工具进行修改。此举可能有利于欧洲的开源人工智能公司”。

与此同时，Meta 成立了一个大型人工智能联盟，旨在“领先的技术开发人员、研究人员和采用者共同合作推进开放、安全、负责任的人工智能”。该联盟包括 AMD、戴尔、HuggingFace、IBM、英特尔、甲骨文、Fast.ai、Stability AI 和 NASA 等重量级企业。

值得注意的是，以上名单不包括苹果、亚马逊、 Google 、微软、Anthropic 和 OpenAI，其中最后 4 家公司在几个月前启动了自己的前沿模型论坛。

这是非常奇怪的现象。为什么会有两个持有完全相反观点的组织都声称自己在确保“安全和负责任的人工智能”？为什么这两个组织没有重叠的成员？为什么两个组织花费数百万美元相互游说？

实际上我们也不难猜到，这并不是意识形态之争，而是屁股决定脑袋的利益之战。

在本文中，我们将讨论以下内容：

为什么 Google 不得不反对开源。
为什么 Microsft 和 OpenAI 如此希望开源 LLM 受到监管。
为什么亚马逊和苹果一直按兵不动。
为什么以 Meta 为代表的大玩家力挺开源。

让我们从近期的舆论焦点开始。

Google AI应该解雇整个公关团队

这个标题可能会让部分读者扬起眉毛。接下来需要以开放的心态阅读本文。了解 Google AI 的公关团队如何让他们失望，将有助于我们理解为什么 Google 现在别无选择，只能反对开源。

这将是一个相当长的部分，先说结论。

在人工智能进步方面，Google AI 一直处于上帝视角。从技术上讲，他们领先于其他竞争对手大概1.5-2年的水平。然而，他们在向市场宣传自己的技术发展方面却极其无能。这极大地损害了他们的公众认知，从而增加了他们股票的波动性。最轻微的错误都会导致严重的过度反应和股市的大幅下跌。Google 针对开源大模型的策略是试图通过限制更多已知实体的竞争来限制股票波动。

下面介绍具体的背景信息，会比较长，可以选择跳到下一 Part 节约时间。

Google 的人工智能团队不断发布一些具有开创性的作品。就现阶段而言，Google 发明了 Transformer，用 BERT 改变了 NLP 世界等。但人们不太了解的是，他们对 AI 领域的贡献有多大，以及他们在 LLM 方面领先了多少。

Google AI 于 2021 年分享了有关 Pathways 架构（用于训练 AI 模型的下一代系统）的出版物。两年多前，他们就在谈论多模态人工智能模型和多任务训练。他们与 Chinchilla 的合作对于将 Transformers 扩展到目前的规模至关重要。他们在大多数人听说 OpenAI 之前的几个月就开始谈论人工智能的幻觉。如果有人今天只采用他们的 Flamingo 模型并围绕它建立一家初创公司，就足以筹集数十亿美元，且这家初创公司将被视为对 OpenAI 和 GPT-4 的严重威胁。而 Flamingo 只是 Google 在 2022 年 4 月做出的贡献之一。

这不仅限于 LLM，Google 已经发布了蛋白质折叠、机器人控制、可扩展人工智能、隐私保护人工智能、气候人工智能和量子计算等领域的瑰宝。我们就算只阅读出色的 Google 研究博客，仍然可以了解该领域最前沿的发展。在那里发表文章的作者是那样的天才、出众。

所有这一切都表明，目前还没有人能够与 Google 比肩。唯一可以声称在人工智能领域具有类似影响力的竞争对手是 Meta，他们只是在谈论他们比较主流的诸如 FAISS、Pytorch 等开源贡献以及他们在自我监督学习方面的贡献。实话说，OpenAI 被视为 Google 的严重威胁表明了 Google 在强调其成就方面表现得多么糟糕。

不幸的是，Google 并没有努力向更广泛的受众传达其发展成果。Google 的主要宣传策略是靠一些主动接触资源并且进行解析的“自来水”。然而能够接触这些资源的人很少，愿意接触这些来源的人甚至更少，这严重限制了受众。在舆论场上是很差劲的策略。

这使得 Google 腹背受敌，竞争对手的成就被推崇，而他们犯的任何错误都被妖魔化。他们发布的 Bard 应该有一个再度崛起的时刻。相反，所有的媒体都在谈论 Bard 曾犯下的代价高昂的错误。

同理，在 Gemini 身上我们可以看到同样的现象。与其相关的头条并不正面。

尽管开发日没有分享太多新内容，但每次 OpenAI 的小更新都受到全场欢呼，可以让大多数人失去理智。Nvidia 和 Sam Altman 的芯片投资都能引起公众的积极关注。与此相比，尽管 TPU 客观上与人工智能更加相关，但 Google 对 TPU 的长期投资却鲜为人知。

Google 发现自己陷入了困境。他们糟糕的营销策略强化了人们对于他们在 LLM 方面落后的认知，而现在他们所做的一切都被视作奋力追赶。这使得他们所犯的任何错误都比“创新”的 OpenAI 更不可原谅。

事实上，Google 他们的核心业务没有受到任何威胁，即使某些人工智能比 Google 更好，构建产品来与他们竞争也注定困难重重。但他们无法向公众展示这一点，他们的股票依旧每次都会遭受巨大打击。当人工智能专家在 ChatGPT 出现后开始宣布搜索死亡时，Google 惨痛地认识到了只要人们相信某些公司的人工智能确实优于 Google，人们就会继续随大流。这一点虽然暂时是无稽之谈，但没关系，因为它在很大程度上成为了推动股市发展的流行叙事。

然而，开源大模型恶化了 Google 的处境。突然间， Google 必须在两条战线上与敌人抗衡。与 OpenAI 或一些大型科技不同，开源是流畅、快速且免费的。这使得它非常擅长通过企业服务蚕食市场份额。这也是极其不可预测的。

即使大模型不会威胁到 Google 的业务，公众的看法已经让它们处于对立面。所以现在 Google 必须开始应对了。

通过围绕开源制定法规，他们可以先发制人进行风险控制。如果这意味着通过将人工智能掌握在行动缓慢且可预测的企业实体手中来为行业带来稳定，那么花费几百万美元来游说和试图扼杀开源只是一个很小的代价。

所有这一切都是因为 Google 一直未能传达出他们有多优秀。这就是为什么 Google 需要解雇负责 AI 公关的人，转而聘请更加优秀的人员。

为什么微软和 OpenAI 欢迎监管

开源不仅给 Google ，也给人工智能带来了很多混乱。这对于在 OpenAI 上投入大量资金的微软来说并不是一件好事。有文章揭示了人工智能初创公司的每月种子价值正在下降，炒作的效果正在逐渐减弱，人工智能不再像几个月前那样带动投资。

如果看看幕后，我们会发现 GPT 的许多承诺都没有兑现。人工智能并没有占领最有利可图的商业机会。目前很多人正在努力为 RAG 引入良好性能的向量数据库 + OpenAI 模型。

数据标签、转录和注释是很好的用例，但大多数情况下任何大型模型都可以很好地完成这些任务。这就是微软停止 OpenAI 竞争的商业利益所在。在具有商业许可证的强大开源模型发布后，Sam Altman 改变了对人工智能监管的必要性的看法，这并非巧合。将开源纳入监管，OpenAI 可以介入并及进行一些操作。

这种双重激励就是微软成为监管捕获最积极的参与者的原因。他们从整件事中获益最多。OpenAI 良好的公众形象也意味着一旦监管生效，它将成为炒作的最佳对象。人们不喜欢 Meta，Google 已经搞砸了，而亚马逊则一直保持沉默。在舆论场上，OpenAI 总是胜出。微软需要反击。

微软已经将自己置于主导人工智能的最佳位置。主要基于一个事实：他们对人工智能的所有主要组成部分都进行了大量投资，因此可以适应每一个发展。Nadella 和微软管理层的其他成员的策略惊人的一致。他们反对开源这件事十分糟糕，但对他们来说玩弄手段不过是小菜一碟。

Google 可能在研究方面处于领先地位，但这并不重要，因为没有人会听说他们的工作。微软可以继续主导叙述，并朝着有利于自己的方向发展。对于上市公司来说，这才是真正重要的。

让我们看看在整个事件中出奇安静的公司：亚马逊和苹果为什么一反常态地置身事外。

为什么亚马逊和苹果如此冷静

除了对 Anthropic 的投资之外，亚马逊还没有任何大动作。这是故意的。与 Google 一样，亚马逊并没有受到大模型的威胁。但与 Google 不被公众看好不同，亚马逊无疑处于不受公众监督的地段，并且能够无忧无虑地投资其核心能力。

苹果公司也处于类似的境地。他们并不担心大模型的争论。他们最近发布了专门针对 Apple 硬件的类似 PyTorch 的 ML 库。这是对开源的一个小小的认可，但更重要的是，让人们对苹果生态系统有了更强烈的认可。

这两家科技巨头都可以继续随心所欲地生活，而不必卷入这场有争议的拉锯战。无论风向如何，他们都拥有资源来随风转舵，所以他们只需要袖手旁观，随事态发展。

这里没什么好说的了。让我们转向 Meta 为什么一直在支持开源。

为什么 Meta 拥护开源

大模型不会威胁到 Meta，从这个角度看拥护开源与否对于 Meta 都可以说是毫无意义的事。但他们将受益于人工智能的发展，他们可以将大量研发工作外包给开源贡献者，后者将免费分享技术支持。他们只需要将这些开发成果重新融入到他们的产品中即可。这意味着对于 Meta 来说，开源是一个极其有利无害的事。

因为有 Metaverse，开源对于 Meta 来说尤其重要。Metaverse 是一个登月项目，需要进行大量设置才能启动。一个健康的开源生态系统将减少他们的研发。几百万是一个相对较小的代价，并且你可以获得布朗尼积分并让更多的人进入你的生态系统。这也是为什么这么多大牌加入 Meta 联盟的原因：他们从 OSS 的下游效应中受益；他们可以接触到行业内的深厚人脉网络；他们获得名望。

总而言之，我们可以看到公司背后的各种经济利益以及他们对法规的不同立场。总而言之，我们很可能会看到天秤慢慢的倾向开源，因为更多的组织有钱可赚。与此同时，政客们会出于视觉原因或获得控制权而试图推动一些法案。如果他们的监管扼杀了开源，我们的工作就是反击。学会揭示发展背后的财务动机是关键。

向量检索实验室

微信号：VectorSearch

扫码关注了解更多

文章转载自向量检索实验室，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。

为什么 Meta 力挺开源 LLM，而微软却想围剿

向量检索实验室

评论