暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

OpenAI收购数据库初创公司Rockset背后逻辑:5大原因、3大作用、4大协同方向

268

点击上方蓝字关注我们



上周,OpenAI宣布收购数据库初创公司Rockset,立刻引爆行业。这项收购作价仅5亿美元,金额并不大,但是却让数据库行业兴奋不已!


Rockset公司由Facebook工程师创立,一个高性能数据搜索和分析数据库的开发商,主打实时搜索和数据分析,能够实现毫秒级延迟。其总融资额达到1.05亿美元。


按照官方说法,这次收购将增强OpenAI的检索基础设施,帮助企业把数据转化为“可操作的智能”(Actionable intelligence)。


冷静下来后,你会发现OpenAI收购Rockset的背后逻辑。







1.背景:OpenAI出手收购数据库企业Rockset


OpenAI收购的Rockset,是一个以数据索引和查询功能著称的实时分析数据库。此举目标有三:


一是通过整合Rockset的技术,强化OpenAI所有产品的基础设施。


Rockset的实时分析数据库为用户、开发人员和企业提供了强大的数据索引与查询功能,使得他们在使用AI产品和构建智能应用时能更高效地处理和访问数据。OpenAI计划利用这些技术来提升其跨产品的检索基础设施。


OpenAI的首席运营官Brad Lightcap表示,Rockset的基础设施将帮助企业客户将数据转化为可操作的情报,并整合进OpenAI的产品中,为客户提供更多价值。


二是Rockset团队将加入OpenAI。


通过这次收购,OpenAI不仅获得了先进的数据库技术,还获得了一支经验丰富的团队,这将加速其在AI领域的技术进步和产品开发。


“我很高兴与大家分享,OpenAI已经完成了对Rockset的收购。我们很高兴加入 OpenAI 团队,并将我们的技术和专业知识用于构建安全有益的 AGI。”Rockset 首席执行官 Venkat Venkataramani 说。




Rockset首席执行官Venkat Venkataramani


三是Rockset现有客户将逐步迁移至新的平台。作为交易的一部分,Rockset的客户将需要找到一个新平台。


那么Rockset的核心竞争力到底是什么?


Rockset由前Facebook工程师Venkat Venkataramani、Tudor Bosman和数据库架构师Dhruba Borthakur于2016年共同创立,旨在解决对可以处理大量流数据的分析数据库的需求,这是一个困扰软件工程师数十年的技术问题。


他们构建了RocksDB,这是Google LevelDB的一个分支,而LevelDB是由Jeff Dean编写的可嵌入NoSQL数据库。


他们通过采用 RocksDB(一种快速键值存储)并在其上构建一系列索引来应对这一挑战,这些索引使用户能够快速运行汇总、聚合和连接数据。其数据库允许在获取数据后几毫秒内使用SQL进行查询。


Rockset以云原生方式构建其软件,并将其作为无服务器服务在云上提供。最近几个月,该公司增加了向量数据类型和向量搜索功能,使客户能够使用他们的数据库为 ChatGPT 等大型语言模型提供数据。


客户包括捷蓝航空、Allianz Direct、Seesaw 和 Facebook 的母公司 Meta。



2.OpenAI收购 Rockset 的5大理由


我们总结专家的分析,将OpenAI收购 Rockset 的理由归纳为以下几点:


·增强数据处理能力:OpenAI 通过收购 Rockset,旨在提高自家AI产品的数据处理能力,以领跑竞争对手。Rockset 的技术将帮助 OpenAI 强化其跨产品检索基础设施,提供更高效和强大的数据处理和分析服务。


·增强实时数据分析与检索:Rockset 提供的实时分析数据库,具有世界一流的数据索引和查询功能,这将使OpenAI 的 AI 应用更加强大和实用。通过整合 Rockset 的技术,OpenAI 能够更好地利用数据,并在构建智能应用程序时访问实时信息。


OpenAI 认识到,要使 AI 应用在企业中落地,需要解决数据的实时分析问题和多模态向量检索问题。Rockset 的技术将帮助 OpenAI 解决这些问题,提供云原生扩展能力、实时性服务和向量搜索能力。


·对向量数据库的补充:有分析认为,向量数据库无法真正解决“人工智能内存”问题,而 OpenAI 可能希望通过收购 Rockset 来补充这一领域,开发适合企业的堆栈,利用数据库的计算能力来卸载一些 AI 模型的计算负担。


·推动 AI 技术发展:OpenAI 希望通过此次收购,推动 AI 技术的发展,使 AI 应用更加智能和实用。Venkat Venkataramani 表示,Rockset 的加入将帮助 OpenAI 解决大规模 AI 应用面临的数据库难题。


减少 AI 模型的幻觉问题。通过将 AI 模型“扎根”在公司的数据上,OpenAI 可能希望减少大模型的幻觉问题,更容易对模型进行微调以适应不同的业务用例。


·技术与人才整合:此次收购不仅是技术的整合,也是人才的吸纳。Rockset 的团队成员将加入 OpenAI,这支团队具有丰富的大规模数据管理和分布式系统的软件工程经验,将为 OpenAI 的技术发展和产品创新贡献力量。


这次收购显示了 OpenAI 对于 AI 技术未来发展的深远考虑,以及对实时数据分析和检索能力的重视。通过整合 Rockset 的技术,OpenAI 将能够提供更加精准和高效的 AI 解决方案,满足企业和开发者的需求。






3.数据库在大模型中的3类关键作用


数据库在大模型中的作用可以归纳为以下3类关键作用:


第一,计算效率与资源优化。


数据库,尤其是向量数据库,通过存储大模型生成的数据的向量化表示,可以显著减少大模型在推理阶段所需的计算量。这是因为向量数据库能够快速进行相似度计算,从而加速检索和匹配过程,这对于需要处理大量数据的AI应用至关重要。


此外,数据库的高效数据管理能力有助于降低大模型的运行成本,因为它减少了对昂贵计算资源的依赖。


第二,数据管理和检索能力。


大模型通常需要处理和分析大量的多模态数据。数据库在此过程中扮演着数据管理和检索的关键角色。向量数据库特别适合存储和检索图像、文本等数据的向量表示,使得大模型能够快速访问和分析这些数据。


此外,数据库支持的索引方法和数据结构优化了检索速度,这对于实现实时或近实时的AI决策和响应至关重要。


第三,支持模型训练与微调。


在大模型的训练和微调过程中,数据库提供了必要的数据支持。通过将训练数据和微调数据存储在数据库中,可以确保大模型能够访问到最新和最相关的信息。这有助于提高模型的准确性和适应性,尤其是在需要模型适应特定业务场景或包含特定领域知识的情境中。


同时,数据库还可以帮助解决大模型在训练过程中可能遇到的“幻觉问题”,即模型生成不准确或虚假信息的情况。


这三大类作用体现了数据库在支持大模型的整个生命周期——从训练到推理再到微调和优化——中的核心价值。通过这些作用,数据库不仅提高了大模型的性能和实用性,而且为人工智能技术的进一步发展和应用提供了坚实的基础。






4. 数据库与大模型结合协同发展4大趋势


数据库与大模型结合的发展趋势可以概括为以下四点:


模型接口标准化:随着大模型在数据库应用中的普及,模型接口的标准化成为了关键趋势。这有助于降低开发成本,提高不同数据库系统与大模型之间的可移植性和互操作性,从而推动大模型在数据管理领域的广泛应用。


向量数据库的崛起:向量数据库因其高效的相似度搜索和多模态数据处理能力,成为大模型基础设施的重要组成部分。向量数据库不仅可以存储和处理非结构化数据,还能通过近似查询提供模糊匹配结果,这与传统数据库的精确匹配形成对比。向量数据库的发展预计将进一步推动数据库与大模型的融合,特别是在处理海量数据和实现快速检索方面。


数据安全和隐私保护:随着大模型与数据库的紧密结合,数据安全和隐私保护变得更加重要。数据库需要加强安全措施,确保在处理敏感数据时符合隐私保护的要求,这可能涉及到采用先进的加密技术、访问控制和数据匿名化处理。


数据库性能与易用性的提升:大模型的引入为数据库带来了性能上的提升和易用性的改善。例如,大模型可以通过自然语言处理技术,将用户的自然语言查询转化为数据库操作,从而提高数据库的易用性。同时,大模型在SQL查询优化方面的应用可以减少查询响应时间,提高数据库的吞吐量。


这些趋势表明,数据库与大模型的结合正推动着信息技术领域的一次重要革命,为数据管理和智能应用带来了新的机遇和挑战。随着技术的不断发展,我们可以预见这一领域将继续演进,带来更多创新和价值。


参考资料:


·https://rockset.com/


·https://www.36kr.com/p/2833006161562116


·https://mp.weixin.qq.com/s/h9g36z-kzqjlSmlfpSevsw


·https://new.qq.com/rain/a/20240622A00C6B00


·https://developer.aliyun.com/article/1440524


·https://www.36kr.com/p/2353733809677826




相关文章


·数据库创新力量系列GQL图查询语言国际标准登场,撬动图数据库市场?



·数据库创新力量系列AI+数据,再次将数据库送上一个高位,这些巨头这样做!


·数据库创新力量系列数据与分析领导者的秘密,向量数据库的5个W:为什么?是什么?玩家是谁?谁用?用在哪儿?


·数据库创新力量系列MySQL 5.7 EOL,超过50%的用户该怎么办?只有4个月时间!




暑期安全


END


最后修改时间:2024-07-15 11:43:29
文章转载自Hadoop大数据应用,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论