
AI的发展正在定义传统数据库的未来。这种改变不仅在于“用AI”的尝试,借助大模型生成SQL、构造测试用例、优化查询计划等。更在于深度"适配AI",解决Agent状态维护、调用路径压缩等新场景问题。

走向前台的数据库
传统数据库,这个过去“藏在后台”的基础设施开始“走向前台”,成为AI数据调度中枢和计算引擎。
这场变革牵扯每一名从业者知识体系甚至身份认同的更新。前不久,在上海金融数据港—柏睿全球大企业创新中心,一众在数据江湖摸爬滚打几十年的老兵齐聚IFClub上海站活动现场。
参与分享的有IFClub 联合发起人薛晓刚,PG中文社区联合发起人、PostgreSQL ACE Director 德哥,asktug社区版主姚春晖,哔哩哔哩数据库负责人赵月顺,以及公众号“DBA札记”主理人董老师。他们有的见证过关系型数据库的黄金时代,也经历过NoSQL的狂飙突进。
现如今,他们在数据库的思维碰撞无论如何都绕不开AI。或是聚焦数据行业从业者在AI浪潮中如何锚定自身的职业定位?或是关注RAG优化思路,为什么用了RAG,我的AI还是笨得跟猪一样?

那一天的柏睿全球大企业创新中心,激烈讨论的紧张空气里漂浮着AI需求的焦虑感。这不仅是以往数据使用管理方式的改变,数据库的使用方式本身,正在被 AI 重塑。这种转变在头部厂商的技术并购整合中早见端倪。
2024 年 7 月,OpenAI以5亿美元整合实时分析数据库Rockset的专家团队,增强了自身在实时分析和RAG领域的实力,让ChatGPT查数据 "快过人类翻书"。
2025 年 2 月,MongoDB 以2.2亿美元收购 Voyage AI,以补上模型侧“最强大脑”,提升其在 AI 应用构建中的“搜索体验”和“智能性”。
2025 年 5 月,Databricks豪掷10亿美元,买下专注于serverless架构 PostgreSQL 数据库的Neon玩AI狠活。Neon 特别适合 AI 代理自动生成与释放数据库实例的使用场景,其超过 80% 的数据库实例都是由 AI 自动创建。
当科技巨头疯狂扫货,透露出致命信号:未来软件 = AI Agent + 数据计算引擎。未来大部分服务将依托AI Agent进行智能交互,AI Agent需要一个强大的Data API。而数据计算引擎则走向前台,直接服务于 AI 驱动下的新需求场景。
正如,微软 CEO 纳德拉在公开访谈中投下的核弹:在 Agent 时代,SaaS is Dead,而未来的软件形式将是 Agent + Database 。逻辑一旦全部上移到 AI 层,Agent可以直接跟数据计算引擎对话而完成任务。

数据库角色的转变
——从数据存储走向数据计算
知所从来,方明所去。数据库的诞生主要是为了“记账”,以高可靠、高一致的方式记录业务操作。犹如严谨的账房先生每天忙着记账、对账、查账。
随着业务复杂度和数据规模迅速增长,企业开始从“记录数据”向“理解数据”转变,数据库转入OLAP时代,Hadoop、Hive、ClickHouse等技术体系让数据“开口说话”。
进入云计算与分布式系统成熟期,数据不再局限于单一系统中运行,而是呈现出高度流动、分布与异构的状态。此时的数据计算引擎进入云原生阶段,强调统一的数据平台。
直到这一阶段,数据计算引擎的核心逻辑依然围绕“存储”和“管理”数据展开。但随着AI的到来,这一切正在被彻底颠覆:数据计算引擎正从“看懂数据”走向真正“参与智能”。
试想,AI Agent突然冲进数据库,边跑边喊:“我要查用户的历史订单、实时库存、竞品价格,还要用BERT分析评论情感——全都要在0.5秒内搞定!”
在这里,数据计算引擎的调用方式变了:从人操作系统触发查询,转变为模型或Agent自动生成请求。请求频率高、链路复杂、语义模糊,对数据计算引擎性能和响应能力提出更高要求。当然,更难的还是权限系统Agent面前像纸糊的城墙,数据安全策略需要重构。
其变化本质是,数据计算引擎从 AI 应用的“支持工具”,变成了“关键路径”;从关注结构化数据处理,转向语义理解、模糊搜索和动态负载;从优化 SQL 查询性能,到配合 embedding、token 和语义图谱协同作战。
数据的组织、检索、计算方式正在围绕 AI 的语义理解、实时交互与弹性需求重构。数据计算引擎产品的智能化演进势不可挡。我们正在通过与AI大模型的深度适配来改造高性能全内存分布式数据引擎RapidsDB:
一是将用户的自然语言描述转化成对应的SQL语句,菜鸟也能对数据库"说人话“;二是数据计算引擎智能运维,运维管理人员可以利用机器学习模型优化查询并提高其准确性。同时将RapidsDB作为一个统一的Data API,支撑MCP的各种应用。



当数据库开始思考,其角色就从“被动存储工具”向“主动智能引擎”跃迁。这场进化不仅关乎技术升级,更是组织智能能力的根本性重塑。未来企业的竞争力,或许不再取决于谁先部署模型,而在于谁最先构建起适应AI时代的数据底座。

推荐阅读








