阿里主要业务是电商,是数据库重度依赖,后面又因为重视云的投入,数据库也是云的关键部分。因此阿里组建的数据库团队一直是国内标杆,另外一个就是华为。区别是阿里走的是 MySQL 路线为主,华为走的是 PG 路线为主。
继续抽空看下云栖大会的回放,今天看下阿里云数据库讲了什么。不过每家的面临的客户环境不太一样,也没有必要全盘抄作业,了解借鉴就好了。
提前申明
阿里数据库在国内是非常先进的,是各个厂商学习的榜样。以下观点只是抱着学习的态度一些个人看法,不代表任何公司立场。受限于时间以及本人知识有限,文中难免有大量错误,也请大家理解!
整体内容:
阿里掌门人李飞飞演讲分三部分:
1、第一部分阐述数据库为什么在 AI 时代也重要。
2、第二部分重点讲产品更新和变化。
3、第三部分讲客户案例。
第一部分:数据库为啥重要
智能时代,数据是关键要素,OpenAI 收购 Rockeset,向量数据库,具身智能对多模数据处理的诉求等。




提出观点:过去一年最大的是带来多模数据处理+实时分析两大诉求。阿里云数据库希望给客户提供的是类似搭建乐高一样,易用,好用,高可用。
快评:
1、这个多模不是指多模数据库,是指数据的种类多了,比如文档啥的,也要处理了。
2、易用,好用,高可用,挺顺口的。
3、总的来说, AI 时代,对数据库肯定是有诉求的,但也不是所有数据库都能用的上,所以没有分门别类的区分,导致观点听着会关联性不强
4、AI 时代,大模型发挥作用,通用智能是不够的,本质上是要企业数据,行业知识。这些原本存在数据库里面。怎么和 AI 结合,是值得探索的。

第二部分:产品重要更新和重大发布
重磅发布 DMS 新能力,提出 OneMeta,OneOps 理念,不光是支持阿里云的自身的数据库,对开源的也支持的,也就是所谓的 DMS+ X
快评:
1、AI 时代,让 DMS 有了更大的想象空间,这估计是DMS 以前从没有想到的。
2、不过和上一个观点比较类似,DMS 还是聚焦 ops领域,更多的是为了能接上 AI 的话题。
3、AI 这个阶段缺的肯定是各自处理算子,其实可以考虑这块步子再大一些。





三层解耦,内存池化。
快评:看华为也在跟进这个概念,说明还挺成功的。

serverless 能力再升级,粒度做得更细。

polardb 多写多读

polardb 软硬一体化,据说用了 scaleflux 更新一代硬件。

ADB 分析引擎,内置 spark,更轻量的处理推荐用这个,批量的推荐用 EMR。

ADB 也用到了 GPU加速。

lindorm 把推理,向量等引擎内置到里面了。
快评:AI 时代,有新的数据需要处理,lindorm 找到了春天了。传统多模目前看起来不成功,AI 时代说不定能有一片新天地。

RDS 通过 BPE 技术(buffer pool extension)冷热温分离,ARM 深度优化。

zero-ETL,TP,AP 各个产品深度打通,和 AWS 一个路线。

DAS ,通过 AI 智能运维。
快评:AI 时代,DAS 成了配角,不应该。

各种级别的容灾能力,免费送跨地域冷备。

Tair Serverless(对标 Redis 服务)
快评:推理加速,feature Server,还挺有前途,前提是大数据团队愿意用,这个前提在阿里估计会比较难。

用到了 NVIDIA 的库

第三部分:讲案例
ADB 和通义构建一站式 RAG

lindorm 帮助kimi 构建 AI 应用,这个案例还是比较重磅。


其他的案例特别的不多,就不一一展示了。
总结
最后总结一下,让我印象比较深的几个点:
1、lindorm 的kimi 案例,多模的车联网案例等。
2、Tair serverless 服务于推理,feature server。
3、polardb 多写多读,TP 领域还是比较领先。
因为今年是 AI 年,所以阿里数据库肯定是要和 AI 去结合,不过总体感觉贴得不够紧。如果要和 AI 结合,有以下几个方向,可以参考:
1、DMS 提供AI 算子,或者打通 PAI,实现 AI 数据处理。而不局限于ops
2、各个数据库打通和 AI组件,实现企业数据到大模型的无缝流转。
3、ADB进一步 构建知识管理平台,而不是停留在向量上。
4、DAS 不停留在运维上,做几个Agent,解决真正数据库好用的问题。




