暂无图片
暂无图片
1
暂无图片
暂无图片
暂无图片

2024年上半年中国数据库和大数据行业最新发展趋势

写在前面

年初我总结了一下 2023 年中国数据库十大发展总结,广受好评,多家媒体转载,可以阅读前面文章回顾上次的总结:2023 年中国数据库十大发展总结

时间又过去半年,还是有不少新的变化和有意思的地方,这次把整个数据库和大数据底座的最新发展趋势都简单总结下,供大家参考,希望大家喜欢。

这次总结还是往常一样,我还是聚焦在产品为主,其他为辅。相对来说,产品的趋势也更客观和准确一些。

数据库 2024 上半年最新发展趋势

相对来说,云厂商提供的产品最为齐全,为了方便归类,我以云厂商视角,把数据库产品细分为三类:托管型产品,云原生+AI 产品,私有化产品(这个是可以覆盖独立厂商的产品)。

1、托管型产品,主要是以开源引擎(MySQL,PG,Redis 等)全托管,帮助用户解决高可用,运维困难的问题。

2、云原生+AI产品,基于云架构自研的,具备云原生能力的数据库解决开源数据库容量,性能,功能瓶颈,解决更严苛的业务要求。给客户体现的能力主要在,弹性(存算分离、Serverless),性能,HTAP等等。

3、私有化产品,给客户部署在私有化环境中,这类通常是金融,电信等行业。客户通常偏保守,对产品各种认证,案例,功能完善度,极致性能要求比较高,但也通常不愿意采用新技术。

数据库领域 24 年上半年明显的趋势和现象是:

1、从数据库全局看,23 年中国数据库市场规模为74.1亿美元(约合522.4 亿元人民币),占全球7.34%;我国公有云和本地部署模式市场规模分别占总市场61.3%和38.7%。2024年公有云数据库市场占比进一步扩大。

2、托管型产品还是大头,云原生产品并没有形成明显的替代作用。只有少部分比如游戏等行业对云原生产品比较buy in,大部分行业还是重度依赖托管型产品。各云厂商产品研发投入上,各家整体还是向serverless演进,云原生产品还是发展重点。

3、 公有云上头部客户仍能可以保持增长,中腰部客户失速。有点强者愈强,弱者愈弱的感觉。和当前的经济也有点类似。头部企业还是很赚钱,大部分中小企业相对更困难。

4、整个行业竞争激烈阿里带头降价,通过低价争夺客户和防止流失,火山更是为抢占市场,是市场上的价格屠夫。

5、公有云头部大客户多云诉求愈发明显,主要原因是通过引入多家供应商控制成本,或者安全可靠角度。

6、AI 场景的向量数据库,主要还是应用到知识库场景,基本上各行各业都在尝试,泛互联网客户,传统行业大客户都有广泛的知识库的诉求。当前的瓶颈不在向量数据库本身,瓶颈在非结构化数据的 ETL 上,缺少合适的工具和方法,从而导致这个行业成熟落地比较难。

7、国产化进一步深化,开始有客户将安全可靠测试结果作为必选项。但是这个测试数据库目前只有第一批分布式数据库和集中式数据库。

8、私有化top1 行业金融,国产化进一步往腰部覆盖,头部厂商市占进一步提升。(大行,城商行基本完成数据库选型,主要是中小行,保险行业选型新数据库。) 私有化政策性推动比较明显,比如保险行业 IF17 带来数仓的新诉求。

大数据 2024 上半年最新发展趋势

参考数据库,我将大数据产品细分为传统大数据平台,湖仓一体新架构,在线中间件。

1、大数据整体私有化规模大概是公有云的 2 倍,但是公有云的增速高于私有化(私有化 CAGR 26.6%,公有云 CAGR 44%)(IDC 报告)

2、其中传统大数据平台,一般以数据中台名义建设。泛互联网,头部金融客户,电网等建设基本完成,金融腰尾部,制造等数字化建设相对薄弱的行业还在建设。传统大数据平台还会增长一段时间,但是业务上已经过了建设高峰期(往中腰,尾部覆盖的阶段),头部企业已经逐步往数据湖升级。

3、湖仓一体是传统大数据平台云原生架构升级,头部行业如互联网等客户往湖仓一体化升级或者智能化转型。

4、在线中间件,指的是如 ES,kafka,CK等服务于客户在线业务,运维门槛高,越来越多客户不愿意运维或者没有能力运维的会选择公有云服务。在线中间件不是技术发展热点,但是因为运维的高门槛,对厂商来说长期有机会。

5、开放数据湖架构是数据治理目前业界共识(统一治理,统一元数据管理,数据资产管理,数据分享),以 databricks 为代表的厂商再推进和探索以湖仓一体化架构为基础的非结构化数据治理。

写在最后

相对来说,数据库大数据市场,已经进入了一个平稳期,这个领域活跃的机会点还是在数据库和大模型的结合上。我在 2024 DTCC 的会上有个 topic 会重点阐述这块的机会,等大会结束了给大家分享出来。Stay tune!

-----------------

欢迎加本作者微信交流,加微信请先自我介绍下!

大模型时代数据库技术创新

深度解读大模型最火的智能体(Agent)

大模型 Copilot 和 Agent 有什么区别?

一次性把“AI 原生应用技术栈”说明白


最后修改时间:2024-08-21 11:43:13
文章转载自大数据和云计算技术,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论