暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

聊聊国产数据库的几个热门话题

数据最前线 2025-01-06
309

最近几篇文章谈了比较多国产数据库的内容,大家的关注度非常高,这里摘取了几个相对热点的话题,谈谈我的个人看法。

分布式还是集中式

分布式数据库兴起于互联网行业,海量的数据和超高的并发访问,传统集中式数据库应对起来确实有些力不从心,于是架构师们将数据拆分成多份放到多个数据库来存储和检索,逐渐演变成今天的分布式架构,这种架构解决了存储和计算资源的瓶颈,很好的满足了互联网行业业务需求,因而广泛流行起来。反观传统行业数据量不会显著增长,并发访问量也不高,在CPU长期低于10%的情况下去谈“弹性扩缩容”似乎有点“为赋新词强说愁”的意味。

但分布式也并非完全没有意义,对于核心系统来说,虽然业务访问量不大但是重要程度很高,分布式可以提供很好的高可用能力,避免数据库系统出现单点故障而影响应用的正常对外服务。但这些也并非没有代价,分布式架构下,一套多副本加容灾架构,节点数量基本都要10个以上,如果要拆库节点数量更是急剧的增加。相比于传统集中式数据库来说,前期设备投资和后期运维工作量都会增加不少,更有客户抱怨“不是没钱买服务器,而是机房没有空间放”!

分布式还是集中式说到底还是成本问题,不考虑成本当然是分布式更加稳妥。成本有限的条件下,核心系统重要程度高建议选择分布式数据库,重要程度没那么高的系统则采用集中式的主从架构,一旦出现问题在可接受的时间范围内将数据库到正常状态,也是一种性价比高的方案。只是很多情况下,不出问题彼此相安无事,出了问题都是重要系统,这个时候就考验决策者的魄力和决心了。

怎么看套壳这件事

说到国产数据库,经常会有人说某某数据库是开源改个名字套壳的,某某数据库是开源加个上层中间件。其实开源数据库改商业版并不是中国特有的,国外也有很多甚至是比较知名的产品,也都是基于开源产品二次开发的。有实力全新开发固然值得尊敬,现阶段有大量开源资源可以利用也是一种明智的选择,只是一定要遵守开源的协议,避免后续发展惹上不必要的麻烦。

但这并不代表国产数据库没有门槛没有技术含量,吹的再好的产品最终也是要用户来买单的,国产化的后半程比拼的是产品差异化和售后服务能力。

基于同一个开源基础做出来的产品,其侧重点仍然有所不同,有的基于内核做性能提升,有的在外围做能力和生态拓展。用户可以根据自己的个性化需求,选择适合自己的产品。而且科技领域变化非常快,今年是AI明年可能又会有其他的热门技术,需要厂商投入更多的资源跟进。此外,数据库是一个软件产品,使用过程中难免会遇到问题,需要厂商快速响应和处理,这些都需要持续的资源投入,这也是为什么市场回向头部厂商收敛的原因之一。

怎么看兼容Oracle这件事

国产化替代,Oracle是一个绕不开的话题。自上世纪80年代进入中国,经过30多年的发展最高占据了50%以上的市场份额。国产化改造面临的绝大多数场景都是从Oracle迁移改造到国产数据库,因此哪个厂商对Oracle的兼容做的好,国产化改造的成本相对会更低,用户会更倾向于选择这样的产品。

但是现在有不少厂商在和Oracle兼容上做的有些“走火入魔”,数据字典和DBMS包等内嵌视图和函数的名称竟然和Oracle也完全相同。这在初期会带来一些便利,但如果大家都争相仿效(事实上这个趋势越来越明显),最终会带来较大的混乱。这种混乱首先体现在搜索引擎上,比如在百度中搜索dba_sequences这个视图,发现这个视图在3种数据库中都有,视图的定义几乎完全相同。在分析问题的时候,也经常会出现搜索A库的字典,结果返回的是B和C库的信息,非常影响问题处理效率。

所以笔者认为,兼容也要适可而止,不能全盘拿来主义,或许国家有关部门可以考虑出一个规范,避免各种数据库之间过于“相像”。

写在最后

国产数据库是个新生的事务,发展初期难免会有各种不同的声音,历史的车轮滚滚向前,我们的数据库也将在这些质疑声中不断成长。

这几个话题都是前期讨论比较多的,这里系统说了我的个人观点,相信大家还会有更精彩的意见,欢迎留言讨论,为国产数据库的发展积极献策!


文章转载自数据最前线,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论