暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

从存算分离到存算协同,来看看2023年数据库年度行业分析报告中为何这样提

火龙呼呼猫 2024-10-10
193

墨天轮在今年5月,对中国的数据库行业,发布了《2023年中国数据库年度行业分析报告》(后文简称《报告》),其中总结了一下2023年中国数据库的发展现状和趋势。《报告》长达三百多页,因此不能完整细致地给大家做解读。不过我注意到一个比较有意思的事情,《报告》中,把包括CPU、存储、云管平台、数据复制与集成、数据库中间件等这些非常重要的数据相关产品,单独列出来,也做了趋势分析。这确实更有助于我们全面了解数据库整个行业。

      在上述相关产品中,《报告》中第一个列出的是CPU,这很好理解。因为数据库本身就是一个很吃算力的软件,因此CPU的能力和使用优化,几乎决定了数据库的效率。而第二个列出的就是存储,可见存储对数据库的重要性可能仅次于其对CPU的依赖。

      其实存储和数据库,长期以来都是一种“伴生”关系,并不是今天才重要起来的。熟悉数据库架构演进历史的同学一定都知道“IOE”,这里面的I指的是IBM,是提供计算能力的,他家的大机在业界赫赫有名;O指的是Oracle,提供的是数据库软件,自不必多介绍;E指的是EMC,提供的就是存储。

      有趣的是,我们现在经常在提去O,寻求Oracle的替代品,但可能并不是所有人都知道,中国的存储厂商,其实在大约10年前就完成了去E,中国的存储行业早已完全摆脱了对EMC产品的依赖。

      但数据库的去O过程,其实并没有第一波吃到存储国产化的红利。其原因在文中有解读,主要是2010年左右,中国的小型机、数据库还是比较受制于国外厂商的,于是从互联网开始的开源数据库+PC服务器+本地盘的架构由于比较简单,就快速流行了起来。

      不过简单的事,有时本身就不简单。就好比减肥,我们都知道要“管住嘴,迈开腿”,道理很简单,可真要像某女星那样短时间内瘦成一道闪电,没有专业的教练指导绝对是不行的。话说用开源数据库+PC服务器+本地盘简单搭建的系统,很快就给客户带来了烦恼。空间占用高,资源利用率低,负载还不平衡,更可怕的是硬盘这种玩意挺娇气的,说坏就坏,撂挑子都不带打招呼的。所以集群规模一大,天天有人撂挑子,连可靠性都成了大问题。

      计算机中所有的二进制其实都是高低电平,所以意外的电磁干扰比如太阳黑子爆发之类的,可能就会造成盘上的数据发生01间的跳变(数据内容发生了变化),如果没有及时被发现和处理,后续都是风险。(太阳:这黑子我有,这黑锅我不背,你那是盘坏了吧……)

      而且大量的数据放在本地盘,对数据进行复制、快速备份难度都很大。专业存储一般都会提供完整专业的方案和工具,而本地盘嘛,只能自己想办法了。《说文解字》中说,“储亦备也,谓蓄物以为备曰储也”。也就是存储的东西得保证以后确实能用得上,才叫存储。所以能理解为啥没把本地盘叫做存储,因为他存是存了,可算不上是储。

      因此,用专业存储来存放数据,形成数据库存算分离的方案,已经在业界形成了共识。正如《报告》中提到的“让专业的人,干专业的事情”。慢盘、坏盘、读写时延、数据分布不均这些问题都可以在专业存储层解决掉,不用DBA操心。

     《报告》中最后还提到,存算分离不是终点,还将走向存算协同。因为专业的人做专业的事,还得需要和业务紧密结合才能做得更好。比如医生就是个专业性很强的职业,然而一个家庭医生他只有对你的身体情况更加了解,才可以更有针对性地提供更好的建议。类似的,专业的存储分出来之后,在性能与高可靠方面,和数据库依然可以通过协同产生更多的创新,让我国数据库可以发挥整体优势。

注:《报告》原文链接:https://www.modb.pro/doc/130680

最后修改时间:2024-10-10 20:02:40
文章转载自火龙呼呼猫,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论