2020年,曾经盛极一时的Oracle在中国市场仅仅留下了2%的市场份额。根据Gartner 2021年报告,因为云数据库技术的发展,Oracle在数据库持续十年的榜首位置被打破。
与此同时,以阿里云、华为云、腾讯云为首的云数据库厂商,总营收占到中国公有云数据库市场份额的75.5%。以达梦、人大金仓、南大通用、神舟通用为代表的国产数据库,在军工、政务等领域成为主角。
如果把时间表拨回1997年,彼时中国的国产数据库刚刚起步,由于其技术的超高难度,中国的商业数据库长期以来依赖于Orcale这类外国企业。在当时,几乎每家大型企业都需要从Oracle买来大量的数据库软件,尽管价格居高不下,企业怨声载道,却难以找到替代的方案。
从开局一副“烂牌”,到如今在市场立有一席之地,国产数据库是如何实现逆袭的?
失利的开局:Oracle称霸
1989年,Oracle 正式进军中国市场,不久之后就赶上了好时候。
1995 年,国内的邮电部电信总局提出开发和建设市内电话业务计算机综合管理系统,即为“九七工程”,并于同年下发了一系列的技术和业务规范,要求全国县以上的邮电局在 1997 年底前实施。
因为过硬的产品质量,Oracle轻而易举地拿下东三省邮电管理局五期工程的大单,从此成为中国电信行业最大的数据库供应商。
2000年开始,互联网电商飞速发展,Oracle垄断步伐更进一步。网络购物的电商平台时常就能达到几十万人同时在线购买,对于商用数据库的需求是巨大的。在巅峰时期,Oracle占到了市场份额的三分之二之多。
对于一家垄断企业,一个绕不开的话题就是,价格自定。Oracle也不例外,其在中国市场的产品价格十分高昂。
当时购买Oracle的商业软件库需要同时购买IBM生产的小型机、EMC生产的存储硬件,也就是我们俗称的「IOE」。其中一台小型机就要价500万,两台小型机就需配300万的EMC存储。此外企业还要每年交给Oracle 22%的服务费,平时的维护和后期的维修只能交由Oracle公司进行。
在2007年,中国联通就有过一则新闻,如果要将原本落后的系统升级到Oracle的最新版本,联通必须先交纳6000万许可证的罚款。这是何其荒唐,但因为市场的需要,当时的公司大多忍气吞声,公司辛辛苦苦苦赚来的钱,大半都进了Oracle的口袋。
艰难的启航:科研之路道阻且长
面对如此的社会背景,国内自产自用的数据库研发迫在眉睫。
中国早在1863就提出过「863 研究计划」,决心要大力发展数据库。彼时国内的数据库行业一穷二白,别说产业化,找出一个能供给几百人使用一月不出错的数据库都没有。
当时华中科技大学计算机教授冯玉才萌生了自研数据库的想法。
在1984年,华中理工大学仅有一台内存256K的老式计算机。冯玉才带12名研究生24小时连轴使用。可大半年过去,数据库的研究毫无进展,12名研究生相继离开。
正当数据库的研究陷入僵局时候,冯玉才获得一笔广西科委3万元的项目资助,附加一台电脑和两名研究人员。
马不停蹄,冯玉才又向数据库研究发起冲击。不到一年,这个项目又折戟沉沙了,广西的研究人员觉得数据库研究过于困难,要求退出。当时领导也找他谈话,认为他的研究方向存在问题。
1987年年初,事情出现了小小的转机。美国CST公司知道了冯玉才的数据库项目。通过初步的交涉,对方表示可以提供全部研究经费,并且帮助全体研发人员及家属移居美国,数据库系统的署名权也属于冯玉才。美国CST公司仅仅获得所有权。
面对这样巨额的诱惑,冯玉才直接了当地拒绝了:“我用七八年时间坚持做这项研究,就是为了实现中国拥有数据库核心技术的梦想。我最困难的时候是国家资助了我。因此,这个系统必须在中国做出来。”
8年后,在冯玉才团队不懈坚持之下,第一款国产数据管理系统CRDS诞生了。随后,冯玉才带着他的DM2数据库通过国家认证。
然而事实很残酷,这些大学项目产出的商品学术氛围浓郁,但是缺乏对产业端的考量,产品在商业市场的拓展举步维艰,离真正上场应用还差十万八千里。
例如,对彼时的达梦而言,用户手册都需要投入大量财力请人完成,更不用说产品实际落地。
尽管国产数据库开端很努力,但Oracle高墙似乎坚不可摧。直到技术变革,创造了一次无比宝贵的超车时机。
珍贵的转机:开源与云掀起革命浪潮
机会源于开源浪潮。
2000年,工程师们都痴迷于一个问题:数控库软件是否也能开源?
这个问题很快迎来解答,天才程序员Monty Widenius撰写了MySQL开源数据库,一下子吸引了大量的市场和资本的目光。
面对商业数据库动辄上百万的授权费,开源的免费数据库对于企业无疑是久旱逢甘霖。企业纷纷组建自己工程师团队来搭建数据库。到 2021 年,封闭商业数据库的市场份额下降 20-30%。
(图片来源:Shutterstock:)
如果只是这样,传统商业数据库厂商耗费数十年建立的行业壁垒不会轻易打破。真正让这些壁垒沦为马奇诺防线的是社交媒体的发展。
在长达数十年的时间里,为了完善和方便数据库的搭建与运行,这些传统厂商建立了SQL标准。可随着社交媒体、物联网的日益发达,非结构化数据等用例越来越多,而它们通通不适合SQL标准。
“Not Only SQL”(NoSQL)很快被市场所提出,使得众多免费和开源选项变得越来越稳定和强大,很快大多数产品都使用了免费开源的数据库。
与此同时,硬件系统也出现了变革。摩尔定律促使处理器、内存、固态存储和网络吞吐量大幅改进,NoSQL 数据库继续获得异常显着的好处,NoSQL能兼容处理SQL数据并且速度极快,这直接导致了纯SQL数据库边缘化。
Oracle对于新浪潮毫不在意的态度,更进一步为后来者们创造了绝妙的超车时机。当时Orcale高级副总裁及中国区董事总经理李翰璋对媒体表示,“我相信I跟E已经差不多了。因为应用的切换和搬迁不是一天两天的,门槛是很高的。”
他很快被打脸了,云数据库的市场份额越来越高。据Gartner预测,到2023年,全球3/4的数据库都会跑在云上。
阿里无疑是最典型的案例。
2008年,随着淘宝和支付宝的用户数量激增,阿里在数据上遇到了大问题。首先是,Orcale的商业产品难以满足业务水平扩展。一个原先预计使用3年的硬件系统,在第二年就面临要购买高端机型升级的问题。
其次,Orcale的系统反馈完全是黑盒子。系统在某些极端情况下出现异常问题,然而反馈却慢出天际,一个问题翻译成英文发给对方,1个月以后才能收到回复。
于是阿里展开了「去IOE」计划。据阿里中间件技术部专家沈洵回忆,阿里自行研发的架构无法适配相应的系统软件。项目组需要持续在线处理问题,请求的商业支持也迟迟得不到回复。
好在开源数据库给项目组提供了解题思路。凭借MySQL的flashcache卡插件,阿里的自研数据库可以支持相关系统,且效果非常好。至此,阿里成功绕开了传统商业数据库公司的技术壁垒。
2013年5月17日,最后一台小型机下线,Oracle 被完全清除出淘宝核心系统。随后,阿里又开发了云端原生数据库PolarDB,在2018年4月正式商用。
继任者们:分布式数据库带来新转机
在若干年的发展之后,国产数据库终于能在市场上站稳脚跟。根据中国信息通信研究院的数据,2020 年国产数据库厂商的市场份额达 47.4%,几乎与外国厂商分庭抗礼。
随着分布式数据库的兴起,以PingCAP、巨杉为代表的一批国产独立厂商开始立足,深耕于此。
分布式数据库是一种全新的数据库类型,其催生的原因是全球产业的迭代升级导致了NoSQL数据库开始力不从心,无法处理交易类数据及复杂的业务逻辑。
这种新型的数据库可谓是潜力无限。在美国,亚马逊和谷歌就凭借这分布式数据库疯狂蚕食Oracle地盘。而在中国,分布式数据库有着天然的发展土壤。分布式数据库主要的应用场景是金融行业和互联网企业。中国的移动支付行业为世界之最,互联网企业也正是勃勃生机。
PingCAP 研发数据库就聚焦于互联网企业。其研发的最新TiDB式关系型数据库,能够按需扩展和搜索数据库的容量,契合业务快速增长的互联网公司的需求。
在2021年,PingCAP 在世界各地有 9个分支机构,服务1500 多家企业的真实生产场景,客户遍布海内外 20 多个国家和地区。
资本市场对于PingCAP也极其看好,2021年7月前,PingCAP 就完成了3.4 亿美元的 5 轮融资,11 月完成的 2.7 亿美元的 D 轮融资,创下当时中国数据库软件领域融资新纪录。
巨杉是另一家明星企业。其主要为金融业提供数据库产品,是国内最早进行商业化布局的分布式数据库。
目前,巨杉数据库已在超过 100 家大型银行及金融机构应用。其中民生银行的生产环境集群包含超过160台物理服务器,三副本数据量达 2460TB,基于巨杉数据库实现的非结构化数据管理平台已接入的各类系统达到100 套。
同时,巨杉数据库坚持打造数据库生态。在研发的6年间,相应的测试方案高达12000多个,机房的测试服务器从来没有停过。
分布式数据库,正给一批第三方数据库厂商们创造新一轮抢占市场的机会。
结语
从一穷二白起步,历经40年,国内数据库行业已经拥有了丰富的产业的生态。
据中国信通院统计分析,截止 2021 年 6 月,我国数据库产品共有 135 款。平均每个国内数据库厂商都有超过50件专利。
在 Gartner 公布的全球数据库最新排名中,阿里在云数据库领域排名全球前三。在阿里之后,中国数据库产业又拥有巨杉、PingCAP、涛思数据、欧若数网等一众第三方独立厂商。
那个掐在中国数据库的咽喉鱼刺已经被拔去。随着新兴数据库模式来临,国产数据库正在抢占下一个增长时机。




