暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

再也不说甲骨文“真香”了

杭派工程师 2021-05-20
547


撰文| 太浪
编辑| 猛哥
图源| 网络



 
新旧交替来得总是这么突然。
 
如果有人问,这几十年哪家科技公司最稳定?估计很多人会给出这个答案:甲骨文。
 
1977年创立,1986年上市,一家专注数据库领域却成为全球最大的企业级软件公司,在数据库领域占据全球一半以上份额,多次碰触反垄断红线,没经历过苹果般的低谷,也没有过谷歌般的巅峰,创始人身家却一度直逼比尔·盖茨,整体市值超过2000亿美元。
 
这就是拉里·埃里森和他的数据库帝国Oracle(中文名“甲骨文”)。
 
在2005年前后,国内一位甲骨文认证的DBA(数据库管理员)的平均年薪就高达50万元,可想而知甲骨文当年有多辉煌。
 
但是,风水轮流转,这一次,甲骨文很难再香下去了。
 


01 大厦将倾,云厂商的奇袭
 

变革发生在埃里森最看不起的技术——“云计算”身上。
 
数据库系统,成型于上个世纪80年代,是计算机领域三大基础软件系统之一。早期的数据库以关系型为主,甲骨文也是在关系型数据库上大杀四方,取得了巨大的商业成功。
 
后来,90年代末,数据类型的增加和数据分析需求的产生,涌现了一批分析型数据库系统。2000年前后,大数据开始进入人们视野,数据分析的价值逐渐被发现,谷歌发表了耳熟能详的分布式文件系统、分布式表格存储、MapReduce三大论文,奠定了今天大数据整个技术生态圈的基石。
 
而2010年开始兴起的云计算浪潮,真正对数据库系统产生了非常大的影响。
 
要知道Oracle大多采用本地部署,需要和IBM小型机和EMC存储设备搭配使用。一台小型机500万,两台小型机要配一个300万的EMC存储设备。除了硬件贵、软件贵,维护的开支也相当庞大。2007年,业界曾爆出一条新闻:联通如果要升级到新版本的数据库产品,必须先交纳6000万Licence费用。
 
 
全球大型电商在起步时期都离不开Oracle,亚马逊、阿里巴巴分别是甲骨文全球、亚洲最大的客户,巨额的费用压得这些大企业都有些喘不过气。于是,他们开始纷纷寻求新的解决方案。
 
第一个吃螃蟹的是雅虎,率先使用开源数据库MySQL替换了Oracle。接着,很多互联网公司纷纷效仿,开启了自己的MySQL之路,让MySQL几乎成为互联网场景的标配。
 
开源数据库虽然便宜,但稳定性与安全性不足。
 
这时云计算出现了。云的资源租赁模式不仅能够大幅降低IT部署成本,其资源弹性、统一安全、免运维等特性也让开源数据库有了稳定依赖的环境。一时间,MySQL、MariaDB、MangoDB成为云平台上最流行的软件之一。
 
与此同时,为了更深层次替换掉Oracle,亚马逊和阿里巴巴也开始研发自己的数据库产品。
 
Aurora是亚马逊为云计算而专门定制的一款关系型数据库,优势是最小化网络IO,提升系统的可扩展性与可用性,其最高性能可达到MySQL的5倍。Aurora一经推出就受到了广泛关注,收获了超过8万客户的青睐。
 
而在云数据库的布道上,亚马逊也不遗余力。AWS前老大、亚马逊现任CEO Andy Jassy曾在多个不同场合下炮轰甲骨文的Oracle是令人厌倦的老旧数据库。
 
埃里森气不过,也反击称AWS想摆脱甲骨文想了十年,但依旧在使用Oracle,“看来他们自己的数据库产品和技术也不咋样”。
 
 
为了更彻底贯彻云计算战略,2019年,亚马逊将自家7500个Oracle数据库迁移到了AWS的云数据库上,降低了近60%的成本,to C业务的延迟缩短了40%。
 
无独有偶。大洋彼岸的阿里云也推出了自研的分布式数据库PolarDB,采用计算存储分离的云原生架构设计,天然具备云上的灵活扩展性,并且可以按需付费;性能是Aurora的2倍;成本只有商业数据库的1/10左右,性价比高。一经推出就俘获了不少中小企业和互联网客户的心。
 
当云数据库出现后,微软、谷歌等厂商都纷纷革新自己的数据库技术,寄希望于通过“云”的方式击败甲骨文。“云计算简直是一派胡言。”埃里森在采访中曾多次对这一新技术不屑一顾。但私下里,甲骨文却一口气收购了15家覆盖云各环节的创新公司。
 
一步慢,步步慢,甲骨文还是为它的傲慢付出了代价。在权威资讯机构Gartner最近公布的2011-2021数据库管理系统全球市场格局报告里,更早向云战略转型的微软首次超越甲骨文登顶,同时,前十名中出现了4家云计算厂商,以谷歌云、阿里云为代表的新势力表现亮眼,分列第6位和第7位,不断缩小与甲骨文、IBM之间的差距。
 
Gartner数据还显示,大多数数据库收入增长都发生在云上,本地增长正逐步萎缩。根据预测,云数据库的市场份额有望在2021年占比达到50%,2023年世界上则会有约75%的数据库跑在云端。
 
简而言之,云数据库爆发了。埃里森和他的甲骨文帝国动摇了。
 
 


02 国产数据库的艰难追赶
 

很长一段时间里,全球数据库的榜单里是没有国产厂商的。直到2014年,阿里云才第一次进入Gartner的全球数据库排名里,当时位列第26位。
 
过来人恐怕都会感叹一句,这几十年的追赶不易。
 
究其原因,其一是因为数据库发端于美国,国内起步较晚。
 
早在1961年,通用公司就推出了第一个数据库系统DBMS。70年代冷战期间,“阿波罗计划”极大推动了数据库的发展,接着,美国迎来IT发展的黄金时代,微软、甲骨文相继成立……
 
反观国内,我国的计算机事业刚经历了中苏关系破裂、计算机研发体系被迫停滞,直到1982年,《数据库系统概论》才首次出现在国内教材上;90年代初,才有了真正意义上的商用数据库。光是起步,国产数据库就晚了近30年。
 
 
其二是数据库技术难度高,甚于操作系统。
 
如果从头开始设计一款数据库,要从最底层的模块开始,SQL引擎、数据库对象、存储引擎、事务管理、缓冲区设计、内存设计、锁管理,每一个的难度都非常之大;要把这些模块整合起来成为一个完备的数据库系统,是难上加难。
 
新型厂商如果想要从头做一套新的数据库,看起来很难实现。
 
彼时,在人才、技术等急缺的窘境之下,我们更多的是通过引进国外先进的数据库来弥补国产技术的空白点。
 
1998年,Oracle进军中国市场,并在1997年顺利地拿下东三省邮电管理局5期工程的大单;1992年,IBM进军中国市场,带来了DB2 和Informix ;1992年,微软在北京设立办事处……
 
但我国自主的数据库研发也没闲着。
 
2000年前后,在一系列政策、扶持基金的支持下,第一批国产数据库厂商出炉——人大金仓KingbaseES系统、武汉达梦数据库、申通数据库系统、东软openBASE系统、南大GBase系统。它们都是国家“863”研究计划、“核高基”重大科研专项、以及“973”研究计划的产物,都以做出追赶甲骨文的Oracle数据库为目标。
 
但结果却是,Oracle和DB2承包了高可用系统和关键业务。跳出银行业,Oracle更是横扫市场所有产品。
 
国内知名数据库推广者盖国强曾撰文分析,这是因为国产数据库的研发思路出了问题。
 
他认为,Oracle的数据库软件,功能极为丰富,支持的语句非常全面。一个国产的小厂商,要模仿Oracle开发一个数据库系统,并与Oracle全兼容,就好比乞丐与龙王比阔,道路艰辛且难以成功。
 
国产自主研发的数据库败在仅仅追求大而全,而技术创新不足、没有特点,产品的稳定性一直上不去,也不敢做有挑战性的性能测试。所以,稳定性、性能都无法让市场信服。最后导致稍微重要一点的系统根本没人敢用。
 
2007年后,一些国内的数据库公司意识到数据库软件应该跟随数据管理市场的发展。而数据分析(OLAP)被认为是具有发展潜力的。而且,数据仓库类的平台,对可靠性、时效性要求比较低,更适合于国产软件进行率先突破。
 
因此,神州通用、南大通用等公司一度在分布式并行处理和列式存储数据库方面做新的投入。
 
 
与此同时,从2015年开始,华胜天成、南大通用(Gbase8t)和星瑞格等公司又将国产数据库的希望寄托于引进IBM Informix源代码。
 
然而,这是一个发展迅速且技术路线存在争议的领域。其一,在技术发展日新月异的年代,经过10多年的搁置,Informix的代码、产品和创新已经算不得先进。其二,依靠代码的引进的另一个风险就是二次落后。
 
2017年5月,IBM把整个Informix业务卖给了印度公司HCL,后者全面接管IBM Informix,此事彻底断绝了Informix成为国产数据库的希望。
 
这条路走不通了。
 
从技术上来讲,如果把传统数据库作为目标,确实很难实现超越。
 
唯有当环境和产业发生拐点和变化时,国产数据库才可能迎来弯道超车的机会。
 


03 转机出现:进击的云计算

 
云计算的出现,让国产数据库拥有了比肩国外数据库的能力,给了中国数据库突破数据库格局的机会。
 
传统上,数据库以单机软件的方式安装在服务器上,版本升级难,容量从安装的那一刻起就固定了,想扩容就得再配置一套硬件,效率非常低下,很难满足高速增长的业务需求。
 
而随着云计算的出现,数据库成为了云计算平台上的核心服务之一,计算、存储、数据库等资源完全可以按需配置,非常富有弹性,并且成本也非常低。
 
云计算作为一种全新的科技服务,对数据库的研发、使用、销售等方方面面带来了彻底的变革,也让全球的厂商在数据库的赛道上站在了同一起跑线上,这一次,中国厂商并没有落后。
 
就在局面被甲骨文们牢牢掌控的时候,市场上出现了一批新面孔:阿里云的PolarDB、AnalyticDB,腾讯云的TDSQL,华为云的GaussDB,达梦启云数据库DMCDB,巨杉的SequoiaDB,PingCAP的TiDB,蚂蚁金服的OceanBase……
 
 
这个故事得从“去O”说起。
 
2008年左右,阿里巴巴业务猛增,IT开销成本激增,一度成为IBM、Oracle中国的标杆客户。淘宝、支付宝98%以上的软件系统和业务都是采用Oracle提供数据服务。
 
即使是全球规模最大的数据库集群之一了,还是无法满足淘宝的快速增长,每天早上CPU的使用率都高达98%,几千万买的Oracle换来的竟然是“卡死”。
 
工程师们只能自己想办法,第一招是基于开源的MySQL对淘宝商品库进行改造,在改造过程中,这群工程师居然“捣鼓”出了分布式数据库AliSQL,不仅能满足业务需求,成本还更低。一年后,淘宝系统果断从Oracle切到AliSQL上。2013年,淘宝最后一个Oracle数据库下线。不到 5年时间,阿里就自己在核心系统领域完成了“去O”,堪称奇迹。
 
 
“既然Oracle满足不了我,那我就自己干。”正是这种不服就干的精神,带动了一大批科技公司转向数据库自研。
 
到了2017年,阿里云率先推出了自研的云原生关系型数据库PolarDB。之后,腾讯、华为也陆续推出自研的数据库产品。
 
一时间,国产数据库千帆竞发。
 
作为领头羊的阿里云,不仅吃下了国内云数据库近一半的份额,还入选Gartner全球数据库领导者象限,这个群里可都是高端玩家,老牌的有甲骨文、微软、IBM、SAP、Teradata,新生代有AWS、谷歌,然后就是阿里云了。
 
目前已有超过40万个数据库迁移到阿里云上,用户遍布全球,涵盖金融、电信、制造、物流等领域的龙头企业,如中石化、中国联通、上汽大众、天弘基金及三星等。
 
阿里云数据库负责人李飞飞曾表示,传统线下数据库是“马车”,云原生数据库是“汽车”,传统数据库会像马车一样被淘汰。
 
另一方面,互联网科技公司不断将AI处理能力融入云产品中,数据分析处理方面能为客户提供更多的价值,所以客户用脚投票,把这些云厂商给顶了上去。
 
 
其他国产数据库近两年也都在向云端转型中。
 
腾讯云整合原有的数据库产品转型为“分布式数据库TDSQL”,华为云推出分布式数据库GaussDB。
 
云数据库超越传统数据库已成定局,未来就是云数据库的天下。
 
这是Oracle历史上第一次丢掉数据库NO.1第一的宝座。
 
云计算的真香警告,你收到了么?
 
参考资料:
1、《中国数据库往事:国产数据库崛起》,冯斯基
2、《国产数据库发展现状分析》,德昂信息
3、《中国跨过数据库这座大山了吗?》
4、《数据库行业专题:数据库有望实现国产化全面性替代》





本文由杭派工程师原创出品
欢迎免费转载
后台发送公众号名称即可开白



文章转载自杭派工程师,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论