数据库的历史最早可追溯到1973年,加利福尼亚大学伯克利分校和IBM可谓数据库领域的布道者,而数据库真正走入人们的视野时是集中在了上个世纪的80年代,耳熟能详的Oracle、PostgreSQL都是在那个时候兴起,是元老级的数据库巨作。

1973年
1973年,可以称作数据库元年,在这一年IBM研究中心启动System R项目,这是最初的数据库原型项目。同年加利福尼亚大学伯克利分校的Michael Stonebraker和Eugene Wong利用System R已发布的信息开始开发数据库系统Ingres,注意这是时候的数据库是非关系型数据库。
20世纪80年代
整个80年代,才陆陆续续的出现了我们现今听说过的数据库,为关系型数据库奠定了坚实基础。
1981年
E.F.Codd发明关系数据库模型,并获得ACM图灵奖。
IBM以System R为原型,开始研发SQL/DS(Structured Query Language Data System),是具备关系型数据库的能力。
1983年
在这一年Larry Ellison 的Oracle数据库以及IBM的DB2问世,以往我们在说某一款数据库的历史时,都会从他的公司成立开始,其实这不太准确,往往这些资料也历史久远,所以以问世时间来说会更容易被大众接受。不过我们也不用太纠结,谁都想成为最历史悠久的数据库,但我们仍然要按照历史顺序来看待这件事。
这一年问世的Oracle及DB2仍然是当代最流行的商业数据库,我们在DB ENGINE上仍然能够看到他们名列前茅的排行。
1984年
美国DEC(Digital Equipment Corporation)公司,在这一年发布了Rdb/vms关系型数据库,这款数据库在当年是可以跟Oracle竞争的,性能上不如Oracle,但在价格和中文支持上比Oracle好,所以早年间在国内还是挺受欢迎的,在1994年,被Oracle收购,改名为Rdb/openvms,目前这款数据库仍然挂在Oracle的官方网站上。
Informix也算是耳熟能详了,属伯克利系,具体渊源网上没有找到,其命运挺坎坷的,数据库是在1984年问世,算是一款出色的数据库,在2001年被IBM收购后,成了半死不活的状态了。
还有一款数据库Nonstop SQL,也是在这一年问世,属伯克利系,不在大众视野,但也属名门,现在是惠普旗下NONSTOP产品,已作为惠普云战略数据库。
1985年
这是Postgres诞生的一年,本文没有表Ingres,这两个都是Michael Stonebraker的项目,Postgres并不单单是Post-Ingres,而是重新的项目,属于关系型数据库,1989年发布v1版本并进行商业化,成立了ILLUSTRA公司,短短五年多的时间就终止了项目,在1995年时被Informix公司收购。
1987年
Ingres的主程序员 Robert Epstein 创建了 Sybase。
20世纪90年代
这一时期,数据库已进入了相对成熟期,同时也新兴了一些优秀的数据库产品。
1993年
在1992年微软和Sybase公司关于数据库进行合作,1993年合作结束后,微软将产品带了出来,命名为“MS SQL”,也就是后来的“SQL Server”。在1995年Sybase公司发布Sybase ASE数据库产品。
1995年
MySQL AB公司成立,也是MySQL面世的一年,MySQL作为“世界上最流行的数据库”,也经历了辗转变卖,在2008年初被SUN公司收购,紧接着2009年SUN公司又被Oracle公司收购。在当年收购时引起了很大轰动,因MySQL在当时已经被各大互联网大量使用,而对Oracle这样的商业公司,能否继续秉持开源理念都持怀疑态度。从现在往前看,我们还是发现Oracle在开源上还是有诚意的,MySQL的各个方面也有了显著提升。
1996年
PostgreSQL在这一年正式正名,真正意义的PostgreSQL元年应该从1994年开始,那时候由两名香港的伯克利学生在Postgres中增加了SQL,并发布到了互联网上。
现代关系型数据库
现今的数据库种类五花八门,真可谓百花齐放、百家争鸣的时期,国外在的DB Engine网站上,所记录的关系型数据库有147种之多,总的数据库种类更有383总,这还没有算上我们国内的数据库,据统计,也有190多种国产数据库。
对于国内数据库,基本上都属于从1开始的数据库,很难找到能从0开始的数据库,在几年前我也在这方面做过溯源,最后几乎都可以归为Oracle、MySQL、PostgreSQL、Informix几类。因此现在关系型数据库仍然都存在着《关系型数据库溯源图》中数据库的身影。
DB Engine是一个很好的途径看到数据库流行趋势,因此我们拿TOP9的关系型数据库为例。榜首仍然被Oracle、Microsoft、IBM等传统数据库厂商所霸占。而对于我们国内的形势来说,国产化进程不断发展,去国外大厂数据库的趋势也越来越强,尤其是金融行业,对数据库的要求较高,很长一段时间都不太可能被真正的国产化替换。

下面是对以上的DB-Engines Ranking做了进一步梳理,区分商业和开源,以及应用场景,在国内流行度以及未来发展的评估。

从目前国内情形来看,在集中式关系型数据库方面,我们很难赶上国外大型商业及开源数据库,这从几家国内老资格知名数据库厂商在国内的市场份额以及一些第三方评测结果就可以看出,差别是不小的。
因此在海量数据爆发的今天,分布式技术的出现,使分布式数据库的发展就像在新能源汽车一样,可以实现弯道超车。而现在主流的分布式数据库除了Google spanner/F1,还有一部分是基于PXC发展而来的,这部分数据库底层仍然采用传统数据库作为存储引擎,以MySQL/PostgreSQL居多。从20世纪70年代发展到现今,开源数据库越来越得到广泛认可和使用,而MySQL/PostgreSQL二者更是这广泛使用的代表者,也是最专业最流行的两大数据库阵营。未来去国外大厂数据库的数据库的重任,也将会落到这些代表者和分支上。




