暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据管理简史:数据库发展史(1)

玉工讲技术 2021-02-10
847

时代造就英雄,信息化时代造也就了数据库江湖的英雄。仅仅懂得概念和原理(concepts)跟技术实现(implementation)完全两个层面的事情,我们应该时刻记住“纸上得来终觉浅,绝知此事要躬行”。就像汽油发动机原理,我们在初中阶段就学过,但到目前为止还不会修理自己车出现小故障。这就是知识和技术的区别,技术除了原理和实现,还需要攻克材料及制造工艺等诸多因素。

在计算机的软件世界,材料或制作工艺这个门槛几乎比硬件有所降低(仅从制造工艺角度),但软件产品也有缺点,即可复制性或盗版。好不容易开发出来,市场出现盗版满天飞现象,人们知识产权意识和对数字产品价值的认可度有待提高。

接着上一篇数据库系统的诞生,继续我们的技术故事。回顾当初,一开始也没有现成的数据库模型,当时常用数据库模型为网状模型和层次模型,还没出现我们现在市面大量使用的关系模型。

1  分类建模数据库

将现实世界用数字世界描述并实现,需要将现实的数据需要分类和建模。因此,怎样将现实世界的数据,在计算机世界里有效存储、存取及并发控制问题,在数据库系统刚诞生阶段也算是很有难度的问题。就像如下图1所示的垃圾分类存储一样,之前只有一个桶,随便扔进去即可。但为了提供资源回收率,现在需要为垃圾也进行了分类并建模。
1  垃圾分类及模型
无论在人类世界还是计算机世界,分类重要性不言而喻。因为当前流行的机器学习的本质也算是一个分类的过程。在机器学习框架里,数据分为字符类数据(非连续)和数值类数据(连续),字符类数据的分类还是叫分类( classification )而数值类数据的分类叫做回归( regression )。除此之外,还有另一种分类叫做聚类( clustering ,这些内容在此不再展开说明,感兴趣的朋友可以阅读玉工曾经写过的博文python入门总结(数据分析方向)”,地址:http://blog.itpub.net/18841027/viewspace-2655682/ 。同样,数据存储也需要有效分类,并为此需要建模型。

数据模型是数据库系统的核心和基础。数据库技术依据数据模型的进展可分为三个发展阶段:第一代的网状、层次数据库系统;第二代的关系数据库系统;第三代的新一代的数据库阶段。
第一阶段,20世纪60年代中期以来,数据库技术的形成、发展和日趋成熟,使计算机数据处理技术跃上了一个新台阶,CharlesWBachman(查尔斯·巴赫曼)主持设计与开发了最早的网状数据库管理系统IDSIDS1964年推出后,成为最受欢迎的数据库产品之一。1969IBM公司研制了层次模型数据库管理系统IMSInformationManagement System)。在1973年8月28日在亚特兰大举行的ACM年会上,巴赫曼获得了图灵奖。

2  CharlesWBachman(查尔斯·巴赫曼)


2  关系型数据库

第二阶段从1970年开始,IBM公司的研究员提出了数据库的关系模型,开创了数据库关系方法和关系数据理论的研究,为关系数据库技术奠定了理论基础。这里不得不提出一个关系型数据库江湖的大英雄Edgar  F. Codd(埃德加·考特)

3 Edgar F.Codd(埃德加·考特)

Edgar Frank Codd19232003)是Michigan大学哲学博士,IBM公司研究员,被誉为“关系数据库之父”,并因为在数据库管理系统的理论和实践方面的杰出贡献于1981年获图灵奖。
1976IBMCodd发表了一篇里程碑的论文“R系统:数据库关系理论”,介绍了关系数据库理论和查询语言SQL。随后,Oracle的创始人LarryEllison非常仔细地阅读了这篇文章,敏锐意识到在这个研究基础上可以开发商用软件系统。因此,巴菲特的如图4所说的一句也是挺有道理的。

4  股神巴菲特


Oracle软件帝国的诞生

19776Larry EllisonBob MinerEdward Oates合伙出资2 000美元成立了软件发展实验室(Software Development LaboratoriesSDL)。后来将公司名称改为Oracle,几个月后Ellison他们就开发了Oracle 1.0

 

5  Oracle早期员工(右一是创始人Larry  Ellison

Larry Ellison是美国犹太人,俄罗斯移民,1944年出生在曼哈顿。Larry一向怀疑所谓“传统的智慧”,不相信权威的观点,特别是那些人云亦云的权威。对他来说,事情必须合理才行。正是这种思考方式在企业经营上非常有价值。他始终相信较早占领大块市场份额是最主要的(这个算不算互联网思维呢?)。
直到1983年,Oracle 3推出,质量才得以提升。该版本用C语言编写,便于移植,也受到用户的好评。
Oracle公司连续12 年销售额每年翻一番,到2013年成为世界上第二大软件公司。正像一位硅谷资深人士评论的那样:拥有普通技术和一流市场能力的公司总是能打败拥有一流技术而只有普通市场能力的公司。说起实话,Oracle公司十分重视技术和质量,这使得Oracle数据库成为当之无愧的行业老大。英文单词oracle本意是“神谕”、“圣贤”,引申含义为“智慧的源泉”,翻译为“甲骨文”意境全无!
这里玉工似乎明白了为什么多数公司大老板是从业务或财务出身,而不是技术出身的道理。技术和质量当然很重要,但是作为工程师,培养一定商业思维和团队管理及开发能力也很重要。该历史教会我们的另一个教训是,也有必要抽空看一些自己专业领域科研论文等创新方式方法,也要提升C语言等基础编程能力,不能满脑子活在配置管理、技术技巧、快速熟练等方面“挥霍”时间。


本文未完,待续...


参考资料

王伟,《计算机科学前沿技术》,清华大学出版社,2012.

https://www.modb.pro/db/44235?xzs=

https://baike.baidu.com/item/%E6%9F%A5%E5%B0%94%E6%96%AF%C2%B7%E5%B7%B4%E8%B5%AB%E6%9B%BC


文章转载自玉工讲技术,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论