暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

[转载]国产数据库出现的背景: 改革开放带来的技术

1956年,周恩来总理亲自领导了《科学技术发展十二年规划》,标志着我国计算机事业的开始[插图]。而那时,几乎没有人知道计算技术是怎么回事,不知道磁芯存储器,不知道集成电路,甚至没有人见过一台真正的数字计算机。在苏联的帮助下,我国相继研制出了第一台小型机——103计算机和第一台大型机——104计算机。之后,我国又陆续研制成功107计算机、119计算机、111计算机、150计算机、757计算机等[插图]。这些计算机遵从苏联的体系,在20世纪50年代末中苏关系破裂时,这些研究工作几乎都停滞了。
本质上,计算机是一种用于处理数据的机器,架构在计算机之上的数据管理技术具体是指人们对数据进行收集、组织、存储、加工、传播和利用的一系列活动的总和,其经历了人工管理、文件管理、数据库管理3个阶段。每个阶段的发展以数据存储冗余不断减小、数据独立性不断增强、数据操作更加方便和简单为标志,各有各的特点。

人工管理阶段

在计算机出现之前,人们运用常规的手段记录、存储、加工数据。也就是说,利用纸张来记录,利用计算工具(算盘、计算尺)来计算,并主要通过人类的大脑来管理和利用这些数据。
20世纪50年代中期,计算机主要用于科学计算。当时没有磁盘等直接存取设备,只有纸带、卡片、磁带等外部存储设备,也没有操作系统和管理数据的专门软件。数据处理的方式是批处理。这个阶段数据依靠程序员人工管理,其特点如下。
(1)数据不保存。因为当时计算机主要用于科学计算,对于数据保存的需求尚不迫切。
(2)系统没有专用的软件对数据进行管理,每个应用程序都要包括数据的存储结构、存取方法和输入方法等。程序员在编写应用程序时,还需要安排数据的物理存储,因此程序员的负担很重。
(3)数据不共享。数据是面向程序的,一组数据只能对应一个程序。
(4)数据不具有独立性。应用程序依赖数据,如果数据的类型、格式或输入/输出方式等逻辑结构或存储的物理结构发生变化,则必须对应用程序做出相应的修改。

文件系统管理阶段

20世纪50年代后期至60年代中期,随着计算机硬件和软件的发展,磁盘、磁鼓等直接存取设备开始普及,这个时期的数据处理方式是把计算机中的数据组织成相互独立、单独命名的数据文件,通过文件系统,按文件名称来访问数据,对文件中的记录进行存取。文件系统中的数据长期保存在计算机外部存储设备上,可以进行反复处理,并支持查询、修改、插入和删除等操作。文件系统实现了文件中记录的结构化,但是从文件整体来看是无结构的。文件系统中的数据面向特定的应用程序,因此数据共享性和独立性差、冗余度大,对数据进行管理和维护的代价也很大。

数据库系统管理阶段

在数据库诞生之前,数据管理非常简单。通过大量的分类、比较,以及利用表格处理机器运行的数百万张穿孔卡片,其运行结果在纸上打印出来或制成新的穿孔卡片。数据管理就是对所有这些穿孔卡片进行物理存储和处理。
20世纪60年代后期以来,计算机性能得到进一步提高,更重要的是出现了大容量磁盘,其存储容量更大且价格更低。在此基础上,文件系统管理数据时的不足才有可能被克服,从而满足在实际应用中多个用户、多个应用程序共享数据的要求,使数据可以尽可能多地为不同应用程序服务,随之出现了数据库这种数据管理技术。数据库的特点是数据不再针对某个特定的应用程序,而是面向全组织,具有整体的结构性,共享性较高,冗余度较小,并且实现了程序与数据之间一定的独立性,可以对数据进行统一的控制。数据库系统管理的特点如下。
(1)数据结构化。在描述数据时不仅要描述数据本身,还要描述数据之间的联系。数据结构化是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。
(2)数据共享性较高、冗余度较小且易扩充。数据不再针对某个应用,而是面向整个系统,数据可以被多个用户和多个应用共享使用,而且容易增加新的应用。
(3)数据独立性高。
(4)数据由数据库系统统一管理和控制。数据库被多个用户和应用程序所共享,对数据的存取往往是并发的,即多个用户可以同时存取数据库中的数据,甚至可以同时存取数据库中的同一个数据。为了确保数据库中数据的正确性、有效性,以及保障数据库系统有效运行,数据库管理系统提供了4个方面的数据控制功能。
● 数据安全性控制:防止因不合法使用数据而造成数据的泄露和破坏,保证数据的安全性和机密性。
● 数据完整性控制:数据库系统通过设置一些完整性规则,确保数据的正确性、有效性和相容性。
● 并发控制:多用户在同时存取或修改数据库中的数据时,防止相互干扰而给用户提供不正确的数据,避免数据库受到破坏。
● 数据恢复:当数据库被破坏或者数据不可靠时,数据库系统有能力将数据库从错误状态恢复到最近的某个正确状态的时间点。
1960年,美国通用电气公司(General Electric Company,GE)的查尔斯 · 巴赫曼(Charles William Bachman,1973年获图灵奖)成功开发出世界上第一个网状数据库管理系统,也是世界上第一个数据库管理系统——集成数据存储(Integrated Data Store,IDS),奠定了网状数据库系统的基础。
1968年,IBM研发的新型数据库IMS(Information Management System),是一种适合其主机的层次数据库,也是IBM研制的最早的大型数据库系统程序产品。
1970年,IBM的研究员埃德加 · 科德(Edgar F.Codd)博士在Communication of the ACM上发表了一篇名称为“A Relational Model of Data for Large Shared Data Banks”的论文,提出了关系模型的概念,奠定了关系模型的理论基础。
关系模型建立之后,IBM在San Jose实验室增加了更多的研究人员研究这个项目,这个项目就是著名的System R。这个项目的目标是论证一个全功能关系数据库管理系统的可行性。该项目于1979年结束,建立了第一个实现SQL的数据库管理系统。然而IBM对IMS的承诺阻止了System R的投产,一直到1980年System R才作为一个数据库系统产品正式推向市场。
此后,虽然关系型数据库基本理论已经成熟,但各大公司在关系型数据库管理系统的实现和产品开发中还是遇到了一系列问题。James Gray在这期间解决了一些重大的问题,使关系型数据库研究原型转化为商业产品。
1973年,加利福尼亚大学伯克利分校的Michael Stonebraker和Eugene Wong利用System R已发布的信息开始开发自己的关系型数据库系统Ingres。他们开发的Ingres最后由Oracle公司、Ingres公司及硅谷的其他厂商商品化。
1979年,Oracle公司引入了第一个商用SQL关系型数据库管理系统。
1983年,IBM推出了DB2数据库产品。
1985年,为Procter&Gamble系统设计的第一个商务智能系统产生。
1987年,Sybase(赛贝斯)公司发布了Sybase SQL Server系统,用于UNIX操作系统。
也就是说,从20世纪80年代开始,数据库系统就进入了关系型数据库时代。数据库系统经历了网状数据库系统、层次数据库系统和关系型数据库系统3个时代,我们现在接触到的基本上都是关系型数据库系统,其中Microsoft SQL Server、MySQL、Oracle、DB2等都是关系型数据库。
1991年,W.H.Bill Inmon发表了《构建数据仓库》。
随着互联网Web 2.0的兴起,传统的关系型数据库在应付Web 2.0,特别是超大规模、高并发的SNS类型的Web 2.0纯动态网站时,已经显得力不从心,暴露出很多难以克服的问题,而非关系型数据库则由于其本身的特点得到了非常迅速的发展。但是,非关系型数据库并未形成一定的标准,各种产品层出不穷、内部混乱,各种项目成果是否可用还需要时间来检验。
数据库从诞生到蓬勃发展再到成熟只有半个世纪左右,但已形成坚实的理论基础、成熟的商业产品和广泛的应用领域,吸引了越来越多的研究者加入。数据库的诞生和发展给计算机信息管理带来了一场巨大的革命。几十年来,国内外已经开发建设了成千上万个数据库,数据库已成为企业、政府部门乃至个人日常工作、生产和生活的基础设施。同时,随着数据库的应用逐渐扩展与深入,数据库的数量和规模越来越大,数据库的研究领域也已经大大地拓展和深化了。

内容来自《中国方案:中国数据库追梦之路》

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论