暂无图片
暂无图片
1
暂无图片
暂无图片
暂无图片

浅谈关于openGauss的相关理论

原创 LIN3 2020-12-15
1800

·概述

openGauss是一款开源的关系型数据库管理系统,它具有多核高性能、全链路安全性、智能运维等企业级特性。 openGauss内核早期源自开源数据库PostgreSQL9.2,融合了华为在数据库领域多年的内核经验,在架构、事务、存储引擎、优化器及ARM架构上进行了适配与优化。

现在的数据库市场中,除了老牌的数据库品牌,一些新开发的数据库产品,开源数据库占比很大。并且,华为GaussDB是个融入了AI原生技术的分布式系统,将 AI 能力植入到数据库内核的架构和算法中,为用户提供更高性能、更高可用、更多计算力支持的分布式数据库。

在GaussDB的产品线中,既有事务性数据库,又有分析型数据库,不同的面向对象满足了市面上的大部分数据库使用者的需求。目前已在招商银行等投入使用。
1.jpg

关于GaussDB,有几大亮点值得我们关注。
(1) GaussDB产品可以支持x86、ARM、GPU、NPU等异型架构。可以看出,不仅面向国产服务器市场,华为的目标市场还包括未来5G带来更多的计算应用场景。
(2) GaussDB是业界首个AI-Native(人工智能原生态)数据库,首次将人工智能技术融入分布式数据库的全生命周期,实现自运维、自管理、自调优、故障自诊断和自愈。首创基于深度强化学习的自调优算法,调优性能比业界提升60%以上。
(3) GaussDB可以完成建立在华为IT架构的底层生态之上,包括网络设备、芯片、操作系统、云计算、人工智能等,这些在华为IT体系内部是高度耦合的。这为以后华为市场的发展,形成一个完整的生态体系提供了基础。

·模块

主要包含了openGauss服务器,客户端驱动,OM等模块。

2.png3.jpg

同时,为了保证整个应用数据的安全性,建议将openGauss的典型组网划分为两个独立网络:前端业务网络和数据管理存储网络。

4.png

·性能

关于GaussDB的性能方面,华为社区用如下的一张图简要进行概括。

5.png

具体我们可以关注有以下几个部分。(此处不是重点不做详细介绍,感兴趣的朋友可以自行了解)
(1)数据分区
(2)NUMA化内核数据结构
(3)绑核优化
(4)ARM指令优化
(5)并行恢复
(6)MOT引擎(Beta发布)
(7)安全
(8)易运维

·总结

生态体系 Oracle 的数据库成为全球第一数据库的地位,与上世纪 80 年代开始的全球 IT 生态体系的逐步确立有关。Oracle 数据库世界霸主地位,是随着 Windows 操作系统、Intel X86 芯片一起建立的 PC 时代的 IT 底层生态而逐步确立的。而 AWS 数据库则是适应了互联网时代(云计算时代)新的计算场景对数据库的新需求,再加上自身的云生态体系,逐步迎来的客户使用的推广。从华为 Gauss 数据库来看,华为 IT 架构的底层生态已经逐步建立起来,包括芯片、操作系统、 数据库等,这些在华为 IT 体系内部是高度耦合的。

计算场景 数据库也有其使用的计算场景。IT 发展的不同阶段, 在不同的计算场景、不同的数据类型环境下,对数据库的要求是不同的。需要数据库产品不断根据外界变化,而进行更新升级,甚至自我革新。

产品的优化和升级 所有好用的软件产品都不是短期开发出来的,而是靠时间堆出来的,都是经过无数客户的实用反馈, 反复修改 bug,优化到大部分用户都满意的水平。对于数据库产品更是如此,Oracle 的数据库之所以好用在于其在产品迭代中,不断收到客户的使用反馈,不断地对产品进行相应的修改和更新,这一过程进行了 41 年。对于华为 Gauss 数据库产品也是如此,不过我们现在已经看到,Gauss 数据库已经在跟银行大客户合作,这对于华为而言,是其数据库快速发展的一个重要因素。

–关于本文的相关要点及图片均来源于互联网,仅供学习参考–

最后修改时间:2020-12-15 17:24:24
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论