为了让更多的数据库技术爱好者、从业人员,能够更深入地了解 openGauss、备考 OGCA,由 openGauss 社区、Gauss 松鼠会、云和恩墨联合主办的 “8小时玩转 openGauss 训练营” 主题活动迎来第三期。
虽然之前也参加过训练营活动,由于官网近期发布了openGauss_3.0.0版本,猜想训练营活动可能会有针对新特性的讲解,顺便对openGuass的知识点再进行巩固加深,但我不得不说,这一次的结营考试还是有一定难度,不仔细听讲和复习是不太容易顺利通过的。
openGauss产品简介
openGauss 是一款全面友好开放,携手伙伴共同打造的企业级开源关系型数据库。openGauss采用木兰宽松许可证v2发行,提供面向多核架构的极致性能、全链路的业务、数据安全、基于AI的调优和高效运维的能力。openGauss内核源自PostgreSQL,深度融合华为在数据库领域多年的研发经验,结合企业级场景需求,持续构建竞争力特性。同时,openGauss也是一个开源、免费的数据库平台,鼓励社区贡献、合作。
两天8小时的课程内容主要包含了openGauss概述、HA集群部署、集群管理组件、WDR性能调优、AI特性、安全、openGuass和PostgreSQL部分特性对比、如何正确连接openGuass、扩缩容和升级、开发运维归档和日常使用、社区介绍几个方面,老师们通过多个不同维度对OpenGauss进行了讲解。
openGauss具有数据库具有高性能、高可用、高安全、易运维、全开放的特点

同时也了解到了openGauss与pg架构的不同之处

重要知识点
行存储和列存储
openGauss支持行存储和列存储两种存储模型,用户可以根据具体的使用场景,建表时选择行存储还是列存储表。
openGauss行存储引擎采用原地更新(in-place update)设计,支持 MVCC(Multi- Version Concurrency Control,多版本并发控制),同时支持本地存储和存储与计算分离的部署方式。行存储引擎的特点是支持高并发读写,时延小,适合 OLTP交易类业务场景。
行存储引擎的关键技术有:
- 基于事务ID以及ctid(行号)的多版本管理。
- 基于 CSN(CommitSequenceNumber,待提交事务的序列号,它是一个64位递增无符号数)的多版本可见性判断以及 MVCC机制。页面,在数据页面中存放元组以及元组的历史版本并集中管理,使用Vacuum(垃圾清理)线程进行定期的空间回收。
- 基于大内存设计的缓冲区管理。
- 平滑无性能波动的增量检查点(checkpoint)。
- 基于并行回放的快速故障实例恢复。
列存储引擎的存储基本单位是 CU(Compression Unit,压缩单元),即表中一列的一部分数据组成的压缩数据块。行存储引擎中是以行作为单位来管理,而当使用列存储时,整个表整体按照不同列划分为若干个 CU
列存储有以下优势:
- 列的数据特征比较相似,适合压缩,压缩比很高,在数据量较大(如数据仓库) 场景下会节省大量磁盘空间,同时也会提高单位作业下的IO 效率。
- 当表中列数比较多,但是访问的列数比较少时,列存储可以按需读取列数据,大大减少不必要的读IO,提高查询性能。
- 基于列批量数据向量运算,结合向量化执行引擎,CPU 的缓存命中率比较高,性能比较好,更适合 OLAP大数据统计分析的场景。
- 列存储表同样支持 DML操作和 MVCC,功能完备,且在使用角度上做了良好的兼容,基本是对用户透明的,方便使用
行列混合引擎
openGauss支持在表级别指定行存/列存,根据不同的场景选择不同的存储类型。

WDR
WDR(Workload Diagnosis Report)基于两次不同时间点系统的性能快照数据, 生成这两个时间点之间的性能表现报表,用于诊断数据库内核的性能故障。
AI特性
AI特性。它的自诊断、自优化、自监控、自安全特性可以大大减轻DBA的工作量。它推出的在线深度学习的查询预测功能。用户只需要根据推荐的模型配置少量参数,并在模型训练完成后调用模型预测接口直接得到性能预测结果。
openGauss 核心技术总结
1、在CPU NUMA 多核的硬件发展趋势下,openGauss通过线程绑核,NUMA化数据结构改造,数据分 区和原子指令优化实现150W tpmc。
2、企业可用性指标为RPO和RTO,openGauss支持双机同步保证RPO=0,通过极致RTO技术保证 RTO<10s。>
3、企业的性能指标为吞吐量和时延,openGauss通过服务器线程池支持企业的高并发,通过增量检查点保 证IO性能的稳定性。
4、企业的业务场景为OLTP和OLAP,openGauss通过行列混合引擎同时支持行存和列存,适应企业混合场 景。
5、在风控,计费等极端性能企业场景下,openGauss通过免锁内存表,内存索引算法保证高吞吐,低时延, 满足企业场景要求。
6、在云化的发展趋势下,openGauss通过全密态实现端到端加密,解决企业上云安全顾虑。
7、通过DB4AI和AI4DB,实现openGauss自运维和调优,减少企业应用开发和维护的TCO。
openGauss未来技术方向:更智能、更安全、更高效




