GaussDB的存储模型与审视和修改表定义概述

wang 2023-05-08

302

一、存储模型

进行数据库设计时，表设计上的一些关键项将严重影响后续整库的查询性能。表设计对数据存储也有影响：好的表设计能够减少I/O操作及最小化内存使用，进而提升查询性能。

表的存储模型选择是表定义的第一步。客户业务属性是表的存储模型的决定性因素，依据下面表格选择适合当前业务的存储模型：

存储模型	适用场景
行存	点查询(返回记录少，基于索引的简单查询)。增删改比较多的场景。
列存	统计分析类查询 (group , join多的场景)。

存储模型

适用场景

行存

点查询(返回记录少，基于索引的简单查询)。

增删改比较多的场景。

列存

统计分析类查询 (group , join多的场景)。

二、审视和修改表定义

在分布式框架下，数据分布在各个DN上。一个或者几个DN的数据存在一块物理存储设备上，好的表定义至少需要达到以下几个目标：

从上述描述来看表定义中最重要的一点是分布列的选择。创建表定义一般遵循图1所示流程。表定义在数据库设计阶段创建，在SQL调优过程中进行审视和修改。

图1 表定义流程

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者