1. Heap 参数(global)
gbase_heap_data 主要设计用途是缓存数据(DC),应分配最多的内存。
gbase_heap_large 用于管理不频繁申请、释放的内存。
gbase_heap_temp 用来分配较为琐碎的和小块儿的临时内存,较少使用。
gbase_memory_pct_target 设置内存的可用比例,默认 0.8。
参数下限:
gbase_heap_data >= 512MB
gbase_heap_large >= 256MB
gbase_heap_temp >= 256MB
参数上限:
(gbase_heap_data + gbase_heap_large + gbase_heap_temp ) <= total memory *
gbase_memory_pct_target
注意:
total memory = physical memory + swap(可忽略)
2. 算子 buffer(session)
算子 buffer 均为 session 级别,即如果设置 gbase_buffer_result=1G,且并发数为 30,则在执行并发的过程中,30 并发总共占用的 gbase_buffer_result 就为1G*30 = 30G,而且是在不计算其他的算子 buffer 的情况下。所以如果在高并发环境中将某一个算子 buffer 设置很大的话,很有可能就会出现内存不足无法分配的情况。
常用的 buffer 如下:
gbase_buffer_distgrby:用于保存 distinct 操作的中间结果;
gbase_buffer_hgrby:用于保存 shash group by 操作的中间结果;
gbase_buffer_hj:用于保存 hash join 操作的中间结果;
gbase_buffer_insert:用于保存 insert values 的中间结果;
gbase_buffer_result:用于保存物化的中间结果;
gbase_buffer_rowset:用于保存 join 计算的中间结果集;
gbase_buffer_sj:用于保存 sort merge join 的中间结果,当 join 条件是 a>=b或者 a<=b 时,可能会使用 sort merge join;
gbase_buffer_sort:用于保存 sort 操作的中间结果。
算子 buffer 的设置原则:
一般情况下(非高并发场景),根据系统内存大小,算子 buffer 可以按照如下方法设置:
gbase_buffer_hgrby 和 gbase_buffer_hj 最大不超过 4G;
gbase_buffer_result 最大不超过 2G;
gbase_buffer_rowset 最大不超过 1G;
其他算子使用系统估算即可。
如果在高并发场景下,则不需要设置过大的算子 buffer,一般以系统自动评估为准。但如果并发数过大,不排除需要人为将算子 buffer 设置更小的情况。即并发数乘以总算子 buffer 大小不超过 gbase_heap_large 为宜,但最大也不能超过系统总内存大小。
修改算子 buffer 的其它场景:
如果某条 sql 由于某个算子执行过慢(瓶颈点可参考单机 trace),可以适当调大与之对应算子 buffer。例如根据 trace 发现 join 较慢,可以适当调大gbase_buffer_hj 的值。但是需要注意,调整该值时必须不能影响其他 SQL 的执行。




