可获得性
本特性自MogDB 3.0.0版本开始引入。
特性简介
采样线程默认1s采样一次,可通过guc参数asp_sample_interval控制,内存中最多采样100000行数据,通过asp_sample_num控制,到达上限就会刷新到磁盘上。
客户价值
当发现某条SQL语句存在性能瓶颈,且无法在采样视图中查询到该SQL每个算子的执行情况时,可以通过plan_node_id定位性能问题。
算子:SQL语句执行过程中各个步骤的具体动作(例如:SELECT、SUM、WHERE、Group By、Having、Order By、Limit等)
特性描述
在dbe_perf.local_active_session和GS_ASP中新增一列plan_node_id来记录SQL语句每个算子操作的执行情况。
现有的监控级别由guc参数resource_track_level控制,该参数按照级别存在三个值,分别是:
-
none:不开启资源记录功能;
-
query:开启query级别资源记录功能;
-
operator:开启query级别和算子级别资源记录功能,
所以只有当将resource_track_level设成operator的时候才会对SQL语句每个算子操作进行采样。
MogDB启动后会启动一个后台worker采样线程,为避免浪费资源,该采样线程不会时刻采样,而是每隔一个采样周期对MogDB进行采样,收集MogDB当时的运行快照保存到内存中,查询视图dbe_perf.local_active_session可以查询到实时的采样信息,该采样周期由guc参数asp_sample_interval控制,默认采样周期为1s,MogDB每在内存中采样100000行(由guc参数asp_sample_num控制)会将内存中的采样数据刷新到GS_ASP表中以供历史查询,只有语句执行时间大于采样时间,才会被采样线程收集到运行信息。
使用场景
-
首先在session1中创建表test,并执行插入操作:
MogDB=# create table test(c1 int); CREATE TABLE MogDB=# insert into test select generate_series(1, 1000000000); -
在session2中,从活跃会话视图中查询出该SQL的query_id
MogDB=# select query,query_id from pg_stat_activity where query like 'insert into test select%'; query | query_id -----------------------------------------------------------+----------------- insert into test select generate_series(1, 100000000000); | 562949953421368 (1 row) -
在session2中,根据该query_id从活跃作业管理视图中查询出该语句的带plan_node_id的执行计划(该语句执行cost需要大于guc值resource_track_cost才会被记录到该视图中,该guc参数默认值为100000,session级别可更新,所以为了方便测试,可在测试中将该值改成10)
Set resource_track_cost=10;
MogDB=# select query_plan from dbe_perf.statement_complex_runtime where queryid = 562949953421368; query_plan ---------------------------------------------------------------------------- Coordinator Name: datanode1 + 1 | Insert on test (cost=0.00..17.51 rows=1000 width=8) + 2 | -> Subquery Scan on "*SELECT*" (cost=0.00..17.51 rows=1000 width=8) + 3 | -> Result (cost=0.00..5.01 rows=1000 width=0) + + (1 row) -
在session2中,根据query_id从采样视图dbe_perf.local_active_session中查询出该语句的采样情况,结合上面查询的执行计划做性能分析。
MogDB=# select plan_node_id, count(plan_node_id) from dbe_perf.local_active_session where query_id = 562949953421368 group by plan_node_id; plan_node_id | count --------------+------- 3 | 12 1 | 366 2 | 2 (3 rows) -
在session2中执行,当内存数据到达上限值(由guc参数asp_sample_num控制)的时候,则会将现有内存的采样数据刷新到gs_asp表中,刷盘后查询gs_asp表也会查到该语句的算子采样的数据。
MogDB=# select plan_node_id, count(plan_node_id) from gs_asp where query_id = 562949953421368 group by plan_node_id; plan_node_id | count --------------+------- 3 | 19 1 | 582 2 | 3 (3 rows)
结论
当发现insert into test select generate_series(1, 1000000000)存在性能瓶颈,通过以上的步骤定位发现,insert操作在整个SQL语句执行过程中被采样的数值最高( plan_node_id =1 ,count=366),可以对其进行优化。




