暂无图片
暂无图片
1
暂无图片
暂无图片
暂无图片

OceanBase管理数据库执行计划算子INTERSECT

2023-06-13
252

INTERSECT 算子用于对左右子节点算子输出进行交集运算,并进行去重。

OceanBase 数据库支持的 INTERSECT 算子包括 MERGE INTERSECT DISTINCT 和 HASH INTERSECT DISTINCT

MERGE INTERSECT DISTINCT

如下示例中,Q1 对两个查询使用 INTERSECT 联接,c1 列有可用排序,0 号算子生成了 MERGE INTERSECT DISTINCT 进行求取交集、去重。由于 c2 列无可用排序,所以在 3 号算子上分配了 SORT 算子进行排序。算子执行时从左右子节点读取有序输入,利用有序输入进行 MERGE,实现去重并得到交集结果。

obclient> CREATE TABLE t1(c1 INT PRIMARY KEY, c2 INT);
Query OK, 0 rows affected 

obclient> INSERT INTO t1 VALUES(1,1);
Query OK, 1 rows affected 

obclient> INSERT INTO t1 VALUES(2,2);
Query OK, 1 rows affected 

Q1: 
obclient> EXPLAIN SELECT c1 FROM t1 INTERSECT SELECT c2 FROM t1\G
*************************** 1. row ***************************
Query Plan:
=================================================
|ID|OPERATOR                |NAME|EST. ROWS|COST|
-------------------------------------------------
|0 |MERGE INTERSECT DISTINCT|    |2        |77  |
|1 | TABLE SCAN             |T1  |2        |37  |
|2 | SORT                   |    |2        |39  |
|3 |  TABLE SCAN            |T1  |2        |37  |
=================================================
Outputs & filters: 
-------------------------------------
  0 - output([INTERSECT(T1.C1, T1.C2)]), filter(nil)
  1 - output([T1.C1]), filter(nil), 
      access([T1.C1]), partitions(p0)
  2 - output([T1.C2]), filter(nil), sort_keys([T1.C2, ASC])
  3 - output([T1.C2]), filter(nil), 
      access([T1.C2]), partitions(p0)

上述示例中,执行计划展示中的 outputs & filters 详细列出了所有 INTERSECT 算子的输出信息如下:

信息名称含义
output该算子的输出表达式。 使用 INTERSECT 联接的两个子算子对应输出,即表示交集运算输出结果中的一列,括号内部为左右子节点对应此列的输出列。
filter该算子上的过滤条件。 由于示例中 INTERSECT 算子没有设置 filter,所以为 nil

HASH INTERSECT DISTINCT

如下例所示,Q2 对两个查询使用 INTERSECT 进行联接,无可利用的排序,0 号算子使用 HASH INTERSECT DISTINCT 进行求取交集、去重。算子执行时先读取一侧子节点输出建立哈希表并去重,再读取另一侧子节点利用哈希表求取交集并去重。

Q2: 
obclient> EXPLAIN SELECT c2 FROM t1 INTERSECT SELECT c2 FROM t1\G
*************************** 1. row ***************************
Query Plan:
================================================
|ID|OPERATOR               |NAME|EST. ROWS|COST|
------------------------------------------------
|0 |HASH INTERSECT DISTINCT|    |2        |77  |
|1 | TABLE SCAN            |T1  |2        |37  |
|2 | TABLE SCAN            |T1  |2        |37  |
================================================

Outputs & filters: 
-------------------------------------
  0 - output([INTERSECT(T1.C2, T1.C2)]), filter(nil)
  1 - output([T1.C2]), filter(nil), 
      access([T1.C2]), partitions(p0)
  2 - output([T1.C2]), filter(nil), 
      access([T1.C2]), partitions(p0)

上述示例的执行计划展示中的 outputs & filters 详细列出了 HASH INTERSECT DISTINCT 算子的输出信息,字段的含义与 MERGE INTERSECT DISTINCT 算子相同。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论