暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

openGauss向量化Merge Join--inner join

yanzongshuaiDBA 2022-10-31
791

openGauss VecMergeJoin状态机

VecMergeJoin状态机如下图所示:
下面我们以一个例子为例,解释各个join的执行情况。
t30和t31的结构及数据如下:
    postgres=# select * from t30
    id1 | id2
    ----|----
    1 | 1
    2 | 3
    2 | 3
    (3 rows)
      postgres=# select * from t31
      id1 | id2
      ----|----
      1 | 1
      5 | 5
      2 | 3
      (3 rows)
      t30作为外表,t31作为内表,join条件为t30.id1=t31.id1。

      inner join

      1)EXEC_MJ_INITIALIZE_OUTER
          取外表值1。进入EXEC_MJ_INITIALIZE_INNER状态
      2)EXEC_MJ_INITIALIZE_INNER
          取内表值1。进入EXEC_MJ_SKIP_TEST状态
      3)EXEC_MJ_SKIP_TEST
          1 = 1,进入EXEC_MJ_JOINTUPLES状态,并标记内表值1
      4)EXEC_MJ_JOINTUPLES
          BatchFillInnerAndOuter将内外表值分别放到m_pInnerMatch和m_pOuterMatch中,进入EXEC_MJ_NEXTINNER状态
      5)EXEC_MJ_NEXTINNER
          取内表的下一个值2,和外表值1比较。1 < 2,进入EXEC_MJ_NEXTOUTER状态
      6)EXEC_MJ_NEXTOUTER
          外表值取下一个值2,进入EXEC_MJ_TESTOUTER状态
      7)EXEC_MJ_TESTOUTER
          外表值2,和标记的内表值1比较。2 > 1,接着取内表当前值2,进入EXEC_MJ_SKIP_TEST状态。
      8)EXEC_MJ_SKIP_TEST
          2 = 2,进入EXEC_MJ_JOINTUPLES状态,标记内表位置为2
      9)EXEC_MJ_JOINTUPLES
          BatchFillInnerAndOuter将内外表值分别放到m_pInnerMatch和m_pOuterMatch中,进入EXEC_MJ_NEXTINNER状态。
      10)EXEC_MJ_NEXTINNER
          取内表的下一个值5,和外表值2比较。2 < 5,进入EXEC_MJ_NEXTOUTER状态
      11)EXEC_MJ_NEXTOUTER
          取外表的下一个值2,进入EXEC_MJ_TESTOUTER状态
      12)EXEC_MJ_TESTOUTER
          外表值2,和标记的内表值2比较。2 = 2,进入EXEC_MJ_JOINTUPLES状态,调整内表当前扫描位置为标记位置,即2。
      13)EXEC_MJ_JOINTUPLES
          BatchFillInnerAndOuter将内外表值分别放到m_pInnerMatch和m_pOuterMatch中,进入EXEC_MJ_NEXTINNER状态。
      14)EXEC_MJ_NEXTINNER
          取内表的下一个值5,和外表值2比较。2 < 5,进入EXEC_MJ_NEXTOUTER状态
      15)EXEC_MJ_NEXTOUTER
          外表值已取完,结束。
      此时,m_pInnerMatch和m_pOuterMatch的值分别为:
        m_pInnerMatch m_pOuterMatch
        1 1
        2 2
        2 2
        最终调用函数ProduceResultBatchT,将两个batch投影到一个batch中,输出最终join结果。

        文章转载自yanzongshuaiDBA,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

        评论