确定连接顺序和方法时,优化器的目标是尽早减少行数,以便在执行SQL语句时减少工作量。
优化器根据可能的连接顺序,连接方法和可用的访问路径生成一组执行计划。然后,优化器估算每个计划的成本,并选择成本最低的计划。
选择执行计划时,优化器会考虑以下因素:
- 优化器首先确定联接两个或多个表是否导致一个行源最多包含一行。
优化识别基于这样的情况
UNIQUE,并PRIMARY KEY在表上的约束。如果存在这种情况,那么优化器将这些表按连接顺序放在第一位。然后,优化器优化其余表集的联接。 - 对于具有外部联接条件的联接语句,具有外部联接运算符的表通常以联接顺序在条件中位于另一个表之后。
通常,尽管在某些情况下优化器会覆盖此排序条件,但优化器不会考虑违反该准则的连接顺序。同样,当子查询已转换为反联接或半联接时,子查询中的表必须位于外部查询块中与其连接或相关的表之后。但是,在某些情况下,哈希反联接和半联接能够覆盖此排序条件。
优化器通过计算估计的I / O和CPU来估计查询计划的成本。这些I / O具有与之相关的特定成本:单个块I / O的一种成本,以及多块I / O的另一种成本。同样,不同的函数和表达式具有与之关联的CPU成本。优化器使用这些指标来确定查询计划的总成本。这些指标可能会在编译时受到许多初始化参数和会话设置的影响,例如DB_FILE_MULTI_BLOCK_READ_COUNT设置,系统统计信息等等。
例如,优化器通过以下方式估算成本:
示例9-1估算加入订单和方法的成本
从概念上讲,优化器构造连接顺序和方法以及与之相关的成本的矩阵。例如,优化器必须确定如何最好地联接查询中的date_dim和lineorder表。下表显示了方法和订单的可能变化以及每种方法的成本。在此示例中,嵌套循环以order进行连接date_dim,lineorder成本最低。
表9-2联接date_dim和行顺序表的示例成本
| Join Method | Cost of date_dim, lineorder | Cost of lineorder, date_dim |
|---|---|---|
| 嵌套循环 | 39,480 | 6,187,540 |
| 哈希联接 | 187,528 | 194,909 |
| 排序合并 | 217,129 | 217,129 |
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




