【手写数据库核心揭秘系列】第69节 3步拆解数据库查询计划：从SQL到高效执行的终极优化秘籍！

开源无限 2025-03-25

💻 深耕数据库内核架构设计与开发十余年，曾主导多款高性能分布式数据库内核研发，攻克高并发、低延迟等核心技术难题。现倾力打造《从零手写数据库》系列教程，首次系统性公开数据库内核源码级实现细节！

🚀 从存储引擎、查询优化到分布式事务，手把手拆解核心模块；从语法解析树构建到执行计划生成，逐行代码还原设计精髓。

🌟 无论你是数据库开发者、系统架构师，还是对底层技术充满好奇的极客，这里都有你想要的“硬核干货”！点击关注，与行业老兵共同探索数据库技术的星辰大海！

在数据库内核中，查询计划模块是数据库执行引擎的核心组件之一，负责将用户提交的SQL查询转换为高效的执行计划，以最小化资源消耗并最大化查询性能。

主要包括以下核心功能：

查询计划模块是一个非常复杂和涉及非常泛的模块，它有两大关键步骤：

一是逻辑计划树，将语法解析树转换整理，方便以关系代数进行运算，在这个阶段对逻辑计划树进行逻辑优化。
逻辑优化的方法主要有：子句的重写，常量表达式计算，子句提升，表达式中应用运算定律进行简化，主要目的是消除冗余，减少嵌套，将索引列优先计算等，来提升执行的效率。
二是物理计划树，也叫做物理执行计划树，这一阶段生成的真正的计划树，执行器会按照计划树节点来执行并得到结果。
在这一阶段主要是将逻辑计划树转换为执行节点，比如逻辑计划树中有基本表，在物理计划中将它转换为表扫描节点。
在实际执行时，每有多种处理方式，比如扫描数据表，可以采用顺序全表扫描，或不同类型的索引扫描等，那具体采用哪种方式执行呢？
在物理计划生成阶段，会根据数据库运行阶段收集的信息和每种资源使用的代价来评估各方式组合下的路径的总代价，选择最优路径生成执行计划。当然对于复杂SQL来讲，各种方式组合的路径非常多，找最优值是非常困难的事，一般会在取极小值来作为最佳路径。

首先会实现计划模块的基础框架，将解析树按照逻辑和物理的两个阶段进行转换，这样就可以支持各种变化的SQL查询语法，同时SELECT命令的执行器，不再像其它命令简单解析执行，它需要按照执行计划树来解释执行，所以执行器也会相应的做变动。

基于一贯的原则，我们不会按照串行的方式一个模块全量做完，接着下一个模块再全量做完，这是上帝视角的做法，可以预知未来并提前可以完成，在实际项目中并不会这样做。在接下来的时间，我们会分为四个阶段来做：

在这几个阶段实现的过程中，还会对之外不足之处进行完善，各模块的功能进行丰富。

🌟 点赞收藏，分享给身边的技术伙伴，关注我们，持续获取数据库内核开发的硬核干货！一起从源码级实现到分布式架构，解锁数据库技术的每一个核心细节！🚀

【往期精彩推荐】

文章转载自开源无限，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。