日常的应用开发中可能需要优化SQL,提高数据访问和应用响应的效率,不同的SQL,优化的具体方案可能会有所不同,但是路径上,还是存在一些共性的。碰巧看到杨老师的这篇文章《第45期:一条 SQL 语句优化的基本思路》,为我们优化一些MySQL数据库的SQL语句提供了可借鉴的路径,值得参考和应用。
一般来讲,我们拿到一条"不是很优化"、"烂的"、"慢的"等SQL语句,应该按照以下几个步骤来逐步分析:
一、定位该SQL语句涉及到的表结构,确认是磁盘表还是视图,如果是磁盘表,那么该考虑以下几点:
这些表是否统一为InnoDB引擎(MySQL 5.7以及以前一些老旧版本可能会有非InnoDB引擎表),如果不是,转换表引擎为InnoDB。因为MySQL从5.5版本开始,所有针对存储层的优化都是针对InnoDB 引擎的。 极个别表为临时表。查看临时表相关参数是否设置合理;或者说能否把临时表替换为磁盘表。 查询每张表的字段类型,看有无不合理的部分。 查询每张表的记录数,检查是否过大需要后续拆分。 查询每张表的统计信息,检查是否及时做了更新。 针对这些表结构做进一步分析,查看索引设计是否合理?大致会有以下几种结果:
(1)都没有索引,有的连主键都没有。
(2)都有主键或者唯一索引,但是没有二级索引。
(3)有主键或者唯一索引,也有一些二级索引,并且二级索引可选择性也比较优化。
二、如果有些表是视图,需要考虑以下几点:
该视图内部的算法有两种,一种是临时表(TEMPTABLE)、另外一种是合并(MERGE)。可以针对这两种算法来分别测试视图整体性能哪个较优化。 该视图内部如果有很复杂的处理逻辑,想办法把这部分内容简化或者从数据库剥离转交给应用处理,避免数据库将其劣势放大。 该视图如果非必须,可拆解为基表与上层SQL语句做合并处理,这样效率较之前更优化(例如视图内部多表关联与上层基表再次关联,拆分后,优化器就会有更多更优的表关联顺序)。
三、如果是多张表关联,此处检查表关联键:
表关联键为主键和外键,即两表用来关联的字段在一张表唯一并且在另一张表被引用,这时需要补充额外的过滤条件来减少扫描记录数。 表关联键为非主键,也即两表用来关联的字段都不唯一, 需要优化为唯一键值关联。 表关联键字段编码不一致,需要人为转换字段编码并改为一致。
四、基于以上几点,表结构分析这块已经大致完成。接下来从SQL语句层面来分析,例如这条SQL语句能否修改为更加优化的方式。可以考虑以下两点:
SQL语句本身很简单,没有必要做修改。 例如这条语句本身是20张表的内联查询,那它不够优化并不是因为写的不好,而是表关联个数实在太多。
SQL语句本身很复杂,仔细分析后,可以简化这条语句的写法。 复杂SQL语句又可以分为很多类别,例如多张子表关联、多张表嵌套子查询、多个子查询合并输出、多个聚合类操作等等。每种都有不同的优化方法。
改写后的语句执行计划很优化,走最合适的索引、语句本身也改的很简洁,那么这条语句改写完成。 改写后的语句执行计划没有走合适的索引,可以考虑在表上建立合适的索引。如果建新索引后,这条语句执行效果很好,那么改写完成。 改写后的语句走了合适的索引,执行效果依然不理想,这时可能有以下几种原因:
(2)这条语句走的索引较优,但是表记录数实在太大,走索引过滤的记录数也很多,需要从表结构这层做些优化。例如改造分区表、拆分表等方法,或者是从业务层面限制这条语句来扫描更少的记录数等。
经过以上几个步骤,一般的语句基本上都能达到比较优化的结果。

近期更新的文章:
近期的热文:
《推荐一篇Oracle RAC Cache Fusion的经典论文》
文章分类和索引:
文章转载自bisal的个人杂货铺,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




