暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

mysql中IS NULL、IS NOT NULL不能走索引?

小罗技术笔记 2020-07-19
773

点击上方“小罗技术笔记”,关注公众号

第一时间送达实用干货


不知道是啥原因也不知道啥时候, 江湖上流传着这么一个说法 mysql查询条件包含IS NULL、IS NOT NULL、!=、like %* 、like %*%,不能使用索引查询,只能使用全表扫描。

刚入行时我也是这么认为的,还奉为真理!

但是时间工作中你会发现还是走索引啊!下面我们来一一探究其中的奥秘。

一、首先验证一下是会走索引的

创建一个表,结构如下:

  1. create table user_info(

  2.    id int PRIMARY key auto_increment,

  3.    name varchar(16) default '',

  4.    age tinyint default 0,

  5.    address varchar(32) default '',

  6.    PRIMARY KEY (`id`),

  7.    KEY `name` (`name`),

  8.    KEY `address_2` (`address`,`name`)

  9. );

  10. ALTER TABLE user_info ADD INDEX (NAME);

  11. ALTER TABLE user_info ADD INDEX (address);

  1. 数据1

  2. INSERT INTO user_info(NAME,age,address)

  3. VALUES (9,9,'shenzhen9');

  4. BEGIN

  5.  DECLARE i INT  DEFAULT 1000;

  6.  WHILE i < 9000 DO

  7.    INSERT INTO user_info (`NAME`, `age`, `address`)

  8.    VALUES

  9.      (NULL, i , SUBSTRING(MD5(RAND()),1,10) ) ;

  10.    SET i = i+ 1 ;

  11.  END WHILE ;

  12. EXPLAIN SELECT *   FROM user_info  WHERE `name`  IS NOT NULL

  13. EXPLAIN SELECT *   FROM user_info  WHERE `name`  !='9'

  14. EXPLAIN SELECT *   FROM user_info  WHERE `name`  is null

  1. 数据2

  2. INSERT INTO user_info(NAME,age,address)

  3. VALUES (null,9,'shenzhen9');

  4. BEGIN

  5.  DECLARE i INT  DEFAULT 1000;

  6.  WHILE i < 9000 DO

  7.    INSERT INTO user_info (`NAME`, `age`, `address`)

  8.    VALUES

  9.      (REPLACE(UUID(),'-',''), i , SUBSTRING(MD5(RAND()),1,10) ) ;

  10.    SET i = i+ 1 ;

  11.  END WHILE ;

  12. EXPLAIN SELECT *   FROM user_info  WHERE `name`  IS NOT NULL

  13. EXPLAIN SELECT *   FROM user_info  WHERE `name`  !='9'

  14. EXPLAIN SELECT *   FROM user_info  WHERE `name`  is null

执行数据1 会发现sql①②走索引,③不走索引

执行数据2 会发现sql⑥走索引,④⑤不走索引

二、B+树数据排列规则

1、聚簇索引索引:

①页面中的记录是按照主键值进行排序的;

②B+树每一层节点(页面)都是按照页中记录的主键值大小进行排序的;

③B+树叶子节点对应的页面中存储的是完整的用户记录(就是一条记录中包含我们定义的所有列值,还包含一些InnoDB自己添加的一些隐藏列);

2、二级索引:

①页面中的记录是按照给定的索引列的值进行排序的。

②B+树每一层节点(页面)都是按照页中记录的给定的索引列的值进行排序的。

③B+树叶子节点对应的页面中存储的只是索引列的值 + 主键值。

二级索引值能为空。那对于索引列值为NULL的二级索引记录,在B+树的哪个位置呢?

在B+树的最左边。如下图

至于为什么,InnoDB是这样的规定:SQL中的NULL值是列中最小的值

什么时候索引又不生效了呢?

对比数据1和数据2两个数据中null值的数量不一样,当null值占多数时is not null 和!=走索引 ,is null不走索引了,数据2刚好相反。

估计大家都能看出什么来了。带索引字段使用null做判断是否走索引与数据量有关,归纳起来就是成本问题(关于mysql索引扫描成本计算详细分析建议大家可以去看一下掘金小册《mysql是怎样运行的:从根上理解mysql》)。

索引(二级索引)扫描成本:

1、读取索引记录成本

2、反查主键索引查找完整数据成本即回表

如果查询读取的二级索引越多那么需要回表查询的次数就会越多,达到一定的比例就会变成全部查询了,也就是上面null 查询时索引有时不生效的原因。

综上MySQL中决定使不使用某个索引执行查询的依据是成本大小。而不是在WHERE子句中用了IS NULL、IS NOT NULL、!=这些条件

三、如何让like‘%字符串%’,‘字符串%’时走索引

通常情况下我们使用like %%、%的确不会走索引 但是并不代表就一定不能走索引,我们对上面表中name和age建立复合索引

  1. explain select name from user_info where name like '%a%';

  2. 1    SIMPLE  user_info       index       idx_n_a 53      6   16.67   Using where; Using index

  3. explain select name,age from user_info where name like '%a%';

  4. 1    SIMPLE  user_info       index       idx_n_a 53      6   16.67   Using where; Using index

  5. 以下两个例子是查询了不在复合索引中的列进而造成全表扫描

  6. explain select name,age,address from user_info where name like '%a%';

  7. 1    SIMPLE  user_info       ALL     6   16.67   Using where

  8. explain select * from user_info where name like '%a%';

  9. 1    SIMPLE  user_info       ALL     6   16.67   Using where

所以like走不走索引并不是绝对的,要看使用条件!



长按二维码关注

点个在看再走呗!

文章转载自小罗技术笔记,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论