写这个的目的在于,这几天有同事遇到了关于sql优化的问题,我也试着帮忙解决了一些,但有些也没有得到根本解决,所以才想着记录一下,sql优化需要注意的地方,以及自己关于sql优化的一些想法
首先在讲优化之前,说一下我使用的工具,我使用的是NavicatPremium,之所以使用这个是因为,我刚好有这个破解版的工具,以及这个工具支持oracle和mysql以及sql server等等,这个工具也有一些快捷键,来更好的服务于我们平时的使用:
1、F8快速回到当前对象列表
2、Ctrl + q 打开查询界面
3、Ctrl + d 快速修改当前的表结构
4、Ctrl + r 运行当前查询界面里面的sql语句
5、Ctrl + shift + r 运行当前选中的sql语句
在这个工具中,有一个比较重要的“服务器监控”的功能

之后,就选择想要查看的oracle的库中的表

这里就可以监控当前服务器的状态,找出当前耗时较长的sql语句,
接下来就是sql语句的性能分析了
我们可以看一个sql的执行时间,如果过长的话,如果查询时间过长那么说明这个sql或者这个表结构需要优化一下
优化的最好的方式是查看sql的执行计划,就是此sql在执行过程中,有没有用到索引等等
这里有几种查看执行计划的方式:
第一种:通过命令来查询

通过EXPLAIN PLAN FOR SELECT * from “表名”;
select * from table(dbms_xplan.display);
这样就能看到对应的执行计划内容了
第二种:通过自带的查看执行计划的工具
如果是Navicat的话

这样也能看到执行计划中的内容了
如果是PLSQL的话

写出对应的sql,然后点击红线圈住的位置
接下来就是更为重要的如何去读懂执行计划
当使用EXPLAIN PLAN FOR SELECT * from “表名”;
select * from table(dbms_xplan.display);
执行这个sql语句的时候,就会出现相关的关于执行计划的参数

id:一个序号,但不是执行的先后顺序。执行的先后根据缩进来判断
Operation: 当前操作的内容
Rows: 当前操作的Cardinality,Oracle估计当前操作的返回结果集
Cost(CPU):Oracle 计算出来的一个数值(代价),用于说明SQL执行的代价
Time:Oracle 估计当前操作的时间
当然也要通过渭词和统计信息一起来做一个综合的评定
这里找一个demo来分析一下

为了方便看,把这个结果1里的数据,复制到Notepad++里看

分析上面的图可以看到,Id这一列并没有实际的作用,不代表实际的执行顺序,而对应的缩进才表示对应的执行顺序,实际先执行的是12,13这两行,又因为12行在13行的上面,所以这里先执行的是12行,先是对MIWBBTH做了单表的扫描,扫描出150K=15万条数据,然后再对MOWBADT表做扫描,扫描出1731K=173.1万条数据,然后对两张表做了关联,这里用到的是第11行的HASH JOIN,关于JOIN这里有几种方式:
1. 排序 - - 合并连接(Sort Merge Join, SMJ):
a) 对于非等值连接,这种连接方式的效率是比较高的。
b) 如果在关联的列上都有索引,效果更好。
c) 对于将2个较大的row source做连接,该连接方法比NL连接要好一些。
d) 但是如果sort merge返回的row source过大,则又会导致使用过多的rowid在表中查询数据时,数据库性能下降,因为过多的I/O.
2. 嵌套循环(Nested Loops, NL):
a) 如果driving row source(外部表)比较小,并且在inner row source(内部表)上有唯一索引,或有高选择性非唯一索引时,使用这种方法可以得到较好的效率。
b) NESTED LOOPS有其它连接方法没有的的一个优点是:可以先返回已经连接的行,而不必等待所有的连接操作处理完才返回数据,这可以实现快速的响应时间。
3. 哈希连接(Hash Join, HJ):
a) 这种方法是在oracle7后来引入的,使用了比较先进的连接理论,一般来说,其效率应该好于其它2种连接,但是这种连接只能用在CBO优化器中,而且需要设置合适的hash_area_size参数,才能取得较好的性能。
b) 在2个较大的row source之间连接时会取得相对较好的效率,在一个row source较小时则能取得更好的效率。
c) 只能用于等值连接中
然后接着执行第10行,有一个叫做VIEW的字段,这个代表的是一个临时结果集的意思,紧接着执行了第9行,HASH GROUP BY,这里的话,有两种GROUP BY的方式:
在10gR2中,group by由以前的sort group by改成了hash group by,这种算法上的改进,取消了sort group by必须进行的排序操作。官方文档上说hash group by的性能强于sort group by,但是这个有人在网上测试过,好像性能是差不多的
执行完Hash Group by之后,在第8行又返回了一个临时结果集,接着又对MBASORG表做了两次TABLE ACCESS FULL(全表扫描),之后这个sql就算是执行完了
从上面的这个sql的执行计划中就能看出来一些问题,比如整个sql查询的时间过长,大部分时间浪费到了Group by这里,所以就得看看能不能在能获取结果集的基础上,减少Group by的次数,再或者是在进行关联表操作的时候,添加联合索引,关于如何去添加索引,如下:
1、说明
1)索引是数据库对象之一,用于加快数据的检索,类似于书籍的索引。在数据库中索引可以减少数据库程序查询结果时需要读取的数据量,类似于在书籍中我们利用索引可以不用翻阅整本书即可找到想要的信息。
2)索引是建立在表上的可选对象;索引的关键在于通过一组排序后的索引键来取代默认的全表扫描检索方式,从而提高检索效率
3)索引在逻辑上和物理上都与相关的表和数据无关,当创建或者删除一个索引时,不会影响基本的表;
4)索引一旦建立,在表上进行DML操作时(例如在执行插入、修改或者删除相关操作时),oracle会自动管理索引,索引删除,不会对表产生影响
5)索引对用户是透明的,无论表上是否有索引,sql语句的用法不变
6)oracle创建主键时会自动在该列上创建索引
2、索引原理
1. 若没有索引,搜索某个记录时(例如查找name='wish')需要搜索所有的记录,因为不能保证只有一个wish,必须全部搜索一遍
2. 若在name上建立索引,oracle会对全表进行一次搜索,将每条记录的name值哪找升序排列,然后构建索引条目(name和rowid),存储到索引段中,查询name为wish时即可直接查找对应地方
3.创建了索引并不一定就会使用,oracle自动统计表的信息后,决定是否使用索引,表中数据很少时使用全表扫描速度已经很快,没有必要使用索引
3、索引的分类
B树索引(默认索引,保存讲过排序过的索引列和对应的rowid值)
1)说明:
1.oracle中最常用的索引;B树索引就是一颗二叉树;叶子节点(双向链表)包含索引列和指向表中每个匹配行的ROWID值
2.所有叶子节点具有相同的深度,因而不管查询条件怎样,查询速度基本相同
3.能够适应精确查询、模糊查询和比较查询
2)分类:
UNIQUE,NON-UNIQUE(默认),REVERSE KEY(数据列中的数据是反向存储的)
3)创建例子
craete index index_sno on student('sno');
单列索引和复合索引(基于多个列创建)
1) 注意:
即如果索引建立在多个列上,只有它的第一个列被where子句引用时,优化器才会使用该索引,即至少要包含组合索引的第一列
函数索引
1)说明:
1. 当经常要访问一些函数或者表达式时,可以将其存储在索引中,这样下次访问时,该值已经计算出来了,可以加快查询速度
2. 函数索引既可以使用B数索引,也可以使用位图索引;当函数结果不确定时采用B树索引,结果是固定的某几个值时使用位图索引
3. 函数索引中可以水泥用len、trim、substr、upper(每行返回独立结果),不能使用如sum、max、min、avg等
2)例子:
create index fbi on student (upper(name)); select * from student where upper(name) ='WISH';
索引的建立原则:
1. 如果有两个或者以上的索引,其中有一个唯一性索引,而其他是非唯一,这种情况下oracle将使用唯一性索引而完全忽略非唯一性索引
2. 至少要包含组合索引的第一列(即如果索引建立在多个列上,只有它的第一个列被where子句引用时,优化器才会使用该索引)
3. 小表不要简历索引
4. 对于基数大的列适合建立B树索引,对于基数小的列适合简历位图索引
5. 列中有很多空值,但经常查询该列上非空记录时应该建立索引
6. 经常进行连接查询的列应该创建索引
7. 使用create index时要将最常查询的列放在最前面
8. LONG(可变长字符串数据,最长2G)和LONG RAW(可变长二进制数据,最长2G)列不能创建索引
9.限制表中索引的数量(创建索引耗费时间,并且随数据量的增大而增大;索引会占用物理空间;当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,降低了数据的维护速度)
建立索引注意事项:
1. 通配符在搜索词首出现时,oracle不能使用索引,eg:
--我们在name上创建索引;create index index_name on student('name'); --下面的方式oracle不适用name索引
select * from student where name like '%wish%'; --如果通配符出现在字符串的其他位置时,优化器能够利用索引;如下:
select * from student where name like 'wish%';
2. 不要在索引列上使用not,可以采用其他方式代替如下:(oracle碰到not会停止使用索引,而采用全表扫描)select * from student where not (score=100); select * from student where score <> 100; --替换为
select * from student where score>100 or score <100
3. 索引上使用空值比较将停止使用索引, eg:
select * from student where score is not null;
创建完索引之后,就可以查看sql是否有优化到,比如全表扫描变成索引的扫描,然后再不断的通过执行计划来查看sql运行的时间和状态来做调整




