. SQL语句执行步骤
语法分析> 语义分析> 视图转换 >表达式转换> 选择优化器 >选择连接方式 >选择连接顺序 >选择数据的搜索路径 >运行“执行计划”
-
选用适合的Oracle优化器RULE(基于规则)、 COST(基于成本) 、CHOOSE(选择性)
-
访问Table的方式全表扫描全表扫描就是顺序地访问表中每条记录,ORACLE采用一次读入多个数据块(database block)的方式优化全表扫描。通过ROWID访问表ROWID包含了表中记录的物理位置信息,ORACLE采用索引实现了数据和存放数据的物理位置(ROWID)之间的联系,通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高。
-
共享 SQL 语句
• Oracle提供对执行过的SQL语句进行高速缓冲的机制。被解析过并且确定了执行路径的SQL语句存放在SGA的共享池中。
• Oracle执行一个SQL语句之前每次先从SGA共享池中查找是否有缓冲的SQL语句,如果有则直接执行该SQL语句。
• 可以通过适当调整SGA共享池大小来达到提高Oracle执行性能的目的。 -
选择最有效率的表名顺序
• ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中写在最后的表(基础表 driving table)将被最先处理。
• 当ORACLE处理多个表时,会运用排序及合并的方式连接它们,并且是从右往左的顺序处理FROM子句。首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行排序,然后扫描第二个表(FROM子句中倒数第二个表),最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并。
• 只在基于规则的优化器中有效。
举例:表 TAB1 16,384 条记录表 TAB2 1 条记录
/选择TAB2作为基础表 (最好的方法)/
SELECT COUNT(*) FROM TAB1,TAB2
/执行时间0.96秒/
/选择TAB1作为基础表 (不佳的方法)/
SELECT COUNT(*) FROM TAB2,TAB1
/执行时间26.09秒/
如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表。
/高效的SQL/
SELECT * FROM LOCATION L, CATEGORY C, EMP E
WHERE E.EMP_NO BETWEEN 1000 AND 2000
AND E.CAT_NO = C.CAT_NO
AND E.LOCN = L.LOCN
将比下列SQL更有效率
/低效的SQL/
SELECT * FROM EMP E, LOCATION L, CATEGORY C
WHERE E.CAT_NO = C.CAT_NO
AND E.LOCN = L.LOCN
AND E.EMP_NO BETWEEN 1000 AND 2000
- Where子句中的连接顺序Oracle采用自下而上或自右向左的顺序解析WHERE子句。根据这个原理,表之间的连接必须写在其他WHERE条件之前,那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。
/低效,执行时间156.3秒/
SELECT Column1,Column2
FROM EMP EWHERE E.SAL > 50000
AND E.JOB = ‘MANAGER’
AND 25 <
(SELECT COUNT(*) FROM EMP
WHERE MGR = E.EMPNO)
/高效,执行时间10.6秒/
SELECT Column1,Column2FROM EMP E
WHERE 25 < (SELECT COUNT(*) FROM EMP
WHERE MGR=E.EMPNO)
AND E.SAL > 50000
AND E.JOB = ‘MANAGER’
-
SELECT子句中避免使用“”
• Oracle在解析SQL语句的时候,对于“”将通过查询数据库字典来将其转换成对应的列名。
• 如果在Select子句中需要列出所有的Column时,建议列出所有的Column名称,而不是简单的用“*”来替代,这样可以减少多于的数据库查询开销。 -
减少访问数据库的次数当执行每条SQL语句时, ORACLE在内部执行了许多工作:解析SQL语句 > 估算索引的利用率 > 绑定变量 > 读数据块等等由此可见, 减少访问数据库的次数 , 就能实际上减少ORACLE的工作量。
-
整个简单无关联的数据库访问如果有几个简单的数据库查询语句,你可以把它们整合到一个查询中(即使它们之间没有关系),以减少多于的数据库IO开销。虽然采取这种方法,效率得到提高,但是程序的可读性大大降低,所以还是要权衡之间的利弊。
-
使用Truncate而非Delete
• Delete表中记录的时候,Oracle会在Rollback段中保存删除信息以备恢复。Truncate删除表中记录的时候不保存删除信息,不能恢复。因此Truncate删除记录比Delete快,而且占用资源少。
• 删除表中记录的时候,如果不需要恢复的情况之下应该尽量使用Truncate而不是Delete。
• Truncate仅适用于删除全表的记录。 -
尽量多使用COMMIT只要有可能,在程序中尽量多使用COMMIT, 这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少。COMMIT所释放的资源:
• 回滚段上用于恢复数据的信息.
• 被程序语句获得的锁
• redo log buffer 中的空间
• ORACLE为管理上述3种资源中的内部花费 -
计算记录条数
Select count(*) from tablename;
Select count(1) from tablename;
Select count(column) from tablename;
一般认为,在没有主键索引的情况之下,第二种COUNT(1)方式最快。如果只有一列且无索引COUNT(*)反而比较快, 如果有索引列,当然是使用索引列COUNT(column)最快。
-
用Where子句替换Having子句避免使用HAVING子句,HAVING 只会在检索出所有记录之后才对结果集进行过滤。这个处理需要排序、总计等操作。如果能通过WHERE子句限制记录的数目,就能减少这方面的开销。
-
减少对表的查询操作在含有子查询的SQL语句中,要注意减少对表的查询操作。
/低效SQL/
SELECT TAB_NAME FROM TABLES
WHERE TAB_NAME =(
SELECT TAB_NAME FROM TAB_COLUMNS
WHERE VERSION = 604)
AND DB_VER =(
SELECT DB_VER FROM TAB_COLUMNS
WHERE VERSION = 604)
/高效SQL/
SELECT TAB_NAME FROM TABLES
WHERE (TAB_NAME,DB_VER)=(
SELECT TAB_NAME,DB_VER
FROM TAB_COLUMNS
WHERE VERSION = 604)
-
使用表的别名(Alias)当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上.这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误。Column歧义指的是由于SQL中不同的表具有相同的Column名,当SQL语句中出现这个Column时,SQL解析器无法判断这个Column的归属。
-
用EXISTS替代IN在许多基于基础表的查询中,为了满足一个条件 ,往往需要对另一个表进行联接。在这种情况下,使用EXISTS(或NOT EXISTS)通常将提高查询的效率。
/低效SQL/
SELECT * FROM EMP
WHERE EMPNO > 0
AND DEPTNO IN (
SELECT DEPTNO FROM DEPT
WHERE LOC = ‘MELB’)
/高效SQL/
SELECT * FROM EMP
WHERE EMPNO > 0
AND EXISTS (SELECT 1
FROM DEPT
WHERE DEPT.DEPTNO = EMP.DEPTNO
AND LOC = ‘MELB’)
- 用NOT EXISTS替代NOT IN在子查询中,NOT IN子句将执行一个内部的排序和合并,对子查询中的表执行一个全表遍历,因此是非常低效的。为了避免使用NOT IN,可以把它改写成外连接(Outer Joins)或者NOT EXISTS。
/低效SQL/
SELECT * FROM EMP
WHERE DEPT_NO NOT IN (
SELECT DEPT_NO FROM DEPT
WHERE DEPT_CAT=‘A’)
/高效SQL/
SELECT * FROM EMP E
WHERE NOT EXISTS (SELECT 1
FROM DEPT D
WHERE D.DEPT_NO = E.DEPT_NO
AND DEPT_CAT =‘A’)
- 用表连接替换EXISTS通常来说 ,采用表连接的方式比EXISTS更有效率 。
/低效SQL/
SELECT ENAME
FROM EMP E
WHERE EXISTS (SELECT 1
FROM DEPT
WHERE DEPT_NO = E.DEPT_NO
AND DEPT_CAT = ‘A’)
/高效SQL/
SELECT ENAME
FROM DEPT D,EMP E
WHERE E.DEPT_NO = D.DEPT_NO
AND D.DEPT_CAT = ‘A’




