一、10046和10053主要做了什么
10053事件是最常用的Oracle优化器optimizer跟踪trace, 10053可以作为我们解析优化器为什么选择某个执行计划,其中的理由的辅助工具,但并不告诉我们这个执行计划到底运行地如何。
而10046并不解释optimizer优化器的工作,但它同样说明了在SQL解析parse阶段所遇到的等待事件和所消耗的CPU等资源,以及Execute执行和Fetch阶段的各项指标。
简而言之10046告诉我们SQL(执行计划)运行地如何,10053告诉我们优化器为什么为这个SQL选择某个执行计划。
二、10053事件概述
我们在查看一条SQL语句的执行计划时,只看到了CBO最终告诉我们的执行计划结果,但是我们并不知道CBO为何要这样做。
特别是当执行计划明显失真时,我们特别想搞清楚为什么CBO会做出这样的一个选择,那么就可以用10053事件来分析SQL分析过程的trace文件。
10053事件有两个级别:
Level 2:2级是1级的一个子集,它包含以下内容:
Column statistics
Single Access Paths
Join Costs
Table Joins Considered
Join Methods Considered (NL/MS/HA)
Level 1:1级比2级更详细,它包含2级的所有内容,额外增加如下内容:
Parameters used by the optimizer
Index statistics
三、10053的trace文件路径
10053事件同10046事件一样也会在同样的路径下产生一个trace文件。值得注意的是,10053生成的trace文件不能够使用tkprof工具处理。tkprof工具只能处理sql_trace或者100046事件产生的trace文件。 对于10053事件只能直接阅读原始文件。
10053事件生成trace文件目录和SQL_TRACE一样。
在Oracle 10g中,SQL_TRACE生成的trace文件默认路径是$ORACLE_BASE/admin/SID/udump.
在Oracle 11g中,trace 默认路径在:$ORACLE_BASE/diag/rdbms/SID/SID/trace目录下
四、10053的启用和关闭
启用10053事件:
ALTER SESSION SET EVENTS='10053 trace name context forever, level 1';ALTER SESSION SET EVENTS='10053 trace name context forever, level 2';
关闭10053事件:
ALTER SESSION SET EVENTS '10053 trace name context off';
说明:
(1)sqlplus中打开autotrace看到的执行计划实际上是用explain plan 命令得到的,explain plan 命令不会进行bind peeking。应该通过v$sql_plan查看SQL的真实的执行计划。
(2)10053只对CBO有效,而且如果一个sql语句已经解析过,就不会产生新的trace信息。
五、10053事件示例
5.1、设定trace 文件标识
SQL> alter session set tracefile_identifier='my_10053';
设置标识的目的就是方便我们查找生成的trace文件。我们只需要在trace目录(user_dump_dest)查找文件名里带有标识的文件即可。
5.2、启动10053事件
SQL> ALTER SESSION SET EVENTS='10053 trace name context forever, level 1';
5.3、执行事务
SQL> select * from ec_org_person eop where eop.id='75546';
10053事件的使用方法和10046相同,首先给事件设置一个级别(level 1),然后运行SQL(或者直接使用explain plan的方式产生执行计划),最后关闭事件
SQL> explain plan for select * from ec_org_person eop where eop.id='75546';
5.4、关闭10053事件
SQL> ALTER SESSION SET EVENTS '10053 trace name context off';
5.5、查询trace文件名
--未设置标识tracefile_identifier使用
SELECT d.VALUE || '/' || LOWER(RTRIM(i.INSTANCE, CHR(0))) || '_ora_' ||p.spid || '.trc' AS "trace_file_name"FROM (SELECT p.spidFROM v$mystat m, v$session s, v$process pWHERE m.statistic# = 1AND s.SID = m.SIDAND p.addr = s.paddr) p,(SELECT t.INSTANCEFROM v$thread t, v$parameter vWHERE v.NAME = 'thread'AND (v.VALUE = 0 OR t.thread# = TO_NUMBER(v.VALUE))) i,(SELECT VALUE FROM v$parameter WHERE NAME = 'user_dump_dest') d;
-设置标识tracefile_identifier使用
SELECT d.VALUE || '/' || LOWER(RTRIM(i.INSTANCE, CHR(0))) || '_ora_' ||p.spid || '_' || e.VALUE || '.trc' AS "trace_file_name"FROM (SELECT p.spidFROM v$mystat m, v$session s, v$process pWHERE m.statistic# = 1AND s.SID = m.SIDAND p.addr = s.paddr) p,(SELECT t.INSTANCEFROM v$thread t, v$parameter vWHERE v.NAME = 'thread'AND (v.VALUE = 0 OR t.thread# = TO_NUMBER(v.VALUE))) i,(SELECT VALUE FROM v$parameter WHERE NAME = 'user_dump_dest') d,(SELECT VALUE FROM v$parameter WHERE NAME = 'tracefile_identifier') e;trace_file_name--------------------------------------------------------------------------------/oracle/app/oracle/diag/rdbms/xddb/xddb/trace/xddb_ora_11937_my_10053.trc
6.1 文件内容可分几个重要区域
参数区:初始化参数,隐含参数,这些参数可以左右oracle工作方式。
SQL区:执行的SQL语句,是否使用绑定变量,是否进行了转换操作。
系统信息区:操作系统统计信息 cpu主频CPU执行时间IO寻址时间单块读时间多块读时间。
对象统计信息区:
数据访问方式:访问方式不一样计算代价的方法也不一样,全表扫描走索引多表关联代价都不同。
关联查询:把每张表都作为驱动表去组合,择优选择“代价”最小的关联方式,与哪个表在前无关系。
代价的最后修正:oracle会对选择出来的代价再进行最后的修正,使其更准确一些,更合理一些。
选择出最终执行计划:这个过程是非常快速的,毫秒级可以搞定。
6.2 分析trace文件
more oracle/app/oracle/diag/rdbms/xddb/xddb/trace/xddb_ora_11937 my_10053.trcTrace file /oracle/app/oracle/diag/rdbms/xddb/xddb/trace/xddb_ora_11937_my_10053.trcOracle Database 11g Enterprise Edition Release 11.2.0.3.0 - 64bit ProductionWith the Partitioning, OLAP, Data Mining and Real Application Testing optionsORACLE_HOME = oracle/app/oracle/product/11.2/db1System name: LinuxNode name: DFJK-TEST-16Release: 2.6.32-220.el6.x86_64Version: #1 SMP Wed Nov 9 08:03:13 EST 2011Machine: x86_64VM name: VMWare Version: 6Instance name: xddbRedo thread mounted by this instance: 1Oracle process number: 24Unix process pid: 11937, image: oracle@DFJK-TEST-16 (TNS V1-V3)*** 2020-08-26 09:22:53.629*** SESSION ID:(5.52795) 2020-08-26 09:22:53.629*** CLIENT ID:() 2020-08-26 09:22:53.629*** SERVICE NAME:(SYS$USERS) 2020-08-26 09:22:53.629*** MODULE NAME:(SQL*Plus) 2020-08-26 09:22:53.629*** ACTION NAME:() 2020-08-26 09:22:53.629Registered qb: SEL$1 0x166d1638 (PARSER)---------------------QUERY BLOCK SIGNATURE---------------------signature (): qb_name=SEL$1 nbfros=1 flg=0fro(0): flg=4 objn=210660 hint_alias="EOP"@"SEL$1"SPM: statement not found in SMB**************************Automatic degree of parallelism (ADOP)**************************Automatic degree of parallelism is disabled: Parameter.PM: Considering predicate move-around in query block SEL$1 (#0)
1、上边部分是10053事件trace文件的最前部分,是trace文件通用的,包含了操作系统、数据库和会话的信息。
**************************Predicate Move-Around (PM)**************************OPTIMIZER INFORMATION******************************************----- Current SQL Statement for this session (sql_id=3ksc7zwyc8x3c) -----select * from ec_org_person eop where eop.id='75546'*******************************************
2、上边部分,从Predicate Move-Around (PM)开始,CBO优化器主要的工作是对SQL语句的谓词进行分析、重写,把它改为最符合逻辑的SQL语句。
LegendThe following abbreviations are used by optimizer trace.CBQT - cost-based query transformationJPPD - join predicate push-downOJPPD - old-style (non-cost-based) JPPDFPD - filter push-downPM - predicate move-aroundCVM - complex view mergingSPJ - select-project-joinSJC - set join conversionSU - subquery unnestingOBYE - order by eliminationOST - old style star transformationST - new (cbqt) star transformationCNT - count(col) to count(*) transformationJE - Join EliminationJF - join factorizationSLP - select list pruningDP - distinct placementqb - query blockLB - leaf blocksDK - distinct keysLB/K - average number of leaf blocks per keyDB/K - average number of data blocks per keyCLUF - clustering factorNDV - number of distinct valuesResp - response costCard - cardinalityResc - resource costNL - nested loops (join)SM - sort merge (join)HA - hash (join)CPUSPEED - CPU SpeedIOTFRSPEED - I/O transfer speedIOSEEKTIM - I/O seek timeSREADTIM - average single block read timeMREADTIM - average multiblock read timeMBRC - average multiblock read countMAXTHR - maximum I/O system throughputSLAVETHR - average slave I/O throughputdmeth - distribution method1: no partitioning required2: value partitioned4: right is random (round-robin)128: left is random (round-robin)8: broadcast right and partition left16: broadcast left and partition right32: partition left using partitioning of right64: partition right using partitioning of left256: run the join in serial0: invalid distribution methodsel - selectivityptn - partition…… ……
3、上边这一部分解释trace文件中常用到的一些缩写的指标含义,指标在trace文件中经常被用到,所以在trace的开头列举出来各自含义,以便更加容易的阅读trace文件。
***************************************PARAMETERS USED BY THE OPTIMIZER*********************************************************************PARAMETERS WITH ALTERED VALUES******************************Compilation Environment DumpBug Fix Control Environment*************************************PARAMETERS WITH DEFAULT VALUES******************************…… ……
4、上边这一部分是数据库的参数信息,初始化参数,隐含参数,这些参数可以左右Oracle工作方式。
Bug Fix Control Environmentfix 3834770 = 1fix 3746511 = enabledfix 4519016 = enabledfix 3118776 = enabledfix 4488689 = enabledfix 2194204 = disabledfix 2660592 = enabledfix 2320291 = enabled…… ……
5、上边这一部分是一些修复bug的信息。
*******************************************Peeked values of the binds in SQL statement*******************************************Final query after transformations:******* UNPARSED QUERY IS *******SELECT "EOP"."ID" "ID","EOP"."LOGNAME" "LOGNAME","EOP"."LOGPASS" "LOGPASS","EOP"."NAME" "NAME","EOP"."STATE" "STATE","EOP"."ORGID" "ORGID","EOP"."USERNUM" "USERNUM","EOP"."LOGINEORTIMES" "LOGINEORTIMES","EOP"."EMPNUM" "EMPNUM","EOP"."DEPTNAME" "DEPTNAME","EOP"."MSG" "MSG","EOP"."NET_WORK" "NET_WORK" FROM "DFZC_BXMC"."EC_ORG_PERSON" "EOP" WHERE "EOP"."ID"=75546kkoqbc: optimizing query block SEL$1 (#0)
6、上边这一部分是绑定变量的描述,如果SQL中有变量绑定,并且SQL语句执行了bind peeking,在这一项中会有相应的信息。
***************************************BASE STATISTICAL INFORMATION***********************Table Stats::Table: EC_ORG_PERSON Alias: EOP#Rows: 2049 #Blks: 32 AvgRowLen: 92.00 ChainCnt: 0.00Index Stats::Index: EC_ORG_PERSON_LOGNAME Col#: 2LVLS: 1 #LB: 6 #DK: 2039 LB/K: 1.00 DB/K: 1.00 CLUF: 1791.00Index: SYS_C0096208 Col#: 1LVLS: 1 #LB: 5 #DK: 2049 LB/K: 1.00 DB/K: 1.00 CLUF: 1185.00***************************************
7、上边这一部分,BASE STATISTICAL INFORMATION, 主要是SQL语句中饮用到的基本对象信息,包括关联表和各自索引的信息,这些信息可以在相关的视图中查到比如user_tables 和 user_index,这些值在CBO计算代价的时候都会被考虑到。
表信息的部分中包含了表的行数,数据块数,平均行长, 对于字段,只列出了谓词条件中包含的字段,对谓词中没有出现的字段,因为它不影响执行计划的选择,所以CBO不考虑将它考虑到代价中来。
索引部分中列出了索引的高度、索引页数块(LB, Leaf Blocks),每个索引键值占据的数据块数(LB/K, Leaf Blocks/Key),每个索引键值对应的数据块数(DB/K,Data Blokcs/Key), 索引的聚合因子(CLUF,Clustering Factor)。
集群因子(CLUF),它表示索引中的键值和原表上的数据分布的一种关系,当索引键值和表中数据的排列顺序大致相同时,表示索引键值指向的数据块越集中,CLUF 因子越小,越有利于索引的使用。反之,CLUF的值越大,越不利于索引的使用。
当我们发现SQL执行计划异常,从Cardinality上无法解释时,也许应该考虑下是否是Clustering Factor的影响导致的。
***************************************SINGLE TABLE ACCESS PATHSingle Table Cardinality Estimation for EC_ORG_PERSON[EOP]Column (#1): ID(AvgLen: 5 NDV: 2049 Nulls: 0 Density: 0.000488 Min: 64531 Max: 78089Table: EC_ORG_PERSON Alias: EOPCard: Original: 2049.000000 Rounded: 1 Computed: 1.00 Non Adjusted: 1.00Access Path: TableScanCost: 10.04 Resp: 10.04 Degree: 0Cost_io: 10.00 Cost_cpu: 637906Resp_io: 10.00 Resp_cpu: 637906Access Path: index (UniqueScan)Index: SYS_C0096208resc_io: 2.00 resc_cpu: 15663ix_sel: 0.000488 ix_sel_with_filters: 0.000488Cost: 2.00 Resp: 2.00 Degree: 1Access Path: index (AllEqUnique)Index: SYS_C0096208resc_io: 2.00 resc_cpu: 15663ix_sel: 0.000488 ix_sel_with_filters: 0.000488Cost: 2.00 Resp: 2.00 Degree: 1One row Card: 1.000000Best:: AccessPath: IndexUniqueIndex: SYS_C0096208Cost: 2.00 Degree: 1 Resp: 2.00 Card: 1.00 Bytes: 0***************************************
8、上边这一部分是CBO计算的每个对象单独访问的代价。CBO要计算出每个对象单独访问时的代价,通过比较所有的数据访问代价,选择出代价最小的一种访问方式。
两个指标对分析执行计划比较重要:
Card: Original: 2049
原记录数,就是操作数据源的输入记录数,这里值就是表的实际记录数2049。
Card: Rounded:1
输出的记录数,CBO计算出来通过条件过滤,预计得到的记录数。
上边的信息还可以看到,SQL执行可以使用哪几种方式访问数据:
Access Path: TableScanAccess Path: index (UniqueScan)Access Path: index (AllEqUnique)
代价从Cost值可以看出来分别是10、2、2。所以采用访问唯一索引的方式数据库代价是最低的。
***************************************OPTIMIZER STATISTICS AND COMPUTATIONS***************************************GENERAL PLANS***************************************Considering cardinality-based initial join order.Permutations for Starting Table :0Join order[1]: EC_ORG_PERSON[EOP]#0***********************Best so far: Table#: 0 cost: 2.0011 card: 1.0000 bytes: 92***********************
9、上边这一部分,如果SQL是多表查询的话,会分析关联方式的代价和CPU消耗代价resp_cpu。
表的连接方式列举(前三种比较常用):
嵌套连接(Nested loops join)
排序合并连接(Sort-Merge join)
散列连接(Hash join)
集群连接(Cluster join)
笛卡尔连接(Cartesian join)
索引连接(Index join)
============Plan Table============----------------------------------------------------+-----------------------------------+| Id | Operation | Name | Rows | Bytes | Cost | Time |----------------------------------------------------+-----------------------------------+| 0 | SELECT STATEMENT | | | | 2 | || 1 | TABLE ACCESS BY INDEX ROWID | EC_ORG_PERSON| 1 | 92 | 2 | 00:00:01 || 2 | INDEX UNIQUE SCAN | SYS_C0096208 | 1 | | 1 | 00:00:01 |----------------------------------------------------+-----------------------------------+
10、通过一系列的计算和比较,CBO最终选择了上边的执行计划。
Optimizer state dump:Compilation Environment Dumpoptimizer_mode_hinted = falseoptimizer_features_hinted = 0.0.0parallel_execution_enabled = true…… ……
11、trace文件的最后一部分信息依然是参数和修复bug的信息。
七、总结
分析10053事件的trace文件,发现CBO一定最终选择的是代价最低的数据访问路径作为SQL的执行计划。
如果感觉CBO做出的执行计划不是最优的,就应该去分析为什么出现这样的执行计划。考虑提供给CBO的统计信息是否真实,代价高的数据访问方式的分析是否真实。
CBO只是一个数据模型,它只是将搜集到的各种信息通过固定的方式进行计算,如果能够保证给CBO提供的各种信息是正确的,CBO通常就应该会计算出最优的执行计划。
10053事件可以使我们进入CBO优化器内部,去了解CBO是如何工作的,按照什么样的依据给出的执行计划。也能够通过trace文件看出CBO使用的统计信息数据是否正确,如果信息不准确造成的问题,可以重新分析问题数据库对象,使CBO做出正确的执行计划。




