暂无图片
周期性 io消耗高
我来答
分享
erickan
2019-09-09
周期性 io消耗高

系统 hp-ux 11.11 oracle 9.2.0.7,内存128g,存储是3par8200/7200


每天下午6.20-6.50,通过glance  -d  查看disk util  发现io使用率高,100%,平常io要低很多。

查看statspack发现logfile sync是主要等待事件




我来答
添加附件
收藏
分享
问题补充
13条回答
默认
最新
erickan
上传附件:sp_2025_2027.lst
暂无图片 评论
暂无图片 有用 0
文成

看看io等待高不高,对比一下redo量,看看有没有突增。

如果io等待高,则io处理不过来

暂无图片 评论
暂无图片 有用 0
erickan

日志切换不频繁,一共切换了4个,日志组300m一个。有个dg。

有类似的信息。

Thu Sep  5 18:46:45 2019

ARC1: Evaluating archive   log 2 thread 1 sequence 290339

ARC1: Unable to archive log 2 thread 1 sequence 290339

当时特地ALTER SYSTEM SET log_archive_dest_state_2='DEFER' SCOPE=BOTH;

除此,看不出什么问题



暂无图片 评论
暂无图片 有用 0
章芋文

看上去是io的问题,可以生成下正常时间的sp报告,对比看下。

暂无图片 评论
暂无图片 有用 0
erickan
上传附件:spreport_19090614.lst
暂无图片 评论
暂无图片 有用 0
章芋文

应该是有特定的业务模块在那个时间运行,特别是1455248145这条SQL占到了40%,建议排查应用或者优化相关SQL。


          -------------------------------------------------------------
SQL ordered by Gets for DB: MESASSY  Instance: mesassy  Snaps: 2025 -2027
-> End Buffer Gets Threshold:     10000
-> Note that resources reported for PL/SQL includes the resources used by
   all SQL statements called within the PL/SQL code.  As individual SQL
   statements are also reported, it is possible and valid for the summed
   total % to exceed 100

                                                     CPU      Elapsd
  Buffer Gets    Executions  Gets per Exec  %Total Time (s)  Time (s) Hash Value
--------------- ------------ -------------- ------ -------- --------- ----------
     56,432,290          390      144,698.2   40.3   894.11    876.92 1455248145
Module: oracle@lixora01 (TNS V1-V3)
SELECT "A2"."NODENAME" FROM "FWFLATPLAN" "A4","FWFLATPLAN_N2M" "
A3","FWFLATNODE" "A2","FWPROCESSPLAN" "A1" WHERE "A4"."PLANNAME"
=:B1 AND "A4"."SYSID"="A3"."FROMID" AND "A3"."TOID"="A2"."SYSID"
 AND "A1"."NAME"="A4"."PLANNAME" AND "A1"."ACTIVEVERSION"="A4"."
PLANVERSION" AND "A2"."NODENAME" NOT LIKE '%DieBond%' AND INSTR(
UPPER("A2"."NODENAME"),'MOLD_')<=0 AND INSTR(UPPER("A2"."NODENAM
E"),'UV')<=0 AND INSTR(UPPER("A2"."NODENAME"),'SAW')<=0 AND INST
R(UPPER("A2"."NODENAME"),'WIREBOND')<=0 AND INSTR(UPPER("A2"."NO
DENAME"),'LASERMARK')<=0 AND "A2"."NODENAME" NOT LIKE '%TopLaser
Mark%' ORDER BY "A2"."STEPSEQ"


SQL ordered by Reads for DB: MESASSY  Instance: mesassy  Snaps: 2025 -2027
-> End Disk Reads Threshold:      1000

                                                     CPU      Elapsd
 Physical Reads  Executions  Reads per Exec %Total Time (s)  Time (s) Hash Value
--------------- ------------ -------------- ------ -------- --------- ----------
        525,772            5      105,154.4   14.9    23.88     45.51 1132812986
Module: oracle@ship02 (TNS V1-V3)
SELECT "AOLOT","PLANQTY" FROM "FWCATNS_AOLOT" "E"


暂无图片 评论
暂无图片 有用 0
erickan

这个情况难搞之处就是没有频繁commit,正常时候比异常时刻还要高,avg.redo write,正常时刻比异常还要低。不论正常与否,cpu没有什么波动。


暂无图片 评论
暂无图片 有用 0
erickan
上传附件:spreport_19090619.lst
暂无图片 评论
暂无图片 有用 0
erickan

@章芋文这个语句执行次数多,平摊后也不算高,而且cpu没有什么波动。而且其他6.20-6.50之间出现主要logfile sync时也不一定有这个语句,比如上一个附件

暂无图片 评论
暂无图片 有用 0
erickan
上传附件:sp_2159_2160.lst
暂无图片 评论
暂无图片 有用 0
erickan

经过对比,发现出现log file sync时,数据文件的读写延迟就比较高,正常时刻,数据文件读写延迟低。用的是3par7200+3par8200,存储。


暂无图片 评论
暂无图片 有用 0
付才魁

感觉是存储问题,查查硬盘、cache电池等有没有报错

暂无图片 评论
暂无图片 有用 0
erickan

目前问题已经排查出来,是同在一个存储上的另一套rac做增量备份。

暂无图片 评论
暂无图片 有用 0
回答交流
提交
问题信息
请登录之后查看
附件列表
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~
暂无图片墨值悬赏