暂无图片
分享
Brian
2020-03-18
Oracle RAC 11.2.0.4 双节点,系统运行卡顿,请教原因和解决方案

具体见附件

收藏
分享
11条回答
默认
最新
Brian
暂无图片 评论
暂无图片 有用 0
李石岩

建议单节点的拿出来。你这个是不是做了负载均衡了?library cache lock 较多。

暂无图片 评论
暂无图片 有用 0
Brian

问题描述:
我们运行的是一套景区票务系统,
1、2019年12月15日以前会发生应用系统在周六周日会死锁,优化应用程序的逻辑后,问题解决;

2、2019年12月27日(周日)发生应用系统卡顿,持续1到2分钟后,自行恢复;

3、我不是DBA,但需要解决问题。

现在需要大神们协助指导:
1、排查问题的方向;
2、排查问题的方式方法;
3、因疫情原因,目前景区没有开园,是否可以远程登录排查?还是必须要等问题重现?

谢谢

暂无图片 评论
暂无图片 有用 0
Brian

建议单节点的拿出来。你这个是不是做了负载均衡了?library cache lock 较多。

===》目前还没有单节点的报告。
系统是2020年1月1日就按计划停止使用,如果现在做单节点是否可以AWR是否来得及?

暂无图片 评论
暂无图片 有用 0
张杰鹏

1.使用hanganalyze分析下,看看是哪边锁住了。
2.内存设置也不是太合理,建议调整SGA和PGA

暂无图片 评论
暂无图片 有用 0
李石岩

先看看7天的dbtime把,执行下一下的语句,看看哪个时间的负载较高,只找到较高时间的awr即可。

WITH sysstat AS
(select sn.begin_interval_time begin_interval_time,
sn.end_interval_time end_interval_time,
ss.stat_name stat_name,
ss.value e_value,
lag(ss.value, 1) over(order by ss.snap_id) b_value
from dba_hist_sysstat ss, dba_hist_snapshot sn
where trunc(sn.begin_interval_time) >= sysdate - 7
and ss.snap_id = sn.snap_id
and ss.dbid = sn.dbid
and ss.instance_number = sn.instance_number
and ss.dbid = (select dbid from vdatabase)andss.instancenumber=(selectinstancenumberfromvdatabase) and ss.instance_number = (select instance_number from vinstance)
and ss.stat_name = ‘DB time’)
select to_char (BEGIN_INTERVAL_TIME, ‘mm-dd hh24:mi’) || to_char (END_INTERVAL_TIME, ’
hh24:mi’) date_time, stat_name, round((e_value - nvl(b_value, 0)) / (extract(day
from(end_interval_time - begin_interval_time)) * 24 * 60 * 60 + extract(hour
from(end_interval_time - begin_interval_time)) * 60 * 60 + extract(minute
from(end_interval_time - begin_interval_time)) * 60 + extract(second
from(end_interval_time - begin_interval_time))), 0) per_sec
from sysstat
where(e_value - nvl(b_value, 0)) > 0 and nvl(b_value, 0) > 0
/

暂无图片 评论
暂无图片 有用 0
李石岩

脚本有点问题,输入之后发现变了。可以通过这个网址
https://blog.csdn.net/tomorrow_is_better/article/details/72639713

暂无图片 评论
暂无图片 有用 0
你好我是李白

从AWR中可以看到
(1)SQL ordered by Elapsed Time (Global)
部分有如下:
b6usrg82hwsa3 call dbms_stats.gather_database_stats_job_proc ( )占用了大量的cpu时间,是手工执行的收集统计信息吗?

(2)Top Timed Events
两节点library cache lock,cursor pin S wait on X较为严重。

建议排查是否是由于对数据库收集统计信息导致,如果是自动维护任务,建议调整到其他空闲时段完成统计信息收集。

暂无图片 评论
暂无图片 有用 0
Brian

感谢各位专家的悉心指导,谢谢。

暂无图片 评论
暂无图片 有用 0
Brian

我们再做分析确认,谢谢。

暂无图片 评论
暂无图片 有用 0
Brian
问题已关闭: 问题已经得到解决
暂无图片 评论
暂无图片 有用 0
回答交流
提交
问题信息
请登录之后查看
附件列表
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~
暂无图片墨值悬赏