暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

达梦AWR修复

原创 薛晓刚 2025-05-23
210

获取AWR失败

  • 系统压测后,我想看看都有哪些SQL。结果压测前后时段的AWR都可以看。唯独这个时段的无法看。应该是太长的SQL放不下。而这正是我想看到的。

c75d34cb7d2e01c82c4121a7a8b97da.png

  • 我想着如果有个参数修改一下能否存下。只是我个人的想法。我觉得这种高级问题可能找原厂一般的人员都无法解决。我尝试联系了一下达梦原厂的黄海明老师。我们去年在我签售会上认识。我本来想如果能解决最好。如果说就这样改不了的我也只能接受。

  • 上图
    image.png

  • 版本确定。
    黄老师先问了一下我版本。然后他们去复现。
    ce4d71f5d0070cd428daf46682eee84.png

  • 其他手段
    在没有结果之前给了我另外一个方法先用着。这未尝也不是一个办法,只是不如AWR便于统计。
    call SP_SET_PARA_VALUE(1,‘SVR_LOG’,1);

  • 我的理解
    这个方法是把日志以文件形式存储。日志文件是一个纯文本文件。命名格式为“dmsql_实例名[_模式名][_用户名][_日期_时间].log”。这里是我的dmsql开头后面是实例名+日期。

7b73ff0750be4d730f018482b30cc0e.png

官方回复

过了一天,黄老师回复:这个估计是系统包里面的某个地方字符串操作出现了截断,没有环境还真不好排查,我们试了一下没有重现。
我觉得复现这种日常我们也知道,有些可遇不可求。我就问了一下关于AWR的其他问题。

  • 问题1:在一些群里在那里看到到说达梦官方也不建议开awr。

  • 问题2::我听说过一个事情。说记录超过10G,以后表空间满了。就不行了。也清除不掉?

  • 黄老师说:这些以前的问题,现在没有了。

  • 于是我有一个思考:有些东西官方可能疏于说明,那么其他的(原来的事实,你也不能说是谣言)就被广泛流传开了。

关于数据库可观测性

  • AWR是数据库可观测性的一个途径,对日后运维是非常重要的。Oracle有这个很容易定位问题。国产数据库遇到问题会比Oracle多很多,可观测性非常重要。
  • 出了问题不知道为什么才可怕。可能下次还出。这会让人觉得我们能力不行,其实不是的。是没有数据支撑,我们无法判断。

黄老师说:达梦现在就是在补充这块的东西,这也是技术债。

柳暗花明

  • 就在我们交流的时候。黄老师说:问题重现了。有特定长度的sql会出现。

  • 给出的建议是让我升级。替换BIN目录的文件。

  • 做数据库的人都知道补丁和升级也不轻松。(主要怕失败,如果是替换部分文件都不能回退)。好在达梦是说整个bin目录替换。

  • 那么这样就好办多了。把大象放冰箱的三个步骤:停数据库实例。替换。启动。

跟进升级

马上华东区交付总监就找到我们。给到了地址下载一个ISO文件。然后我们进行了安装和提取BIN目录,于是我就向官方提一个合理化建议。官方为什么不直接生成一个bin文件夹压缩一下?发用户呢?然后交付人员说:只升级软件即非整包升级也是可以的,只需要下载链接中的bin-release包。这就是一个花絮。

image.png

这是一个沟通理解问题和产品无关。

反思

  • 有时候吧。是不是可以这样说,数据库有问题,但是也不完全是数据库的问题。找不到靠谱的人(当然了每家数据库都要买服务才行)。
  • 可能数据库的问题也能解决,但是在交付和沟通上会存在各种各样的问题。导致问题蔓延和扩大。
  • 最后感谢一下黄海明老师,需要更多的这样能力和态度都好的才能做好啊。
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论