暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

金仓数据库KingbaseES V8R6 集群运维案例--麒麟系统bug导致sys_monitor_sh无法启动集群

数据猿 2023-05-22
482

案例说明:
麒麟信安操作系统,在部署了KingbaseES V8R6集群后,sys_monitor.sh在启动集群时,启动数据库服务失败,导致集群无法正常启动。
后连接现场分析发现,此环境只要通过ssh或sys_securecmd工具远程启动数据库服务都会失败。操作系统版本如下:
0.png

适用版本:
KingbaseES V8R6

一、问题现象:

如下图所示,新部署的集群,通过sys_monitor.sh启动失败,但是通过sys_ctl手工启动主备节点数据库服务后,集群状态正常。
1.png

如下图所示,手工启动主备节点数据库服务后,集群状态正常:
2.png

二、问题分析:

1)分析sys_monitor.sh执行过程

执行:

sh -x sys_monitor.sh start

如下图所示:
3.png

1、sys_monitor.sh脚本通过sys_securecmd远程连接节点启动数据库服务。
2、脚本反馈数据库服务已经被启动。
3、ksql连接数据库服务访问失败。
4、验证数据库服务启动失败,集群无法启动。

2)远程连接节点启动数据库服务测试

4.png
如上图所示,通过sys_securecmd或ssh连接远程节点启动数据库服务均失败。

3)查看数据库日志,在通过ssh或sys_securecmd远程启动数据库后,数据库会收到SIGTERM信号。

通过以上分析,数据库服务本地启动正常,但是通过ssh或securecmd工具远程启动后,数据库服务收到SIGTERM信号被终止,可能和操作系统有关。

三、问题解决:

后经操作系统人员分析,此故障为系统systemd服务bug ,打了补丁后,问题解决。下图为系统补丁。
在此环境中,sys_securecmdd进程通过systemd服务管理。
5.png

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论