暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

OpenEuler 22.03 LTS操作系统崩溃记录

watson 2024-06-12
188

OpenEuler 22.03 LTS运行系统自带的Nginx 1.25.5,代理后端的svn和gitlab。

图片

一开始还好,不久就出现死机的情况,开始是几天一次,最严重的时候一天几次内核崩溃,没有时间规律。

图片

从其中的片段信息

Apr 13 22:51:28 xxxxx kernel: [360190.326916]  secondary_startup_64_no_verify+0xc2/0xcbApr 13 22:52:52 xxxxx kernel: [360274.081810] watchdog: BUG: soft lockup - CPU#3 stuck for 67s! [swapper/3:0]Apr 13 22:52:52 xxxxx kernel: [360274.102848] Modules linked in: rfkill isofs nft_fib_inet nft_fib_ipv4 nft_fib_ipv6 nft_fib nft_reject_inet nf_reject_ipv4 nf_reject_ipv6 nft_reject nft_ct nft_chain_nat nf_tables ebtable_nat ebtable_broute ip6table_nat ip6table_mangle ip6table_raw ip6table_security iptable_nat nf_nat nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 libcrc32c iptable_mangle iptable_raw iptable_security ip_set nfnetlink ebtable_filter ebtables ip6table_filter ip6_tables iptable_filter ip_tables sunrpc kvm_amd ccp kvm qxl drm_ttm_helper ttm drm_kms_helper syscopyarea sysfillrect sysimgblt fb_sys_fops cec irqbypass sg virtio_balloon pcspkr i2c_piix4 drm fuse ext4 mbcache jbd2 sr_mod cdrom sd_mod ata_generic virtio_net t10_pi ata_piix net_failover libata serio_raw failover virtio_console virtio_scsi dm_mirror dm_region_hash dm_log dm_modApr 13 22:52:52 xxxxx kernel: [360274.132818] CPU: 3 PID: 0 Comm: swapper/3 Kdump: loaded Tainted: G             L    5.10.0-60.128.0.155.oe2203.x86_64 #1Apr 13 22:52:52 xxxxx kernel: [360274.142639] Hardware name: QEMU Standard PC (i440FX + PIIX, 1996), BIOS rel-1.16.1-0-g3208b098f51a-prebuilt.qemu.org 04/01/2014Apr 13 22:52:52 xxxxx kernel: [360274.149769] RIP: 0010:netif_receive_skb_list_internal+0x57/0x1e0
网上查了下Tainted的意思,说 G表示所有模块都是GPL, L表示系统软锁死,可是这么简单的应用实在想不到怎么会导致软锁死到内核都罢工了。

怀疑是操作系统的问题,可是同一个云平台上运行了多个OpenEuler,有22.02也有20.09,其他机器都没有崩溃死机。

说ngixn问题,可是nginx本身很流行,这个版本是系统自带的稳定版,而且怎么能让内核都崩溃了。

说负载太大吧,早上八点没人的时候也崩溃过。

此外系统还运行了两个安全基线检查程序,可是这两个程序在所有的虚拟机和LXC容器上都运行着。


试过把系统升级到最新的升级包,编写定时任务每天凌晨自动重启,问题依旧。实在不知道怎么回事,只好换一个系统。这个云平台是使用PVE7.4搭建的私有云,用它自带的LXC容器模板创建了一个容器。

图片

启动该容器后禁用了自带的nginx配置,把OpenEuler上的nginx的配置文件拷贝过去,运行了几周,没有任何问题。

我2021年底就开始在公司内部的私有云平台上部署OpenEuler,为了方便还

创建了模板以便快速启用
戒一双,公众号:LINUX开源玩家[PVE][Linux]PVE创建openEuler虚拟机模板


,一直以为这个系统还挺稳定可靠的,没想到遇到这么一个大麻烦。

这大概就是现在国产软件面临的问题,既需要大量使用试错,还需要大量不廉价的人力来解决故障,而成熟的生产系统这么干的显然是不合适的。

华为欧拉3
国产软件5
华为欧拉 · 目录
上一篇[Linux][PVE]PVE上安装openEuler

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论