前言:最近使用华为鲵提供一段时间的服务后,出现了系统负荷高达40以上的情况。 查了一下,kworker进程占用了CPU,而且杀不死。
华为的监控显示,磁盘I/O较高,重新启动服务器可以暂时解决问题,但几天后负载会变重,许多进程会被系统杀死。
但是,出现问题的是一台鲲鹏,没有出现其他的鲲鹏。 通过比较可知内核版本不同,执行uname -a输出如下所示
正常的鲲鹏linuxkpv7- PBX-00014.18.0-80.7.2.el7.a arch 64 # 1 smpthusep 121633601336020 utc 2019 a arch 64 a arch 64 g Linux非正常鲵鹏Linux PBX-gch-t4. 18.0-193.28.1.el7.a arch 64 #1smpp
运行yum-yupdateyum-yinstallkernel-devel yum-yupdatekernelreboot解析方法grub2-set-default0使内核配置启动菜单进入第1项grub2- set-dedeault
通过dmesg查看过去,可以看到设备正在打印最近的繁忙操作和日程。
以下是我这个装置的打印状况。
您可以看到名为virtio_gpu的驱动程序报告了错误。 疑似驱动失配。 是否需要重新编译驱动程序,如果需要,是否保留此驱动程序。 因为在这里不能使用,所以我干脆卸载了那个驱动器。
步骤如下。
就这样,我再去看top。 我们发现woker核已满的现象已经解决。
参考地址: https://BBS.Huawei cloud.com/forum/thread-92155-1-1.html
用于分析内核的工具perf
相关文章: https://Ubuntu QA.com/article/560.html