1. 解释“kernel watchdog: bug: soft lockup”错误信息的含义 “kernel watchdog: bug: soft lockup”是一个内核级别的错误消息,表明Linux内核的NMI(Non-Maskable Interrupt,非屏蔽中断)看门狗检测到某个CPU在预定的时间内没有响应中断或调度请求,这通常意味着系统中的一个或多个任务或进程进入了无法被调度的死...
内核软死锁(soft lockup) Soft lockup:这个bug没有让系统彻底死机,但是若干个进程(或者kernel thread)被锁死在了某个状态(一般在内核区域),很多情况下这个是由于内核锁的使用的问题。 出现死锁原因 1、CPU高负载时间过长2、服务器电源供电不足,导致CPU电压不稳定3、vcpus超过物理cpu cores4、虚机所在的宿主机的...
Linux内核对于每一个cpu都有一个监控进程,在技术界这个叫做watchdog(看门狗)。通过ps –ef | grep watchdog能够看见,进程名称大概是watchdog/X(数字:cpu逻辑编号1/2/3/4之类的)。 这个进程或者线程每一秒钟运行一次,否则会睡眠和待机。这个进程运行会收集每一个cpu运行时使用数据的时间并且存放到属于每个cpu自己...
Soft lockup:这个bug没有让系统彻底死机,但是若干个进程(或者kernel thread)被锁死在了某个状态(一般在内核区域),很多情况下这个是由于内核锁的使用的问题。 内核参数kernel.watchdog_thresh(/proc/sys/kernel/watchdog_thresh)系统默认值为10。如果超过2*10秒会打印信息,注意:调整值时参数不能大于60 Linux内核对...
8、Linux kernel或KVM存在bug 9、BIOS Intel C-State开启导致,关闭可解决 10、BIOS spread spectrum开启导致 解决办法 echo 30 > /proc/sys/kernel/watchdog_thresh echo “kernel.watchdog_thresh=30” >> /etc/sysctl.conf sysctl -w kernel.watchdog_thresh=30 ...
8、Linux kernel或KVM存在bug 9、BIOS Intel C-State开启导致,关闭可解决 10、BIOS spread spectrum开启导致 解决办法 echo 30 > /proc/sys/kernel/watchdog_thresh echo “kernel.watchdog_thresh=30” >> /etc/sysctl.conf sysctl -w kernel.watchdog_thresh=30 ...
Soft lockup名称解释:所谓,soft lockup就是说,这个bug没有让系统彻底死机,但是若干个进程(或者kernel thread)被锁死在了某个状态(一般在内核区域),很多情况下这个是由于内核锁的使用的问题。 Linux内核对于每一个cpu都有一个监控进程,在技术界这个叫做watchdog(看门狗)。通过ps –ef | grep watchdog能够看见,进...
watchdog 简而言之,watchdog是为了保证系统正常运行,或者从死循环,死锁等一场状态退出的一种机制。看...
[runc:[1:CHILD]:358270] NMI watchdog: BUG: soft lockup - CPU#0 stuck for 22s! [runc:[1:CHILD]:358270] NMI watchdog: BUG: soft lockup - CPU#0 stuck for 22s! [runc:[1:CHILD]:358270] I have tried to reinstall the system many times and redeploy the harbor. The same problem...
这里介绍下lockup的概念。lockup分为soft lockup和hard lockup。 soft lockup是指内核中有BUG导致在内核模式下一直循环的时间超过10s(根据实现和配置有所不同),而其他进程得不到运行的机会。hard softlockup是指内核已经挂起,可以通过watchdog这样的机制来获取详细信息。