今天单位一台linux的mail server突然自己关机,其实上星期四已经关过一次了,当时我人不在机房,也没想仔细查看一下,只是以为可能电源线路有问题,造成的关机,因为这台机器一直很稳定,经常工作1年半载的没啥问题,连显示器都给我拿掉了。(可以ssh,要显示器干吗。。。)
吃完中饭回办公室,同事反映说这台机器关机了,于是ssh上去看了下日志,首先查看一下最近的重启情况。
[root@mail log]# last reboot reboot system boot 2.6.9-1.667smp Mon Sep 9 16:07 (-1:-40) reboot system boot 2.6.9-1.667smp Mon Sep 9 11:32 (02:54) reboot system boot 2.6.9-1.667smp Fri Sep 6 14:23 (02:07) reboot system boot 2.6.9-1.667smp Thu Sep 5 16:18 (21:06) reboot system boot 2.6.9-1.667smp Thu Sep 5 15:57 (21:26)
确实是从上星期四开始有重启记录的,而且看记录,都和入侵丫的没鸟关系,基本排除被人shutdown的可能。随后查看message以及boot的日志信息,最后从密密麻麻的信息里找到了下面那一坨。
Sep 9 14:04:14 mail kernel: CPU1: Temperature above threshold Sep 9 14:04:14 mail kernel: CPU1: Running in modulated clock mode Sep 9 14:04:14 mail kernel: CPU0: Temperature/speed normal Sep 9 14:04:51 mail kernel: CPU1: Temperature above threshold Sep 9 14:04:51 mail kernel: CPU1: Running in modulated clock mode Sep 9 14:04:51 mail kernel: CPU0: Temperature/speed normal Sep 9 14:04:57 mail kernel: CPU1: Temperature above threshold Sep 9 14:04:57 mail kernel: CPU1: Running in modulated clock mode Sep 9 14:04:57 mail kernel: CPU0: Temperature/speed normal
我承认,这台机器够老了,估计风扇有严重积灰了或者彻底不工作了,导致的CPU温度过高,然后pia地华丽的关机了,星期三有空的时候拆机清理一下吧。(9.11日补充,今天拆机,果然CPU上的风扇罢工了。)
PS:网上有误导的文章,修改了/etc/syslog.conf,注释掉相关错误信息的显示,这个简直就是掩耳盗铃么,丫的能解决问题吗?
文章评分5次,平均分4.8:★★★★☆
linux高手,博主。。。
看的不太懂
我是菜鸟,这么专业的没看懂··
这系统就不能在重启后自动弹出个提示框子,上书:前次意外关机直接原因为CPU过热。。。