温度过高会导致RAID卡运行异常,影响硬盘业务。 可能原因 风扇模块故障。 环境温度过高。 进风口/出风口堵塞。 存在空槽位或间隔。 RAID扣卡故障。 处理步骤 检查服务器是否存在风扇模块告警。 是=>2 否=>3 更换产生告警的风扇模块,5min后检查告警是否清除。 是=> 处理完毕 否=>3 检查机房环境温度是否超出设备运行
2、 收集操作系统日志及BMC日志,分析结果是raid卡温度过高。 3、 拆开服务器检查raid卡散热片正常,拆除GPU显卡,上电,服务器恢复正常。 4、 兼容性助手查到该K80 GPU显卡需要在riser取两路电,该局点只取了一路电,重新安装电源线缆上电服务器。 5、 进入raid卡,PD Mgmt 显示硬盘全部是Failed状态,手动Make unconf...
检查环境温度是否过高。 是=>步骤7。 否=>步骤8。 降低环境温度,查看告警是否消失。 是=> 处理完毕。 否=>步骤8。 执行smmget -l bladeN-tsensorname-d thresholdall命令检查RAID卡温度过高轻微告警门限设置是否合理。 传感器合理的门限值为:85℃。 命令回显如下,查询设置的阈值为合理值: root@SMM:/#smmget...
温度过高会导致RAID卡运行异常,影响硬盘业务。 可能原因 风扇模块故障。 环境温度过高。 进风口/出风口堵塞。 RAID扣卡故障。 处理步骤 检查服务器是否存在风扇模块告警。 是=>2 否=>3 更换产生告警的风扇模块,5min后检查告警是否清除。 是=> 处理完毕 ...
温度过高会导致RAID卡运行异常,影响硬盘业务。 可能原因 风扇模块故障。 环境温度过高。 进风口/出风口堵塞。 未安装导风罩。 RAID扣卡电容故障。 处理步骤 检查风扇模块是否存在低转速告警。 是=> 2 否=> 3 更换产生告警的风扇模块,5min后检查告警是否清除。 是=> 处理完毕 否=> 3 检查机房环境温度是...
2、 收集操作系统日志及BMC日志,分析结果是raid卡温度过高。 3、 拆开服务器检查raid卡散热片正常,拆除GPU显卡,上电,服务器恢复正常。 4、 兼容性助手查到该K80 GPU显卡需要在riser取两路电,该局点只取了一路电,重新安装电源线缆上电服务器。 5、 进入raid卡,PD Mgmt 显示硬盘全部是Failed状态,手动Make unconf...