raid失效实战

以下内容均为几天前亲身经历的事情,希望能给大家带来帮助。


0.风暴前夕

一般raid失效前都有一些前兆,除了文件无法访问,读取速度大降外,最主要的特征就是活动时间为100%但磁盘本身并未进行读写.
请输入图片描述


1.问题浮现

在感觉到一样以后,立刻进行重启,当时还未想到是raid出了问题,但到开机的时候阵列卡boot画面竟然没了,进bios也找不到这张卡。开机,进Windows-设备管理器,发现如下图问题。
设备管理器

2.排查

这款阵列卡还能被识别说明卡没问题,但hp的相关软件不认。遂百度,发现io错误主要出现在储存设备上。这张阵列卡内建了ddr2缓存,所以除了硬盘问题外还有可能是缓存问题。顺便联想到之前bbu报错,遂怀疑是电池问题。
拔下电池,开机出现阵列卡boot画面,重写缓存规则无视电池后进windows仍然无法识别。遂怀疑是硬盘的锅,但盘是服务器备件盘应该没太大问题所以直接检查缓存。
果不其然,缓存的ic居然掉了,当时估计卡已经要没救了。
damage

3.一波未平一波又起

拔掉缓存开机,居然有boot画面,发现认不到盘。遂尝试暴力方法。关机后拔掉其他硬盘只用一个盘开机,可以认盘,于是把所有盘在开机状态上电源都插上,进入windows,发现hssa居然把盘都识别出来,但阵列配置什么的都没有了。当时是可以重新新建阵列,而且心想保盘也蛮值的,但还是要为从网盘上恢复数据发愁,所以选择再试试。
drop
联想到正常开机boot初始化的时候都是一个|/|这样一直转圈(可以自己脑补下画面),但raid失效的情况下出现了三个|一起转,又怀疑是固件的问题,于是google找到了这张卡的最新固件并且刷了上去,开机,成功认盘,数据也都在。

总结

所以出故障的时候不要心急,可以先从硬件入手,然后排除软件问题。无论raid级别多高,也要做好最坏的打算。当然了,防患未然,平时多做好保养,散热工作也是很重要的。

Last modification:March 16th, 2019 at 11:41 am

One comment

  1. zzzz
    该评论仅登录用户及评论双方可见

Leave a Comment