現在位置: ホーム / ブログ / RAIDを過信してはいけない

RAIDを過信してはいけない

2019/1/17 (QNAP) - IT担当者に送る、ちょっと怖い話 -RAIDを構成してもデータ損失は発生する、RAID修復失敗や別のHDDが故障するリスクについてお伝えしたいと思います。

RAIDを構成してもデータ損失は発生する

「RAIDだから、バックアップを取らなくても大丈夫」そう思われてる方は少なくないと思います。

確かにRAID 5以上の構成であれば、1台あるいは2台のHDDが壊れてもRAIDは破綻しませんし、データも保持されています。壊れたHDDを交換すれば、RAIDは再構築されて元通りです。

しかし裏を返せば「複数のHDDが同時に壊れた」「RAID再構築中に止まった」という場合にはRAIDは復旧できず、データ喪失が発生する事になります。

同時に壊れるハードディスク


複数の物が同時に壊れる確率は非常に低いと思われがちですが、本当でしょうか。

機械の故障率の推移を表す「バスタブ曲線」というグラフがあります。これは特にハードディスクに限ったものではなく、工業製品一般に言われている故障率の推移です。



raid



なんとなく、感覚的に納得できるグラフではないでしょうか。使い始めていきなり壊れてしまう事もありますが、それを過ぎればあまり故障もせずに使い続け、何年もたてば故障して買い替える。家電製品でもそんな感じですね。

さて、グラフをよく見てみましょう。稼働開始が起点となっています。お使いのNASに搭載されているHDDは、NAS導入時に同時期に使用を開始した物では無いでしょうか?

さらに、同時期に生産された、同メーカー、同モデルのHDDが搭載されているのが普通です。それが、同様な温度環境で、同様な負荷で使用されているのですから、同時期に壊れる可能性もゼロではありません。

RAID修復中に止まる・別のHDDが故障する


RAIDの修復に失敗するケースは、実際には稀です。しかし……。

RAIDを修復する際は、現在残っているデータ+パリティから故障したHDDのデータを計算して復元しています。残っているHDDに不良ブロックがあってリードエラーが出たら、当然復元はできません。

また、修復中はCPUやHDDに大きな負荷がかかります。HDDは数時間~数十時間も連続でフル稼働する事になり、通常よりも高い負荷にさらされます。もし、故障したHDD以外にも調子の悪いHDDがあったらどうなるでしょうか?

RAID 6ならばRAIDを構成するHDDが2台故障してもまだ大丈夫ですが、RAID 5の場合は2台故障した時点でRAIDの復旧が不可能になります。

転ばぬ先のバックアップ


つまり、「RAIDだから大丈夫」ではないのです。万が一の事はあり得ます。

データ喪失という大惨事にならないように、バックアップを取得しておきましょう。

「バックアップ機まで予算が回らない」なんて言っている場合ではありません。データ損失が発生して、責任を問われるのはどなたですか?

2019/1/17 NO