さくらのクラウドでディスク?障害発生
dmesgに、以下のような内容が複数回残っていた。
[784267.341132] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen [784267.341136] ata1.00: failed command: WRITE DMA [784267.341142] ata1.00: cmd ca/00:68:b8:6a:41/00:00:00:00:00/e1 tag 0 dma 53248 out [784267.341143] res 40/00:01:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout) [784267.341145] ata1.00: status: { DRDY } [784267.341203] ata1: soft resetting link [784267.494985] ata1.00: configured for MWDMA2 [784267.495390] ata1.01: configured for MWDMA2 [784267.495520] ata1.00: device reported invalid CHS sector 0 [784267.495525] ata1: EH complete
不安なので、 e2fsck -n /dev/sda3 を実行してみたところ、
Free blocks count wrong (4437457, counted=4357586). Fix? no Free inodes count wrong (1048431, counted=1037995). Fix? no /dev/sda3: ********** WARNING: Filesystem still has errors **********
と、エラーが発見された。
また仮想CD入れて起動し直して、ちゃんとe2fsckしないといけないようだ。
クラウドはこんなエラーとは無縁だと思っていただけにちょっとショック。
ちょっと気になって、"さくらのクラウド" と上記メッセージの断片で検索してみたところ、別のさくらのクラウドを契約している人も同じタイミングで同じエラーが出ているのを発見した。
という事は、データセンターレベルでの不具合?
とおもって、コンソールからログインして、トップのお知らせ一覧を見たところ、上記のメッセージが記録されてるタイミングで、「ストレージネットワークの障害」のお知らせが複数回入っていた。
これが原因という事で間違いないようだ。
しかし、この「ストレージネットワークの障害」が起こる毎に、fsのFree blocks countやFree inodes countがおかしくなって、仮想CD入れ直してfsckしないといけなくなるのは、ちょっと勘弁してほしい。
物理サーバの方を解約したのは早まったかもしれない。
自分のさくらのクラウドのメモは以下に置いています。
追記: 更に別の人の日記も発見した。
更に追記: 上の e2fsck -n /dev/sda3 実行時のエラーは、rwでmountしてるにも関わらず無理矢理fsckしたせいかもしれない。CDブート後にfsckをかけてみても、同じエラーは発見されなかった。あわてすぎたかも。