Hatena::ブログ(Diary)

chrono-meterの日記 このページをアンテナに追加 RSSフィード

2011-03-22

[Linux] [mdadm] [Ubuntu] 再起動したら software RAID が無効になってた話

あるマシンにメモリを足して再起動したら構成しといた md がない。gkbr しながら対処。

ログはこんな感じ。50 分くらいは冷や汗をかいてたらしい。

$ dmesg | grep \\bmd
[    1.857015] md: linear personality registered for level -1
[    1.894921] md: multipath personality registered for level -4
[    1.985273] md: raid0 personality registered for level 0
[    2.001741] md: raid1 personality registered for level 1
[    2.717988] md: raid6 personality registered for level 6
[    2.717992] md: raid5 personality registered for level 5
[    2.717995] md: raid4 personality registered for level 4
[    2.728079] md: raid10 personality registered for level 10
[    7.595494] md: bind<sdb5>
[  784.690270] md: md_d0 stopped.
[  784.690284] md: unbind<sdb5>
[  784.700034] md: export_rdev(sdb5)
[  784.705872] md: bind<sdb5>
[  813.456615] md: md_d0 stopped.
[  813.456628] md: unbind<sdb5>
[  813.468028] md: export_rdev(sdb5)
[  813.541598] md: bind<sda5>
[ 1038.488863] md: md_d0 stopped.
[ 1038.488876] md: unbind<sda5>
[ 1038.500023] md: export_rdev(sda5)
[ 1809.412795] md: bind<sdb5>
[ 1809.413055] md: bind<sda5>
[ 1809.415098] md/raid1:md0: active with 2 out of 2 mirrors
[ 1809.415144] md0: detected capacity change from 0 to 994998943744
[ 1809.419643]  md0: unknown partition table
[ 1824.436854] md: md_d0 stopped.
[ 1844.353592] md: md_d0 stopped.
[ 2770.547976] EXT4-fs (md0): recovery complete
[ 2770.548468] EXT4-fs (md0): mounted filesystem with ordered data mode. Opts: (null)

$ cat /proc/mdstat は取り忘れたけど inactive なんたらだった。

復旧したと思われるコマンドは以下のどれか。

$ sudo mdadm --assemble
$ sudo mdadm --assemble --scan
$ sudo mdadm --assemble /dev/mdhoge /dev/sdXn

/etc/mdadm/mdadm.conf の内容が一行だけよろしくなかったので superblock から構成されたと思われる。

mdadm -A --scan が起動時に実行される内容ならそこで失敗して mdadm -A で復旧したのかな。

要するにアレイを構成するブロックデバイスに書き込まなければ損失はないはず。RAID superblock formats を見るに md を構成した環境で mdadm -A を実行すれば大概は再構成されるはず、はずだ。superblock のバックアップとっとこうかな。

Connection: close