tsucchi’s diary(元はてなダイアリー)

はてなダイアリー(d.hatena.ne.jp/tsucchi1022)から移行したものです

サーバを再起動したら大変だったお話

サーバを再起動するだけの簡単なお仕事ですの続きみたいな話。なんだけど...

         ,. -‐'''''""¨¨¨ヽ
         (.___,,,... -ァァフ|          あ…ありのまま 今 起こった事を話すぜ!
          |i i|    }! }} //|
         |l、{   j} /,,ィ//|       『サーバを再起動するだけの簡単な仕事だと
        i|:!ヾ、_ノ/ u {:}//ヘ        思ったらいつのまにかサーバが壊れていた』
        |リ u' }  ,ノ _,!V,ハ |
       /´fト、_{ル{,ィ'eラ , タ人        な… 何を言ってるのか わからねーと思うが
     /'   ヾ|宀| {´,)⌒`/ |<ヽトiゝ        おれも何をされたのかわからなかった
    ,゙  / )ヽ iLレ  u' | | ヾlトハ〉
     |/_/  ハ !ニ⊇ '/:}  V:::::ヽ        頭がどうにかなりそうだった…
    // 二二二7'T'' /u' __ /:::::::/`ヽ
   /'´r -―一ァ‐゙T´ '"´ /::::/-‐  \    メモリエラーとかディスククラッシュとか
   / //   广¨´  /'   /:::::/´ ̄`ヽ ⌒ヽ    そんなチャチなもんじゃあ 断じてねえ
  ノ ' /  ノ:::::`ー-、___/::::://       ヽ  }
_/`丶 /:::::::::::::::::::::::::: ̄`ー-{:::...       イ  もっと恐ろしいものの片鱗を味わったぜ…

本当にプルナレフの言ってるとおりなんですがね。なんか、boot_archive を壊しちゃったっぽいんだよね。で、Solaris が、「failsafe で起動して、bootadm update-archive -R しろ」みたいな事言うから、そのとおりにしたら boot_archive かファイルシステムあたりが致命的にぶっこわれたっぽい。fsck 要求されたり、要求どおりに fsck したらさらににぶっこわれたり。。。

多分普通の環境なら、bootadm update-archive で直ったのだろうけど、SVM でミラーしてたのが裏目に出たのかな。

Fixing a Solaris Boot Archive | Flux

を見ると、SVM 環境では、vfstab 書き換えたり、ミラーをはずしたり色々しなきゃだめだったらしい。。。

つーか、色々試行錯誤してるうちに、すっかり破壊しちゃったみたいなので、明日から復旧作業しないと。。。

追記(2009/01/26)

13.  Solaris ブートアーカイブの管理 (手順) (Solaris のシステム管理 (基本編)) - Sun Microsystems

通常は、システムをフェイルセーフモードでブートしてから、bootadm update-archive コマンドを実行して、ブートアーカイブを更新するという操作をお勧めします。ただし、ルート (/) ファイルシステムがミラー化メタデバイス (RAID-1 ボリューム) の場合は、この方法でブートアーカイブを正常に更新することはできません。

ブートアーカイブを手動で更新するには、以下に説明している手順に従います。

なんだよー、ちゃんとやり方書いてあるじゃねーか。トラブル時って焦りがちだけど、やっぱあせっちゃダメなんだよね。分かっているけど、難しい。。。