ちょっと前のシステム障害の話
ちょっと前、不可思議な現象というか障害があった。
何でも良いから、コマンドを打つと、失敗(?)して値が返ってこない。たとえば、ls を叩いてもファイルリストが出ない。これだけなら、「そういうこともあるかなぁ」と思うのだけど、不可思議なのは、たまにうまく行くことがあったということ。
ls なら、5回叩くと4回は何も返らず、1回はちゃんとファイルリストが返る、みたいな。そんな調子だから調査のためにリモートログインする時点からおかしくて、ssh すると5回くらいはパスワードプロンプトが返らずそのまま戻り、6回目くらいで何故か普通にログインできる。おかしいからリブートしようとすると、shutdown コマンドも何もしないで戻ってしまう。7, 8回叩いたら、ようやく shutdown メッセージ(wall)は出るけどいつまでたってもシャットダウンされない。まあシャットダウンの途中のプロセスが失敗してるんだろうなぁ。
で、syslog には何にも残ってない。まあ「コマンドがたまにしか成功しない状態」だったから、当然syslog の書き込みもたまにしかできなかったんだろうな。
調べようにも、ログはないし、ググるキーワードも思いつかないし、どうしたものやら。。。
どなたかこの現象について何かご存知でしたらコメントいただけると幸いです。ちなみに、OS は Linux(Cent OS 5.2)です。