Main Contents
2009年07月30日
N商工会議所 サーバ障害
外出している上司から、N商工会議所のサーバでトラブルが発生しているので見に行くよう指示。
テンポラリディレクトリが設定してあるドライブDが満タンで、一部のサーバアプリケーションが不具合を起こしていることへの対処と、昨晩温度異常で鯖落ちしてるらしいので状況確認との二点。
現着後、先方担当者立会いのもと現況確認。
連絡あった状態そのまんま。
Dドライブが満タンなのは、ノートン先生がため込んだ更新用データ 11GBを削除してよし。
次の温度異常は…
イベントに何度もファンの異常と、CPU温度異常のアラートが上がって来てる。
とりあえずサーバのフロントパネル開けてみると、案の定吸気ファンが止まってる。
そうこうしているうち、目の前でサーバの電源が落ちちゃう。
うわー。筺体動かした時に電源抜けちゃったー。って思ったけどそんなことなし。
深夜に起こった鯖落ちが再現しちゃっただけみたい。電源入れてみたらPOST中に落ちるし。
側蓋も開けて導風板を取り除いてみると、止まってるフロントファンがCPUファンの役割を果たしている作りなので Pentium 3 / 1.2GHzがファンレス駆動状態になってたのを確認。
温度チェックのため CPU冷却フィンにちょっと触れてみたら、あまりの高温に反射的に手を引いて筺体のエッジで手を切っちゃった。
メモ: CPU冷却フィンに、ファンを直付するタイプの CPUクーラーは、まともなサーバなら普通採用しません。ファンなんて壊れるものと相場が決まっているのに、特にCPUファンなんて小口径高回転の上、高温にさらされる場所にあるので寿命短いですし。
CPUに直接くっついていたら電源落とさないで交換するのが困難だし―とか、気軽に止められるパソコンとは違った設計概念があります。
もちろんCPUだけ冷やしても仕方ないので、CPUまわりのVRMとかメモリなんかを、大口径低回転ファンで筺体内に風の流れを作ってまとめて冷やす狙いもあります。
爆熱Xeon世代では筺体内にメモリとかVRM系と、CPU系と、HDD, 拡張カード系とで、それぞれ風の流れを分離したようなマシンもあります。
交換するファンさえ手に入ればすぐなんですが、んなもんこんなとこにあるわけないので、筺体開け放して扇風機で強制冷却し続けてもらうことに。
ある程度温度が下がったはずのところで、電源再投入。
今度は無事に Windows 2000 Serverが起動。イベントログ見てみたら、落ちる直前で CPU温度 107度が記録されていました。
良く焼け死ななかったものです。
- by umedak
- at 2009年07月30日 17:09
- in Works