テープの意味不明エラー
0.改訂履歴
- 1998.02.12 初版
1.はじめに
このドキュメントでは,1998年2月10日にNT13で起こった障害に関する報告を行なう.
2.時系列
- テープの交換当番者から,「テープがBUSYランプが付いてて取り出せない」と連絡を受ける.
- サーバを見てみると,テープのランプとテープアクセスランプが両方とも付いたままであった.
- ここまでなら良くある障害なので,イベント状況を調べるためにサーバにログオンしてみた.すると,NTBackupが起動していて,次のようなエラーが表示されていた.
- ここで[OK]ボタンを押すと,NTBackupが終了してテープを取り出すことが出来た.
- テープの中身を見てみようとしたが,最初のインデックス部分,ディレクトリ一覧は表示されるが,中の深い階層のリストを参照しようとすると,同じダイアログが表示される.
- 他のNTサーバマシンでも読み込んでみたが,同じ状態であった.
- 結果,テープメディアが壊れていると推測される.
3.問題点
まず,この件について次のような問題がある.
- このテープはリリース後間もないのに壊れた.
- 既に同じメーカのメディアはかなりこわれている.(このメーカはサーバ機と同じメーカ)
- この障害は,NTのイベントログに書き出されない. よって障害を感知する方法が作れない.
- 毎日ログインして画面を見れば状態を把握することも出来るが,工場内に点在するサーバを毎日監視することは出来ない.
4.解決案
- テープが壊れる現象については,別件でも既にメーカに問い合わせ中である.
- テープメディアに異常があることを正しく通知し,イベントログに書き出すバックアップソフトを導入する.