ブログ - IT企業で障害,そして長期化
SNSの接続障害が長引いているという話題がニュースに取り上げられていますが,こういう場合,根本的原因の究明ができてないとかが重要なのではなくて,適切な判断が出来てないという事に問題があります.
ネット企業で数々のトラブルシューターとして経験していて言えるのは,まず半日以上原因箇所が特定できない事は無いです. 明確な障害じゃなくても,サイト立ち上げ時の初期不良じゃないんだから,発生前後に変化があるはずです.
ざっくりとした現象とエンジニアのインタビューでおおよその原因箇所を狭める事が出来るので,それに対して障害箇所に切り離しを含む暫定処置を素早くやる為のいくつかの案をだし,即効性のありそうなものから適用していくだけです. 忘れてはイケナイのは,連絡すべき所に状況を知らせておく事.
明確な方針を速くだして対処するという事ができてない,つまり「組織の乱れ」がこういう所からかいま見る事ができるのではないか,そう,おもうのです. ちなみにその企業に知り合いはいません.たぶん.
ネット企業で数々のトラブルシューターとして経験していて言えるのは,まず半日以上原因箇所が特定できない事は無いです. 明確な障害じゃなくても,サイト立ち上げ時の初期不良じゃないんだから,発生前後に変化があるはずです.
ざっくりとした現象とエンジニアのインタビューでおおよその原因箇所を狭める事が出来るので,それに対して障害箇所に切り離しを含む暫定処置を素早くやる為のいくつかの案をだし,即効性のありそうなものから適用していくだけです. 忘れてはイケナイのは,連絡すべき所に状況を知らせておく事.
明確な方針を速くだして対処するという事ができてない,つまり「組織の乱れ」がこういう所からかいま見る事ができるのではないか,そう,おもうのです. ちなみにその企業に知り合いはいません.たぶん.