ブログ - 切り替わらないコンピュータ
小学生が気象予報士の資格を取った事がニュースになっていた,まさにその時,気象情報の配信システムが障害を起こしていました.
財団法人気象業務支援センター
即時気象情報配信システム(電文形式データ配信システム)障害の復旧について
http://www.jmbsc.or.jp/hp/online/090309error3.pdf
システムは2重化していたけれども,何らかの理由で切り替わらなかったという事です. もう,何度も同じ事を聞きました.
2重化には2つあって,デュアルとデュプレックスです. ITパスポート試験レベル?ですが,おさらい.
1.デュアルシステム
全く同じ構成,機能のシステムを二重化して,互いの処理結果を照合しながら処理を行うシステム構成.
2.デュプレックスシステム
メイン,スタンバイの2系統をもつシステム構成で,スタンバイ系をホットスタンバイさせておき,メイン系に何らかの障害が発生すると切り替えて動作する.
今回のシステムは,文面からするとデュプレックスになります. システムの現場でいうと「クラスタシステム」と言われている奴ですね. デュアルシステムでは,私の導入した事のあるものでは,ストラタスのftServerがあります.
財団法人気象業務支援センター
即時気象情報配信システム(電文形式データ配信システム)障害の復旧について
http://www.jmbsc.or.jp/hp/online/090309error3.pdf
システムは2重化していたけれども,何らかの理由で切り替わらなかったという事です. もう,何度も同じ事を聞きました.
2重化には2つあって,デュアルとデュプレックスです. ITパスポート試験レベル?ですが,おさらい.
1.デュアルシステム
全く同じ構成,機能のシステムを二重化して,互いの処理結果を照合しながら処理を行うシステム構成.
2.デュプレックスシステム
メイン,スタンバイの2系統をもつシステム構成で,スタンバイ系をホットスタンバイさせておき,メイン系に何らかの障害が発生すると切り替えて動作する.
今回のシステムは,文面からするとデュプレックスになります. システムの現場でいうと「クラスタシステム」と言われている奴ですね. デュアルシステムでは,私の導入した事のあるものでは,ストラタスのftServerがあります.
今回のシステムを少し調べたのですが,次の様なもので計画されてます.
気象資料総合処理システム等の最適化計画
http://www.jma.go.jp/jma/kishou/chousa/04-02.pdf
Cアデス,Lアデスと呼ばれているものの様です. TCP/IP上,クラサバ型,Webベース,J2EEでソフトウェアのアンバンドル化を思想で設計されているとの事です.
また,次の様な資料もあります.
2005 年(平成17 年)度気象資料総合処理システム等最適化実施状況報告書
http://www.kantei.go.jp/jp/singi/it2/cio/dai21/21siryou6_90.pdf
ベンダーは気象情報通信システムは,保守業者として,富士通,トーコンフィールドサービス,日本テレコム(現ソフトバンクテレコム)となっているので,それぞれソフト&ハード納入,保守サポート,回線業者ですね.
実際の構築はもしかして富士通グループ会社かもしれませんが,主担当が富士通という事で,当然導入時等に切り替えテストを行って納入していると思いますが,トラブル時には切り替わりません.
これは富士通が悪いのではなくて,こういうシステムは,そういうものなのです. 禅問答じゃないですが,
可用性向上の為のクラスタシステムは,正常に動作している時の切り替えはうまく行くけど,異常時の切り替えはうまく行かない事が多い
という事で,「過度な期待をしない」というのが必要な事となります.
今回,復旧までに17時間かかった様ですが,これは切り替わらない事を想定していないと言えます. それらはベンダー&メーカからすると2重障害と言うのですが,稼働率の式からすると構成要素が増えれば故障率は上がる訳なので,もっと単純に切り替えを行う必要があるでしょう.
という事で,必要なのは手動で切り替える手順の整備という事になります.
気象資料総合処理システム等の最適化計画
http://www.jma.go.jp/jma/kishou/chousa/04-02.pdf
Cアデス,Lアデスと呼ばれているものの様です. TCP/IP上,クラサバ型,Webベース,J2EEでソフトウェアのアンバンドル化を思想で設計されているとの事です.
また,次の様な資料もあります.
2005 年(平成17 年)度気象資料総合処理システム等最適化実施状況報告書
http://www.kantei.go.jp/jp/singi/it2/cio/dai21/21siryou6_90.pdf
ベンダーは気象情報通信システムは,保守業者として,富士通,トーコンフィールドサービス,日本テレコム(現ソフトバンクテレコム)となっているので,それぞれソフト&ハード納入,保守サポート,回線業者ですね.
実際の構築はもしかして富士通グループ会社かもしれませんが,主担当が富士通という事で,当然導入時等に切り替えテストを行って納入していると思いますが,トラブル時には切り替わりません.
これは富士通が悪いのではなくて,こういうシステムは,そういうものなのです. 禅問答じゃないですが,
可用性向上の為のクラスタシステムは,正常に動作している時の切り替えはうまく行くけど,異常時の切り替えはうまく行かない事が多い
という事で,「過度な期待をしない」というのが必要な事となります.
今回,復旧までに17時間かかった様ですが,これは切り替わらない事を想定していないと言えます. それらはベンダー&メーカからすると2重障害と言うのですが,稼働率の式からすると構成要素が増えれば故障率は上がる訳なので,もっと単純に切り替えを行う必要があるでしょう.
という事で,必要なのは手動で切り替える手順の整備という事になります.