UJP - システム障害事故カテゴリのエントリ

不正IP報告数

Okan Sensor
 
メイン
ログイン
ブログ カテゴリ一覧

  • カテゴリ システム障害事故 の最新配信
  • RSS
  • RDF
  • ATOM

ブログ - システム障害事故カテゴリのエントリ

Akamai広域障害

カテゴリ : 
システム障害事故
ブロガー : 
ujpblog 2021/7/23 3:00
 こういうの別の日にしてほしいなぁ. 

「サイバー攻撃ではない」 大規模なアクセス障害に障害元の米Akamaiがコメント
https://www.itmedia.co.jp/news/articles/2107/23/news028.html

引用:
 7月23日午前1時ごろから午前2時ごろにかけて発生した、オリンピックや日本航空(JAL)などの公式サイトや、オンラインサービス「PlayStation Network」(PSN)のアクセス障害。問題の原因になったとみられるサービスを手掛ける米Akamai Technologiesは、障害について「Akamaiへのサイバー攻撃によるものではないことを確認した」と同社のTwitterアカウントで明らかにした。

 一気に複数システムがダウンすることはありえないので,そういうと時は広域障害を疑って,ツイッターで「繋がらない」で検索すると,情報が見えてくる.
 逆に回復の兆しが見えた時は「繋がった」で検索する.これ,プチ情報.

「ネット予約」はなぜ落ちるのか

カテゴリ : 
システム障害事故
ブロガー : 
ujpblog 2021/7/6 19:14
 こういう話.

「ネット予約」はなぜ落ちるのか どうすれば落ちないのか
https://www.itmedia.co.jp/news/articles/2105/21/news094.html

引用:
 コロナ向け予防接種の予約システムで、「ネットのシステムが混雑で落ちた」という話が問題視された。話題の製品が出るたびに「ネットショップが落ちる」という話も出る。
 予約だけじゃなくて,テレビで紹介された地方のスイーツショップの公式サイトとか,中小企業が運営しているサーバは簡単に接続できなくなる.このサーバもそう.

 大量にアクセスがある場合,どう処理するかは古典的なものは静的コンテンツと動的コンテンツを分けること.並列にスケールすることというのがあるけれど,急に来て一時的なものは予測不可能なので,AkamaiなどのCDNを使うのが良いでしょう.お金がかかるけれど.まぁ,とはいえ普通一時的なものだから,殴られっぱなしで時を待つ対処がおおいかな.実はプログラムの効率化(画面遷移・SQL最適化)などもあるんだけれど.

 最近の大規模予約システムで問題が出なかったのは,2019年のラグビーと,2019年の東京オリンピックの抽選申し込み.

 




 こうして並べてみると,同じシステムのように見えるな.これはアクセスしてきた人を待ち行列に入れて処理する方式.ここまでくると大規模システムじゃないと導入は無理かな.

 やっぱり処理性能を見積もっていて,それ以上になったらSorryに流すのが基本か.

わざとかな? 2

カテゴリ : 
システム障害事故
ブロガー : 
ujpblog 2021/6/29 1:54
WD製NASに脆弱性、今すぐネット切断を。フルリセットで全データ消失
https://news.yahoo.co.jp/articles/e993eb400fd08d4346b22d89887d16e079465f81

引用:
 米Western Digital(WD)は25日(現地時間)、同社が2010年に出荷したNAS「My Book Live」および「My Book Live Duo」に脆弱性があるとし、現在も使用しているユーザーはすぐにネットから切断するよう注意を促した。
 10年前の商品だけれど,まだ使っている人が多くいる点について,どう評価するか. こういう簡易NASは当時流行った気がする.

引用:
 また、同製品に使われているPowerPCアーキテクチャ向けにコンパイルされた、「.nttpd,1-ppc-be-t1-z」と呼ばれるLinux ELFバイナリ形式のトロイの木馬がインストールされた形跡があったといい、現在同社は分析のため、このバイナリをVirusTotalにアップロードしたとしている。

わざとかな?

カテゴリ : 
システム障害事故
ブロガー : 
ujpblog 2021/6/28 23:00
 もうアンドロイドを使ってないから被害はなかったけれど最近この手の「風が吹いたら桶屋が儲かる」的な障害が多いな.

Android版「Google」アプリ、「繰り返し停止」する不具合を修正した最新版配信
https://internet.watch.impress.co.jp/docs/news/1333640.html

みずほ証券

カテゴリ : 
システム障害事故
ブロガー : 
ujpblog 2021/6/16 0:37
 1ヶ月ほど前だけれど.

みずほ証券、一時システム障害 ネット取引で売買できず
https://www.jiji.com/jc/article?k=2021051200612

 カミさんが,新光証券時代からのお付き合いでNISAの講座を持っていたけれど,使ってないので解約した日がこの障害の当日で,その影響もあったのかどうか,解約した途端に担当営業から電話がかかってきたそうな.
 システム障害があったから,営業がスタンバイしていたのかもしれないけれど,担当営業にすぐ伝わるシステムを作っているということかな.CRMの機能なのかね.

CDNのFastlyの障害影響

カテゴリ : 
システム障害事故
ブロガー : 
ujpblog 2021/6/9 1:32
 縁の下の力持ち,的なものは昔からあるけれど,CDNもその1つかな.

AmazonやGitHubなど大規模な障害発生「古き良きインターネットみたいに」
https://ledge.ai/fastly0608/
 画像やCSSなどの静的ファイルはCDNに置くので,そこに障害があると,昔のWebサイトのようなデザインになってしまうことを,このように表現しているのは興味深い.おっさんセンサーだという自白か?

 
世界同時多発HP閲覧障害は徐々に復旧…CDN運営会社「Fastly」がプログラム修正を報告
https://hochi.news/articles/20210608-OHT1T51182.html

astlyのCDN障害でSpotify、GitHub、CNNなどがダウン
https://jp.techcrunch.com/2021/06/08/2021-06-08-numerous-popular-websites-are-facing-an-outage/

 ここであぶり出されるのは,Fastlyの顧客一覧.まぁ漏洩したのは,Fastlyの営業情報の一部,と言えるから,Akamaiの営業がウォームアップしているかな?
 今週月曜日,17日から始まった自衛隊による大規模接種会場でのワクチン予約システムの不備.

不備把握もスピード優先 防衛省、システム改修へ―大規模接種
https://www.jiji.com/jc/article?k=2021051801022

引用:
自治体から届く接種券に記載された番号や生年月日、市区町村コードを入力する。その際、実在しない情報で予約できることが分かった。ただ、会場では接種券などで本人確認するため、虚偽予約で接種はできない。

 予約が間違った状態でも,本質的にちゃんと予約できた人にしかワクチン接種はできないように仕組み全体ではカバーされている模様.

大規模接種予約システム改修へ 架空情報入力取材に抗議
https://www.tokyo-np.co.jp/article/104935

引用:
取材目的で架空情報を使い予約した朝日新聞出版と毎日新聞に対して「悪質な行為であり、極めて遺憾だ。厳重に抗議する」と述べた。

 朝日新聞出版と毎日新聞が嘘の情報で登録したようだが,これによって正規の人が予約できない状態になっているのは問題だろう.わかっていて業務妨害,国民の不利益だ.

  • 間違って登録してしまった→その人が受けられないので自己責任
  • 意図して偽情報を登録した→枠が消費されたので他の人が受けられない

     加藤官房長官曰く「全市区町村が管理する接種券番号含む個人情報をあらかじめ防衛省が把握し、入力情報と照合することが必要」だが「全国民の個人情報を防衛省が把握することが適切なのかという問題」という意見もあったようだ.

     完璧なものなんて短期間で最初から作れないから,ワークアラウンド,対策前進で対応していくという方針は問題ないと思う.
     メディアも揚げ足取りばかりしていても仕方ない.メディア利用者に注意を呼びかけるくらいの協力をすれば良いのに.
  • 朝からsalesforceにログインできない件

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2021/5/12 9:35
     朝からセールスフォースにログインできないと話題.

    salesforce_status_japanese
    https://www.notion.so/salesforce_status_japanese-df2a619796f0467fa4c083f9a56972ba

     スクショ.


     09:35現在の公式ステータス

    Salesforceステータスへようこそ
    https://status.salesforce.com



    みずほ銀行システム障害

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2021/4/6 0:52
     全体的なまとめはこれ.

  • データ移行で発生したみずほ銀行のシステム障害についてまとめてみた
    https://piyolog.hatenadiary.jp/entry/2021/03/01/055810

    引用:
    障害発生中は、ATMよりキャッシュカード、通帳が機器から戻されない事象が発生。取り出せなくなる影響を受けた件数は5,244件。
     ATMの不正防止のため,通帳を吐き出さない仕様.

  • みずほFG社長「過去の教訓生かせず」、システム障害で対応策
    https://jp.reuters.com/article/mizuho-system-idJPKBN2BS0L2

    引用:
    みずほ銀のシステム障害は、2月28日から約2週間で4件発生した。このうち外貨建て送金に遅れが生じた3月12日の障害は、日立製作所が保有・管理する機器が故障したことで発生。バックアップ機器への切り換えもできなかった。

    みずほFGはこの日公表した原因分析で、万一に備えて日立側の早期復旧手順と体制が確立されていなかったと指摘。坂井社長は、責任はすべてみずほにあるとする一方で、「少なくとも(復旧に)7時間もかけることは想定されていない」と発言。「契約の関係にのっとって(日立に)しかるべき対応していく」と述べた。
     テレビかネットのニュースを見たカミさんは「日立が原因だっていってたよ」と言ってたが,よく読むと3月12日の障害は,日立の機械故障であって,ATMで通帳が取り出せなかった件はまた別.
     ちなみに,3月12日の障害はコレ.

  • みずほ銀でシステム障害、外貨送金300件に遅れ-2週間で4度目
    https://www.bloomberg.co.jp/news/articles/2021-03-12/QPURA0T0G1L201

    引用:
    みずほ銀行は12日、システム障害によって300件の外貨建て送金に遅れが出ていたと発表した。
     300件程度で「遅れ」なので,そんなに一般人が認知するほどでも無さそうな.2月28日の障害がなければ小さくお詫びで終わりになるはず.

    引用:
    全国に設置するATMの7割超が停止した2月28日の障害では、利用者のカードや通帳が戻らなくなる不具合が発生した。みずほ銀はこれを受け、通帳を原則返却する仕様にATMを変更したという。

  • みずほ、おわびで「5000円」 クオカード配布―システム障害
    https://www.jiji.com/jc/article?k=2021032501259

    引用:
    キャッシュカードなどが取り込まれた顧客に対し、おわびとして5000円分のクオカードを送ることを明らかにした。
     現在の金利は0.10%で,100万円を7年定期で預けると税引後5583円.みずほ銀行で通帳が吸い込まれる事案が発生したら,吸い込ませに行くのが正解???かと思っていたけれど,この錬金術は封鎖された模様.

     正式な発表はこれ.

    システム障害に係る対応状況について - みずほフィナンシャルグループ
    https://www.mizuho-fg.co.jp/release/pdf/20210405_2release_jp_1.pdf

    2月28日分は,メモリ容量オーバー.
    3月3日分は,機器故障
    3月7日分は,プログラム不良
    3月12日分は,機器故障&切り替え失敗

     詳細説明がないけれど,メモリ容量オーバーは「自動拡張設定なし」が原因だった模様.

    みずほシステム統合の謎、参加ベンダー「約1000社」の衝撃
    https://xtech.nikkei.com/atcl/nxt/column/18/00942/082900007/

    引用:
    ミッションクリティカルな運用が求められる。日本IBM製メインフレーム上で稼働させることを決めたが、アプリケーションの開発は旧システム「STEPS」を開発・保守してきた富士通に委託した。「流動性預金は銀行業務の根幹。長年信頼関係を築いてきた富士通が最適と判断した」
     MINORIのシステムブロックと担当ベンダを見ても,基盤は日本IBMのようで,日立は外貨の部(今回の3/12障害部分と一致)であって,日本IBMの名前は出てこないな.

     基幹は富士通がCOBOLでプログラムを作ってIBMのメインフレーム場で動かし,周辺は日立とかが装置も含めて納入.メインフレームの運用だと,IBMの全面サポートを受けつつも,みずほのシステム部門ががっつりやっているのだろうね.
     「自動拡張設定なし」というのもメインフレームっぽいな.使ったらお金はらう契約.



    おまけ

    ITエンジニア3年でフリーランスに…「得意な技術が1つあれば、それを活かして活躍していける」経験者からのアドバイス
    https://news.yahoo.co.jp/articles/ec21b9849554ca01243d6995b034ac30a4d93727

    引用:
    ◆岡山のIT業界は?
    向井地:エンジニア歴5年の耒須さん。現在どんなお仕事をされているんですか?

    耒須:金融業界のATM関連のシステム開発に携わっています。例えば、ATM利用者の履歴管理をするシステムなどです。

    向井地:なるほど。ATMと言えば、最近、某銀行でシステムが動かなくなるというニュースを目にしましたが、耒須さんはどんな思いで聞いていましたか?

    耒須:すごくヒヤッとしました。その後のニュースでいろいろと聞いてみると、結果的に、自分が携わっているところではないということでホッとしました。
     この発言だとMINORIに関わってそうだけれど?,フリーランスということだから,富士通の下請けの孫請けってことかな.もっと階層は深いと思うけれど.(個人事業主の自分ならよくわかります・・・)
  • ドコモメール障害

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2021/3/18 1:22
     Macを使っていたらいきなりドコモメールのパスワード入れろと言い出したのでいくら入力しても認証できず.1時間くらい悩んで今は放置.
     すると,こんなニュースが.

    16日夜からドコモメールで障害 現在は復旧
    https://www.itmedia.co.jp/mobile/articles/2103/17/news082.html

    引用:
     3月16日21時30分頃から、全国でドコモメールなどのサービスが利用しづらい状況が発生していた。翌17日5時34分頃に回復したが、原因は調査中とのこと。この他に「認証系のサービスでも障害が発生していた」とのことだが、こちらの詳細も調査中としている。
     時間的に一致...アカウント消したりしたので被害が大きいなぁと思ったけれど,My docomoにログインして,Mac用にプロファイルをダウンロードしてインストールすれば復帰するので便利.

     でも,障害が起きていたことは通知が来てないから,ドコモの公式Twitterをフォローしておくとかが必要なのか.しないな.
     テレビ番組によっては,トップ扱いだったこのニュース.

    LINEの個人情報管理に不備 中国の委託先が接続可能
    https://www.asahi.com/articles/ASP3J7K5DP3JUHBI03T.html

    引用:
     無料通信アプリ「LINE」が、中国にある関連会社にシステム開発を委託するなどし、中国人技術者らが日本のサーバーにある利用者の個人情報にアクセスできる状態にしていたことがわかった。LINEはプライバシーポリシーでそうした状況を十分説明しておらず、対応に不備があったと判断。政府の個人情報保護委員会に報告する一方、近く調査のための第三者委員会を立ち上げ、運用の見直しに着手する。
     オフショアで運用委託している事業があったら,別にそういうことは珍しくないのでは?なんて思ったけれど,問題の本質は法律の改正だった模様.

    引用:
     個人情報保護法は、外国への個人情報の移転や外国からのアクセスに制限をつけ、必要な場合は利用者の同意を得るよう定めている。LINEの規約は「お客様のお住まいの国や地域と同等の個人データ保護法制を持たない第三国にパーソナルデータを移転することがある」などとしているが、[b]昨年6月に成立した改正個人情報保護法(2年以内に施行)に関し、個人情報保護委員会は、原則として移転先の国名などを明記[ib]するよう求めている。
     そういえば,10年前にソフトバンクテレコムが韓国にデータセンタを作ったけれど,そこに個人情報のデータは置いてないのかな? それとも利用者に通知されているのかな.

    韓国KT社との合弁によるプサンデータセンターが竣工
    https://www.softbank.jp/corp/group/sbtm/news/press/2011/20111208_01/
     メールを整理していたら,ETCマイレージサービスからのメールが2016年からきてない事が確認.
     ETC,全く使ってないのだけれど,気になったのでログインしようとしてみた.


     解約されてます!!!


     使ってない事が原因か.それは正しい.

  • 6-3.マイレージ登録が取り消されることはありますか。
    https://www.smile-etc.jp/guide/qa/06.html

    引用:
    730日間ETCマイレージサービスのポイント及び還元額に増減がない場合、マイレージ登録は取消しになります。

     別のところが気になった.

    システム障害に関するお詫び - ETCマイレージサービス
    https://www.smile-etc.jp/sysmainte/

     頻繁に障害が起こっているようだから,利用のある際にはちゃんとチェックしたいね.
  • ファミペイ決済機能を一部停止

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2021/1/27 22:46
     政府主導もあったし,ここ数年でキャッシュレスも進んできた実感もあるけれど,1つの決済方式に依存していると,難民になりそう.

    ファミペイ、決済機能を一部停止 システム不具合で - 時事通信社
    https://news.yahoo.co.jp/articles/6a47547e8f48dba855147282965f72730311251d

    引用:
     ファミリーマート子会社の「ファミマデジタルワン」は27日、スマートフォン決済アプリ「ファミペイ」について、ファミマ以外の店でのQRコードとバーコードによる決済機能を同日午前5時から一時利用停止にしたと発表した。システムの不具合により、26日からこれらの決済が利用できないケースが多発しているため。

     27日正午時点でも原因の特定に至っておらず、復旧のめども立っていないという。
     ファミペイも前払いであらかじめチャージしておくやつみたいだけれど,「半額戻ってくる」キャンペーンが中止になったそうだ.延期でなくて中止.

    システム不具合のためFamiPay半額戻ってくるキャンペーン、飲食店と家電量販店が中止
    https://www.bcnretail.com/market/detail/20210127_210044.html

    引用:
     カテゴリごとにキャンペーン実施期間、FamiPayボーナスで戻る上限額が異なり、ファミリーマートが1月19日~2月1日、ドラッグストアが1月19~25日(終了)、飲食店が1月26日~2月1日、家電量販店が2月2~8日だった。ファミリーマートでは、期間中500円相当を上限にFamiPay決済額の50%が戻ってくる。
     障害の原因は飲食店でのキャンペーン決済が多かったからなのかな? 中止と判断した原因は,負荷が原因だとすぐサーバ増強できないから中止,なのかもしれない.

     決済系はクラウド上で稼働させてスケールさせるような実装にしてないと思うんだけれどなぁ.どうなんだろう.(考えが古いか)

    バックアップ見つかる その2

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2020/12/16 14:23
     10月31日で契約満了になりインスタンス削除したが,10月5日分のバックアップがあったという件の続報.

  • バックアップ設定は保守業者がしていた.
  • クラウドの運用担当者は把握してなかった.
  • 停電で三週間はバックアップが取れてない.

     真偽不明の情報だが,参考までに.

     定期的にコンフィグレーション・チェックをするのは必要だね.根本的には東証アローズの件も同じだ.
  • GoogleとAWSの障害がIoT家電に影響が

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2020/12/15 23:47
     11月下旬のこのニュース.


    AWS障害にともない他社サービスもダウン
    https://jp.techcrunch.com/2020/11/26/2020-11-25-amazon-web-services-outage-takes-a-portion-of-the-internet-down-with-it/

    AWSが11月の大規模障害について説明
    https://japan.zdnet.com/article/35163174/

    引用:
     Amazon Web Services(AWS)は、米国時間11月25日に発生した大規模障害についての説明を公開した。この障害では、何千ものサードパーティーのオンラインサービスが数時間にわたって影響を受けた。
     そしてこれ.

    AWSで障害、「Nature Remo」「SwitchBot」などに影響 「電気消せない」と嘆く声【追記あり】
    https://www.itmedia.co.jp/news/articles/2011/26/news056.html

     同じようなことがGoogleでも起きた.

    Google Workspaceのダウンは認証システムのストレージクオータが原因 ~Googleが発表
    https://forest.watch.impress.co.jp/docs/news/1295179.html

    【体験談】Google Homeが全て停止して家の家電が制御できなくなって凍死しかけたお話
    https://www.hayaponlog.site/entry/2020/12/14/221759

     うちの被害はこれ.


      ポケモンGoのプレイ中に急にログイン白と通知が来て,ログインしようとするも500エラーがでてしまう問題.

    LINEの不審なBot

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2020/11/23 17:06
     うーん.

    「LINE」で不審な“友だち追加/グループ招待”発生、10月下旬~11月初旬、12万人に影響
    https://k-tai.watch.impress.co.jp/docs/news/1290346.html

    引用:
     LINEは、ユーザーの同意なく「不審なBotが友だちに強制追加される」「不審なBotからグループへ招待される」という事象が発生したことを明らかにした。
     去年,スマホに変更したオカンだけれど,近くで操作を教えてくれる人も居ないので,利用に難儀している模様.
     そういう人のアカウントにこういうBotが来たら,防ぎようがないかなぁ.

     でも,実はバーチャンコミニティの中で不審なメールや通知,アパート経営,ソーラーパネル,リボ払いは良いことがない案内なので無視する事!という口コミが進んでいるので,意外と大丈夫そうだったりはする.

    バックアップ見つかる

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2020/11/23 2:18
     色々と問題があると思う.

    「ふくいナビ」バックアップ見つかる 全データ消失のサイト、年内復旧めど
    https://www.fukuishimbun.co.jp/articles/-/1209081

    引用:
     ふくい産業支援センター(福井県坂井市)は11月18日、サーバー上の全データが消失して使用できなくなったポータルサイト「ふくいナビ」について、12月末までに復旧するめどが立ったことを公表した。

  • NECキャピタルソリューションの事務手続き瑕疵で,10月31日で契約満了になり仮想サーバが停止されてデータが削除された.
  • バックアップはないので復旧不可能としていた
  • やっぱりバックアップがあった.それも10月5日分

     なかったと認識していたものが出てきたということは,これはこれで管理できてなかったと同じじゃないかな.

    公益財団法人ふくい産業支援センター様の「ふくいナビ」のデータ障害につきまして
    https://pdf.irpocket.com/C8793/aMKh/RtZQ/YIJo.pdf

    福井県産業情報ネットワーク「ふくいナビ」の 利用者データ(10 月 5 日時点)の復元およびシステムの復旧時期(予定)について
    https://pdf.irpocket.com/C8793/aMKh/hLiw/uzzB.pdf
  • 東証システム障害の長期化の原因

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2020/10/21 0:52
     10月1日,東証のシステムが停止して株取引ができなくなった.この原因は共有ディスクが故障したけれどバックアップ系に切り替わらなかったことが原因とされていたけれど,その切り替わらなかった原因が特定できたそうです.

    バックアップ、5年「OFF」 富士通のマニュアルに誤り 東証システム障害
    https://mainichi.jp/articles/20201019/k00/00m/020/240000c

    引用:
    2015年9月のシステムの仕様変更前までは「オフ」でも15秒後に予備に切り替わる仕組みだったが、機器を製造した米メーカーが「オフ」時にはバックアップを作動させない方式に変更。これを富士通が把握せず、「オフ」にして東証に納入。マニュアルにも反映させなかったため、東証は気付かないままシステムを運用していたという。
     設定ミスということで説明が整理できれば,類似の機械を導入している他社にも説明がしやすい.

    10月1日に株式売買システムで発生した障害について
    https://www.jpx.co.jp/corporate/news/news-releases/0060/20201019-01.html

     東証アローヘッドって,今現在は3代目なんだな.

    Slackの障害

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2020/10/6 11:36
     個人的に今はSlackを使ってないので全く影響はないのだけれど,

    Slack、約7時間にわたる障害(ほぼ復旧済み)
    https://www.itmedia.co.jp/news/articles/2010/06/news050.html

    引用:
     企業向けコラボレーションツール「Slack」で、日本時間の10月5日午後11時5分ごろに障害が発生した。Downdetector.comによると、日本だけでなく、米国や欧州を含む広範囲な障害のようだった。運営する米Slackは6日午前4時43分、影響を受けたすべてのサービス(=Slackのすべてのサービス)を更新したと報告し、5時20分にはそれ以上の更新はしないが引き続き問題解決に取り組むとしている。

    Monday October 5, 2020
    https://status.slack.com/2020-10/e8c094cc99aabf64


     30分毎くらいに状況を伝達していたのが好感触のよう.


     クラウドサービスを利用する際には,稼働状況をレポートするシステムが提供されているかどうかもチェックポイントですな.Slackの場合はAPIがあるそうだ.

    https://status.slack.com

     今回は日本時間で深夜早朝隊だったので,影響は少なめだろうけれど,監視システムとして使っている場合は仕事にならないね.

    Microsoft 365 障害回復中?

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2020/9/29 11:47
     ほとんどは回復した模様.

    https://twitter.com/MSFT365Status
    引用:
    The majority of services are now recovered for most users. We’re closely monitoring some residual impact for a subset customers located within North America. Please visit https://status.office.com for additional information.

    現在、大部分のサービスは、ほとんどのユーザーが復旧しています。北米内の一部のお客様については、一部の影響が残っているかどうかを注意深く監視しています。詳細については、https://status.office.com をご覧ください。

     私は,北米では無いから.(たぶんリージョンは日本だとおもう)

    https://status.office365.com
     ちょっとだけ変わっていたので抜粋.

    引用:
    Current status: We have confirmed via our monitoring that the majority of services have recovered for most customers. However, we continue to see a small subset of customers whose tenants are located in North America region who are still impacted. We're now investigating mitigation steps for those customers who are still affected.

    現在の状況 モニタリングの結果、ほとんどのお客様のサービスが復旧していることを確認しております。しかし、北米地域にテナントがあるお客様の中には、まだ影響を受けている一部のお客様がいます。現在、影響を受けているお客様への緩和策を検討しています。

    Microsoft 365 障害発生中

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2020/9/29 10:14
     全世界的に新規ログオンができなくなっている模様.今のログオン情愛は保持しなければいけないな.
     10時出社の人とは連絡取れないかもな...




     対応状況を確認するためのサイト.

    Microsoft 365 Status
    https://twitter.com/MSFT365Status
    引用:
    We're investigating an issue affecting access to multiple Microsoft 365 services. We're working to identify the full impact and will provide more information shortly.
    複数の Microsoft 365 サービスへのアクセスに影響を与える問題を調査しています。影響の全容を特定するための作業を行っており、近日中に詳細な情報を提供します。

    We’re rerouting traffic to alternate infrastructure to improve the user experience while we continue to investigate the issue. Please visit http://status.office.com for additional information.
    問題の調査を継続している間、ユーザー体験を向上させるために、トラフィックを別のインフラストラクチャに再ルーティングしています。詳細については、http://status.office.com をご覧ください。

    We’re seeing improvement for multiple services after applying mitigation steps and we’ll continue monitoring the services to ensure full recovery. Please visit http://status.office.com for additional information.
    緩和措置を適用した後、複数のサービスで改善が確認されており、完全な回復を確実にするためにサービスの監視を継続します。詳細については、http://status.office.com をご覧ください。

     障害による問題のあるサービスを確認する情報.

    Microsoft 365 Service health status
    https://status.office365.com
    引用:
    Title: Can't access Microsoft 365 services

    User Impact: Users may be unable to access multiple Microsoft 365 services.

    More info: Users may be unable to access any services that leverage Azure Active Directory (AAD) including Outlook, Microsoft Teams and Teams Live Events as well as Office.com. Additionally, Power Platform and Dynamics365 properties are also affected by this incident.

    Existing customer sessions are not impacted and any user who is logged in to an existing session would be able to continue their sessions.

    Current status: Our mitigation strategy was successful in allowing users to sign into the previously impacted services. Our internal monitoring has validated this recovery and we have received positive confirmation from customer reports. We’ll continue to monitor the service and provide updates on full recovery to remaining impacted users.

    Scope of impact: Any user may experience access problems for Microsoft 365 services.


    詳細はこちらをご覧ください。Outlook、Microsoft Teams、Teams、Teams Live Events、Office.comなど、Azure Active Directory (AAD)を利用しているサービスにアクセスできなくなる可能性があります。また、Power PlatformおよびDynamics365のプロパティもこのインシデントの影響を受けます。

    既存のお客様のセッションに影響はなく、既存のセッションにログインしているユーザーはセッションを継続することができます。

    現在の状況 緩和策により、影響を受けていたサービスにサインインできるようになりました。当社の内部監視により、この復旧が確認され、お客様のレポートから肯定的な確認が得られています。今後もサービスの監視を継続し、影響を受けた残りのユーザーに完全復旧に関する最新情報を提供していきます。

    影響の範囲。どのようなユーザーでも、Microsoft 365 サービスへのアクセス問題が発生する可能性があります。


     リージョン別,機能別に状態がわかる.
    Azure の状態
    https://status.azure.com/ja-jp/status



    引用:
    警告 Authentication errors across multiple Microsoft or Azure services - Seeing Signs of Recovery

    Starting at approximately 21:25 UTC, a subset of customers in the Azure Public and Azure Government clouds may encounter errors performing authentication operations for a number of Microsoft or Azure services, including access to the Azure Portals. Engineering teams have applied mitigation steps and are continuing to validate for full mitigation. At this time, customers in both the Azure Public and Azure Government clouds should see signs of recovery. The next update will be provided in 60 minutes or as events warrant.

    This message was last updated at 01:31 UTC on 29 September 2020

    警告 複数のMicrosoftまたはAzureサービスにまたがる認証エラー - 復旧の兆しを見る

    UTC 21:25頃から、Azure PublicおよびAzure Governmentクラウドの一部の顧客が、Azure Portalsへのアクセスを含む多くのMicrosoftまたはAzureサービスの認証操作を実行する際にエラーが発生する可能性があります。エンジニアリングチームは、緩和措置を適用し、完全な緩和のための検証を継続しています。現時点では、Azure Public クラウドと Azure Government クラウドの両方のお客様に回復の兆しが見られるはずです。次回の更新は、60分以内、またはイベントに応じて提供されます。

    このメッセージの最終更新は 2020 年 9 月 29 日 01:31 UTC です。
     Active Directoryに障害が出ているのであれば,これが単一障害点か.キャッシュログオンで救われているけれど...

    Office 365障害

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2020/4/22 9:48
     昨日,Office365のWebメールに障害発生と連絡が.
     普段,Web版は使ってないので障害を感じることはなかったけれど,現在のステータスがどういった状態かは,マイクロソフトの公式サイトで確認できます.

    サービスの状態 - Microsoft Office 365
    https://portal.office.com/servicestatus



     これだと現在状態しか出てないのだけれど,過去,どうなっていたかは,Downdetectorというサイトで確認できました.

    Downdetector
    https://downdetector.jp



     公式サイトの方も,履歴が観れるようになるといいなぁ.SLAの関係で出したく無いのかもしれないけれど.

    情報システムの障害状況一覧

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2020/3/6 23:00
    IPA 情報処理振興機構が,こんなレポート出してたんだな.


    情報システムの障害状況一覧
    https://www.ipa.go.jp/sec/system/system_fault.html

     記憶に新しいあの問題や,そんな事があったのかと報道で目にしなかっただけの大きな問題まで,色々とあげられています.
     障害の内容が,一次報道向けなので差し障りのないことを言っていることだけで参考になる情報は何もないけれど,障害が起こったら素早く正確に報告できる体制ができているか無いかは,よくわかる.

    追記2021/05/19
     2020年年末をもって「情報システムの障害状況」事業は終了したそうです.2月3月の,みずほ銀行などについても載ってない.
     みずほに限らず国も含めて,影響の大きいシステム障害が最近増えてきたので追いつかないのではなかろうか

    office 365 障害

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2019/11/20 23:57
     2日連続の大規模障害発生.

     「20日朝から「Exchange Online」「SharePoint Online」「Microsoft Teams」「Skype for Business」「Yammer」などのサービスが利用しづらい状況が続き、ネット上では「Teamsを起動すると、インターネット接続エラーが出る」「仕事にならない」「復旧を待つしかない」など悲鳴が上がっていた。」と報道されていたけれど,「Exchange Online」「SharePoint Online」「Microsoft Teams」「Skype for Business」を使っている某勤務先は,朝から全く仕事ができない.

     状況が混乱していたのは,接続できたり切断したりを繰り返したこと.これによって「私はできる・できない」「急にできなくなった・できるようになった」と情報が錯綜して,ローカルの話なのか広範囲なのか切り分けが難しかったことかな.

     どうせならすっぱり使えないようにしてくれれればよいものを.スマホのゲームアプリみたいにステータスコードによって「ただいまメンテナンス中です」と表示する程度の対応が実装されていてもおかしく無いだろう.英語のTwitterで逐次報告しているなんて,まるでどこかのポケモンGO・・・

     一番困ったのはRMS.Rights Management Servicesという機能で,詳細は以下.
     ユーザ作成ファイル,例えばExcelのXLSXファイルを保存すると,適当な感じで自動的に暗号化され保存される.添付ファイルでそのファイルを送信したいときは,ファイル選択後に右クリックで暗号化解除を行い,メーラに貼り付ける.一旦解除してもしばらくすると再度暗号化される.
     承認されてない人がファイルを持ち出した,手に入れた,誤送信したとしても相手には見ることができないわけだけれど,MicrosoftのAzure CloudでRMSの認証をしているので,つまりRMSのサービスが停止していると認証エラーできないのでファイルを開くことができない.

    クラウド時代のデータを保護する「Azure RMS」とは?
    https://www.itmedia.co.jp/enterprise/articles/1503/10/news006.html

     今回のトラブルで,メールも読めないしイントラとして使っているSharePointサーバもアクセスできなく,TeamsもSkypeも連絡手段が断たれてしまい,ネットが使えない時はローカルのファイル編集しようとしてもそれもできない.お手上げ.

     でも今日は午後から研修だったので,ちょっと早めに移動で外出しました.不幸中の幸い.

    原因不明のシステム障害

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2019/10/9 23:58
     一見関係ない原因不明のシステム障害は,何か大規模なセキュリティ攻撃の予行演習なのではないか.
     という話を聞いた.そういう推理は面白いので,ランダムにピックアップ.
    楽天銀行でシステム障害か スマホやPC取引不具合
    https://www.sanspo.com/geino/news/20190507/sot19050714400006-n1.html
    
    インターネット銀行大手の楽天銀行(東京)は7日、
    スマートフォンやパソコンからサイトの口座にログインできなくなる障害が
    起きたと発表した。
    原因は不明で、取引復旧のめどは立っていない。
    
     楽天証券とか,頻繁に障害出して金融庁から指導を受けているから,生まれは違っても同じグループ会社だから,障害が起こっても不思議では無い,かも.
     楽天銀行のサイト上には解消したとは書いてあるけれど,発生したこともその原因も記載されてない.金融庁のサイト上は,この件については今現在何も情報はでていない.
    FacebookやInstagramで原因不明の大規模なシステム障害が発生
    https://gigazine.net/news/20190704-facebook-instagram-network-incident/
    
     この件は,発表があった.

    FacebookとInstagramの大規模障害、原因はサーバの設定変更
    https://www.itmedia.co.jp/news/articles/1903/15/news066.html

     「昨日、サーバの設定変更の結果、トラブルが発生した。」と公式に発表があった.そして「これはDDoS攻撃ではない」とツイートしているそうだ.
     色々ある中でDDoSでは無いと宣言するあたり,DDoS対策ができているのかその逆なのか...?
    システム障害、全面復旧=関東・北海道の8信金
    https://www.jiji.com/jc/article?k=2019081500682
    
     関東地方や北海道の8信用金庫で発生したシステム障害が
    15日午後、全面復旧した。
    同日朝から現金自動預払機(ATM)での現金引き出しや
    振り込みのほか、窓口やインターネットバンキングでの
    取引ができなくなっていた。
    原因は調査中。
    
     これは復旧したけれど,詳細な原因については非公開かな.
    AWS日本拠点でシステム障害 PayPayなどに影響
    https://www.asahi.com/articles/ASM8R555TM8RULFA017.html
     米アマゾンが運営するクラウドサービス
    「AWS(アマゾン・ウェブ・サービス)」の日本の
    データセンターで23日、大規模なシステム障害が発生した。
    アマゾンによると、関東エリアにあるデータセンターで
    23日午後1時過ぎに障害が発生し、
    午後3時半現在も復旧していないという。
    
     これは,AWSのサーバが熱が原因だそうだ.

    AWSの障害は冷却装置の故障が原因--サービスはほぼ復旧
    https://japan.zdnet.com/article/35141698/
     ほんとかな? データセンタで熱暴走?!

     攻撃の予行演習というか実証実験と考えた時に,軽い障害を出してどういうIR(インシデントレスポンス)があるかという反応を観察しているのかもしれない.
     障害を発生させて,それが広まって公表され一次対策されるまでの対応時間の計測や,AWSのようなクラウドサービスを停止すると,ソーシャルゲームをはじめとするネットベンチャー系のサービスがたくさん停止していたけれど,それ以外の大手企業のサービスも停止してしまった事は,意外と騒がれなかった.

    AWS 東京リージョンで発生した大規模障害についてまとめてみた
    https://piyolog.hatenadiary.jp/entry/2019/08/23/174801

     mixi.jpもAWSだったのか...

     まぁ,これも「風が吹いたら桶屋が・・・」的な一蓮托生というか連鎖を調査するには丁度いいものだったかもしれない.

     攻撃者からみて,このAWSの障害の時に無傷で生存していたサイトが攻撃対象サイトだったとすると,新たに別の攻撃を仕掛けて,最終的なターゲットに近づいているのではないか.

     東野圭吾の映画「容疑者Xの献身」で「たとえば幾何の問題に見せかけて、じつは関数の問題であるとか」というセリフを思い出した.

     これからターゲットとなるであろう影響・反共の多いシステムといえば,即位の礼関係や,オリンピックかな.
     

    ローソンサイト停止中

    カテゴリ : 
    システム障害事故
    ブロガー : 
    ujpblog 2019/9/25 23:54
     ローソンでのPontaポイントの貯め方について調べごとがあったので検索したらローソンの公式サイトにアクセスしたら...


     調べて観たらこんなことになっていた.
    コンビニ大手「ローソン」は公式ホームページと公式アプリの
    サービスを一時停止したと発表しました。
    24日午後8時ごろ、システムを管理するサーバーに対し、
    不正な攻撃が確認されたためです。
    ローソンによりますと、現在、不正攻撃をした発信元の解明と
    防御策の対応をしている最中だということです。
    ホームページやアプリのサービス再開のめどは立っていません。
    [テレ朝news]
    
     もう27時間も継続しているということか.こういうのをいると今現在現場で右往左往とやってるのだと思うけれど,考えてみればローソンの公式サイトが使えないからと行って,なんのデメリットがあるのだろうか.ローチケは普通にアクセスできたし.

     ローソンのことだからなぁ...

    広告スペース
    Google