« NHKの技術研究成果をもっと国民生活へ活用しよう!-NHK技研公開2007・研究発表より | メイン | 「100Gバイト・フラッシュ 2010年に1万円へ」-日経エレクトロニクス2007年5月21日号より(前半) »

2007年05月27日

NTT東西「ひかり電話}不通の原因を発表

 5月23日に発生した「ひかり電話」の不通の原因が、5月24日にNTT東日本、NTT西日本から発表されています。
 「ひかり電話」のNTT東西間接続装置の故障について(最終報)
平成19年5月24日
・・・ NTT東日本、NTT西日本

 
 それによると、不通の原因は「ひかり電話」のNTT東西間接続装置(中継系呼制御サーバ)の故障ということです。では、中継系呼制御サーバの故障の原因は何かというと、人的ミスとソフトウェアのバグ(不具合)が重なった、ということです。
 5月21日深夜から5月22日未明にかけて、ハードディスクの交換作業を実施した際に、作業員がコマンドのパラメータを誤って入力したということです。その時、ハードディスク内のデータの一部が破壊されていた(後になって判明)が、コマンド自体は正常に受け付けられた(注1)ために、作業員はコマンドは正しく受け付けられたと判断したようです。(この時点で作業員は、ミスには全く気付いていない)
 その後、5月23日6時25分に、このデータにアクセスがあり、異常処理が発生し、中継系呼制御サーバの通話制御が機能しなくなった(電話が不通になった)ということです。
 
 整理しますと、原因の1つめは、作業員によるコマンドのパラメータ入力誤り(人的ミス)、2つ目はパラメータの誤りによってハードディスク内の一部データが破壊されたこと(ソフトウェアのバグ)ということです。

 (注1) NTT東日本、NTT西日本による上記の報告では、“フェールセーフ機能が不充分でコマンドが正常に受け付けられた”と記載されています。“フェール(Fail)”つまり1つ失敗が発生しても、即危険(故障)には至らない=安全(Safe)を保つ、ということです。システムや機械、ユーザインターフェースなどの設計における考え方の1つです。

 
 今後の対策として上記資料では
 
 “今後同様の事象を発生させないようハードディスク交換時の作業内容のチェック強化等による再発防止に努めて参ります。
 さらに安心してご利用いただけるサービスを目指し、NTT東西間中継網をはじめネットワークの更なる信頼性向上に努めて参ります。”

 
と述べています。
 
 
 私どもの前回の記事でも申しましたが、NTTの「ひかり電話」に関係する障害は、昨年秋以降、大きいものだけでも3回発生しています。原因は、ソフトウェアのバグに起因するものが2回(2006年9月19日~21日発生、2007年5月23日発生)、人的要因が2回(2007年5月15日発生(注2)、2007年5月23日発生)です。
 (注2) 2007年5月15日に発生した「フレッツサービス」および「ひかり電話」の通信障害は、ルータのパッケージ交換工事を実施したことに伴い、一時的に処理能力を超えるルート情報が発生したことが原因ですが、広い意味で人的要因としました。
 障害個所としては、“呼制御サーバー”が多い(2006年9月19日~21日発生、2007年5月23日発生)と思います。
 
 
 特筆すべきは、今回の報告において、やや詳細な故障発生メカニズムの情報を公開していることです。
  別紙 故障発生のメカニズム(資料「『ひかり電話』のNTT東西間接続装置の故障について(最終報)」の別紙)
 情報を隠さずにオープンにするという姿勢は、評価したいと思います。今回は、最終的にはバックアップソフトウェアを再インストールという手段で、復旧したということですが、処理装置1系と処理装置0系を手動で切り替える、という選択肢は無かったのか、知りたいところです。(処理装置1系と処理装置0系の自動切替は、ハード障害時のみ作動し、今回のようなソフト的な障害時は作動しないとのことです。)その辺りまで、報告書の中で言及していただければ、NTTに対する信頼性回復につながるのではないか、と思います。
 
 
 なお、今回のトラブルに関しては多くのネットメディアが報じています。
 
  NTTのひかり電話障害はコマンド間違いが原因、待機系は稼働せず(ITpro)
 
  ・HDD交換ミス&バグで4時間ダウンしてしまう「ひかり電話」(@IT)

 
 
 また、相次ぐトラブルを受けて、NTTに対して総務省が行政指導を行なったことも、報じられています。
 
  総務省がNTT東西とNTT-MEに行政指導,障害の増加・長期化を問題視(ITpro)
 
  ・総務省、NTTに行政指導 IP網運用を問題視(CNET Japan)

  
 
--- 関連情報 ---
(1) NTT東日本・西日本「ひかり電話」東西間で不通、現在は回復 2007年05月23日 IT屋もりたの今時パソコン日記

投稿者 もりた : 2007年05月27日 23:58 このエントリーを含むはてなブックマーク この記事をクリップ!

トラックバック

このエントリーのトラックバックURL:
http://www.imadokipc.com/mt/mt-tb.cgi/490

コメント

森田さんこんにちは。
またひかり電話に障害があったようですね。

投稿者 わかめ路 : 2007年05月30日 17:10

 わかめ路さん、コメントありがとうございます。

> またひかり電話に障害があったようですね。

 そのようですね。今回は、過去の障害と異なり、利用者宅(会社)に配布(レンタル)されているルータ(正確にはルータ機能付きモデム)のソフトウェア(ファームウェア)の更新ミスのようですね。(カッコばかり多くてすみません。)
 該当する状況に陥っているユーザーは、解消の方法(設定方法)が、NTT東日本のニュースリリースのページに掲載されていますので、参考にして直したほうがいいですね。

投稿者 もりた : 2007年05月31日 00:28

コメントしてください




保存しますか?