WiMAX大規模障害の原因が判明

先日の大規模障害の原因が分かったようです。
簡素に言うとソフトウェアのバグが原因だったようですね。
台風によりトラフィックが集中したことによって見つかったバグで、バグフィックスにより今後同じパターンでの障害は起きないよう。


データ用回線をWiMAX一本に纏めてるので、少しでも安定的に運用して欲しいです。
UQ WiMAXには大変お世話になってるので、今回の件をバネにして頑張って欲しいです。


WiMAX大規模障害の原因



日本電気 モバイルWiMAXルータ AtermWM3600R シルバー PA-WM3600R(AT)S

日本電気 モバイルWiMAXルータ AtermWM3600R シルバー PA-WM3600R(AT)S

設備に内在するバグが起因……UQ WiMAX、大規模ネットワーク障害の経緯を公表


RBB TODAY 9月28日(水)16時15分配信


 UQコミュニケーションズは28日、東日本全域で発生した大規模ネットワーク障害について、経緯と対処を発表した。


 この障害は、9月21日17時45分〜2011年9月22日13時頃の約19時間15分にわたり、埼玉県、神奈川県、山梨県、北海道、青森県岩手県秋田県宮城県山形県福島県茨城県、栃木県、群馬県、千葉県、新潟県、東京都で発生したもの。障害発生原因については「アクセス系センター設備に内在するバグ」に起因するとされた。


 経緯の説明によると、当日は台風が接近し、交通機関が乱れる状況の下、通常トラヒックを大きく上回るアクセスが発生。アクセス系センター設備において、アクセスの増加に加え、大量のリトライ処理を繰り返すことにより異常な負荷が発生したことで、内部輻輳状態がおき、内在するバグによりセンター設備でシステムが停止したという。そのため、制御下にある東日本全域の基地局が停波し、通信ができない状態に陥った。再起動を試みるも、輻輳状況下では内在するバグにより再度システムが停止し、復旧措置中の負荷を抑止しつつ、センター設備を順次立ち上げたことにより、復旧までに時間を要したとしている。


 UQコミュニケーションズでは、障害解析の結果、該当設備のバグによるシステム停止が発生したことが判明したため、9月26日時点でシステム停止を回避する処置を実施。これにより、同様の障害は発生しないとしている。また、より一層の安定化を目的とし、11月上旬を目途にソフトウェアのバージョンアップを行う予定とのこと。あわせて設備障害時の早期復旧に向け、立ち上げ手順の見直しを行うとしている。