KDDI障害、加入者DBの不一致とは、加入者DBに加入者データを書いて、その後にVoLTEサーバに書き込む。この時、VoLTEサーバが輻輳しているので書き込めず不一致に。不一致だとエラーが出てしまう。
2日から続くau通信障害、KDDIの髙橋社長が緊急会見で謝罪しました https://t.co/xugNElUACH
— 石井 徹 @モバイル・ITライター (@ishiit_aroka) Jul 3, 2022
au通信障害。現時点で判明している、影響範囲。回線数は最大3915万回線。スマホは3580万回線。 https://t.co/eejWuJHThF
— 石井 徹 @モバイル・ITライター (@ishiit_aroka) Jul 3, 2022
au通信障害の流れ
— 石井 徹 @モバイル・ITライター (@ishiit_aroka) Jul 3, 2022
2日1:35 コアネットワークのメンテナンス作業中にルーターで障害が発生
1:50 一部音声通信が不通になっていることが判明。メンテナンス前の状態に戻す
2:17 貯まったトラフィックで音声交換機がパンク状態に。その後、加入者データベースもパンク
3:00 通信規制を実施 https://t.co/gHmS5LYRxZ
au通信障害、ざっくり言うと、
— 石井 徹 @モバイル・ITライター (@ishiit_aroka) Jul 3, 2022
ルーター交換で不具合発生(15分で復旧)
↓
復旧後に通信リクエストが貯まり、交換機がパンク
↓
交換機のパンクが加入者データベースのパンクに波及
↓
加入者データベースで“不一致”が発生
という4段階の混乱があり、復旧まで時間がかかっている、という流れです
IoT回線での影響数は150万回線と少なめですが、これは障害の影響がIoT回線の中でも「SMSを利用する回線」に限られているため。コネクティッドカーの制御回線などは別系統で管理しているため、影響がないとしています。
— 石井 徹 @モバイル・ITライター (@ishiit_aroka) Jul 3, 2022
スポンサーリンク
スポンサーリンク
au障害ざっと書くと
— 齋藤 勉/TsutomuSaito (@Tsutomu_eng) Jul 3, 2022
①メンテ作業でNWのルート変更した時に音声不通が発生。
②ルート変更切り戻しを実施。
③ユーザーの再接続処理多発でVoLTE交換機で輻輳発生→VoLTE交換機、無線側で流量制御対処実施。
④再接続処理多発で加入者DB側でも輻輳発生→負荷低減対処(西日本と東日本のNW切り離し)
通信は仕組みとして最初に加入者DBにアクセスしてステータスを書き、その後VoLTE交換機にアクセスしてそこで呼制御するんだけど、加入者DBとVoLTE交換機の間でステータス不一致だと通信出来ないと。
— 齋藤 勉/TsutomuSaito (@Tsutomu_eng) Jul 3, 2022
輻輳発生してることによりリクエスト捌けてないから、
— 齋藤 勉/TsutomuSaito (@Tsutomu_eng) Jul 3, 2022
加入者DBへのステータス書き込みに失敗した状態でVoLTE交換機にアクセスしにいって状態不一致で通信不可ってのが発生してると。
なので、今この状態不一致を輻輳解消した段階で再アクセスさせることで復旧させていってるとこだと。
— 齋藤 勉/TsutomuSaito (@Tsutomu_eng) Jul 3, 2022
KDDI障害、加入者DBの不一致とは、加入者DBに加入者データを書いて、その後にVoLTEサーバに書き込む。この時、VoLTEサーバが輻輳しているので書き込めず不一致に。不一致だとエラーが出てしまう。なるほど。ここは結構、疑問だった
— 本田雅一 (@rokuzouhonda) Jul 3, 2022
VoLTE交換機・加入者DBアクセス「グエー死んだンゴ」
— ケー (@ke_odakyu9000) Jul 3, 2022
au通信障害
— kaya15 (@kaya156) Jul 3, 2022
輻輳が起きた→加入者DBエラー→アクセス集中で障害
子のアクセス集中を減らす対処していたが追いつかなかった
KDDIのau障害、加入者DBの不一致が起こってるって、どうなってるの…?
— ゆっくりドットコム (@ch62547763) Jul 3, 2022
スポンサーリンク
スポンサーリンク
あー加入者DBの不一致ってそういうことか
— くえいる (@queile) Jul 3, 2022
au通信障害の会見を聞いていると、加入者DBとVoLte交換機のデータ不一致が回復が遅れている最大の原因かと思った。
— Kこーじ㌠ (@K_Kojis) Jul 3, 2022
#au通信障害
端末はまず加入者情報DBに情報を書き込み、次にVoLTE交換機DBに情報を書き込んだ後に2つのDBの整合性を確認?するが、VoLTE交換機に輻輳が起きたため書き込むことが出来ずに不一致となり、再接続するためにまた加入者情報DBに書き込んで…というわけか?
— dai (@d_7412) Jul 3, 2022
担当「ちょっと加入者DBとの不一致があり....長引いた原因の一つでした エラーが多く出まして....」
— リナ🖖スナバ(砂場)でMacをキメるプログラマ (@chrmlinux03) Jul 3, 2022
出典:AMEBA NEWSチャンネル https://t.co/xBnXayDdLx
通信輻輳により加入者データベースの不一致の件、どこにいるのか基地、位置情報など加入者DBに登録して、VoLTE(通話)のサーバーに登録するが、Vo LTEに繋がらないので、DBの不一致が発生してしまったと。
— 妙典・行徳あたりに在住 go_myoden (@go_myoden) Jul 3, 2022
おお。 https://t.co/hdAvePVUAt
加入者DB不一致の原因
— halpeq (@halpeq) Jul 3, 2022
移動機アクセス時に加入者DBにアクセスして位置登録をする。その後にVoLTE交換機へアクセスする。
VoLTE交換機輻輳によって、加入者DBとVoLTE交換機で状態にずれが起きていた。
長引いた理由は?
— ヘウゲもん (@heugemon) Jul 3, 2022
加入者DBとルーター書き込み情報の不一致、その解消(再書き込み)に時間がかかっているのも事実。
#KDDI通信障害
スポンサーリンク
スポンサーリンク
なんかいまいちなにやったかわかりにくいしなんで復旧し出したのかわからんのよな。
— りんご4個分 (@uxlayman) Jul 3, 2022
結局輻輳→流量制限、加入者DBも高負荷→流量制限しかやってない?それが17:31〜?その効果が確認できたから見通し出すようにした?それが1:00?
初回接続で加入者DBに位置情報などを書き込む。
— halu@BELIEVER. 春を待つ人 (@halu834) Jul 3, 2022
2回目の接続でVoLTE交換機側に位置情報などを書き込む。
今回、通信障害により2回目の書き込みができないことで、加入者DBとの情報に不一致が起きた。
#KDDI会見
作業切り戻し後に加入者DBの不一致を確認とは一大事じゃまいか
— ももむー (@momomuu) Jul 3, 2022
加入者のDB不一致ってauかなりやばくないか
— おとーふ (@Kinu54_Do_Fu) Jul 3, 2022
エンジニアの感覚的には、起こっちゃダメだけど、よくある話。
— 森山京平 / Kyohei Moriyama 📶 (@kyoheimoriyam) Jul 3, 2022
例えば新しいものに切り替えるというブルーグリーン的なデプロイじゃなくて、カナリーリリースのように緩やかに切り替えられれば良いんだけど、加入者DBが分かれていたら難しいよね。
なるほど加入者DBの不整合が起きてたのね。
— 水月あゆま (@ayumachin) Jul 3, 2022
って、もしかして作業に引っ張られてDB壊れたんかな?
KDDIのライブ会見のチャット欄がなかなかの地獄。
— ネゴトワ・ネティエ (@quadrifogliospa) Jul 3, 2022
・態度が悪い
・誠意を見せろ
日本人総ヤカラ進行中か。
それよりは原因と復旧見込みでは?
加入者DB不一致でエラーが増幅とか、なかなか厄介そう。
KDDI社長会見。「加入者DBの不一致」って、修整するのめちゃめちゃ大変そうやな・・・。
— ぽぽんぷぐにゃん (@poponpgunyan) Jul 3, 2022
スポンサーリンク
スポンサーリンク
この記事に問題があると考えた場合、こちらから作者様にご連絡をお願いします。