Azure 宕機 3 個小時:因人為配置 DNS 失誤

可以用TITSUP這個技術術語來形容今天持續了三個小時的宕機,TITSUP的全稱是完全無法支持用戶的數據包。

至少在過去的一兩個小時,由於DNS配置失誤,微軟Azure雲在全球範圍內處於不穩定的狀態。

這次影響整個平臺的故障破壞了全球各地由微軟託管的各種系統:從Azure SQL數據庫和App Services,到多因子身份驗證、Microsoft 365、Teams、Dynamics、SharePoint Online和OneDrive,不一而足。

本文發稿時,這個雲巨頭在逐漸恢復如初,Azure地區在逐個地恢復正常,不過你遇到的實際情況可能會有所不同。問題似乎是從協調世界時(UTC)19點45分左右開始的。

Azure狀態頁面在UTC 21點28分顯示:“客戶在Azure及微軟其他服務(包括M365、Dynamics和DevOps等)方面可能遇到間歇性連接問題。”

“工程師正在研究影響網絡連接的DNS解析問題。連接問題導致對計算、存儲和數據庫等下游服務帶來了影響,一些客戶可能無法提交支持請求。”

“一有更多信息,我們會及時發佈。一些客戶可能開始看到恢復正常。”

換句話說,微軟還沒有給出故障消除信號;正如微軟所說,在接下來的半小時任何情況都有可能發生。

Azure 宕機 3 個小時:因人為配置 DNS 失誤


早些時候的Azure狀態頁面

在Microsoft 365狀態頁面上,微軟的技術人員聲稱內部DNS配置錯誤導致了這次宕機:

用戶可能無法訪問Microsoft 365服務或功能。

更多信息:受影響的服務包括SharePoint Online、OneDrive for Business、Microsoft Teams、Stream、Power BI、Planner、Forms、PowerApps、Dynamics 365、Intune和Office Licensing。

我們已找到並糾正了阻止用戶訪問Microsoft 365服務和功能的DNS配置問題。我們觀察到成功的連接數量增加,我們的遙測數據表明所有服務正在恢復。我們繼續密切關注環境,以驗證服務已恢復。

Azure 宕機 3 個小時:因人為配置 DNS 失誤


這不會是DNS問題頭一回整垮Azure――據估計,上一次發生這種情況時,幾個客戶的數據庫丟失數據,所以自求多福吧。

最新消息:

微軟表示它已修復了破損的系統,結束了今天持續了三個小時的宕機,Azure的網絡基礎設施應該或多或少已恢復正常:“我們已採取了緩解措施;大多數服務已恢復,只有一小部分服務可能仍受到一些影響。”

這個科技巨頭補充道:“底層的根本原因是不正確的名稱服務器授權問題。”


分享到:


相關文章: