06.28 阿里雲迴應訪問故障:運維操作失誤導致,將敬畏每一行代碼

阿里雲回應訪問故障:運維操作失誤導致,將敬畏每一行代碼

阿里雲再次對6月27日下午發生的技術問題進行了回應和解釋,稱“對於故障,沒有藉口。”

6月27日下午,有網友反映,登陸阿里雲控制檯時出現異常,部分服務無法正常使用。隨後阿里雲在官網發佈公告稱,阿里雲的部分產品及賬號登陸出現訪問異常,截至當天下午17:30大部分受影響的業務已經恢復正常。

阿里雲在最新的說明中介紹,故障發生在6月27日16:21左右至16:50,受影響的範圍包括阿里雲官網控制檯,以及MQ、NAS、OSS等產品功能。

經過技術覆盤,故障發生的原因是,當天下午工程師團隊在上線一個自動化運維新功能中,執行了一項變更驗證操作。這一功能在測試環境驗證中未發生問題,上線到自動化運維繫統後,觸發了一個未知代碼Bug。錯誤代碼禁用了部分內部IP,導致部分產品訪問鏈路不通。

阿里雲稱,將認真覆盤改進自動化運維技術和發佈驗證流程,“敬畏每一行代碼”。


分享到:


相關文章: