餓了麼還是掛了,而且掛那麼久!異地多活成了擺設

餓著肚子的時候,打開餓了麼App,看到的卻是這樣的頁面。

餓了麼還是掛了,而且掛那麼久!異地多活成了擺設


無法忍受,居然直接扔一個RunttimeError給我!!!這種測試需要拉出去祭天了吧?

隨後餓了麼官方微博稱:非常抱歉!由於快速增長的訂單,我們的服務器沒能承接住大家的熱情,11時32分左右,在部分地區遭遇了大約28分鐘的故障,到12時左右,故障已經被修復。

餓了麼還是掛了,而且掛那麼久!異地多活成了擺設


這裡要打一個大大的問號,你真的是因為快速增長的訂單而掛掉的嗎?道歉文案還不忘吹一把,你的容量規劃呢,動態擴容呢?這麼容易就掛了嗎?

17年5月的時候,朋友圈各種刷屏餓了麼異地多活實現方案分享,在當時也是一個重磅消息,那麼一瞬間覺得這技術,賊牛逼。餓了麼CTO張雪峰在朋友圈透露:餓了麼多活(Multi-Active IDCs/Regions)終於取得成功,實現首次多活生產環境全網切換(灰度)

餓了麼還是掛了,而且掛那麼久!異地多活成了擺設


昨天這張截圖還被拿出來在各種群裡調侃,確實有點打臉的味道,但是我還是想說,給技術人一點時間,故障總是會有,但是我們得想盡一切辦法去避免,架構的演進過程中,不可能面面俱到,即使是那種你覺得不可能發生的故障,你也得做好100%的故障降級準備。

1、機房會不會停電,或者是電壓不穩

2、周圍施工,會不會挖斷電纜

3、雷雨天氣,會不會把機房變壓打掛

4、颱風山竹來,機房會不會被吹跑

當然了,上面這些都是大家覺得不可能發生的外界因素,可是萬一發生了呢?

不過餓了麼這次肯定不是外界故障,故障定位後,內部架構也許又要進行一次大規模演進,然後又可以在各種大會上吹吹吹... 然後繼續砰pa!

總之呢,作為技術人,各種技術方案落地,話不能說的太滿,給未來可能發生的問題留點臺階。


分享到:


相關文章: