餓著肚子的時候,打開餓了麼App,看到的卻是這樣的頁面。
![餓了麼還是掛了,而且掛那麼久!異地多活成了擺設](http://p2.ttnews.xyz/loading.gif)
無法忍受,居然直接扔一個RunttimeError給我!!!這種測試需要拉出去祭天了吧?
隨後餓了麼官方微博稱:非常抱歉!由於快速增長的訂單,我們的服務器沒能承接住大家的熱情,11時32分左右,在部分地區遭遇了大約28分鐘的故障,到12時左右,故障已經被修復。
![餓了麼還是掛了,而且掛那麼久!異地多活成了擺設](http://p2.ttnews.xyz/loading.gif)
這裡要打一個大大的問號,你真的是因為快速增長的訂單而掛掉的嗎?道歉文案還不忘吹一把,你的容量規劃呢,動態擴容呢?這麼容易就掛了嗎?
17年5月的時候,朋友圈各種刷屏餓了麼異地多活實現方案分享,在當時也是一個重磅消息,那麼一瞬間覺得這技術,賊牛逼。餓了麼CTO張雪峰在朋友圈透露:餓了麼多活(Multi-Active IDCs/Regions)終於取得成功,實現首次多活生產環境全網切換(灰度)
昨天這張截圖還被拿出來在各種群裡調侃,確實有點打臉的味道,但是我還是想說,給技術人一點時間,故障總是會有,但是我們得想盡一切辦法去避免,架構的演進過程中,不可能面面俱到,即使是那種你覺得不可能發生的故障,你也得做好100%的故障降級準備。
1、機房會不會停電,或者是電壓不穩
2、周圍施工,會不會挖斷電纜
3、雷雨天氣,會不會把機房變壓打掛
4、颱風山竹來,機房會不會被吹跑
當然了,上面這些都是大家覺得不可能發生的外界因素,可是萬一發生了呢?
不過餓了麼這次肯定不是外界故障,故障定位後,內部架構也許又要進行一次大規模演進,然後又可以在各種大會上吹吹吹... 然後繼續砰pa!
總之呢,作為技術人,各種技術方案落地,話不能說的太滿,給未來可能發生的問題留點臺階。
閱讀更多 java全棧技術 的文章