Azure生死17個小時,最後重啟下好了!有人說:如果是PPIO就好了

據報道,Azure的多因子驗證因為出現故障,使得用戶無法登錄持續17個小時,網民在twitter上瘋狂吐槽,在工作周卻無法工作,這多少有點戲劇性。

經過漫長的17個小時等待後,微軟終於出了公告。表示故障已經於今日凌晨得到解決。

Azure生死17個小時,最後重啟下好了!有人說:如果是PPIO就好了

  • 初步性的根本原因:從多因子驗證(MFA)服務器到歐洲Redis緩存系統的請求達到了操作閾值,因而導致延遲和超時中斷。嘗試進行故障切換、試圖將流量切換至北美后,這導致了另一個問題,即服務器變得無法正常運行,流量只好被遏制,以處理增加的需求。
  • 緩解:工程師部署了一個熱修復程序,該修復程序斷開了Azure身份多因子驗證服務和後端服務之間的連接。之後,工程師關閉並重啟了受影響的服務器,這使得身份驗證請求成功處理。

眾多IT人士表示:這很Windows!、果然還是重啟大法好、Server Reboot Engineer SRE表示這很SRE、這才是正版的Windows、Windows大招重啟,必殺重裝系統。

綜合來說,其實我喜歡這個簡單處理問題的方式,就算現場只有臨時工都會緊急處理。仔細想想,這也許就是微軟被廣大用戶接受的原因,畢竟,沒有哪家能保證不出故障。

前有阿里雲、騰訊雲故障,今有微軟雲出現故障,在數據安全與穩定越來越重要的今天,竟然還會出現如此大規模、長時間的機器故障,著實讓人擔心與驚訝。

Azure生死17個小時,最後重啟下好了!有人說:如果是PPIO就好了

面對數據集權式的中心雲公司故障頻發,我越來越覺得分佈式雲存儲才是未來,最近研究到有一個叫PPIO的項目,他們的分佈式系統架構和未來發展路徑,著實讓我驚訝。

驚訝的一點在於,他們是以QoS為考慮目標,沒有實現一步去中心化(因為這樣會導致極低的QoS),而是先強中心,然後弱中心,最後去中心。這才是一款產品應該走的完美路徑。

Azure生死17個小時,最後重啟下好了!有人說:如果是PPIO就好了

眾所周知,任何項目一旦與區塊鏈結合,勢必就會變臭,畢竟在大眾的眼中:鏈圈的項目=圈錢的項目。

但是在PPIO身上,我看到了不一樣的行為作風。

引用PPIO一位創始人的話說:區塊鏈解決的是信任問題,不是數據存儲問題。所以我在設計PP.io的時候,不會將存儲文件放在鏈上,在鏈上只存放資產,合約,證明等和激勵相關的信息。數據存放在分散的存儲節點節點上,使用P2P存儲技術來分配和調度,不存入區塊鏈,數據是可以被所有者刪除的,但也只能被數據所有者刪除。就像比特幣,只有所有者能發起轉賬一樣。

對於未來,分佈式雲存儲+區塊鏈的結合勢必引領未來,因為不論是從性能還是價格,其都有著無可比擬的優勢。對於這一點的結論,我們或許可以從阿里身上找到一點苗頭,從去年開始,阿里的區塊鏈專利就是世界第一,再聯想到阿里的雲棲大會,這兩者或許不是巧合,而是一種必然。


分享到:


相關文章: