Azure生死17个小时,最后重启下好了!有人说:如果是PPIO就好了

据报道,Azure的多因子验证因为出现故障,使得用户无法登录持续17个小时,网民在twitter上疯狂吐槽,在工作周却无法工作,这多少有点戏剧性。

经过漫长的17个小时等待后,微软终于出了公告。表示故障已经于今日凌晨得到解决。

Azure生死17个小时,最后重启下好了!有人说:如果是PPIO就好了

  • 初步性的根本原因:从多因子验证(MFA)服务器到欧洲Redis缓存系统的请求达到了操作阈值,因而导致延迟和超时中断。尝试进行故障切换、试图将流量切换至北美后,这导致了另一个问题,即服务器变得无法正常运行,流量只好被遏制,以处理增加的需求。
  • 缓解:工程师部署了一个热修复程序,该修复程序断开了Azure身份多因子验证服务和后端服务之间的连接。之后,工程师关闭并重启了受影响的服务器,这使得身份验证请求成功处理。

众多IT人士表示:这很Windows!、果然还是重启大法好、Server Reboot Engineer SRE表示这很SRE、这才是正版的Windows、Windows大招重启,必杀重装系统。

综合来说,其实我喜欢这个简单处理问题的方式,就算现场只有临时工都会紧急处理。仔细想想,这也许就是微软被广大用户接受的原因,毕竟,没有哪家能保证不出故障。

前有阿里云、腾讯云故障,今有微软云出现故障,在数据安全与稳定越来越重要的今天,竟然还会出现如此大规模、长时间的机器故障,着实让人担心与惊讶。

Azure生死17个小时,最后重启下好了!有人说:如果是PPIO就好了

面对数据集权式的中心云公司故障频发,我越来越觉得分布式云存储才是未来,最近研究到有一个叫PPIO的项目,他们的分布式系统架构和未来发展路径,着实让我惊讶。

惊讶的一点在于,他们是以QoS为考虑目标,没有实现一步去中心化(因为这样会导致极低的QoS),而是先强中心,然后弱中心,最后去中心。这才是一款产品应该走的完美路径。

Azure生死17个小时,最后重启下好了!有人说:如果是PPIO就好了

众所周知,任何项目一旦与区块链结合,势必就会变臭,毕竟在大众的眼中:链圈的项目=圈钱的项目。

但是在PPIO身上,我看到了不一样的行为作风。

引用PPIO一位创始人的话说:区块链解决的是信任问题,不是数据存储问题。所以我在设计PP.io的时候,不会将存储文件放在链上,在链上只存放资产,合约,证明等和激励相关的信息。数据存放在分散的存储节点节点上,使用P2P存储技术来分配和调度,不存入区块链,数据是可以被所有者删除的,但也只能被数据所有者删除。就像比特币,只有所有者能发起转账一样。

对于未来,分布式云存储+区块链的结合势必引领未来,因为不论是从性能还是价格,其都有着无可比拟的优势。对于这一点的结论,我们或许可以从阿里身上找到一点苗头,从去年开始,阿里的区块链专利就是世界第一,再联想到阿里的云栖大会,这两者或许不是巧合,而是一种必然。


分享到:


相關文章: