华为云故障的背后, 是用户持续不断的增长

疫情之下,万物皆可“云”。上班族“云办公”、学生党“云上课”。自全国大中小学校陆续在网上开课,上千万家企业迎来新一波“复工潮”以来,各线上平台跻身“顶流”。但突如其来的流量暴增让各大线上平台上演“连环崩”,系统接连崩溃,加载错误等情况时有发生,用户爆发式增长,这次,连华为云也崩了。

当前数字化正在加速,客户需求日趋复杂,云服务已成为企业IT的底层支柱。这意味着,云服务商面临的压力、承担的责任也越来越大,如何确保客户的业务无中断?成为云服务商不得不重点考虑的一个问题。最近,不少用户反映,一些云平台访问出现故障,后台账号无法登陆,让他们颇为苦恼。

科技世界,变化万千,云计算服务不断更新迭代,“速度与激情”已经成常态

2019年,全球知名科技公司的云宕机事件不断爆发,全球有影响力的云服务提供商均发生了“宕机事件”,包括:谷歌云、AWS、微软Azure、阿里云、腾讯云等,几乎没有企业幸免。

例如:美东时间2019年6月2日下午,大量用户反映谷歌邮件、谷歌云以及YouTube、Snapchat等应用软件系统速度缓慢,甚至无法登录,包括使用谷歌技术的苹果iMessage和iCloud等服务。在经历了大约4小时的宕机之后,这些基于谷歌云技术的服务才恢复正常。

谷歌经过调查后发现,是因为“服务器配置更改”导致的。据了解,事故期间,YouTube全球观看次数下降了10%,Google云存储的流量减少了30%。

华为云故障的背后, 是用户持续不断的增长

2018年日本软银故障造成约3000万软银用户无法正常通信,腾讯云因硬盘故障导致一家初创公司数据丢失;19年芝商所(CME)Globex平台出现了宕机,导致无法正常交易;19年 Facebook及旗下多项服务出现技术故障,广告业务直接受到影响; 19年阿里云故障导致不少互联网公司的业务受到不同程度的影响,不少网友微博上反馈称阿里云疑似出现了宕机故障,引发众多网友吐槽,“一大波程序员和运营、运维专员都从被窝爬起来去公司干活了”等等,这样的事例不胜枚举。

华为云故障的背后, 是用户持续不断的增长

纵观近年来,随着云计算的渗透、数据量的迅猛增长,越来越多的政府机构、企业等将自己的系统、数据搬上“云”。即便只是云服务上的一个小小宕机事件,都可能引发一场大灾难,那么各大云服务厂商也是第一时间响应发出公告,紧急处理宕机事件。

华为云故障的背后, 是用户持续不断的增长

面对当下疫情,复工复产,企业云上业务迅猛增加,用户暴增,数据海量增多,庞大的用户数据上云搬迁,华为云也宕机了,没能顶住此次“热浪的袭击”在云服务企业当中,面对暴增迅猛的数据流量,这已经不是公有云行业的第一次宕机了。

华为云故障的背后, 是用户持续不断的增长

那么关于宕机可能出现故障有哪些原因?

1.硬件自身故障:为了维持相对低廉的成本,云服务商通常采用X86结构的服务器,做过运维的朋友们应该知道,这些服务器在较大负载的情况下,平均1年宕机一次是相当大概率的事件。

2.网络问题,云计算厂商最怕的问题,因为机房内部的问题可以通过重视运维来解决,但是机房外部的网络问题,那可就真是看命了。比如遭遇突发性的大规模DDoS、一铲子挖断了机房的光纤,所以很多时候,真心不是云服务厂商自己技术不行。

3.机房运维问题,说实话,中国机房的水平…谁接触过谁知道

4.自然灾害等不可抗力事件,这个就不解释了那么,相应的云服务厂商,自己也会通过各种各样的方式来解决问题。

综上所述,在云服务领域做到“永不宕机”,并不是云服务厂商自己就能决定的,云计算服务未来的发展,还是有很漫长的路要走。

那么你怎么看华为云宕机?宕机是各大云服务厂商需要共同面对的问题,也许不久的将来,在软硬件升级结合不断完善的背景下,降低人为因素,容灾备份及时跟进,宕机或许将不再是问题。


分享到:


相關文章: