「至关重要的可靠性」公有云区块储存的可用性与耐久性

如同所有储存设备与服务,资料储存的可靠性,是考量公有云区块储存的应用时,不可忽略的关键环节。如果无法确保资料储存的可靠性,那么公有云储存服务无论成本效益再高、如何地具备弹性,也难以承担企业级的应用。

「至关重要的可靠性」公有云区块储存的可用性与耐久性

公有云区块储存服务的可靠性,我们能以可用性(availability)与耐久性(durability)来衡量。

其中可用性的需求,是利用分散式储存架构的多复本镜像复写机制来实现,当前所有公有云服务商都是通过分散式架构来建构储存环境,并通过纠删码(erasure coding)之类的技术,在资料中心的多个储存节点间分散复写资料,以防止单一储存节点或元件的失效,从而造成资料遗失或存取中断。

至于耐久性的需求,则是通过纠删码(erasure coding)与资料洗涤(Data Scrubbing)等技术的结合应用来实现,借由持续地校验磁碟区资料,防止资料恶化(corruption)或位元衰减(bit rod)等现象,导致磁碟区中存放的资料出现错误。

整体来说,目前的公有云区块储存服务都能提供相当高的资料耐久性, 优于一般企业级硬盘或SSD,例如AWS EBS的年故障率(AFR)为0.1~0.2,相较下,目前最新型的SAS硬盘与SSD的年故障率规格,则为0.35~0.45%左右,这也就是说,把资料存放在AWS EBS磁碟区上,要比存放在本地端服务器的磁碟机中更可靠。

但是,在可用性方面,公有云区块储存服务的表现平平,多数都只有99.95%或99.99%的服务等级,这意味着在一个月的使用周期中,含有多达21.5分钟或4.32分钟的潜在停机时间(downtime),只有AWS EBS与Azure磁碟储存服务,可以达到更高的99.999%可用性等级,这相当于每月潜在的停机时间只有25.9秒。

整体来说,公有云区块储存服务的可用性,足以应对一般的企业应用,但若是对可用性极为敏感的关键应用,还是以本地端的高阶储存设备较为稳当。

一般而言,用户可以通过公有云区块服务内含的快照功能,来降低磁碟区不可用时造成的冲击,能通过快照复本迅速重建失效的磁碟区。快照同样也能帮助改善公有云区块服务的耐久性,当原始磁碟区出现错误或故障时,可从快照复本还原资料。


分享到:


相關文章: