「至關重要的可靠性」公有云區塊儲存的可用性與耐久性

如同所有儲存設備與服務,資料儲存的可靠性,是考量公有云區塊儲存的應用時,不可忽略的關鍵環節。如果無法確保資料儲存的可靠性,那麼公有云儲存服務無論成本效益再高、如何地具備彈性,也難以承擔企業級的應用。

「至關重要的可靠性」公有云區塊儲存的可用性與耐久性

公有云區塊儲存服務的可靠性,我們能以可用性(availability)與耐久性(durability)來衡量。

其中可用性的需求,是利用分散式儲存架構的多複本鏡像複寫機制來實現,當前所有公有云服務商都是通過分散式架構來建構儲存環境,並通過糾刪碼(erasure coding)之類的技術,在資料中心的多個儲存節點間分散複寫資料,以防止單一儲存節點或元件的失效,從而造成資料遺失或存取中斷。

至於耐久性的需求,則是通過糾刪碼(erasure coding)與資料洗滌(Data Scrubbing)等技術的結合應用來實現,藉由持續地校驗磁碟區資料,防止資料惡化(corruption)或位元衰減(bit rod)等現象,導致磁碟區中存放的資料出現錯誤。

整體來說,目前的公有云區塊儲存服務都能提供相當高的資料耐久性, 優於一般企業級硬盤或SSD,例如AWS EBS的年故障率(AFR)為0.1~0.2,相較下,目前最新型的SAS硬盤與SSD的年故障率規格,則為0.35~0.45%左右,這也就是說,把資料存放在AWS EBS磁碟區上,要比存放在本地端服務器的磁碟機中更可靠。

但是,在可用性方面,公有云區塊儲存服務的表現平平,多數都只有99.95%或99.99%的服務等級,這意味著在一個月的使用週期中,含有多達21.5分鐘或4.32分鐘的潛在停機時間(downtime),只有AWS EBS與Azure磁碟儲存服務,可以達到更高的99.999%可用性等級,這相當於每月潛在的停機時間只有25.9秒。

整體來說,公有云區塊儲存服務的可用性,足以應對一般的企業應用,但若是對可用性極為敏感的關鍵應用,還是以本地端的高階儲存設備較為穩當。

一般而言,用戶可以通過公有云區塊服務內含的快照功能,來降低磁碟區不可用時造成的衝擊,能通過快照複本迅速重建失效的磁碟區。快照同樣也能幫助改善公有云區塊服務的耐久性,當原始磁碟區出現錯誤或故障時,可從快照複本還原資料。


分享到:


相關文章: