“捲土重來”的磁帶存儲

“捲土重來”的磁帶存儲

將磁帶運用於數據存儲的歷史,開始於20世紀的50年代。

雖然這聽上去像是睡前故事裡“很久很久以前”的那個時期,但在存儲領域,磁帶介質一直都是常青樹般的存在,雖然後起之秀們有如海浪一樣湧現,但是磁帶儲存依舊像岸邊的礁石那樣堅挺。我們仍然可以看到許多新興的,基於磁帶存儲的用例,在這些用例中,磁帶為諸多令人苦惱的存儲挑戰提供了完美的解決方案。


數據量的激增

激增的挑戰來源於兩方面:操作層與經濟層。公司和機構面臨著大型數據集的持續增長所帶來的管理難題,同時,管理成本也需要得到嚴格的控制。

這是一個前所未有的挑戰。根據世界經濟論壇(World Economic Forum)的數據,今年,全球的數據量很快將超過40ZB(1ZB=1,000,000PB)。而根據國際數據公司(IDC)的數據,到2025年,這一數字預計將達到175ZB。如果將範圍框定為企業數據——信息技術(IT)組織管理下的數據——雖然這個數字會低很多,但依然不容小覷。根據IDC的數據顯示,這一數字每兩到三年就會翻一番,預計到2025年將達到7.5ZB。

隨著智能傳感器數量的激增,企業對人工智能設備使用的日趨成熟,以數據為中心,開始成為越來越多的組織完成發展目標的基調,他們管理下的數據量只會呈現一種趨勢——上漲。

“捲土重來”的磁帶存儲

推動磁帶存儲“捲土重來”的因素

以下幾大因素,正在推動組織轉變其目前使用的存儲策略,也間接推動了磁帶存儲業務的復甦。


數據的價值

想要在當今的任一行業領域獲得成功,都離不開客戶體驗的優化和企業的業務創新。在Salesforce進行的一項調查中,超過76%的用戶表示,他們希望公司能夠深入理解他們的需求和期望(這兩點對於公司能否提供個性化的服務或產品體驗,是至關重要的),63%的受訪者表示,他們預計企業提供新產品和服務的頻率將高於以往的任何時期。

各類型的公司或組織,將比以往任何時候都更加依賴數據。通常,一個品牌或機構與另一個品牌或機構的區別就在於,雙方所擁有的數據量與數據類型——以及彼此如何對手頭的數據進行分析和使用。

如今,數據正在慢慢成為“數字經濟世界中的貨幣”。面對如此重要的資產,企業完全有必要在數據的備份、災難恢復和存檔方面,建立可行的、經濟合理的相關策略。


超大規模環境的增長

超大規模的環境不再像以前那樣罕見。十年前,“超大規模”這個術語是為大型服務提供商保留的——像亞馬遜、谷歌和微軟這樣的公司——這些提供超大規模雲計算服務的廠商。提供這類服務的前提在於,這些公司必須找到一種方法來管理大量的基礎設施環境,以滿足對計算和存儲資源的需求。他們的確也成功了。

大型服務提供商有能力運營極為複雜的IT環境,比如EB字節級別的存儲基礎設施等等。這些服務商對存儲技術進行了廣泛、且深入的研究和測試,得出的結論是,大規模提供廉價存儲的最佳方式是對象存儲技術和磁帶。

當然,很少有公司會有直接處理EB字節級別的業務的需求。然而,由於複雜的工作流,抑或是源於各類研究中的原始數據的增長,PB級別的環境數量開始變得十分常見。

比如汽車行業和對自動駕駛汽車的追求。這個領域目前的成功和失敗不是本文的重點,值得注意的是國際自動機工程師學會(SAE international)定義的6個級別的自動化指數——從沒有自動化(0級)到完全自動化(5級)。雖然目前,完全自動化級別的汽車還遠未觸及規模化民用的範疇。

但是業界對此類型技術的投資熱度始終存在。汽車製造商們需要為測試車輛配備專用的傳感器,海量的數據會在設計、測試和改進工作過程當中生成。在這種環境下,僅一輛測試車,每天就可以生成10-20TB的數據用於分析。對於這個領域的開發人員來說,通過數百PB的存儲空間,來保持工作流程的正常運行,已經是司空見慣的場景了。

生命科學是另一個受到數據量增長影響的行業。十多年前,人類的基因組測序的花費,高達30億美元。2015年,這一成本降至1500美元。今天,大多數的相關商業檢測程序的成本,不會高於1000美元。由於成本的降低,幾乎每個研究機構都有能力購買基因組測序儀器,並提供大眾檢測服務。由此生成的海量數據可用於研究,幫助研究人員在科研,或者疾病治療方面取得突破。

這些“二線”的超大規模環境,與之前提到的大型服務提供商們的基礎設施環境具有類似的特徵,因為它們都面臨著,如何長時間地保存大量數據的難題。而許多公司正在採用類似的解決辦法來滿足此類需求。

“捲土重來”的磁帶存儲

勒索軟件的威脅

勒索軟件攻擊事件,近年來層出不窮。根據McAfee最近的一份報告,2018年,勒索軟件的攻擊頻率同比增加了118%,在對所有被抓獲的幕後人員的罪證清理中,警方發現了超過20億個的被盜賬戶憑證。這樣的威脅不容忽視。企業必須採用更完備的數據備份和安全程序等措施,來防範此類風險。數據保護的最佳實踐方法,應當遵循3-2-1-1策略,即使用兩種不同介質的媒體,複製三份數據,一份保存在異地,另一份以離線狀態保存。防止勒索軟件攻擊辦法裡的重要一環是,將關鍵數據的副本離線存儲在磁帶上,其天然的物理防禦特性,是黑客和網絡罪犯無法攻破的。


磁帶技術的進步

“捲土重來”的磁帶存儲

(來源:Tape Storage Council)

比較不同的數據儲存媒體顯示,高性能磁帶提供最低誤碼率,甚至較其他技術更優1,000倍。

如前所述,磁帶在計算世紀的初期就已經存在了。漫長的歷史,對一家IT企業來說似乎並不算是一個友好的名詞,守舊、停滯的觀念會先入為主地根植於人們的觀念中,但事實並非如此。至少對於磁帶存儲技術來說,其一直在不斷地發展,相關的研發資金投入依然源源不斷。

線性磁帶開放協議(LTO),是由LTO聯盟開發的磁帶格式(LTO聯盟是一個聯合開發組織——由來自IBM、惠普和昆騰三家成員組成),於2000年首次發佈。從那時起,LTO成為了一項公認的磁帶存儲技術標準。

LTO-8盒式磁帶是目前市場上可用的,最新一代產品,在性能上比前幾代有著顯著的提升。(原生)狀態下,每個LTO-8盒式磁帶可存儲12TB的數據,(使用2.5比1的壓縮比)後,每個LTO-8盒式磁帶可存儲30TB的數據。此外,LTO-8盒式磁帶的數據傳輸速度更快,提供每秒360 MB的本地速率和每秒750 MB的數據壓縮速率。

雖然LTO-8的表現出眾,但對該技術的投資仍在繼續。根據LTO聯盟制定的發展路線圖,目前規劃到了LTO-8後的第4代——LTO-12,目標是使每卷本機磁帶的存儲容量超過150TB,每卷壓縮磁帶的存儲容量達到480 TB。

兩個額外的功能有助於磁帶產品的復甦:卷/文件磁帶歸檔和FLAPE (閃存+磁帶)。

2010年推出的LTO-5磁帶,首次搭載了線性磁帶文件系統(Linear Tape File System;LTFS)。LTFS支持對LTO磁帶進行索引,這種類似於USB驅動器的工作方式,使用戶可以更加方便地訪問存儲於LTO磁帶中的內容。這也使得用戶可以像面對磁盤介質那樣,管理和共享磁帶上的數據。

未來,我們預計LTFS將繼續作為媒體數據交換和長期數字媒體歸檔的主要格式。LTFS支持的數字媒體工作流、歸檔存儲和和備份管理等應用程序,也將伴隨新一代的LTO產品與相應的LTFS規範特性,保持持續發展的態勢。

FLAPE作為一種分層存儲方法,結合了閃存、磁帶兩種不同介質的共同使用。當數據被寫入閃存時,副本也會被隨之寫入磁帶。頻繁訪問的數據將保留在閃存中,以獲得最優的性能。一旦數據不再被使用,就會被從閃存中清除,為其他數據騰出空間。這使得用戶能夠優化對閃存的利用率,同時使用成本較低的磁帶介質,完成歸檔工作。


存儲成本

無論哪個行業,每個企業都有在數據管理的成本方面舉棋不定的時刻。從整體數據看,各個行業的數據量年平均增長率高達35%-65%。下圖,為LTO聯盟的LTO-磁帶產品的總擁有成本(TCO)計算器,其向用戶們展示了,如何發現雲端數據存儲中的隱藏成本,以及如何更智能、更節省完成數據存儲工作(詳情可查閱LTO官網:https://www.lto.org/resources/tcotool/):

“捲土重來”的磁帶存儲

如今的各類組織與公司,在數據量的不斷增長的大環境下,始終面臨著數據管理方面的挑戰。幸運的是,隨著研發方面的不斷投資,和介質密度的持續突破,歷久彌新的磁帶存儲始終能在市場中找到適合產品特性的創新用途,併成為廣泛的存儲環境中,一塊重要的拼圖。


分享到:


相關文章: