英特爾“存儲金字塔”重塑層級結構,破解AI存儲難題,指引存儲未來

4月24日,英特爾公佈2020年第一季度業績表現,在眾多業務群中,英特爾非易失性存儲解決方案事業部(NSG)實現了46%的最高同比增長,營收達到13億美金,比數據中心事業部(DCG)的增速還高3個百分點。

這其中,究竟是傲騰貢獻多還是傳統NAND存儲貢獻多,我們不得而知,不過從英特爾中國區非易失性存儲解決方案事業部戰略業務開發總監倪錦峰的言語間我們能感受到,其對傲騰業務的發展態勢非常滿意。

英特爾“存儲金字塔”重塑層級結構,破解AI存儲難題,指引存儲未來

英特爾中國區非易失性存儲解決方案事業部戰略業務開發總監倪錦峰

而在NAND存儲中,英特爾此前宣佈的144層QLC NAND規劃也在緊鑼密鼓地進行中。作為目前市場上最高層的NAND技術,144層QLC NAND的發佈勢必將掀起閃存普及的又一波浪潮。所以NAND存儲對於英特爾NSG業務部門的重要程度也不言而喻。

從倪錦峰的介紹中瞭解到,2020年第一季度,突如其來的疫情面前,英特爾數據中心業務需求迎來暴增的趨勢,互聯網、雲計算廠商對擴容都有較大需求,用戶對於TLC/QLC NAND以及傲騰+QLC的組合方案的需求明顯增多,倪錦峰認為,以創新閃存能力補充服務能力的做法比單純添加服務器的做法要更具優勢。

英特爾“存儲金字塔”重塑層級結構,破解AI存儲難題,指引存儲未來

當然,閃存的快只是一方面,另一方面,閃存的容量也越來越大,這種在性能和容量上不斷優化的層級就是英特爾常說的“存儲金字塔”,這一貫穿整個IT架構的體系已逐步成為解決多樣化存儲需求不變的參照系。

在2020年4月15日舉行的軟件定義存儲線上峰會上,倪錦峰詳細介紹了AI對數據基礎設施的挑戰,也介紹了英特爾如何基於“存儲金字塔”解決AI存儲的問題。

AI帶來的數據存儲新挑戰!

事實上,AI作為一種新的數據處理技術,它的數據管道(Data Pipeline)涵蓋採集、準備、訓練和推理四個階段,每個階段對於數據存儲的要求都不盡相同。

英特爾“存儲金字塔”重塑層級結構,破解AI存儲難題,指引存儲未來

數據採集階段:數據從不同來源聚攏並存儲起來,數據的大小和格式存在各種差異,數據類型往往是文件或者對象形式的非結構化數據。

採集過程的特點是首先要進行百分之百的順序寫入,從多個數據源進行數據的批處理或者流傳輸,如果存儲性能跟不上,數據就會被丟棄,所以,數據採集階段對存儲性能的要求非常高。採集完後,還要將收集來的數據重新放入更大的存儲池內,對讀性能也提出很高要求。

數據準備階段:由於數據大小和格式不一樣,為了便於訓練,必須改為統一格式,以便後續訓練階段使用。這一過程要對不同格式和尺寸的數據進行規範化處理,其快慢就取決於計算節點的內存以及存儲的性能。在數據轉化過程中,其工作負載跟採集過程也很不一樣,包括順序讀寫、隨機讀寫,在最極端的情形下,甚至可能是50%:50%的讀寫混合。

訓練階段:AI訓練過程的工作負載非常密集,往往需要高性能的GPU或者加速器等來執行一系列的數學函數,對資源要求非常高,在做特定訓練時,AI訓練所需的時間更加取決於所部署的高性能內存與高性能存儲的數量。

推理階段:推理過程是檢驗人工智能的重要階段,可以真正認識到人工智能的強大之處。推理基礎設施根據不同場景,所需配置的處理器、內存、存儲都不盡相同。

從以上可以看出,AI對於存儲的需求是複雜多變的,英特爾的思路是希望更多數據能夠更加靠近處理器,建立以數據為中心的高效存儲架構,也就是我們說的“存儲金字塔”。

以數據為中心的高效架構解決AI存儲難題

英特爾以數據為中心的存儲架構中,最上層是DRAM,最下層是磁盤和磁帶。其中,DRAM和英特爾傲騰持久內存提供超高性能和超低延遲,英特爾傲騰固態盤以及英特爾TLC、QLC大容量、高性能固態盤相配合則作為更好的溫熱數據存儲層。

英特爾“存儲金字塔”重塑層級結構,破解AI存儲難題,指引存儲未來

因為每一層級間的容量和時延特性有一個數量級的差距,所以系統可根據不同數據的工作負載進行冷熱分層,然後根據需求和成本預算來不斷優化性能,解決各種存儲難題。

作為一種革命性的技術,英特爾傲騰是過去20多年以來,在內存和存儲方面的革命性進步,它的出現讓“存儲金字塔”真正完整起來,成為解決各種存儲難題的殺手鐧。

相比傳統的NAND、HDD技術,革命性的傲騰技術具有以下重要特性:

第一,支持就地寫入(Write in Place),不需要像NAND一樣先擦除再寫入,引起對IO工作負載不利的問題,例如垃圾回收(Garbage Collection)等。

英特爾“存儲金字塔”重塑層級結構,破解AI存儲難題,指引存儲未來

第二,支持字節尋址(Bit addressable),最大程度的獲得超低的延遲。

英特爾“存儲金字塔”重塑層級結構,破解AI存儲難題,指引存儲未來

上圖展示的是硬盤在70%/30%的隨機讀寫工作負載下,所展現的IOPS/TB擴展能力。

隨著容量提升,機械硬盤的IOPS並沒有什麼提升,SATA NAND固態盤受接口限制,容量和性能提升也有限,PCIe固態盤受限於NAND介質的特性,擴展能力有限。而英特爾傲騰則從介質層突破種種限制,展現出良好的性能可擴展性,成為低性能存儲的有益的補充。

英特爾“存儲金字塔”重塑層級結構,破解AI存儲難題,指引存儲未來

同時,英特爾傲騰P4800X固態盤的延遲極低,一致性及壽命表現非常強。

據上圖最左顯示,在不同的隨機寫入負載下的平均讀取延遲,隨著寫入壓力的不斷增加,NAND固態盤的讀延遲也在不斷增加。相比之下,英特爾傲騰固態盤的超低延遲始終沒有變化(橫軸藍色線),在圖例中的極端情況下,傲騰固態盤比NAND固態盤的讀取延遲能降低63倍左右,差異非常顯著。

此外,英特爾傲騰P4800X固態盤有超高的壽命,通常我們用DWPD來表示寫入壽命,英特爾傲騰固態盤的DWPD便多達60 DWPD,相對英特爾的NAND SSD比如P4600、P4610只能支持3DWPD,傲騰固態盤在壽命上的進步是非常可觀的。

低延遲、高壽命的傲騰也帶來極高的系統效率,比如,可以用更低的緩存比例,來實現更好的性能,同時又承受巨大的寫入壓力。

英特爾“存儲金字塔”重塑層級結構,破解AI存儲難題,指引存儲未來

在人工智能場景中,四個階段通常用一個存儲數據管道來支撐,需要的是持續的、一致的吞吐量,以及超低的延遲,英特爾傲騰加上英特爾QLC 3D NAND的組合方案可以幫助改善客戶的超融合或者相應的軟件定義存儲的解決方案,為即將到來的人工智能的爆發,做好相應的準備。

在落地應用方面,百度已率先於2018年發佈了基於英特爾傲騰固態盤加英特爾QLC 3D NAND固態盤技術的存儲解決方案,這一解決方案極大提升了AI、Big Data、Cloud的存儲性能。比如說在AI的訓練場景中,相比原來的磁盤方案可以得到21倍的性能提升, 96%的延遲下降,同時TCO也下降了60%左右。此外,這一解決方案很好地解決了性能以及容量的可擴展性,百度對於該方案非常滿意。

英特爾“存儲金字塔”重塑層級結構,破解AI存儲難題,指引存儲未來

以數據為中心的高效架構面向廣泛應用場景

除了解決AI存儲難題,以數據為中心的高效架構在許多其他場景中都展現出了巨大價值。

英特爾“存儲金字塔”重塑層級結構,破解AI存儲難題,指引存儲未來

例如在VMWare vSAN方案中,將高性能緩存從NAND PCIe固態盤換成英特爾傲騰固態盤以後,虛擬機密度提升了60%,同時系統整合率能夠提升30%,也就是說,可以節省更多的服務器,更多的空間,減少更多的功耗等。

在Hadoop方案中,將英特爾傲騰固態盤作為Hadoop的臨時數據緩存,吞吐量或者性能可提升40%左右。

在開源分佈式存儲Ceph方案中,英特爾傲騰固態盤替換NAND固態盤存放Journal,作為元數據(metadata)緩存,能夠使得99%延遲降低73%,同時IOPS性能提升了大概40%左右。

微軟Azure Stack HCI使用英特爾傲騰固態盤作為緩存盤,每個系統、每個節點所能夠支持的虛擬機數量提升達60%左右,同時虛擬機的跑分也提升了80分。

此外還有很多國內企業也在積極利用英特爾傲騰技術進行創新,在本屆軟件定義存儲峰會上可以看到的浪潮、VMWare、XSKY、QingCloud青雲等都有相應的方案展示。

結語

在如今應用類型越來越複雜多樣,數據類型和數據存儲需求也多種多樣的發展趨勢下,我們也許無法預測未來的存儲技術是什麼,但可以肯定的是未來存儲將由工作負載來驅動。

英特爾不斷推動存儲技術演進,滿足不斷變化的需求,通過傲騰持久內存以及傲騰固態盤使得數據更加靠近CPU,通過QLC 3D NAND固態盤為海量數據存儲提供一個最佳選擇,英特爾所打造的“存儲金字塔”已在當下這個工作負載多樣化且密集的時代成為解決不同存儲需求的一大利器,而在各層級產品不斷演進的過程中,我們也有理由相信這一“金字塔”架構將在數據負載的指導下發揮出更大的價值。


分享到:


相關文章: