警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

Navi潔身自好之日不久矣?

自2018年大礦災之後,即便經歷了2019年夏天這一波短暫回升,區塊鏈代幣行業依然處於低迷時期。2016~2018年通過Polaris系列顯卡大挖特挖的AMD礦卡家族,在2019年已經逐漸銷聲匿跡,新發布的Navi系列7nm顯卡也罕有涉及挖礦的新聞曝出。

警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

挖礦算力未得到革命性升級的RDNA架構,總算是免過挖礦之難

然而,GitHub(著名開源組織社區)在對AMD ROCm開發庫進行調查後獲悉:

AMD GPU將加入BFloat16(BF16)浮點指令的支持。此指令將比當前的FP16浮點性能獲得巨大(革命性)提升。

警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

而這一提升的幅度會是多少?ARM架構方面的測算提升幅度約為1.6~4倍,藍廠10代CPU架構方面在NPU、AI綜合增益約為2.5倍。因此,得益於大量CU(運算單元)的結構又是,GPU架構的BF16綜合增益,在高級製程下Sp數量擴張之後,將有可能達到4~10倍以上(無責推)。

打算用BF16革了FP16的命,劍指何方?

AI、深度學習是已確認的CPU(包括ARM類產品)下一階段重點發展方向,Jim Keller在換庒之後的基本操作也是將特斯拉任職期間主刀的AI、深度學習、神經網絡等“手術”實驗,植入第10代開始的Intel CPU上。

警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

除此之外,主流ARM芯片企業,在今年春末紛紛確認BFloat16指令集的研發、標準策略等工作進度。看來這場又AI為主導的神經網絡大升級已是待發之箭了。

警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

AMD RX5700XT的FP16性能:19.51TFLOPS(圖源AMD官網)

而AMD被曝將在“未來”的GPU上(筆者預計最快將在明年發佈的RDAN2架構上)支持BF16指令集,則傳達出更多隱含深意的訊息。

警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

挖礦運算,更像窮舉法的重複運算過程,運算單元越多越划算

眾所周知,典型的區塊鏈加密運算難度並不高,且運算模式重複率高。因此在多年來的經驗中表明,CPU強大的複雜運算能力應對“挖礦”運算並不佔優,反而是具備少則2048、多則4096(sp)的多單元GPU運算架構,對於區塊鏈挖礦運算更勝一籌。簡而言之就是,讓8個數學教授去做一萬道小學計算題的速度,絕對比不過2048個高中生的速度快。

警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

而這種“低難度”的運算操作,其實就涉及到‘單精度浮點性能’,恰好,傳統顯卡的單精度浮點性能和FP16(峰值半精度性能)息息相關。講到這裡,讀者們應該已經大概明白,數碼君想表達什麼了。

總結 & 預測(無責推)

AMD的顯卡份額基本上就是 的,在區塊鏈代幣行業遭遇瓶頸期、傳統顯卡挖礦模式趨於衰退的環境下,如何保持2016~2018年長達30個月的GPU快速增長勢頭?光靠遊戲卡或者零售、OEM大單是根本不可能的。

警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

各GPU區塊鏈運算相關參數一覽(圖例時間2018年7月)

因此,假設BFloat16獲得數倍於傳統FP16的性能增益,結合7nm+、大核心RDNA2架構、高達8192sp的旗艦卡皇,外加500W左右的TDP(Navi10結構推算),這張AMD顯卡的算力會怎麼樣?

警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

我不敢猜,我更怕的是:

獲得BF16指令集增強的大批100瓦左右、2048sp的RDNA2顯卡,再次重回礦場。
警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

往事不堪回首,本文僅供解悶,咱也不懂,咱也是瞎猜~


淘數碼關注數碼配件優惠特價資訊,關注+轉發+私信:【20196688】自動獲取更多優惠信息


分享到:


相關文章: