「Fronit 小課堂」AVX-512 指令集簡介,是選擇酷睿 X 的理由嗎?

在遊戲玩家、超頻愛好者、性能追求者之中,英特爾酷睿 i9-9900K(i9-9900KF、i9-9900KS)處理器憑藉優異的單核性能、強大的超頻潛力,受到廣泛關注,並佔領了大量市場。

i9-9900K 基本參數

  • 8 核 16 線程、3.6 - 5.0GHz、16MB 緩存
  • 雙通道內存、16 條 PCI Express 通道
  • 集成 Intel UHD Graphics 630 顯卡
  • TDP 95W
  • 499 美元

英特爾還有「酷睿 X」系列處理器,定位更高端的 HEDT(High-End Desktop)市場,擁有更多核心數和緩存,支持四通道內存和更多的 PCIe 通道。這系列處理器主要面向內容創作者,無論是影視後期還是 3D 渲染,多核帶來的優勢不言而喻。配置獨立顯卡,在 PCIe 16x + 16x 雙卡完全發揮性能的同時,還不影響 PCIe SSD 的讀寫速度。

9 代「酷睿 X」系列包括多款處理器:i7-9800X、i9-9820X、i9-9900X、i9-9920X、i9-9940X、i9-9960X、i9-9980XE。

「Fronit 小課堂」AVX-512 指令集簡介,是選擇酷睿 X 的理由嗎?

作為入門款 i7-9800X,同樣是 8 核 16 線程,比 K 系列最高端 i9-9900K 賣得更貴。

i7-9800X 基本參數

  • 8 核 16 線程、3.8 - 4.4GHz、16.5MB 緩存
  • 四通道內存、44 條 PCI Express 通道
  • TDP 165W
  • 599 美元

而 10 核 20 線程的 i9-9900X 價格更是賣到了 i9-9900K 的兩倍。

i9-9900X 基本參數

  • 10 核 20 線程、3.5 - 4.4GHz、19.25MB 緩存
  • 四通道內存、44 條 PCI Express 通道
  • TDP 165W
  • 999 美元

「酷睿 X」還需搭配價格更高 X299 主板,進一步推高了平臺搭建成本。不過對於專業人士,除了更高的多核性能和擴展能力,另一個原因讓他們更傾向於「酷睿 X」,便是其支持英特爾最新的 AVX-512 指令集。

「Fronit 小課堂」AVX-512 指令集簡介,是選擇酷睿 X 的理由嗎?

AVX 指令集簡介

AVX 指令集(Advanced Vector Extensions,即高級向量擴展指令集)是 x86 架構處理器中的指令集,被 Intel 和 AMD 處理器所支持。AVX 指令集由英特爾於 2008 年 3 月提出,並在 2011 年第一季度發佈的 Sandy Bridge 系列處理器中首獲支持,隨後 AMD 在 2011 年第三季度發佈的 Bulldozer(推土機)系列處理器中開始支持 AVX。

AVX 是 X86 指令集 SSE 的延伸,類似 IA16 至 IA32演進,AVX 把暫存器 XMM 128bit 提升至 YMM 256bit,將運算效率提高一倍。此架構支持 3-Operand Instructions(三運算指令),減少在編碼上需要先複製再運算的動作。AVX2 指令集將整數操作擴展到了 256 位,並引入了 FMA(熔合乘法累積)指令集作為擴充。AVX-512 則將指令進一步擴展到了 512 位,實際上應該叫做 AVX3。

按照英特爾的說法:

英特爾 AVX-512 是一組能夠針對各種工作負載和用途(例如科學模擬、金融分析、人工智能 (AI)/深度學習、3D 建模與分析、圖像和音頻/視頻處理、加密及數據壓縮)提高性能的新指令。


藉助多達兩個 512 位融合乘加 (FMA) 單元,應用程序在 512 位矢量內的每個時鐘週期可打包 32 次雙精度和 64 次單精度浮點運算,以及八個 64 位和十六個 32 位整數。因此,與英特爾高級矢量擴展 2.0(英特爾 AVX2)相比,數據寄存器的寬度、數量以及 FMA 單元的寬度都增加了一倍。

AMD 好戲被搶

2007 年 4 月,英特爾發佈了 SSE4 指令集;不到半年,同年 8 月,AMD 搶先宣佈 SSE5 指令集。 AMD 計劃在 K10 之後的下一代 Bulldozer(推土機)架構中率先支持 SSE5,並於 2009 年發佈該架構處理器。AMD 企圖先發制人,搶奪新一代指令集指揮棒。在以往的指令集爭奪戰賽中,基本上都是英特爾領跑,AMD 被動跟隨,之前從SSE 到 SSE4 均由英特爾制定。

不過沒有料到的是,英特爾玩的更狠,直接廢掉了 SSE 這個指令集名稱,而改用 AVX 指令集。英特爾的技術人員曾公開表示:AMD 的 SSE5 並不正統,英特爾沒有任何支持 AMD SSE5 的意向。AMD 最終奪權失敗,隨後開始支持 AVX 指令集,並採用 AVX 架構重新改寫 AMD 的 SSE5 指令集。

AVX-512 實際作用

在計算密集領域,例如科學模擬、 人工智能(AI)、深度學習(Deep Learning)、多媒體圖像處理和音視頻解碼等應用場景,AVX-512 指令集能夠提供很大的幫助,替代部分以往通過 GPU 完成的任務。且對於開發人員更友好,C 語言或彙編指令可直接編程,比通過 GPU 接口實現方便許多。

但在消費級市場中,支持 AVX-512 指令集的軟件和遊戲並不多,所以在很多應用場景中,「酷睿 X」系列處理器還不能完全發揮其實力。不過隨著英特爾 10nm 製程處理器的到來,主流處理器開始支持 AVX-512 指令集,必將加快 AVX-512 指令集的普及。軟件開發商也在跟進,包括 GCC、TensorFlow、x265、Cinema 4D 等軟件已加入對 AVX-512 指令集的支持。

對普通消費者來說,如今能直觀感受 AVX-512 威力的莫過於 SiSoftware Sandra 2020、AIDA64、y-cruncher 等支持 AVX-512 的測試 / 跑分軟件。相對於不支持 AVX-512 的英特爾或 AMD 處理器, 相關跑分測試顯示「酷睿 X」處理器能有 10% - 50% 的領先優勢。


分享到:


相關文章: