英特爾14nm末代服務器增加了新指令

英特爾最近發佈了第二代可擴展Xeon處理器,代號為Cascade Lake,流程仍然是14nm,該架構仍然是Skylake-SP,而明年,英特爾將推出一代代號為Cooper Lake的14nm服務器平臺並且很可能會更換接口和主板,然後將轉換10nm Ice Lake。

Cascade Lake顯著增強了機器學習,ai人工智能和Cooper Lake繼續改進。根據英特爾發佈的最新開發者文檔,Cooper Lake將推出一種新的AVX512_BF16適當數量的神經網絡指令,它支持bfloat16(BF16)格式。

bfloat16(BF16)浮點格式介於標準化半精度FP16和單精度FP32之間。指數位與FP32相同且大於FP16,但小數位小於FP16。

英特爾14nm末代服務器增加了新指令

它允許開發人員通過降低16位空間的精度來實現更大的數值空間,在存儲器中存儲更多數據,減少進出空間所需的時間,並降低電路複雜性,最終提高計算速度。這種格式已成為深度學習的事實標準。谷歌TPU,英特爾未來的FPGA及其Nervan神經網絡處理器都將支持它。 Xeon Xeon家族的支持也是合理的。

Cooper Lake支持AVX512-BF16命令,包括VCVTNE2PS2BF16,VCVTNEPS2BF16,VDPBF16PS,並具有128位,256位和512位模式,因此開發人員可根據需要選擇九種不同版本。

令人驚訝的是,每次英特爾發佈新命令時,它都會確認支持的第一個架構以及此後支持的架構,例如原始AVX指令集。支持的架構標記為“Sandy Bridge and later”。但這一次,AVX512-BF16命令的支持結構只寫了“Future Cooper Lake”,並沒有看到通常的“and later”。

這似乎意味著只有14nm的Cooper Lake將支持AVX512-BF16,而下一個10nm的Ice Lake將被切斷。

英特爾回應稱:“Coper Lake現在將添加Bfloat16機器學習加速指令(DLBoost)。路線圖中沒有共享。”


分享到:


相關文章: