04.08 牙膏還能再擠擠 Intel14nm服務器增加新指令 10nm又一次了無音訊

近日,Intel發佈了第二代可擴展至強處理器,代號為Cascade Lake,工藝依然是14nm,架構依然Skylake-SP,而明年,Intel還將再拿出一代14nm服務器平臺,代號為Cooper Lake,或許會更換接口和主板,再往後才有可能使用10nm Ice Lake。


牙膏還能再擠擠 Intel14nm服務器增加新指令 10nm又一次了無音訊


Intel稱,Cascade Lake在機器學習、人工智能方面做了顯著增強,Cooper Lake則會繼續改進。根據Intel發佈的最新版開發者文檔,Cooper Lake會引入新的AVX512_BF16適量神經網絡指令,也就是支持bfloat16(BF16)格式。

bfloat16(BF16)浮點格式介於標準化的半精度FP16、單精度FP32之間,指數位和FP32一樣而多於FP16,小數位比FP16更少。

它能讓開發者在16位空間內通過降低精度來獲取更大的數值空間,在內存中存放更多數據,減少數據進出空間的時間,還能降低電路複雜度,最終帶來計算速度的提升。

這種格式已經成為深度學習事實上的標準,Google TPU、Intel未來的FPGA及其Nervan神經網絡處理器都會支持,Xeon至強家族支持也在情理之中。

Cooper Lake支持的AVX512-BF16指令包括VCVTNE2PS2BF16、VCVTNEPS2BF16、VDPBF16PS,而且都有128位、256位、512位三種模式,因此開發者可以根據需要選擇九種不同版本。


牙膏還能再擠擠 Intel14nm服務器增加新指令 10nm又一次了無音訊


Intel幾乎每次公佈新指令的時候,都會確認支持的首個架構以及此後支持的架構,比如最初的AVX指令集,支持的架構就標註為“Sandy Bridge and later”。

但這次,AVX512-BF16指令的支持架構卻只寫著“Future Cooper Lake”,並沒有看到慣例的“and later”。

這似乎意味著,只有14nm Cooper Lake才會支持AVX512-BF16,而接下來的10nm Ice Lake反而會砍掉。

Intel對此回應稱:“目前,Cooper Lake會為機器學習加速(DLBoost)加入Bfloat16指令。除此之外在路線圖內沒有可公佈的。”


牙膏還能再擠擠 Intel14nm服務器增加新指令 10nm又一次了無音訊



分享到:


相關文章: