英特尔14nm末代服务器增加了新指令

英特尔最近发布了第二代可扩展Xeon处理器,代号为Cascade Lake,流程仍然是14nm,该架构仍然是Skylake-SP,而明年,英特尔将推出一代代号为Cooper Lake的14nm服务器平台并且很可能会更换接口和主板,然后将转换10nm Ice Lake。

Cascade Lake显着增强了机器学习,ai人工智能和Cooper Lake继续改进。根据英特尔发布的最新开发者文档,Cooper Lake将推出一种新的AVX512_BF16适当数量的神经网络指令,它支持bfloat16(BF16)格式。

bfloat16(BF16)浮点格式介于标准化半精度FP16和单精度FP32之间。指数位与FP32相同且大于FP16,但小数位小于FP16。

英特尔14nm末代服务器增加了新指令

它允许开发人员通过降低16位空间的精度来实现更大的数值空间,在存储器中存储更多数据,减少进出空间所需的时间,并降低电路复杂性,最终提高计算速度。这种格式已成为深度学习的事实标准。谷歌TPU,英特尔未来的FPGA及其Nervan神经网络处理器都将支持它。 Xeon Xeon家族的支持也是合理的。

Cooper Lake支持AVX512-BF16命令,包括VCVTNE2PS2BF16,VCVTNEPS2BF16,VDPBF16PS,并具有128位,256位和512位模式,因此开发人员可根据需要选择九种不同版本。

令人惊讶的是,每次英特尔发布新命令时,它都会确认支持的第一个架构以及此后支持的架构,例如原始AVX指令集。支持的架构标记为“Sandy Bridge and later”。但这一次,AVX512-BF16命令的支持结构只写了“Future Cooper Lake”,并没有看到通常的“and later”。

这似乎意味着只有14nm的Cooper Lake将支持AVX512-BF16,而下一个10nm的Ice Lake将被切断。

英特尔回应称:“Coper Lake现在将添加Bfloat16机器学习加速指令(DLBoost)。路线图中没有共享。”


分享到:


相關文章: