2018-05-26 21:34:45 百度AI

所有 PaddlePaddle 的应用者们：

我们很高兴地宣布，

PaddlePaddle Fluid 可以支持在卷积神经网络上进行 float 16模式的低精度预测了！

同时在 NVIDIA 最新的支持 Tensor core 的 GPU 提供的 float 16加速运算支持下，float 16模式的预测在不损失准确率的情况下，实现了很大的加速效果（跟float 32比较）！

为什么可以非常开心的庆祝起来？

这就需要从 float 讲起。通常的深度学习预测（inference）的参数，输入输出和运算都是用的4个字节的 float（也叫 float 32）浮点数表示。 Float 指的是浮点数，由 IEEE 指定规则，这种结构是一种科学计数法，用符号、指数和尾数来表示，底数定位2。float 包括1个符号位、8个指数位和23个尾数位。

如果改成用2个字节的 float 16浮点数来表示，可以节约内存占用、耗电量和运算时间。PaddlePaddleFluid 完成了在卷积神经网络（CNN)上进行 float16inference 的支持。跟 float 32模式的预测比较，在准确率一致的前提下，float 16模式的预测在 GPU 上更快，更省电，更节省内存占用。

这就好比在吃食物时，同样热量的棉花糖和软糖，显然后者的食用速度是快于前者的，这样也可以尽快消化。