被特斯拉嘲笑，英伟达放狠话要造超级AI芯片！_科技 _ 頭條網

NVIDIA的数据中心业务最近一直处于亏损状态，过去几年每年大约翻一番。它在2018财年达到了19.3亿美元，比上一年增长了近130％。这种增长主要是由于HPC中普遍使用NVIDIA GPU以及人工智能研究和开发的神经网络培训。

然而，常识说，在某些时候，运行AI应用程序的需求将变得比构建它们的需求更大（假设这些AI工具确实有用）。考虑到这一点，现在有很多公司，无论大小，都在为推理处理设计芯片，包括Google，Intel，Wave Computing和Graph Core。

进入基于图灵的Tesla T4和TensorRT 5软件

当NVIDIA宣布图灵GPU，定位可视化和实时渲染时，它包含了一些非常有趣的规格，表明它可以成为一个很好的推理引擎。行业观察家们想知道NVIDIA GPU是否是引领这种向“生产AI”过渡的合适技术，因此对NVIDIA首席执行官Jensen Huang来说，展示公司在推理处理中的地位至关重要。令人失望的是，黄先生在GTC-Japan主题演讲中宣布推出基于Turing的全新Tesla T4，这是该公司首款专门针对数据中心推理处理的GPU。

迄今为止，NVIDIA的推理平台一直专注于机器人和自动驾驶，例如用于汽车的DrivePX中的Xavier SOC和用于机器人的Jetson。就数据中心的推理处理而言，NVIDIA表示其P4和P40 GPU在云中非常受AI欢迎 - 提供视频，语音处理，运行电子商务推荐引擎的图像识别，以及用于分析和翻译的自然语言处理演讲成文。NVIDIA共享的一个例子是微软Bing，它使用这些GPU为其视觉搜索功能提供了比使用CPU快60倍的能力。此外，每个P4 GPU可以处理30个同步的视频流，以每秒30帧的速度运行。

全新的NVIDIA Tesla T4 GPU将有效取代P4，并采用图1所示的薄型PCIe封装。新型芯片仅耗电75瓦，具有针对推理作业中流行的整数计算优化的320“Turing Tensorcores”。它可以产生每秒130万亿的8位整数和260万亿次4位整数运算（或TOPS）。如果您需要浮点运算，例如神经网络训练所需的，T4可以处理65 TFLOPS进行16位计算 - 大约是NVIDIA Volta GPU性能的一半，而功耗仅为1/4。最终结果是处理前面提到的视频流的速度提高了2倍; 虽然P4可以处理30，但T4可以处理60。

该故事的软件方面基于NVIDIA TensorRT的第5版，它提供神经网络的预处理，以优化其在新设备上的执行（分支修整，稀疏矩阵优化等），以及运行时库来支持执行。 TensorRT 5还支持Kubernetes容器化，负载平衡，动态批处理和交钥匙资源管理，以帮助云服务提供商将这些新GPU放入其基础架构中。 TensorRT 5还支持Google神经机器翻译（GNMT）。

NVIDIA一直在努力在数据中心的AI推理处理中建立自己的位置，原因有两个：

大规模推断刚刚开始，今天大部分或大部分处理都可以通过Intel Xeon（或AMD EPYC）CPU来处理。主要用例是低分辨率静止图像，例如Facebook用户上传的图像，因此在推理处理中几乎不需要GPU的强大功能。

NVIDIA没有通过AI与HPC与虚拟桌面基础架构分解其数据中心业务，更不用说AI培训与推理。它不能或不会说已经有多少GPU用于推断。

随着越来越多的应用程序处理流媒体视频的品牌，安全性和营销，第一个挑战应该消失。此外，既然NVIDIA拥有专用的推理GPU，我们可以期待用例。也许我们甚至可以了解公司能够捕获的推理处理量。

最后，我要指出的是，有数十家创业公司针对推理，有可能匹配（甚至可能超过）特斯拉T4的性能和效率。与人工智能训练不同，这不可能是一匹马。但就目前而言，大多数创业公司只有PowerPoint。 NVIDIA现在有一个真正的专用推理引擎可供出售。

再来看看其他正在做AI芯片的公司。

Facebook也在探索芯片开发，说不定哪天它就可以开发出AI芯片。这并不令人意外，因为去年英特尔表示，它正在与Facebook合作开发一种新的AI芯片。就在最近，Facebook才刚刚从谷歌挖来一员大将——谷歌前芯片产品开发部门负责人Shahriar Rabii跳槽，担任Facebook副总监及芯片部分负责人一职。

在收购了一家名为Nervana的创业公司之后，英特尔正在构建专门用于机器学习的芯片。IBM也是如此，创建了一个反映神经网络设计的硬件架构。LeCun表示，最近，高通公司已开始专门为执行神经网络构建芯片。

正如Google的TPU所示，专用的AI芯片可以为数据中心带来全新的效率，特别是随着对图像识别服务需求的增加。毕竟，谁比谷歌本身更了解谷歌的人工智能处理需求？从最开始使用 CPU 跑 AI，到用 NVIDIA GPU 跑 AI，再到如今专有的 TPU AI 芯片跑 AI，就是专用场景优化的结果。随着虚拟和增强现实变得越来越普遍，手机和耳机将需要类似的芯片。

此外，谷歌还发布了Edge TPU，特定用途 ASIC 芯片，专为在设备上运行 TensorFlow Lite ML 模型而设计。针对Edge TPU的新设备是：AIY Edge TPU Dev 开发板和 AIY Edge TPU 加速器，二者皆采用 Google 的 Edge TPU 芯片。

针对Edge TPU的新设备是：AIY Edge TPU Dev 开发板和 AIY Edge TPU 加速器，二者皆采用 Google 的 Edge TPU 芯片。

相關文章:

05.08 深信服：GPU将成为桌面云的标配

大众展示采用全触屏控制台的高尔夫 R Touch

小米太无耻了。

蹭热点！说说我理解的手机包装盒事件。

苹果公司正式发布iPhone SE二代手机

华为河图、麒麟芯片和鸿蒙OS三驾马车并行？华为生态建设布局深远

小米高管表示，四千毫安时 5G 手机，和三千多毫安时 4G 手机一样

5G画风变了：麒麟985落地首跑，荣耀坐上开往高端的「地铁」

旗舰手机标配Wifi 6 换Wifi 6路由器的时机到了吗？

2020年5G手机卖不动？继苹果砍单25%之后，华为小米纷纷跟砍？

干翻华为P40系列 荣耀30也玩中

程序员辞互联网工作，跨行传统上市公司，上班第1天就蒙了

苹果发布新款iPhoneSE，3299元起售

我很纠结：我究竟适不适合做亚马逊电商？看了这三条你就知道了

请仔细阅读，关于跨境电商你想知道的都在这儿

骗子手段太“精明”：商家赔了货物又赔款，亚马逊平台骗术大揭秘

做跨境电商这么多年，今天才知道给国外客户发文件原来这么简单

值得收藏！三类卖家三种选品方案，总有适合你的一个……

万万没想到！亚马逊平台上面卖床单竟营收一个亿！你还在等什么？

做店铺这么多年，今天才知道我的listing突然被封，竟是因为……

亚马逊小白看过来！请采纳这些：亚马逊选品和运营的小建议

亚马逊卖家如何爆单？跨境精细化运营攻略必看

不收保证金、入住费、年费，还免三个月佣金，我也想入驻这个平台

马云终于要辞职了，留下的话句句触动人心

等等，明年5G手机将迎来大降价

微信公开课PRO版2019正在进行时，往届各自都有什么黑科技

推出「信任分」升级「闪购」，美团本地生活这盘棋有多大？

5G我们超越了6G我们也将领先! 美国为什么会害怕失去5G领导地位呢

界读｜华为：帮助英国共渡疫情难关，无端批评令英国蒙受损失

为什么华为今天可以傲视群雄，在世界上立于不败之地？

血战「在线办公」，阿里、腾讯、字节、华为的底牌与大杀器

2020年最强拍照旗舰来了 华为P40系列多项业界首创 香！

今天聊一聊直播

通过直播赚钱不容易，既要豁得出去，又要端得起来

AI和自动化技术联手，最终会让60%的工人失去现有的饭碗。

这个网还能不能好好上了？今日全球IPv4地址正式耗尽

12306系统不行？内行人告诉你它有多牛，阿里腾讯高手去了也膜拜

有内幕？美国防部授与微软百亿云合同，亚马逊不满发起诉讼

未来之芯--RISC-V总部从美国迁往瑞士，华为、阿里是其成员

神话还能继续吗？几度过山车，比特币半年来首次跌破7000美元

刘强东卸任后，突然宣布一个“好消息”，让马云措手不及！

苹果的疯狂其实从未停止，AirPower或将重新启航

干翻华为P40系列荣耀30也玩中

2020年最强拍照旗舰来了华为P40系列多项业界首创香！