收穫BAT三家訂單!細數英偉達 GTC 大會三大亮點!

9 月 26 日上午,英偉達 GTC 大會中國站在北京開幕。本次 GTC 大會上,英偉達除了發佈新版優化引擎 TensorRT 3.0 以外,還宣佈與國內 OEM 廠商展開合作,準備共同推出基於 Tesla V100 的HGX-1 加速器;同時宣佈全球首款自動機器處理器 Xaiver,正在與京東合作,共同探索無人機和送貨機器人等設備的發展。

收穫BAT三家訂單!細數英偉達 GTC 大會三大亮點!

大會 Keynote 亮點:

1、發佈 TensorRT3 深度學習引擎;

2、HGX-1加速器以及國內產業合作;

3、全球首款自動機器處理器 Xavier。

TensorRT3 深度學習引擎

在本次大會中,最為引人關注的就是正式發佈的 TensorRT 3.0 了。黃仁勳在大會上花費了大量篇幅對其進行了詳細介紹。「深度學習推理引擎」TensorRT 是連接神經網絡框架和硬件(GPU)平臺的橋樑,它的支持範圍覆蓋終端設備芯片到服務器級別的各種芯片。由於英偉達的硬件優勢,TensorRT 可以將神經網絡計算的延遲降低至業內最低水平,這對於面向消費者的應用級產品而言非常重要。

在使用 TensorRT 3.0 之後,ResNet-50 處理圖像的速度是 CPU 的 40 倍。

英偉達宣稱,新的 TensorRT 3.0 已經支持所有種類的流行神經網絡框架(包括 TensorFlow、Microsoft Cognitive Tookit、MXNet、PyTorch、Caffe2、PaddlePaddle 與 Theano),並覆蓋支持更多種類的 GPU(包括最近推出的 Jetson TX2 與 Tesla V100)。在過去主要面向於圖像處理任務的基礎上,英偉達的持續開發讓 TensorRT 支持了更多的應用和神經網絡種類。作為一個可編程的通用平臺,TensorRT 讓 GPU 相對其他硬件有了更多優勢。

收穫BAT三家訂單!細數英偉達 GTC 大會三大亮點!

「人工智能在過去的一年裡發展很快,但是我們面臨的挑戰仍然很多,」英偉達人工智能產品負責人 Han Vanholder 表示,「目前我們使用的服務器架構不是為人工智能任務設計的,在這種情況下,如果想完成一種語音識別服務,我們就需要(基於 CPU 的傳統服務器)用到價值 10 億美元的服務器組,而它的功率是 100MW——而這只是用於一種服務的數字。」

除了速度和效率,對於開發者而言,TensorRT 也是一種易於使用的工具。英偉達表示,很多人工智能研發團隊在使用中發現,用其他的解決方案可能需要幾周,幾月才能實現的深度學習項目(需要修改代碼、進行編譯、測試),在使用 TensorRT 的情況下只需要一天的時間就可以看到結果了,由於高度集成的特性,開發者在實現自己的想法時不需要調整大量手動設置。

收穫BAT三家訂單!細數英偉達 GTC 大會三大亮點!

「這樣就可以讓你更加關注與產品本身相關的東西了,」黃仁勳在演講中說道,「而不是在優化和兼容性上消耗時間。」

HGX-1加速器以及國內產業合作

在 GTC 大會上,英偉達也宣佈了一系列與國內相關的合作項目。其中,將搭載最新架構 Tesla V100 芯片的 HGX-1 帶入中國值得注意。在上午的大會上,黃仁勳宣佈,英偉達正在與華為、浪潮、聯想等公司展開合作,準備共同推出基於 Tesla V100 芯片的 HGX-1 加速器。希望使用這些技術的用戶,可以在近期獲得有這些公司生產的 OEM 產品。

收穫BAT三家訂單!細數英偉達 GTC 大會三大亮點!

高性能計算設備(HPC)是現代科學的基礎,從預測天氣、發明新藥到尋找新能源,大型計算系統能為我們模擬和預測世界的變化。這也是英偉達在新一代 GPU 架構推出時選擇優先發布企業級計算卡的原因。在今年五月,英偉達發佈全新 Volta 架構時,首先推出的就是專為 HPC 和 AI 的融合而設計的 Tesla V100 計算卡。目前,它主要整合在 HGX-1 加速器中被使用。

全新的 Tensor Core 設計是 Volta V100 最重要的特徵,它有助於提高訓練神經網絡所需的性能。Tesla V100 的 Tensor Core 能夠為訓練、推理應用的提供 120 Tensor TFLOPS。相比於在 P100 FP 32 上,在 Tesla V100 上進行深度學習訓練有 12 倍的峰值 TFLOPS 提升。而在深度學習推理能力上,相比於 P100 FP16 運算,有了 6 倍的提升。Tesla V100 GPU 包含 640 個 Tensor Core:其中每個流式處理器(SM)有 8 個。

矩陣-矩陣乘法運算(BLAS GEMM)是神經網絡訓練和推理的核心,被用來獲得輸入數據和權重的大型矩陣的乘積。如下圖 6 所示,相比於基於 Pascal 的 GP100,Tesla V100 中的 Tensor Core 把這些運算的性能提升了至少 9 倍。

加速器內含 8 塊 Tesla V100 芯片(外加必要的 CPU 等芯片),英偉達宣稱其性能相當於 150 塊 CPU 的和(在語音識別、圖像識別等任務中)。它通過 NVLink 高效並聯了 8 塊 GPU 的計算能力,通過 PCIe 交換架構,HGX-1 也可以動態鏈接任意數量的 GPU。這樣以來,一臺 HGX-1 就可以為用戶提供足夠的 CPU 和 GPU 應用。英偉達宣稱,在深度學習任務中,HGX-1 與傳統基於 CPU 的服務器相比,性能可以提升 100 倍,人工智能訓練任務的花費為後者的 1/5,AI 推算的十分之一。黃仁勳表示,每臺 V100 服務器可以為客戶節省 50 萬美元的成本。

「科大訊飛、微信、京東、阿里巴巴等公司都已經在使用英偉達的最新產品了。」黃仁勳介紹道。「對於這些公司來說,搭載 Volta 芯片的服務器讓自己獲得了先機。如果在手機 APP 上,一項服務的延遲有一秒鐘的話,用戶會感到不耐煩,傾向於轉而使用其他服務。對於阿里巴巴來說,在使用了英偉達的技術和硬件之後,他們獲得了滿意的效果。」

收穫BAT三家訂單!細數英偉達 GTC 大會三大亮點!

在本次大會上,英偉達也已宣佈自己已經開始與阿里雲、百度雲、騰訊雲等平臺展開合作,將搭載新一代 Tesla V100 芯片的服務器大規模投入使用。

「摩爾定律已經是過時的定律了,」黃仁勳表示,「它是一種緩慢增長的定律,GPU 的計算能力發展速度超過了摩爾定律,神經網絡的性能發展也超過了摩爾定律。我們將這兩者結合,可以創造更加美好的未來。」

收穫BAT三家訂單!細數英偉達 GTC 大會三大亮點!

全球首款智能機器處理器 Xavier

英偉達認為,AI 技術、用戶場景(關係到數據)和計算能力,促成了首批 AI 先鋒公司。作為芯片供應商,這家公司希望與所有致力於拓展 AI 前沿的公司展開合作。

京東選擇了英偉達的支持在無人機/機器人平臺上提供計算能力。京東稱在 2022 年將會部署 100 萬臺無人機用於物流。無論使用什麼樣的 GPU,TensorRT 都可以進行很好的支持。

收穫BAT三家訂單!細數英偉達 GTC 大會三大亮點!

在大會上,英偉達展示了搭載 Volta 芯片的新一代終端芯片 Xavier,並宣佈該芯片將會出現在下一代 Jetson 系統上,自 2018 年一季度起為京東的物流機器人與無人機率先提供支持。而大規模供貨需要等到 2018 年四季度。

收穫BAT三家訂單!細數英偉達 GTC 大會三大亮點!

隨著 Volta 系列芯片的推廣,英偉達正在將工作重心傾向企業級市場。「我們發現,目前市場在數據中心級別上的芯片需求非常大,」黃仁勳表示,「英偉達會以構建平臺的角度推進自己的計劃。」

在近日與谷歌在雲服務硬件中達成新合作之後,我們必將看到這家公司在人工智能技術的發展中扮演越來越重要的角色。

更多人工智能領域的新鮮資訊,歡迎關注遊戲陀螺的頭條號,或者在微信關注遊戲陀螺(shouyoushouce)~



分享到:


相關文章: