黃仁勳發佈全世界最大的GPU,售價只要39.9萬美元

北京時間3月28日凌晨00:00,英偉達GTC 2018(GPU Technology Conference 2018,以下簡稱GTC)在美國聖何塞舉行。

英偉達再一次在提升計算力的路上越走越遠。

新產品—全世界最大的GPU只要399

GPU產品依然是主旋律,Tesla V100系列、DGX系列和Quadro GPU系列都進行了更新。

全新Tesla V100顯存將從原來的16GB提升至32GB。2017年5月11日,英偉達正式發佈了全新Volta架構GPU——NVIDIA Tesla V100,它擁有超過210億個晶體管,是上代TeslaP100的1.37倍。它的單精度浮點性能高達15 TFLOPS,雙精度浮點7.5 TFLOPS。

基於此前的NVIDIA NVLink架構,英偉達還推出了全新的NVSwitch架構。這一互聯架構的帶寬比PCle交換機高5倍,足以支持更大規模和複雜的數據集運算,讓開發者和科學家可以構建更高級的系統。

基於Tesla V100的升級和全新的NVSwitch架構,英偉達將DGX 2的性能較前一代產品有大幅度提升。

在2016年的GTC上英偉達正式發佈DGX 1,它擁有8顆帕斯卡架構GP100核心的Tesla P100 GPU,以及7TB的SSD,由兩顆16核心的Xeon E5-2698v3以及512GB的DDR4內存驅動。售價為129000美元。2017年9月份,英偉達推出了一款基於Volta架構的DGX 1V,擁有8塊Tesla V100。

而DGX 2應用了最新的NVSwitch架構,通過12個NVSwitch支持16塊全新的Tesla V100共享同一的內存空間,總計512 GB HBM2存儲,能實現每秒高達2千萬次的浮點運算。此外,基於NVSwitch架構的應用,16塊GPU可以實現2.4TB/秒的數據傳輸能力。

黃仁勳發佈全世界最大的GPU,售價只要39.9萬美元

DGX 2內含16顆Tesla V100芯片

“這是全球最大的GPU。”黃仁勳表示,他還用“美麗、性感”等詞語來形容這一款最新的DGX系列產品。

DGX 2的售價,黃仁勳首先給出的是150萬美元,最後直接減價為39.9萬美元,將在今年的第三季度正式開放購買。

面向藝術及設計領域,英偉達還推出了搭載了NVIDIA RTX(實時光線追蹤)技術的NVIDIA Quadro GV100 GPU。單塊GPU擁有32GB內存,可以基於NVLink技術將兩塊GV100 GPU並聯,從而將內存提升至64GB。在前一週的遊戲開發者大會上,英偉達正式推出了NVIDIA RTX技術。

GV100 GPU基於最新的Volta架構,可以提供每秒7.4萬億次浮點運算的雙精度性能,每秒14.8萬億次浮點運算的單精度性能,以及每秒118.5萬億次浮點運算的深度學習性能。

黃仁勳發佈全世界最大的GPU,售價只要39.9萬美元

黃仁勳手中的GV100 GPU

這款產品主要針對傳媒娛樂從業者、產品設計師、建築設計師等專業設計與流媒體專業人員。其中,NVIDIA RTX內置的NVIDIA OpitX AI-denoiser可以實現實時的AI降噪去噪。

硬件之外,英偉達還發布了針對軟件的更新——TensorRT 4軟件。這一軟件可用於優化、驗證和部署在超大規模數據中心、嵌入式與汽車GPU平臺中經過訓練的神經網絡。

為了籠絡更多的開發者,英偉達與谷歌的工程師將TensorRT集成至谷歌的TensorFlow 1.7中。

自動駕駛—暫停自動駕駛研發

黃仁勳發佈全世界最大的GPU,售價只要39.9萬美元

自動駕駛仍在本次GTC的討論之列

英偉達的自動駕駛平臺可以統稱為Drive PX系列。但是其實,Drive PX只是NVIDIA車載AI平臺的系列名稱。而這個系列目前主要包括兩代產品:已經量產的Drive PX 2平臺,以及在2018年初展示的新一代平臺Xavier。

不過黃仁勳卻在GTC 2018上宣佈英偉達將暫停自動駕駛的研發工作,雖然沒有說明何時能再推進這一進程,但是他也表示“不會太久。”

在2018年2月9日對外發布的2018財年第四季度及全年財報中,英偉達曾經提到過與Uber、Aurora合作打造自動駕駛汽車,採用的就是開源的NVIDIA Drive人工智能自動駕駛平臺。

美國當地時間3月18日晚上,亞利桑那州一名女子被Uber自動駕駛汽車撞傷,之後不幸身亡。這是全球首例自動駕駛車輛致人死亡的事故,隨後Uber宣佈將暫停其在美國和加拿大的自動駕駛項目。隨後在26日,亞利桑那州州長宣佈暫禁Uber在亞利桑那州公路測試自駕車。

黃仁勳在回答媒體關於該案件的提問時表示,英偉達對於這個意外感到悲傷,但是自動駕駛的研究本身是沒有錯的,應該從這個案件中吸取經驗,提升自動駕駛的安全性。作為Uber在自動駕駛領域的合作方之一,英偉達暫停自動駕駛的研發可能和Uber的自動駕駛汽車撞人致死案有關,但其並沒有完全放棄自動駕駛項目。

黃仁勳發佈全世界最大的GPU,售價只要39.9萬美元

英偉達的DRIVE Constellation仿真系統

英偉達在GTC上推出了針對自動駕駛汽車測試的仿真系統——DRIVE Constellation。

DRIVE Constellation仿真系統是一套使用照片級真實感模擬,基於雲的自動駕駛汽車測試系統。它基於兩個不同的服務器,第一臺服務器運行的是DRIVE Sim軟件,可以模擬自動駕駛汽車的傳感器,比如攝像頭、激光雷達和雷達等。

DRIVE Sim軟件可以通過生成照片級的數據流,從而創建不同的測試環境,比如晴天、暴雨、暴雪等不同的天氣狀況、日間和夜間等不同的光線狀況、急轉彎或陡坡等不同的路面狀況。並且在模擬過程中設置各種危險和突發狀況,比如行人突然穿越馬路等,以測試自動駕駛汽車的反應能力,以確定其不會對人帶來安全威脅。

第二臺服務器搭載的是NVIDIA DRIVE Pegasus AI汽車計算平臺,運行完整的自動駕駛汽車軟件堆棧,並能夠處理傳感器蒐集模擬數據。經過處理的數據會被反饋給傳感器,一直進行數據的循環。

從時間來看,英偉達推出的這個仿真系統和Uber的自動駕駛汽車撞人致死案並無太大關聯,不過在長遠的未來,它將能有效幫助提升自動駕駛汽車測試的安全性。

新合作—與ARM合作佈局IoT

英偉達還宣佈與ARM達成了合作,共同為全球數十億臺IoT設備提供深度學習的能力。雙方將開源的英偉達深度學習加速器整合到ARM的Project Trillium機器學習平臺上。

2018年2月23日,ARM推出了Project Trillium項目,這是一套包括新的高度可擴展處理器的ARM IP組合,這些產品可以提供增強的機器學習(ML)和神經網絡(NN)功能。當前的技術產品主要針對移動設備市場,將讓全新的搭載機器學習功能的設備具有先進的計算能力,包括先進的目標檢測功能。

在將英偉達深度學習加速器整合到Project Trillium之後,全球數十億臺的消費電子設備上的IoT芯片將具備機器學習能力。

GTC之外—計算力提升從創新驅動變為需求驅動

提到英偉達和黃仁勳,就不得不提到CPU。在2017年的GTC上,黃仁勳曾聲稱摩爾定律已經終結,設計人員無法再創造出可以實現更高指令集並行的GPU架構,晶體管數量每年增長50%,但CPU的性能每年僅增長10%。

在演講中,黃仁勳沒有放過任何一次揶揄CPU的機會。不管是更新後的Tesla V100、DGX 2,還是最新發布的GV100 GPU,黃仁勳聲稱“在提供相同的計算力下,它們都比CPU組成的集群要更節能、高效,佔用更少的空間。”

“買得越多,省得越多。”已經成了他的口頭禪。然而回歸到英偉達本身,其本身的高速增長很大一部分是依賴於市場對圖形芯片的巨大需求。

在英偉達公佈的2018財年第四季度財報中,雖然數據中心業務同比實現了一倍多的增長達到6.06億美元。但遊戲圖形芯片業務的營收達17.4億美元,同比增長29%,佔該季度總營收的一半以上。

“加密貨幣市場的強勁需求超出了我們的預期。” 英偉達首席財務官科萊特·克雷斯表示,“儘管加密貨幣對我們業務的總體貢獻仍難以量化,但我們認為,其在營收中所比例高於上一季度。”

從產品本身來說, GPU目前只能是不斷疊加性能,帶來的驚喜越來越少。以DGX系列為例,內含的GPU芯片從4顆變成了8顆,今年從8顆增長到了16顆,改變的只不過是互聯的架構。單顆芯片的算力提升越來越難,英偉達的“橫向發展”只是另闢蹊徑。

不過,英特爾的Nervana芯片,谷歌的TPU(目前只在谷歌內部使用)對於英偉達來說是潛在的競爭對手。有競爭在,更大的驚喜才有可能會到來。


分享到:


相關文章: