NVIDIA在MLPerf基準測試中創下六項人工智能性能記錄

Tensor Core GPU在每一項MLPerf基準測試結果中均實現最佳表現;用戶可通過NGC使用加速堆棧。

NVIDIA在MLPerf基準測試中創下六項人工智能性能記錄

在最新公佈的業內首套人工智能基準測試中,NVIDIA創下6項人工智能性能記錄。

在谷歌、英特爾、百度、NVIDIA及其他數十家科技行業領軍企業的支持下,新型基準測試套件 MLPerf 可測定一系列深度學習工作負載。該套件涵蓋了計算機視覺、語言翻譯、個性化推薦以及強化學習任務等領域,旨在成為業內首個客觀的人工智能基準測試套件。

最佳性能表現

NVIDIA 在其提交的 6 個 MLPerf 基準測試結果中均取得了最佳表現。這些測試涵蓋了多種工作負載和基礎架構規模 – 從單節點上的16顆GPU到跨80節點上的多達640顆GPU。

這些測試分為6大類別,分別為圖像分類、對象實例分割、目標檢測、臨時翻譯、複發性翻譯與 推薦系統。NVIDIA並未提交第7類別,即強化學習的基準測試,原因是該類別尚未充分利用到GPU加速。

NVIDIA在語言翻譯測試類別中表現突出

NVIDIA在語言翻譯這一關鍵基準測試類別中表現尤為出色,僅需6.2分鐘即完成了Transformer神經網絡的訓練。

NVIDIA 工程師利用 NVIDIA DGX 系統實現了這些測試結果。該系統包括全球最強大的人工智能系統NVIDIA DGX-2,搭載了16顆完全連接的V100 Tensor Core GPU

唯一一家參與多達6項基準測試的公司

NVIDIA是唯一一家參與多達6項基準測試的科技公司,充分展現出 V100 Tensor Core GPU 在部署人工智能工作負載方面的通用性。

NVIDIA副總裁兼加速計算總經理Ian Buck表示:“全新基準 MLPerf 展示了NVIDIA Tensor Core GPU非凡的性能與通用性。我們的Tensor Core GPU擁有高性價比,且可通過各地的雲服務提供商及電腦製造商實現供貨,進而幫助世界各地的開發人員在開發過程中的每一個階段推進人工智能的應用。”

一流的人工智能計算需要“全棧式”創新

要想在複雜多樣的計算工作負載中實現優異性能,不僅僅需要出色的芯片。加速計算也不單單與加速器有關,還需要實現全堆棧創新。

NVIDIA堆棧包括NVIDIA Tensor Cores、NVLink、NVSwitch、DGX系統、CUDA、cuDNN、NCCL、經過優化的深度學習框架容器以及NVIDIA軟件開發套件。

超高易用性

NVIDIA的人工智能平臺是最便捷且高性價比的選擇。Tensor Core GPU可通過各地的雲服務提供商及電腦製造商實現供貨。

高性價比的選擇

藉助售價僅為2,500美元的超強桌面級GPU - NVIDIA TITAN RTX,用戶在桌面上也可實現相同的Tensor Core GPU 強大功能。如果按照 3 年使用期來計算,該GPU每小時的費用僅相當於幾美分。通過NVIDIA GPU Cloud (NGC) 雲容器註冊,用戶可持續更新這些軟件的加速堆棧。

NVIDIA 創紀錄的平臺現可通過NGC下載

用於實現NVIDIA業界領先的MLPerf性能的軟件創新與優化,現可通過我們最新的NGC深度學習容器免費獲取。

此容器包含經過NVIDIA優化的完整軟件堆棧及頂級人工智能框架。18.11版本

NGC深度學習容器包含了用於實現我們MLPerf基準測試結果的詳細軟件。

開發人員可將這些軟件用於任意地點以及各大開發階段:

  • 對於桌面數據科學家:此容器支持利用NVIDIA TITAN RTX GPU開展前沿研究。
  • 對於工作組:此容器同樣可運行於NVIDIA DGX Station
  • 對於企業:利用來自阿里雲、AWS、百度雲、谷歌雲、IBM 雲、Microsoft Azure、Oracle Cloud Infrastructure以及騰訊雲的NVIDIA GPU加速實例,此容器可加快將人工智能用於其雲端數據。
  • 對於正在構建內部人工智能基礎架構的各組織:來自Atos、思科、Cray、Dell EMC、HP、 HPE、浪潮、聯想、中科曙光以及Supermicro的NVIDIA DGX系統與NGC-Ready系統可讓人工智能投入使用。

如果您計劃開展自己的人工智能項目,或者參與 MLPerf 基準測試,請點擊鏈接下載容器。


分享到:


相關文章: