比較對象檢測模型在不同GPU上的性能

Quantum Blocked Unblock 遵循以下內容

比較對象檢測模型在不同GPU上的性能

近年來,深度學習方法的發展越來越多。DL已成功應用於各種不同的任務,從識別照片上的狗到解析人類語音。隨著時間的推移,模​​型開始表現越來越好,但作為副作用,它們也變得更大,更復雜。完全運行大多數最先進的深度學習模型需要一個非常強大的GPU。更不用說訓練那些模型了。沒有多少人能夠購買,存儲和維護GPU機架。這就是雲服務發揮作用的地方。在那裡,您可以在一段時間內為您的需求租用不同的GPU,同時支付一小部分GPU成本。

因此,雲服務很有用,但您需要選擇哪種類型的GPU來滿足您的深度學習需求?這就是我們決定要找到的。我們有自己的GPU,我們希望與亞馬遜提供的兩種不同的雲GPU進行比較:Nvidia Tesla V100和Nvidia Tesla M60。之所以選擇它們是因為它們都具有Tesla架構,但與具有相同GPU量的M60實例(分別為p3.8xlarge和g3.16xlarge EC2實例)相比,V100實例的價格要貴2.5倍。

作為比較GPU性能的一種方法,我們選擇了對象檢測任務。它是計算機視覺領域的主要問題之一,其主要目標是在圖像或視頻上查找和分類不同的對象。在這個領域已經進行了大量的研究,我們今天的最佳方法都是基於深度神經網絡。我們將比較三種主要現代架構的性能:SSD,更快的R-CNN和YOLOv3。

關於模型的一點點

首先,讓我們簡要介紹一下每個模型,它們在架構上的區別以及它們在速度上的差異。正如我們已經提到的,測試了3種架構,但沒有測試3種型號。對於測試,我們採用了兩種SSD:SSD Mobilenet V2和SSD Inception V2。但是我們稍後會談到它們,首先,讓我們來看看這裡最古老的架構 - 更快的R-CNN。

更快的R-CNN

比較對象檢測模型在不同GPU上的性能

更快的R-CNN

此體系結構與此處列出的任何其他體系結構的不同之處在於檢測分兩步執行:

  • 區域建議 - 在此步驟中,神經網絡尋找它認為對象可能存在的位置併為這些區域分配概率;
  • 分類 - 在這裡它查看建議的區域並嘗試實際預測對象的類及其實際存在;

SSD一般

SSD代表單次檢測,這意味著這種體系結構與我們之前討論過的結構不同,只需一步即可完成所有檢測和分類。這使得這種方法更快,整體計算量更少。這是使用不同的方法完成的,該方法基於使用“錨框”並在特徵提取的不同步驟中應用它們如果您想要了解更多關於它們的信息,請查看此處。所有SSD型號在提取功能的方式上差異很大。

SSD Mobilenet V2

從我們的名字可以看出,SSD的這種實現更多地針對移動市場。它針對移動電話的GPU和CPU提供了一些特定的架構優化。但一般來說,這個網絡在任何PC上的運行速度都比較快,因為它體積小。不幸的是,與大多數其他型號相比,它也不太準確。但是,嘿,擁有一個小型,快速和極其準確的模型仍然有點不切實際,你必須做出一些權衡。

SSD Inception V2

這裡使用著名的Google的Inception V2模型完成特徵提取。在該模型中,他們引入了卷積分解。通常,它在尺寸,速度和準確性方面具有很好的平衡。它是最常用的型號之一。此外,如果您想了解更多有關Inception架構的信息,以及它如何隨著時間的推移而改進,特別是v2,請相應地轉到此處或此處。

YOLO v3

比較對象檢測模型在不同GPU上的性能

每篇提到YOLO建築的文章都必須包括狗,自行車和卡車的標誌性圖片。

YOLOv3以及SSD都採用了錨點的概念。YOLO的作者也決定使用softmaxing檢測類是不可取的,因為有些類可能不像Person和Man那樣互相排斥。因此,使用邏輯迴歸分別預測類,然後將最可能的類分配給檢測。

並一如既往的一些閱讀文章:官方YOLO網站,論文。

GPU規範比較

比較對象檢測模型在不同GPU上的性能

測試運行結果

比較對象檢測模型在不同GPU上的性能

MSI GTX 1080 Ti運行

比較對象檢測模型在不同GPU上的性能

特斯拉V100運行

比較對象檢測模型在不同GPU上的性能

特斯拉M60運行(僅測試了YOLOv3)

比較對象檢測模型在不同GPU上的性能

FPS比較圖

我們對雲GPU的性能感到非常驚訝。根據規範,這些GPU應該至少在同一級別上,如果不比更便宜的遊戲GPU快。這可以通過以下事實來解釋:遊戲GPU的構建是為了在相對較小的數據上快速進行大量計算,而云GPU則用於使用更大的數據進行長而重的計算。因此,在像G100這樣的雲GPU上訓練一些巨大的深度神經網絡數據將會更快,但是那些推斷時間並不是最大的(至少從我們的經驗來看)。除非您需要不斷地對千兆字節的數據進行推斷。


分享到:


相關文章: