你有一份超詳細的深度學習裝機指南等待認領!(下篇)

硬盤/固態硬盤SSD

一般硬盤無法限制我們的深度學習任務的運行,但我們也不能因此小看了硬盤的作用。假設我們從硬盤中讀取數據的速度是100MB/s,那加載一個32張ImageNet圖片構成的mini-batch,要用185毫秒。

相反,如果在使用數據前異步獲取數據,將在185毫秒內加載這些mini-batch的數據,而ImageNet上大多數神經網絡的計算時間約為200毫秒。即在計算狀態中加載下一個mini-batch,性能將不會有任何損失。

Ci妹推薦的是SSD,因為選擇SSD效率和舒適度都可以照顧到。和普通硬盤相比,SSD的啟動和響應速度更快,大文件的預處理更是要快很多。頂配的就是NVMe SSD,比一般SSD更流暢。

你有一份超詳細的深度學習裝機指南等待認領!(下篇)

電源PSU

隨著GPU的更新換代,一個優質的PSU能夠經得起時間的考驗。我們對電源的基礎要求是能滿足各種GPU所需的能量。那PSU應該怎麼選?

Ci妹在這分享一個計算方法:將電腦CPU和GPU的功率相加,再加上額外的10%的功率作為其他組件的能耗,就能得到功率的最大值。

舉個栗子:你有4個GPU,每個功率250瓦,加上一個功率150瓦的CPU,那電源要提供4×250+150+100=1250瓦的電量。在此基礎上再加10%,那就是1375瓦。所以可以得出,電源的性能要達到1400瓦。

還有一點需要我們注意,即便一個PSU達到了所需的瓦數,也可能缺少足夠的PCIe 8-pin或6-pin的接頭,所以我們在採購時要確保電源上有充足的接頭能接GPU。

你有一份超詳細的深度學習裝機指南等待認領!(下篇)

此外,記得買一個能效等級高的電源,尤其是你需要連很多GPU且需要長期運行工作時。再舉個栗子:假設以以滿功率(1000-1500瓦)運行4 GPU系統、花兩週時間訓練一個卷積神經網絡,需要耗用300-500度電,消耗電費摺合人民幣約455-766元。如果將電源效率降到80%,電費則增加140-203元左右。需要的GPU數量越多,數值差距越明顯。嘿嘿,PSU的挑選是比我們之前想象的情況要複雜吧?

CPU和GPU的冷卻

對容易發熱的CPU和GPU來講,如果其散熱性不佳,會導致其性能降低。對CPU來說,標配的散熱器或是AIO水冷散熱器都是不錯的選擇。但GPU應該用哪種散熱方式,是個複雜的問題。

 風冷散熱

風冷對單個的GPU是可以的,但如果你的GPU多達3-4個,光靠空氣冷卻那可不行。目前GPU會在運行算法時將速度提到最大,所以功耗也會達到最大值。而一旦溫度超過80℃,則會導致速度降低,無法實現最佳性能。

這種現象對於深度學習任務來說更是常見,一般的散熱風扇是遠遠達不到降溫效果的,通常運行幾秒鐘就會達到溫度閾值。如果是用多個GPU,性能會降低10%-25%。

那該怎麼辦?眼下很多英偉達的GPU都是針對遊戲設計開發的,所以也針對Windows系統進行了專門的優化,也可以輕鬆設置風扇方案。但在Linux系統中這招就不能用了,麻煩的是,很多深度學習庫也都是針對Linux編寫的。這個問題存在,但並不是無解。

在Linux系統中,我們可以進行Xorg服務器的配置,選擇“coolbits”選項,這對單個GPU還是很有用。如果是多個GPU,就要模擬一個監視器。我們試了不少,但沒什麼改進。如果想在冷空氣環境中運行3-4個小時,則應該需要重視風扇的設計。

目前市面上的散熱風扇的原理大致兩類:鼓風式的風扇將熱空氣從機箱背面推出從而讓冷空氣流入;非鼓風式的風扇在GPU中吸入冷空氣以達到冷卻的效果。

你有一份超詳細的深度學習裝機指南等待認領!(下篇)

所以,如果你有多個GPU彼此相鄰,那周圍就缺少冷空氣可用,所以在這種情況下就不一定需要非鼓風式的散熱風扇了。該用什麼呢?可用考慮水冷散熱。

水冷散熱

雖然此方法比風冷法略貴,但可以用在多個GPU相鄰的地方,能使四個最強勁的GPU保持低溫狀態,這是風冷法無法達到的效果。

而且水冷散熱法更安靜,在公共區域運行多個GPU,水冷的優勢更為明顯。至於說成本問題,水冷單個GPU要花大約690元,再加上些額外的費用約350左右。還有就是得花點時間去組裝計算機,不過這也不復雜,網上教程非常多,幾個小時就能輕鬆搞定,後期維護也簡單。

總結一下就是,單個GPU用風冷,多個GPU的情況,鼓風式的空氣冷卻可能會導致10%-15%的性能損耗,但是更划算。當然如果你追求散熱的極致效果,水冷散熱最佳而且不會製造噪音。所以風冷或水冷都可以,關鍵看你的實際情況和預算。

主板

主板該配有足夠的PCIe插槽來支持所需的GPU數量。注意,大多數顯卡寬度需要佔用兩個PCIe插槽。如果要使用多個GPU則要購買PCIe插槽之間有足夠空間的主板,以確保顯卡之間不會相互遮擋。

你有一份超詳細的深度學習裝機指南等待認領!(下篇)

機箱

在選擇機箱時,要保證機箱能裝下主板頂部的全長GPU。一般情況下大部分機箱是沒問題的,但是如果你買小了,能不能退換就得看商家說了算了。所以買之前最好確認下機箱的尺寸大小,看下機箱裝好GPU的圖,這樣也能放心點。

另外,如果你要定製水冷的話,要確保買的機箱能裝下散熱器,尤其是在給GPU用定製水冷的時候,因為每個GPU的散熱器都要佔空間。

顯示器

可能有人會說,選顯示器這麼簡單還用說?那時當然...用的啊。

你有一份超詳細的深度學習裝機指南等待認領!(下篇)

多配臺顯示器是作為一個成熟的技術人員的標配。不然你想,這麼多內容擠到同一個小屏幕裡來回切換,那多累人?


分享到:


相關文章: