清華團隊蟬聯世界大學生超級計算機競賽總冠軍

不久前,由清華大學計算機系7名本科生組成的超算團隊,在南昌大學舉辦的2018ASC世界大學生超級計算機競賽(ASC18)中蟬聯總冠軍,這是他們第五次在這項賽事中奪冠。

ASC世界大學生超級計算機競賽於2012年由中國倡議發起,與2007年發源於美國的全球超級計算機競賽(SC超算競賽)、2012年起源於德國的國際超級計算機競賽(ISC超算競賽)並列為世界三大國際大學生超算競賽。清華大學超算團隊先後9次在這三大賽事中奪冠,而2015年他們更是包攬這三大賽事總冠軍,成為目前國際上唯一一支實現“大滿貫”的隊伍。

那麼,這樣一支實力強悍、經驗豐富的隊伍是如何練成的?

超算競賽並非純粹比拼運算速度

清華大學超算團隊主要由高年級本科生組成,規模10餘人。在以往的比賽中,通常以5—6名大三、大四同學為參賽主力,大二同學則為替補隊員,以保證團隊建設的連續性。

超算競賽並非純粹比拼運算速度,部分賽題還要求在規定時間內完成運算的前提下儘可能減小功耗值。因此,比賽過程中設備計算速度並非越快越好,而是要儘可能平衡計算資源及應用運行參數,做到既能在規定時間內完成運算,又能在運行過程中保持穩定且儘可能小的功耗值。這一規則不僅考驗選手對超算系統構建的掌控能力,更要求他們有好的團隊協作和臨場應變能力。

ASC18清華大學參賽隊隊長、計44班李北辰表示,為了應對比賽中出現的各類具體問題、優化協同合作,他們一直保持團隊的多元化組成。隊員中既有擅長軟件的,也有擅長硬件的,彼此互為補充。在比賽題目準備過程中,成員們會多次向生物、化學、物理等有關領域的老師和同學請教,每週都會花費幾個小時進行競賽題目的交流和討論,彙報問題準備的進展情況。

除了重視平時訓練、紮實進行賽前準備外,超算團隊指導教師翟季冬認為,“清華大學計算機系在高性能計算、並行系統和計算機系統等方面提供了完整的教學體系,高性能計算研究所在超算領域所取得的多項科研成果,都對團隊的多次奪冠有所幫助。”多樣化的課程設置豐富了同學們的知識維度,而良好的實驗室氛圍、廣泛的研究領域成果、老隊員持續的經驗傳承,則增強了成員們的實戰能力,這些都是清華大學超算團隊能脫穎而出的優勢。

實力和應變能力在賽場上很關鍵

增強實力,打好“地基”很重要,但想最終奪冠,賽場上的應變能力也很關鍵。

ASC競賽要求各參賽隊伍在總功耗3000W的限制下,採用組委會統一提供的超算節點、高速網絡和自行配置加速卡等設備,完成超算系統搭建。在2014年舉行的ISC14超算競賽上,首次出現了強調優化運算功耗的賽題。

翟季冬對2014年的這道賽題至今記憶猶新。當時競賽組委會現場公佈了當次競賽的神秘應用賽題規則,要求參賽隊現場重新構建各自的超算系統,在規定時間內運行出正確結果,完成任務且運行過程中功耗值最小的隊伍可獲得滿分,其餘成功運行出結果的隊伍根據和第一名功耗比例給分,沒有完成任務的隊伍得零分。

為了降低功耗,每個隊都會盡可能減少運行中的CPU核數、節點數等計算資源,同時對計算平臺進行“瘦身”,如拆除平臺上的GPU加速卡和多餘的內存條,在散熱條件允許的情況下拆除平臺上的風扇等。“我們向比賽展商臨時要了一個非常低功耗的風扇裝上,為的是保證在比賽的30分鐘之內保持機器的低功耗,但這樣很危險,因為我們可能在規定時間內跑不完數據。那次我們是在29分鐘過幾秒時拿到數據、提交結果。超過30分鐘,我們就只能得零分。”回憶起當時的驚險,翟季冬還心有餘悸。

比賽的記憶不只這些,說起與南非國家超算中心團隊的“掰手腕”,李北辰記憶也很深刻:“他們的實力不容小覷,每年跟南非隊的競爭都很激烈。”清華大學學生超算團隊與南非國家超算中心團隊多次在超算競賽中同場競技,對於超算背後的年輕人而言,強強對話的激烈競爭既是壓力,更是動力。


分享到:


相關文章: