AMD EPYC以超多核心超強“算力”助推基因研究


AMD EPYC以超多核心超強“算力”助推基因研究

一場突如其來的新型冠狀病毒(COVID-19),牽動著全世界的神經,抗擊疫情成為社會各界廣泛關注的焦點。實際上,除了一直以來奮戰在一線的醫務人員,先進的“科技力量”也是這場“戰疫”中的另外一條關鍵戰線。在針對新型冠狀病毒的研究工作中,科研人員首先需要解析病毒全基因組序列,從而根據序列來研發相應診斷試劑盒,並進行病毒同源性分析找到病毒的來源,同時根據病毒的信息和特點決定接下來的防控和治療方式。

在如何獲取更完整詳盡的病毒基因組序列方面,目前廣泛應用高通量測序技術來完成,但由於病毒體的基因測序會產生TB級甚至PB級的海量數據,使用這種技術產生的DNA序列數據量十分龐大,需要強大的計算能力來支持。為此,高性能計算(HPC)在有效管理、分析和利用這些序列數據方面發揮了重要作用。作為國際知名的基因科研組織之一,俄勒岡州立大學基因組研究和生物計算中心(CGRB)在利用基於AMD EPYC(霄龍)處理器的高性能計算設備開展基因測序方面進行了積極探索,無疑很值得借鑑。

多線程帶來高效率,讓科研更進一步

俄勒岡州立大學基因組研究和生物計算中心(CGRB)為大學的26 個科系提供服務,從而促進基因組和數據驅動研究。研究人員可以使用該中心開發的 4,000 至 5,000 個程序,這些程序運行在分佈式服務架構上,並且該架構擁有 5000 多個處理器、5 PB 可用存儲以及安全的專用 1G/10G/40G 網絡。 CGRB 每天生成 4TB 到 8TB 的海量數據,同時每時每刻都有成千上萬個作業在運行。 因此,如何進一步提升高性能計算水平,增加運行的作業數,幫助該大學以最佳的成本效益進行科學研究,是該中心目前亟需解決的問題。

CGRB 生物計算助理主任 Chris Sullivan表示: “我們每天處理約 20,000 個作業,並且大部分作業與基因組比對有關。可能同時有一百個作業在運行,每個作業包含必須與基因組比對的 5000 萬個序列,並且每個都使用不同的算法。 而處理如此龐大的數據需要具有非常多的處理器核心和線程的高性能服務器才能做到。”

經過一系列的評估和對比,AMD EPYC處理器成為了俄勒岡州立大學的選擇。“我們在研究上取得的成果要依賴於線程數。我們需要解答科學問題, 但處理器頻率並不會改變科學答案,所以我們不會為更高的處理器頻率而多花錢。 但是,我們擁有的線程數越多,完成的作業就越多,這意味著我們可以離答案更近一步。因此,我們一直在尋求獲得非常高的線程數,希望能達到 100 個以上,同時要擁有高性價比。” Sullivan表示, “就我們所談論的線程和作業數量而言,只有AMD EPYC真正達到這個要求,可以提供128個線程。”

事實上,通過增加多臺基於AMD EPYC的高性能計算設備,CGRB能以較低的總運營成本獲得更多的線程,從而完成更多的作業數量,提升投資回報率。

降本增效省空間,讓科研更容易

AMD EPYC所擁有的核心密度和線程數在其他方面同樣發揮重要作用。 “我無法擴建我的服務器機房,這需要花費成百上千萬美元,然而EPYC處理器為我提供了新的選擇。”Sullivan 表示, “EPYC處理器的雙路配置帶來的回報非常顯著。我們插上電源,獲得所需的線程,以足夠快的速度完成作業,並且不用對服務器機房做任何改建。”

除此之外,俄勒岡州立大學的研究組還降低了 CGRB 管理費用,同時使可以執行的作業數量增加了一倍。Sullivan解釋道:“由於配備了AMD EPYC,我們不再使用 InfiniBand。它們可以在本機運行,比使用 InfiniBand 更快。” 藉助AMD EPYC,該中心不僅減少了管理開銷,而且降低了成本,同時將笨拙的大型機器更換為更具成本效益的設備且不影響性能,獲得了研究人員的一致好評。

CGCB尋找的新技術要求能夠為研究人員更快獲得運算結果。 “這項技術令研究人員折服,他們是購買的決策者。 AMD EPYC 正是他們想要的,因為無論價格還是線程數量都極具優勢。因此,我們在撥款申請方面也變得非常容易。” Sullivan提到。

科研永無止境,算力永不止步

Sullivan表示,對於俄勒岡州立大學的各種科研項目來說,現有的計算能力還遠遠不足,科學的發展正在逐漸超越設備的能力。面對不斷攀升的計算需求, CGRB將繼續攜手AMD來部署新一代高性能計算,獲得更加前沿、強勁的 “算力 “體驗。

“我們的研究組正準備撤換現有的 48 線程、24 核心處理器,替換為更多核心和線程的 AMD EPYC處理器。” Sullivan 表示, “AMD 將會成為推動該中心不斷髮展的科學事業的重要力量。 AMD 一直在幫助我們,我們期待部署更多的 AMD EPYC,因為更多線程意味著更出色的成本效益。”

毫無疑問,無論是在當前新冠疫情背景下的應用,還是疫情結束之後的科學研究和檢測,強大的算力支持都是不可或缺的。在這場收集、研究和分析與醫療信息化環境相關的關鍵生物醫學研究數據的競賽中,AMD EPYC憑藉超強的性能和易用性,加上其領先的總體擁有成本(TCO)優勢,為企業和研究機構的分析和不斷創新提供了一條捷徑。

關於俄勒岡州立大學基因組研究和生物計算中心(CGRB)

基因組研究和生物計算中心(CGRB)致力於讓俄勒岡州立大學以及整個州在生命和環境科學領域促進基因組和數據驅動的研究。 該中心通過專家、核心實驗室、計算設施、技術研討會以及各類會議,為教職員工和學生帶來先進理念、培訓和服務。 同時以該中心為平臺,促進研究人員建立聯繫、發起合作以及在研究中應用新技術。 如需更多信息,請訪問 cgrb.oregonstate.edu


關於 AMD

在超過五十年的歷史中,AMD引領了高性能運算、圖形,以及可視化技術方面的創新,這些都是遊戲、臨境感平臺以及數據中心的基礎。每時每刻,全球數百萬的消費者、500強公司,以及尖端科學研究所都依靠AMD技術來改善他們的生活、工作以及娛樂。AMD全球員工緻力於打造偉大的產品,努力拓寬技術的極限。成就今日,啟迪未來。更多信息,敬請訪問AMD公司(NASDAQ:AMD)官網www.amd.com.cn 關注AMD官方微信: AMDChina,關注AMD官方微博@AMD中國。


分享到:


相關文章: