英偉達與華大基因合作,使用 CUDA 進行全基因組測序

英偉達與華大基因合作,使用 CUDA 進行全基因組測序

雷鋒網消息,12月18日,GTC 2019大會在蘇州舉行。在長達兩個小時的大會上,英偉達CEO黃仁勳帶來了AI框架、開發工具、數據科學、雲計算、實時渲染以及 5G 等等方面的新動作。而在垂直領域,黃仁勳則表示,從運輸、醫療、金融到零售,各行各業都在爭相利用AI的自動化能力。

今年,英偉達為CUDA增加了兩個新的主流應用——5G vRAN和基因組處理,基因組行業的華大基因對應用實現了支持。

據雷鋒網瞭解,華大基因的生命科學超級計算機以每天60個基因組的吞吐量,改變了全基因組測序(WGS:Whole Genome Sequencing),並同時降低了成本。

全基因組測序會分析整個基因序列,可以檢測由遺傳性疾病引起的DNA突變,突變導致的癌症擴散,或是追蹤基因突變引發疾病的機制。

同時這項技術也用於研究畜牧業、農特和導致疾病的微生物。

但是,如何解決大數據存取能力以及計算能力不足等瓶頸問題,是基因組學研究和應用面臨的一大難題。基因組處理流程在行業標準中被稱為GATK,這一過程可根據參考繪製DNA短鏈,以重建基因組並找出變異,屬於計算密集型任務。

英伟达与华大基因合作,使用 CUDA 进行全基因组测序

現場,黃仁勳發佈NVIDIA Parabricks基因組分析工具包,Parabricks是一個基於CUDA加速的基因組處理工具包,可以用於發現變異,並能產生與GATK最佳實踐流程一致的結果,實現30-50倍的加速。

Parabricks提供了DeepVariant工具,利用深度學習技術進行基因變異檢測。現在,華大基因就採用了Parabricks。藉助若干GPU服務器,華大基因可以按照測序儀生成數據的速率來處理基因組。

當然,除了發佈會上推出的工具包,2018年11月,英偉達還推出了專門針對醫療影像的超算平臺Clara,讓開發人員通過開發各種應用程序來處理現有數據 。但是,在今天的發佈會上,黃仁勳並沒有現場展示CLARA的相關內容。

對此,在接受採訪時,黃仁勳開玩笑說,發佈會只有短短的兩個小時,他無法將所有的東西都展示出來。但是他特別提及了聯邦學習,他表示,很多公司都希望利用這種方法去解決數據隱私問題。“事實上,上午我們展示聯邦學習技術在自動駕駛上的應用,在醫學影像上也是共通的。英偉達提供的 Drive Federated Server Global Model 可以提供給每個 OEM 廠商使用,結合各自的數據,幫助各個廠商提升彼此的模型。”

此前,英偉達醫療副總裁Kimberly Powell曾向雷鋒網表示,醫療領域是英偉達規模最大、也是最為成熟的一個領域。而英偉達更多的是扮演一個“賦能者”的角色,為整個AI生態系統打造了一個完善的開發工具,幫助創業公司更好地執行醫療AI的應用。


分享到:


相關文章: