AI是疾病基因分析和診斷的加速器

在科技領域,跨界、融合帶來的新生事物具備的顛覆性競爭,而只是技術和經濟層面的競爭。

而在病毒領域,跨界、融合產生的新病毒往往意味著災難。一個天上飛的鳥落下的糞便不小心與地上某個禽類的食物結合被這個禽類所食,那麼其上可能帶來的病毒與禽類體內病毒進行雜交進化一個新的病毒。而這個病毒獲得跨界傳播的能力,將對整個人類造成大的災難。最快速的瞭解新的病毒帶來的病例成因早日實現對症下藥,成為打贏“抗疫”的關鍵。今天AI等新技術在積極發揮著作用。

目前新型冠狀病毒疫情進入了攻堅戰階段。除了一線醫務人員前赴後繼的戰鬥之外,對於新冠病毒的疫苗研發和藥物篩中也在爭分奪秒的進行中。此次“抗疫”戰爭中,AI等科技技術在默默貢獻中。關注抗擊疫情中的科技公司的動向,就會發現包括阿里雲、華為雲、中科曙光、騰訊雲、上海超算中心等積極主動並免費提供超算能力,AI算法來助力開展抗新冠病毒的疫苗研發和藥物篩選中。

要最快解決此次新型冠狀病毒疫情,目前來看除了全國動員在家“悶”死病毒之外,對於從早期對病毒基因組的數據分析及AI建模到如何對疑似患者的快速、精準臨床診斷,以及抗新冠病毒的疫苗研發和藥物篩選中也需要和時間賽跑。在其中AI正在發揮其作用。

AI技術能夠加速“疫情”中數據分析

AI作為一種工具,有三要素在支撐,算力、算法和數據。基於三個特點,目前AI等科技公司都是提供具備高性能、高可靠性、高性價比的計算、存儲、分析和AI能力支持的,能夠讓科研過程固化可執行,提高效率的工具。

而讓AI在疾病基因的分析和診斷中發揮。首先要依靠醫學界的專家發現病毒。就像上海華山醫院張文宏就談到醫療專家要“要非常準確的知道現在搜索的病毒是什麼,才能相應的病毒做相應的抗病毒治療。”

我們應讓人工智能與病理學家形成互補,提高人工診斷的效率與可靠度。依靠科技手段 “面對未知的病毒的時候,通過把其基因序列全部打碎,通過深度測序的平臺,把所有的序列全部恢復,然後通大數據開始拼接,通過組裝序列,經過大數據分析,分析出其演化關係,通過數據庫記錄分析獲得遺傳標誌,來最終告訴你這是什麼病毒。” 張文宏站在醫生的角度言簡意賅的闡述了AI的作用。

AI是疾病基因分析和诊断的加速器

比如針對此次新冠病毒,AI等新技術的應用一個核心的作用就是讓醫學專家們不用把大量的時間放在海量的數據分析上,而是能夠將自己的時間、精力以及醫學經驗投入到應對傳染病風險之上。把數據分析、重複的信息的收集等任務,交給AI來處理。

目前集成了AI功能的基因組測序平臺能夠提供從基因組數據管理、生物信息分析流程、科研分析管理到知識圖譜整個流程的服務,快速實現基因組數據分析及AI建模,讓基因組分析更便捷。

比如將深度學習算法及藥物分析服務融入藥物研發過程,令藥企能更快速高效地完成藥物研發,節約研發成本,讓研發更快速。

具備醫療影像標註、影像分析服務及AI模型預測服務,全方位滿足醫療影像研發需求,讓影像分析更方便。很大程度上幫助了醫生提高閱片效率、減少漏診誤診的情況。一個醫生可能一天看一百個病人,一個月看了兩千個病人,一年可能看幾萬個病人,他通過這樣的方式去累計經驗。一個15年經驗的醫生,和一個剛出來做3個月的醫生,他們兩個的經驗不同,在對一些影像圖片上面的判斷就不是一樣的級別。

AI是疾病基因分析和诊断的加速器

深度學習會提取圖像特徵。然後影像專家先把上面做一個標註,等到標註有更大的樣本的時候,就可以做到輔助醫學診斷。比如通過AI對疑似患者肺部CT影像進行病灶的自動檢出、定位、瀰漫性程度的多維分析並生成自動報告,幫助醫護人員快速篩查疑似新冠病例並進行隔離與進一步確診,從而減少交叉感染的風險,同時產品的隨訪功能還可幫助醫生對患者的治療效果進行精準量化評估,用AI為一線醫務工作者提供有跡可循、有據可依的智能輔助。

聯合科研成為AI技術應用在疾病領域的主要形式

在整個“抗疫”過程中,包括分離毒株、藥物篩選、意思病例檢測、新藥研發等需要基於AI技術進行大量的數據分析。目前科技公司在病毒基因組計算分析、抗病毒藥物研發和抗疫醫療影像分析領域,將提供海量AI算力和算法的強有力支持。這就需要具有強大的CPU及GPU算力調度能力,能夠為基因測序、醫療工程提供穩定高效的算力支持的平臺。

最近關於“抗疫”的戰役中,我們看到科技公司聯合醫療機構、科研機構成為最高效的一種模式。比如華中科技大學同濟醫學院基礎醫學院、華中科技大學同濟醫學院附屬武漢兒童醫院、西安交通大學第一附屬醫院、中科院北京基因組研究所、華為雲聯合科研團隊宣佈,篩選出五種可能對2019新型冠狀病毒(2019-nCoV)有效的抗病毒藥物。

其中華為雲EI醫療智能體平臺(EIHealth)集成了醫藥領域眾多算法、工具、AI模型和自動化流水線提供大規模計算機輔助。

AI是疾病基因分析和诊断的加速器

在幾位教授的指導下,針對數十個靶向蛋白和上億小分子化合物,通過醫療智能體平臺完成了蛋白質同源模建,分子動力學模擬計算,和大規模虛擬藥物篩選,短時間內完成了上千萬次的模擬計算,讓以往耗時數月的計算機輔助藥物篩選在數小時內完成。

比如在新冠肺炎疫情上,疑似患者的快速、精準臨床診斷仍是挑戰。2月1日,由浙江省疾控中心、阿里達摩院和傑毅生物聯合研發上線的自動化全基因組檢測分析平臺,讓原來數小時的疑似病例基因分析縮短至半小時。重點在“全基因組”這幾個字,全基因組以為著海量的基因數據,需要對平臺的算力、AI算法、數據處理和分更高的要求。阿里達摩院創新的採用分佈式設計的分析算法,並基於蛋白質數據庫(PDB)等公共數據集的數據進行算法的優化訓練。這樣的AI突破,對於有效提升疑似病例確診效率,及時阻斷病毒的傳播,必然會有極大助益。

我們也看到為助力研究機構加速新藥篩查和疫苗研發,騰訊雲組建了應急工作小組,免費開放雲超算等能力。目前,已向中山大學藥學院羅海彬教授團隊提供了批量GPU雲服務器免費使用權,幫助該團隊推進病毒藥物的篩選工作;向北京生命科學研究所/清華大學生物醫學交叉研究院的黃牛教授實驗室提供了大量標準的CPU算力以及對象儲存能力,幫助他們進行基於結構的藥物分子設計的離線計算任務。

與此同時,基於新型冠狀病毒靶標結構的化合物虛擬篩選工作正在北京生命科學研究所/清華大學生物醫學交叉研究院黃牛教授實驗室推進。從原理上講,藥物通過與體內的生物靶標相互作用而發揮藥效,若能夠根據藥物靶標結構來計算篩選和設計小分子配體,將可大大降低創新藥前期研發的成本與週期。針對新型冠狀病毒的多個靶點,黃牛教授實驗室通過騰訊雲秒級交付的海量高性能計算、存儲資源,快速計算篩選數億級別的化合物數據庫,結合實驗驗證,來尋找新型結構類型的先導化合物,為下一步新藥研發工作提供依據。

總結,AI對於基因組的分析和診斷,有幾個關鍵點。首先數據庫的檢索功能,在獲取到病毒基因信息後,通常需要與已知數據庫的基因組匹配來找出可能存在的突變。而突變與疾病的對應關係的判斷大部分依靠海量的數據庫資源,因此如果人工來完成這些工作是不現實的,這個時候便體現出了人工智能的價值。

其次算法的優化,我們看到包括華為雲、阿里達摩院都是採用了最新的AI算法和分佈式數據庫,來優化人工智能的技術路徑,能夠更有效的對大量非結構化數據進行學習和整合,挖掘並計算其中的關聯。縮短人工智能可以持續不斷的挖掘並更新突變位點和疾病的潛在聯繫。

再次海量的數據餵養,與在Google AI實踐中曾有關於診斷乳腺癌的人工智能的報道。它只需幾秒鐘,就能取得比人類醫生花上幾十個小時還要準確的診斷。在基於醫學圖像的診斷上,結合人工智能的效率可以說是大大增加了癌病的診斷。這需要基於大量患者的成百上千張醫療影像,基於深度學習算法的訓練。經歷了大量迭代訓練後,實現算法的精準度越來越高,實現在疾病分析豐富臨床經驗的專家的診斷結果與AI工具的診斷結果是否一致來判斷AI分析的價值。

除此之外,業內專家對至頂網表示目前基於“深度學習”的AI技術要發揮作用,一個好的雲數據庫其實是非常關鍵的一個點,因為如果醫院裡面每個科室的數字是零散的,那麼很難做這個工作。基於雲數據庫,不管是從公有云還是從私有云,幫助醫院把這些數據規範起來。從數據的採集,到它的存儲,到預處理,形成一套規範的AI服務。這樣的話,數據即使在有些單位是分散的,需要的時候還是可以複合起來使用。

同時在深度學習的技術上面,對這些數據做訓練的時候,不僅僅是把數據丟到深度學習裡面去訓練就好了,而且我們還要對這些數據做一些特徵提取。我們把數據的維度降低了以後,再去訓練就可以得到一個相對比較好的效果。當然,這個數據積累以後,越來越多的數據積累以後,準確率會越來越高。

最後,醫療過程是一個複雜,週期長的過程,AI輔助只是其中一個環節,我們希望能夠通過AI等科技技術幫助到醫藥領域的專家,加速疾病基因檢測和相關藥物研發過程。


分享到:


相關文章: