2020 全球新冠肺炎之下,了不起的 AI 人

雷鋒網 AI 源創評論按:目前,新型冠狀病毒(COVID-19)仍在全球範圍內蔓延。在這樣的情況下,除開奮戰在前線的醫護人員們,小到個人、大到國家,都在努力做好防疫工作。

而計算機科學家、機器學習研究者群體,也在以他們的方式來應對該病症,包括:編譯數據集,並構建從中學習的算法等。儘管目前大部分人無法參與到研發過程中,但我們可以見證他們的成果併為之喝彩。

因此,雷鋒網 AI 源創評論整理了部分數據集與算法論文如下,並向所有為疫情做出貢獻的人致以敬意。

2020 全球新冠肺炎之下,了不起的 AI 人

圖片來源: Sompong Rattanakunchon/Getty Images

數據集類

  • COVID-19 病例數據集

目前,Google 的數據科學競賽平臺 Kaggle 上已公開了一個 COVID-19 病例數據集,並且每天都會更新。

其中包含的數據,包括患者的年齡、位置、何時開始出現症狀、何時暴露、何時進入醫院等等,均基於實際情況錄入,具有可靠性。據統計,已有近 300 人在自己的分析中使用了該數據。

數據集地址:

https://www.kaggle.com/sudalairajkumar/novel-corona-virus-2019-dataset

  • covid-chestxray 數據集

蒙特利爾大學的一位研究人員收集併發布了包含數十個 CT 掃描和胸部 X 射線圖像的數據庫。這些圖像取自公開的 COVID-19 疾病研究數據。

2020 全球新冠肺炎之下,了不起的 AI 人

數據集地址:

https://github.com/ieee8023/covid-chestxray-dataset

  • 全球感染分佈圖

約翰·霍普金斯大學建立了一個令人印象深刻的「儀表盤」,詳細展示了全球 COVID-19 病例數據。這些數據會定期更新,從而使大家能對疾病的傳播及其死亡率有了全球視野。

目前,該項目已在 GitHub 上開源代碼,可以自行復制和修改。

2020 全球新冠肺炎之下,了不起的 AI 人

開源地址:

https://github.com/CSSEGISandData/COVID-19

  • 大型新冠肺炎開放數據集

艾倫人工智能(AI)研究所、陳扎克伯格基金會(CZI)、喬治敦大學安全與新興技術中心(CSET)、微軟、美國國立衛生研究院國家醫學圖書館(NLM),以及 OSTP 今日聯合發佈了「新冠肺炎開放研究數據集」。

2020 全球新冠肺炎之下,了不起的 AI 人

據介紹,該數據集包含與新冠肺炎、新型冠狀病毒及冠狀病毒組有關的 29000 多篇學術文獻,其中超過 13000 篇是完整文獻。

這一數據集是迄今可用於數據和文本挖掘研究的最廣泛的機器可讀冠狀病毒文獻合集,將主要用於醫學和機器學習等相關領域研究,幫助人們更快更好地應對新冠肺炎疫情。

全球疫情信息實時查詢網站:

https://www.bing.com/covid

  • 地區資源網站數據集

還有一些數據集則直接來自治療患者的醫院,以及部分地區的數據資源網站,例如:

  1. 北京市政務數據資源網開放但由市衛生健康委員會提供的數據集「新型冠狀病毒感染的肺炎病例信息」。(https://data.beijing.gov.cn/)

  2. 山東公共數據開放網在平臺首頁的「疫情防控」欄目下開放了由省衛生健康委員會提供的 5 個數據集。(http://data.sd.gov.cn/)

2020 全球新冠肺炎之下,了不起的 AI 人

論文類

針對 COVID-19 病例研究,截至目前也出現了一些算法,以下是其中部分論文:

  • 基於肺部 CT 的 COVID-19 診斷準確性評估

該論文是近日科亞醫療的原創性研究成果,也是在世界頂級期刊《Radiology》首個發表的基於人工智能的新冠診斷準確性評估論文。

該方法採用了前沿的深度學習技術,開發了針對新冠肺炎 COVID-19 的 3D 檢測神經網絡 --- COVNet,使其從肺部 CT 中提取各類影像特徵用於鑑別新冠肺炎。

最終,在獨立測試集中驗證表明,COVNet 對新冠肺炎的鑑別靈敏度和特異性分別高達 89.76%和 95.77%,ROC(受試者工作特徵)曲線下面積 AUC 為 0.96。同時驗證了模型對社區獲得性肺炎的鑑別準確性(靈敏度 86.85%,特異性 92.28%,AUC 為 0.95)。

2020 全球新冠肺炎之下,了不起的 AI 人

論文地址:

https://doi.org/10.1148/radiol.2020200905

  • 深度學習對 CT 圖像中 COVID-19 的肺部感染定量研究

上海研究人員設計了一種系統,該系統可以與人工檢查結果配合,從而將 CT 圖像的分析時間從數小時減少到大約 4 分鐘。

具體而言,研究人員開發了基於深度學習(DL)的分割系統,訓練 VB-Net 神經網絡對 CT 掃描圖像中的 COVID-19 感染區域進行分割。

通過在 300 例 COVID-19 患者的胸部 CT 掃描中,比較自動分段的感染區域與手動劃定的感染區域,從而評估系統的性能。

而為了加快數據標註的速度,該方法採用了人機迴圈 (Human-in-the-loop) 優化的方法對每個病例進行註解,從而大大減少總分割時間。

最終,該系統在自動分割和手動分割之間的戴斯相似係數為 91.6%±10.0%,感染百分比(POI)的平均預測誤差為 0.3%。

論文地址:

https://arxiv.org/abs/2003.04655v2

  • 異常的呼吸模式分類器助力大規模篩查 COVID-19

在這裡,研究人員通過分析人的呼吸速度,尋找一種篩查 COVID-19 的聽覺方法。這項研究不是結論性的,但它是一種以較少侵入性方式測試病毒的新思路。

根據最新臨床研究,COVID-19 的呼吸模式與流感和普通感冒的呼吸模式不同;感染 COVID-19 的人有呼吸暫停現象,並且呼吸更快。

2020 全球新冠肺炎之下,了不起的 AI 人

對呼吸模式進行分類的 BI-AT-GRU 模型

因此,論文提出根據呼吸特徵對新型冠狀病毒的患者進行篩查。具體而言,研究人員使用了深度相機和深度學習來完成這項篩查任務。

但基於實際情況中的數據量不足以進行深度模型訓練,論文中首先提出了一種新的呼吸模擬模型,來彌補訓練數據不足的問題。

隨後該論文首次利用雙向注意力機制的 GRU 模型來對 6 種臨床上重要的呼吸模式進行分類,這一方法可以拓展到大型的應用場景中,對現有的篩查方法形成補充。

論文地址:

https://arxiv.org/abs/2002.05534v1

  • 使用深度學習 CT 圖像分析進行自動檢測和患者監測的初步結果

由於非對稱胸部 CT 已被證明是檢測、量化和追蹤該疾病的有效工具,因此可以開發深度學習算法,來幫助分析大量的胸部 CT 圖像。

因此,研究人員開發了該基於 AI 的自動 CT 圖像分析工具,並證明它們可以將冠狀病毒患者與未患該疾病的人區分開。

論文提出的系統具有輸入胸部 CT 圖像並標記懷疑具有 COVID-19 病例的功能。此外,對於分類為陽性的病例,系統會輸出肺部異常定位圖和測量值。

最終,胸部 CT 冠狀病毒與非冠狀病毒的分類結果為 0.996 AUC(95%CI:0.989-1.00),這是在中國控制和感染患者的數據集上的結果。實際使用的結果:靈敏度為 98.2%,特異性為 92.2%。

目前,該研究正在擴展到更大的人群,證明基於 AI 的圖像分析可以在檢測冠狀病毒以及量化和跟蹤疾病方面取得高精度的結果。

論文地址:

https://arxiv.org/abs/2003.05037

  • 三種臨床特徵預測重度 COVID-19 患者但危急程度

在當前階段,對疾病的嚴重程度進行快速、準確和早期的臨床評估至關重要。在尚無確定的生物標誌物作為標準的情況下,這個方法,能夠對新冠高危患者進行快速檢測、早期干預並有可能降低他們的死亡率。

在此研究中,研究人員運用最先進的機器學習框架,選擇了 3 種生物標誌物來預測個體患者的生存率:LDH(乳酸脫氫酶)、淋巴細胞和 hs-CRP(超敏 C-反應蛋白)。

研究人員開發了基於 XGBoost 機器學習的預後模型,並採用來自中國武漢的近 3,000 例患者的電子健康記錄。最終,該模型使用患者最新血樣樣本能夠以 90%以上的準確度預測 COVID-19 重症患者是否存活;使用其他血液樣本則能達到 90%的預測準確度。

這也表明三種生物標記物可以準確預測疾病的嚴重程度,因此可大大減輕臨床參數監測的壓力和其他相關的醫療負擔。

論文地址:

https://doi.org/10.1101/2020.02.27.20028027

2020 全球新冠肺炎之下,了不起的 AI 人

XGBoost 機器學習算法流程圖

原文參考:https://onezero.medium.com/computer-scientists-are-building-algorithms-to-tackle-covid-19-f4ec40acdba0

雷鋒網 AI 源創評論


分享到:


相關文章: