爲了數據也是拼了!多倫多大學用人造X射線訓練人工智慧

高層速讀

關鍵信息:為了解決罕見疾病X射線數據較少的問題,多倫多大學工程師們設計了一種新的方法,利用機器學習創造出人造X射線來增強人工智能訓練集,他們使用深度卷積生成對抗網絡(DCGAN)來生成並持續改進模擬圖像。

關鍵數據:在一般情況下,結合了人造X射線的增強數據集的分類精度提高了20%,在一些罕見疾病中,準確率提高到40%左右。

關鍵意義:從某種意義上說,我們正在利用機器學習來進行機器學習。

為了數據也是拼了!多倫多大學用人造X射線訓練人工智能

在象限的左邊是病人胸部的真實X射線圖像,旁邊是由人造的合成X射線

人工智能可以提高醫學診斷速度和準確性,但在臨床醫生利用人工智能來識別X射線等圖像的情況之前,他們必須“教”會算法尋找什麼。

在醫學圖像中識別罕見的病理現象,給研究人員帶來了持續的挑戰,因為在監督學習環境中,可以用來訓練人工智能系統的圖像十分缺乏。

為了數據也是拼了!多倫多大學用人造X射線訓練人工智能

多倫多大學電子與計算機工程系(ECE)Shahrokh Valaee教授和他的團隊設計了一種新的方法:利用機器學習創造計算機生成的X射線來增強人工智能訓練集。“從某種意義上說,我們正在利用機器學習來進行機器學習”,Valaee說。

“我們正在通過計算機制造某些罕見疾病的X射線,我們可以將它們與真實的X射線結合起來,從而擁有足夠大的數據庫來訓練神經網絡,以便此後從其他X射線中識別出有異常情況的數據。”

為了數據也是拼了!多倫多大學用人造X射線訓練人工智能

Valaee是醫學實驗室(MIMLab)機器智能的一員,這是一個內科醫生、科學家和工程研究人員組成的團隊,他們將自己在圖像處理、人工智能和醫學方面的專業知識結合起來,以解決醫療挑戰。

“人工智能有潛力在醫學領域提供各種各樣的幫助”Valaee說,“但要做到這一點,我們需要大量的數據——我們需要數千個標籤的圖像讓這些系統發揮作用,但一些罕見疾病的數據太少了。”

為了數據也是拼了!多倫多大學用人造X射線訓練人工智能

為了製造這些人造X射線,研究小組使用一種被稱為深度卷積生成對抗網絡(DCGAN)的技術來生成並持續改進模擬圖像。

GANs是由兩個網絡組成的一種算法:一個是生成網絡,一個是判別器網絡,生成網絡負責生成圖像,判別器則負責從真實圖像中區分出合成的圖像,直到這兩個網絡被訓練成一個點,判鑑別器不能區分真實的圖像和合成的圖像,就可以輸出了。

一旦有足夠數量的人造X射線被創造出來,它們就會與真實的X射線相結合,來訓練一個深度卷積神經網絡,這個網絡負責將需要鑑別的圖像分類為正常或其他情況。

為了數據也是拼了!多倫多大學用人造X射線訓練人工智能

Valaee說:“我們已經能夠證明,由深度卷積的GANs生成的人工數據可以用來增強真實的數據集,這為培訓提供了更多的數據,並提高了這些系統在識別罕見疾病方面的性能。”

在通過人工智能系統輸入數據時,MIMLab將其增強數據集的準確性與原始數據集進行了比較,發現在一般情況下,增強數據集的分類精度提高了20%,在一些罕見的情況下,準確率提高到40%左右。

由於合成的X光並不是來自真實的個體,所以數據集容易獲得,同時也不會存在侵犯隱私方面的擔憂。Valaee說:“這很令人興奮,我們已經能夠克服將人工智能應用於醫學的障礙。”


分享到:


相關文章: