如何用深度學習檢測女性的第一殺手“乳腺癌”?

如何用深度學習檢測女性的第一殺手“乳腺癌”?

在本文中我將構建一個基於 WideResNet 的神經網絡,並將幻燈片圖像分為兩類,一類使用深度學習來檢測乳腺癌,另一類是不使用深度學習來檢測。

浸潤性導管癌(IDC)是最常見的乳腺癌類型。美國癌症協會估計,每年美國超過 18 萬婦女發現患有浸潤性乳腺癌,並以 IDC 居多。

準確識別和分類乳腺癌類型是一項重要的任務,基於人工智能的自動化方法可大大節省時間,減少誤診。

關於數據集

俄亥俄州克利夫蘭凱斯西部儲備大學的研究人員收集了這個問題的數據集。原始數據集由Kaggle的工作人員預先處理,作為我們工作的起點。

詳見:http://gleason.case.edu/webdata/jpi-dl-tutorial/IDC_regular_ps50_idx5.zip

如何用深度學習檢測女性的第一殺手“乳腺癌”?

圖 1:每張幻燈片大約得到 1700 張 50x50 像素的小片

數據集有 162 個大切片(whole mount)幻燈片。這些幻燈片以 40 倍分辨率加以掃描。最後,它們被分成了 275215 個 50x50 像素的小片。

然後將 0 或 1 的標籤分配給每個小片,其中包括 IDC 的小片的標籤為 1,不包括 IDC 的小片的標籤為 0。

如何用深度學習檢測女性的第一殺手“乳腺癌”?

圖 2:陽性和陰性 IDC 組織的 3 個例子

用 WideResNet 對幻燈片進行分類

使用殘差連接的 ResNet 架構非常擅長處理圖像分類任務。ResNet 的核心思想是,引入跳過一層或多層的所謂的“身份快捷方式連接”。

WideResNet 架構表明只有 16 層深度也可以獲得類似的性能。這有助於解決非常深的與 ResNet 有關的各種問題,比如爆炸/消失的梯度和退化。

使用 Vincent Fung(https://medium.com/@vincent.fung13)和 Apil Tamang(https://medium.com/@apiltamang)所寫博文中的詳細信息,我們就能對 ResNet 的實際用途有一番瞭解。

如何用深度學習檢測女性的第一殺手“乳腺癌”?

圖 3:殘差塊

假設讓疊加層擬合殘差映射比讓它們直接擬合所需的底層映射來得容易。這表明,更深層的模型應該不會得出比淺層模型更高的訓練錯誤。

由於出色的實踐結果,ResNet 迅速成了各種計算機視覺任務中最流行的架構之一。

另外,WideResNet 的存在是有它的理由的:精確度每提高一點,層數就要幾乎翻番,所以訓練很深的殘差網絡存在特徵重用逐漸減少的問題,這使得網絡訓練起來非常慢。

如何用深度學習檢測女性的第一殺手“乳腺癌”?

圖4:WideResNet 訓練

為了解決這些問題,Zagoruyko 和 Komodakis 對 ResNet 塊的架構進行了詳細的實驗研究,在此基礎上提出了一種新的架構:我們可以減少殘差網絡的深度,增加寬度。他們稱之為寬殘差網絡。

現在我們將介紹用 WideResNet 架構逐步解決這個問題的過程。我們使用 Deep Learning Studio,迅速構建神經網絡,無需操心編程、語法和數據集的攝取。

項目創建

登錄到本地或雲端運行的 Deep Learning Studio 後,點擊+按鈕,即可創建一個新項目。

如何用深度學習檢測女性的第一殺手“乳腺癌”?

數據集攝取

然後,我們在“數據”選項卡中為該項目創建數據集。通常,訓練和驗證之間 80% 和 20% 是個不錯的比例,但如果你願意,也可以使用其他設置。

如果機器的內存足夠多,可以將整個數據集加載到內存中,別忘了將“將數據集加載到內存中”設為“整個數據集”。

如何用深度學習檢測女性的第一殺手“乳腺癌”?

創建神經網絡

你可以通過拖放層來創建神經網絡,如下圖所示:

如何用深度學習檢測女性的第一殺手“乳腺癌”?

確保將 WideResNet 設置成完全可以利用右邊的屬性來加以訓練。另外,第一個密集層(Dense_3)應該有 20 個左右的神經元,ReLU 作為激活函數。

最終密集層(Dense_1)應該將輸出維度設為 1,將激活設為 sigmoid。這麼做的原因是,我們將這個問題設置為迴歸而不是分類。

如果迴歸輸出低於 0.5,那麼我們可以說輸入屬於類 0(即沒有 IDC 癌症),否則它就有 IDC 癌症。

超參數和訓練

我們使用的超參數如下圖所示,你可以隨意更改試用這些超參數。

如何用深度學習檢測女性的第一殺手“乳腺癌”?

最後,你可以從“訓練選項卡”來開始訓練,並藉助訓練儀表板來關注進度。

如何用深度學習檢測女性的第一殺手“乳腺癌”?

一旦完成了訓練,你可以在結果選項卡中查看結果。我們在成本為每小時 0.90 美元的 K80 GPU 上,在幾小時內獲得了 85% 以上的精確度。

如何用深度學習檢測女性的第一殺手“乳腺癌”?

有了 Deep Learning Studio,作為 Web 應用程序或 REST API 來部署就輕而易舉,這可以使用部署選項卡來完成,如下所示:

如何用深度學習檢測女性的第一殺手“乳腺癌”?

部署模型

部署的模型可以作為 Web 應用程序或 REST API 來加以訪問,如下所示:

結束語

藉助 Deep Learning Studio,短短几分鐘就能構建好深度學習模型,只需要短短几秒鐘就可以完成部署。

這種便利將讓開發人員能夠解決複雜的問題,不必擔心編程和 API 等其他方面。


分享到:


相關文章: