全球首場神經影像人機對決:AI戰勝25位醫界「最強大腦」!

全球首場神經影像人機對決:AI戰勝25位醫界“最強大腦”!


來源:北京青年報、人民日報、健康界等

【導讀】昨天,備受關注的全球首場神經影像人機大戰在國家會議中心舉行,在腦腫瘤和腦血管影像判讀比賽中,醫療AI最終以高出20%的準確率戰勝25名人類醫生。如果這款AI產品投入實用,核磁檢查的出片速度將從現在的幾天縮短至幾分鐘。

2018年6月29日-30日,一場AI vs人類醫生的“讀片大戰”在北京國家會議中心展開。

這場比賽由國家神經系統疾病臨床醫學研究中心、首都醫科大學人腦保護高精尖創新中心和中國卒中學會聯合主辦,是全球首場神經影像人工智能人機大賽。

參加比賽的雙方,AI這邊是一個名叫“BioMind 天醫智”的系統,由國家神經系統疾病臨床醫學研究中心與首都醫科大學人腦保護高精尖創新中心、北京安德醫智科技有限公司共同研發,號稱全球首款CT、MRI神經影像人工智能輔助診斷產品。

人類這邊,則由25名全球神經影像領域頂尖專家、學者和優秀臨床醫生組成,他們中有擁有幾十年臨床工作積累的影像學大咖,也有有志於AI系統研究的青年科技人才。經過前期招募、預賽及定向邀請選拔而出。

經過緊張激烈的角逐,在兩輪比賽中,BioMind分別以87%、83%的準確率,戰勝醫生戰隊66%、63%的準確率。值得一提的是,兩輪比賽BioMind均僅用15分鐘左右時間便答完所有題目,而醫生戰隊幾乎答到最後一秒。

全球首場神經影像人機對決:AI戰勝25位醫界“最強大腦”!

醫生隊伍緊張討論

全球首場神經影像人機對決:AI戰勝25位醫界“最強大腦”!

A組比賽結果

神經影像人工智能人機大賽賽制介紹

據瞭解,大賽將分A、B組進行,內容包括:顱內腫瘤CT、MRI(核磁)影像判讀;腦血管疾病CT、MRI影像判讀及血腫預測;腦血管病(狹窄、微出血、梗死、腦白質病變、腔隙灶、血腫)病灶標識,出血體積及梗死體積測量。

全球首場神經影像人機對決:AI戰勝25位醫界“最強大腦”!

A組比賽中,有15名人類醫生,包括此前全國線上預賽產生的優勝者6名、國內神經疾病排名前列的專家7名,以及國外知名醫院專家2名。本組試題共225題,人類選手每人回答15題,AI 回答225題,最終以人類選手整體成績與AI對比。

全球首場神經影像人機對決:AI戰勝25位醫界“最強大腦”!

B組比賽由10名人類神經影像領域“大咖”(國內神經疾病排名前列醫院專家8名+知名醫院的專家2名)和AI比賽。其中,每名人類選手都與AI一樣,完成30道題的挑戰,最終將以人類選手整體成績 VS AI成績。

A組試題為首都醫科大學附屬北京天壇醫院神經影像學中心主任高培毅教授從天壇醫院腦腫瘤病例庫中隨機挑選,B組為首都醫科大學附屬北京天壇醫院常務副院長王擁軍教授從國家神經系統疾病臨床醫學研究中心腦出血病例庫隨機挑選,兩組試題均非AI訓練試題,為保證試題的保密性,北京市長安公證處的公證人員為試題挑選、封存進行了公證。

賽前,公證人員正式為試題解封,並交付本次決賽評審專家,進行最終題目抽取。據瞭解,由於本次比賽使用的病例均為首都醫科大學附屬北京天壇醫院病例庫中回顧性病例,因此,最終評判結果以醫院最終病理結果為準。為保證準確性,選手開始答題後,評委對試題結果進行二次審核。

最終,在A組比賽中:225例判讀,AI用15分鐘準確率達87%,15位醫生用30分鐘準確率達66%;B組比賽中,10名頂尖醫生對戰AI,同樣完成30道腦血腫擴大預測試題,AI以83% VS 63% 準確率勝出。

獲勝醫療AI:每個腫瘤背後都學習了1000個病例,基本掌握50種顱腦腫瘤

參加比賽的AI——BioMind天醫智,是由國家神經體系疾病臨床醫學研討中心和首都醫科大學人腦維護高精尖立異中心等一起研製的全球首款CT、MRI神經印象人工智能輔佐確診產品。

在參加比賽前,它已經跟著北京天壇醫院神經影像學中心主任高培毅學習了半年。

對於本次比賽AI學生取得的成績,高培毅並不意外,他介紹說,通過對北京天壇醫院近十年來接診的數萬餘神經系統相關疾病病例影像的系統學習,“BioMind天醫智”在腦膜瘤、膠質瘤等常見病領域的磁共振影像診斷能力相當於一個高級職稱醫師級別的水平,實力不容小覷。

“每種腫瘤背後,它都學習了1000個病例,目前基本上已經掌握了50種顱腦腫瘤,這是任何一名醫生都難以實現的。”

全球首場神經影像人機對決:AI戰勝25位醫界“最強大腦”!

北京天壇醫院,作業人員正在調試“BioMindTM”天醫智

在近期“人機大戰”決賽備戰中,高培毅還為提高AI體系應戰表現打開集訓。300多個病例,陪練醫師們需10小時以上時刻才做完結,AI只需不到半小時。除了學習速度外,它的安穩性也顯著逾越人類。“不知道累,也不受外界攪擾要素的影響。不像醫師會被心情、狀況、時刻地址等外界要素打擾,然後影響描繪準確性。它永久堅持鎮定,水平安穩。”

不過,他對自己AI學生的表現還不太滿意。“對它的比賽成績不夠滿意,我認為它的準確率應該在90%以上,”高培毅說,接下來他們將對AI的“丟分”原因進行研究分析。

戰勝25位醫生≠戰勝人類醫生,AI和專業醫師仍然存在差距

全球首場神經影像人機對決:AI戰勝25位醫界“最強大腦”!

關於這次比賽結果,中國科學院院士、第三軍醫大學病理學研究所所長、西南醫院病理科主任卞修武表示,“我希望大家不要產生對立性思維,因為無論醫生勝還是人工智能勝,對於醫療界和廣大患者都是一件大好事。”卞修武認為,人工智能更聚焦於某一細分領域,但醫生有其系統性的學習,所以人工智能如果能作為一個幫手幫助醫生工作,將會是醫生的一大福利。

美國卡內基梅隆大學(CMU)計算機科學學院副教授馬堅告訴新智元,AI對一些特定的問題在特定的時間內比人做得更好,這類事情之前也發生過,這可能是又一個有意思的案例。但是,通過 AI 和幾個醫生的比賽的結果,就說AI戰勝某個整個的職業領域肯定不妥。

馬堅表示,目前AI對單一數據源的分類可能做的不錯,但是如何從複雜的多模態數據中有效綜合作出診斷和治療意見,AI可能還有非常多問題要解決,而且,這還涉及到更多社會學意義上的問題,譬如AI和醫生以及病人互相間信任、溝通的問題。

BioMind的老師高培毅也表示,“覺得它容易就能代替醫師的人,把醫師的作業看得太簡略了。”AI在大數據深度學習方面確實具有巨大的優勢,不過在實踐確診中,放射科醫師仍具有很強的不行代替性。

“除了影像查看,一個合格的放射科醫師還需求看化驗單、體檢單,問詢宗族史、個人病史,瞭解患者從前接受過的藥物、醫治、反響。歸納以上狀況後,才敢做出確診。”AI或許能夠代替“看片匠”的任務,但不可能成為一個真實的醫師。

王擁軍也以為,人工智能使用能夠將醫師們從單調、重複的作業中解放出來,然後騰出更多時刻進行開發性作業。

此外,現在AI在神經體系印象確診方面,仍徹底依賴於數據真實性和質量的支撐,在缺少大數據支撐的疑難病、稀有病確診範疇,AI和專業醫師之間仍存在距離。

使用AI輔助,核磁檢查結果有望縮短至幾分鐘

王擁軍表示,這次向全球招募神經科醫師打開“人機大賽”,意圖主要是為了驗證天醫智確診的準確性。

目前,全國影像科人才資源地域性分配不均衡問題十分突出。以腦腫瘤為例,北京天壇醫院每年手術量約為一萬例,而在大部分底層醫院,這個數字可能只停留在兩位數。大多數患者即便在底層做了查看,仍是會挑選帶著片子到三甲大醫院來看,有的在“上流”的過程中重複屢次拍片,形成資源糟蹋。假如底層醫院能使用AI技能為確診賦能,讓底層醫師在讀片確診上與大醫院具有平等水準,提高醫治功率,就能削減患者不必要的醫治環節和經濟損失,也能減輕大醫院壓力。

此外,在天壇醫院,天醫智有用發掘信息與疾病的潛在聯絡的才幹還可輔佐醫師對疾病做出更為精準的猜測,如猜測患者血腫後是否會大出血的準確度,可從人為判別的60%提高至90%,輔佐醫療團隊提早為患者可能遇到的風險供給處理方案。

這次比賽,醫療AI表現出了速度快、準確率高的結果,令人讚歎的同時,更多人關心的是它未來將給神經醫學帶來哪些改變——人腦疾病真的可以實現電腦診斷嗎?

高培毅介紹說,一個CI病例背後,可能是近千張片子,天壇醫院一個影像大夫每天讀片診斷的時間甚至達到18個小時。按照“BioMind天醫智”目前的速度,一個大夫一天的工作量,它只需要400-500秒,也就是不到10分鐘的時間。

“現在患者到醫院做核磁,結果都要等第二天以後才能拿到。如果讓AI來做,那麼核磁結果基本上立等可取,幾分鐘就行”。

北京天壇醫院院長王擁軍介紹說,目前已經向國家藥監局提交申請,希望在臨床中應用這款AI產品,提高基層醫院影像診斷準確率,同時也提高影像判讀速度,為患者節約時間。

不必擔心機器在臨床技術上超越人類醫生

北京大數醫達有限公司創始人、CMU博士鄧侃在瞭解到這項比賽後,給出瞭如下的點評:

以往司機必須具備三種能力,第一種是規劃路徑的導航能力,熟悉地圖,能夠規劃從起點到終點的合理路徑。第二種是駕駛汽車的操作能力,包括踩油門、踩剎車、轉方向盤等等。第三種是對交通實況,迅速做出判斷的能力,譬如避讓行人,如何處理其它車輛超車。

有了導航軟件以後,司機們不再需要熟記地圖,不再需要第一種能力。隨著無人駕駛技術的發展,不久的將來,司機們也不再需要第二種和第三種能力。

隨著人工智能醫療技術的發展,人類醫生也將不再像以往那樣,依賴臨床經驗的個人積累,而是越來越依賴電腦的提示。

讀片是醫療過程中,診斷的一個環節。輸入是檢查設備生成的影像,輸出是文字版的檢查報告,檢查報告中包括兩部分,一個是檢查所見,列出檢查影像中需要關注的特徵標誌物。另一個是檢查結果,根據檢查特徵標誌物,判斷患者罹患的疾病。

昨天北京舉辦了一場AI vs人類神經科醫生的讀片大賽,在A組比賽中,225例判讀,AI 系統用 15分鐘完成讀片,準確率達87%,15位醫生用30分鐘準確率達66%;B組比賽中,10名頂尖醫生對戰AI,同樣完成30道腦血腫擴大預測試題,AI 系統以83% vs 人類醫生 63% 準確率勝出。

昨天的比賽,人工智能系統以 20% 的顯著優勢,戰勝人類醫生。這說明,在某幾類疾病的讀片中,人工智能確實比人類智能更有優勢。而且,不久的將來,在其它疾病的讀片中,機器也勢必超越人類。

整個診斷過程,包括問診、體檢、化驗、檢查。讀片只是檢查這個單個環節。不久的將來,機器勢必在診斷和治療全過程,而不僅僅是讀片單個環節,超越人類。人工智能醫療,下一步的發力點,一定是診斷和治療的全過程的整合,把問診、體檢、化驗、檢查全部串連起來。

人類醫生會失業嗎?醫療界有句名言,“To Cure Sometimes, To Relieve Often, To Comfort Always,有時是治癒;常常是幫助;總是去安慰”。也許機器在治癒和幫助方面,確實比人類醫生更精準,但是患者需要關懷,需要安慰,醫生提供的“話療”,哪怕是無聲的一個同情的眼神,機器能難替代人類醫生。

不用擔心機器在臨床技術方面超越人類,就像不用擔心導航軟件和無人駕駛技術,超越人類司機一樣。 歷史經驗表明,機器取代人類,完成繁瑣的工作,讓人類騰出手去,完成更精巧的工作。全球人口發展的歷史也表明,隨著機器的普及和進步,人類人口非但沒有下降,反而不斷增加。


分享到:


相關文章: