李飛飛最新訪談:希望AI領域泡沫儘快消散,尤其是醫療部分

Eric J. Topol AI前線

李飛飛最新訪談:希望AI領域泡沫儘快消散,尤其是醫療部分

作者 | Eric J. Topol

譯者 | 核子可樂

策劃 | 鈺瑩、Tina

技術與人性之間平衡的支點,如何尋找?

最近,Medscape《醫學與機器》欄目的主持人、《深度醫學(Deep Medicine)》的作者 Eric J. Topol 博士與李飛飛圍繞“人工智能、醫療、人性”三個關鍵詞展開了交談。自從離開谷歌回到斯坦福,李飛飛就立即開啟了一項“以人為中心的 AI 計劃(Human-Centered AI Initiative,HAI)”,李飛飛曾在 twitter 上表示該項目的願景是:推進 AI 研究、教育、政策和實踐,以惠及全人類。

李飛飛最新訪談:希望AI領域泡沫儘快消散,尤其是醫療部分

Eric J. Topol 博士:大家好,這裡是 Eric Topol,也是 Medscape《醫學與機器》的主持人。很高興能有機會與斯坦福大學的李飛飛教授面對面交流。她是斯坦福大學 Human-Centered 人工智能(HAI)研究所的負責人。多年以來,她在人工智能領域擁有巨大的影響力,同時也是我心中的巨人以及摯友。歡迎你,飛飛。

李飛飛: 多謝,Eric。很高興來到這裡。其實我對你也抱有同感,你永遠是我心中的醫學數字化英雄。

Topol: 哈哈,太客氣啦。此前 ,你在斯坦福大學開設了新的研究院能不能結合背景講講開設新研究院的原因,以及這家研究院的定位?

李飛飛:你指的應該是斯坦福大學 Human-Centered AI 研究院。這所研究院當然有很多新鮮元素,但也繼承了不少學術機構的特性,畢竟在斯坦福大學乃至美國其他地區,AI 技術代表著一大跨學科領域,從業者們也一直在 AI 社會下的人性問題方面推動著相關探索性研究。除此之外,AI 正在與人文、醫學、教育乃至其他各類領域開展跨學科合作。

新的研究院將把這一切結合起來,在我稱其為“重大歷史時刻”的當下,也是過去十年中的第一次,我們將見證“人工智能”從小眾計算機科學議題逐步融入現實生活。此外,我們也將見證 AI 技術給人類生活以及社會結構造成的深遠影響,觀察它在各行各業的實際應用,以及可能在無數產品及服務中迸發出的巨大能量。

無論是從科學性、應用性還是對人類生活的切實影響層面出發,我們都有必要了解 AI 技術的發展導向,這一點應該得到全世界的高度重視。

Topol: 毫無疑問,在醫學領域,AI 將給我們的生活帶來更重要的影響。也正因為如此,你才適合在新的研究院當中擔任負責人一職。

多年之前,你曾經創立過名為 ImageNet 的項目,而該項目也隨著時間推移改變了整個 AI 領域的面貌。從各類圖像掃描場景來看,無論是視網膜圖像、心電圖圖像還是其他任何圖像,很多從事醫學領域並運用這類技術的人們,還不清楚 ImageNet 正是當前眾多醫學發展成果的最初萌芽。但我知道,如今的累累碩果,確實始於你當初建立的 ImageNet 項目。

你能給大家講講當初為什麼要建立 ImageNet 項目,它又在深度學習領域引發了哪些變革嗎?

李飛飛: 我在 AI 領域的專業方向,主要是研究計算機視覺與機器學習之間的交集。早在 2006 年,我就試圖解決計算機視覺領域的一個核心難題——用直白的話來說,就是如何實現物體“識別”。

人類是一種非常聰明的動物,我們會以非常豐富的方式觀察這個世界。但是,這種視覺智能的基礎,在於首先準確識別出周遭環境中多達幾十萬種不同的物體,包括小貓、樹木、椅子、微波爐、汽車乃至行人等。從這個角度出發探索機器智能的實現,無疑是實現人工智能的第一步,而且直到現在也仍然是重要的一步。

我們一直在為此努力。當時我還年輕,在學校擔任副教授。在評上副教授的第一年,我就開始研究這個問題。但我突然間意識到,那個時代下的所有機器學習算法,在本質上只能處理來自幾十種對象的一組極小數據類別。這些數據集中的每個類別只包含 100 張或者最多幾百張圖片,這樣的素材量遠遠無法與人類及其他動物的實際成長經歷相契合。

受到人類成長過程的啟發,我們意識到大數據對於推動機器學習發展的重要意義。充足的數據量不僅能夠改善模式的多樣性,同時也在數學層面有著關鍵的積極意義,能夠幫助一切學習系統更好地實現泛化,而非被束縛在總量遠低於真實世界的數據集內,經歷一次又一次過度擬合。

以這一觀念為基礎,我們認為接下來不妨做點瘋狂的事情,那就是把我們周遭環境中的所有物體都整理出來。具體是怎麼做的?我們受到了英語詞彙分類法 WordNet 的啟發,這種方法由語言學家 George Miller 於上世紀八十年代提出。在 WordNet 當中,我們能夠找到超過 8 萬個用於描述客觀對象的名詞。

最終,我們收集到 22000 個對象類,這些對象類通過不同的搜索引擎從互聯網上下載而來。此外,我們還通過 Amazon Mechanical Turk 發動了規模可觀的眾包工程項目,這一干就是兩年。最終,我們吸引到來自 160 多個國家和地區的超過 5 萬名參與者,他們幫助我們清理並標記了近 10 億張圖像,並最終得到一套經過精心規劃的數據集。數據集中包含 22000 個對象類以及下轄的 15000 萬張圖像,這就是今天大家所熟悉的 ImageNet。

我們立即把成果向研究社區開源。從 2010 年開始,我們每年舉辦一屆 ImageNet 挑戰賽,誠邀全球各地的研究人員參與解決這一代表計算機視覺領域終極難題的挑戰。

幾年之後,來自加拿大的機器學習研究人員們利用名為“卷積神經網絡”這一頗具傳統的模型刻了 2012 年 ImageNet 挑戰賽。沒錯,就是 Geoff Hinton 教授帶領的小組。

我知道,很多人都把 ImageNet 挑戰賽視為開啟深度學習新時代的里程碑式事件。

Topol: 大約四年之前,你走上了 TED 演講的舞臺,談到我們如何教導計算機理解圖片內容。那一期真的很特別,我想至少有幾百萬人觀看過這場演講。我記得之前曾經問過你,你當時拿出了一張男人騎馬的照片,並解釋了計算機為什麼在對象識別方面一下子就突飛猛進起來。

但如今的計算機視覺在不同情境下的表現仍然差距巨大,而且偶爾還會犯下錯誤。我曾問你,我們目前的水平就只能達到這樣,對吧?那麼現在回頭看,我們對於訓練機器理解圖像內容的理論還準確嗎?

李飛飛:是的,雖然圖像識別技術一直在穩步發展,但你的觀點確實值得深思。圖像內容仍存在很多計算機無法判定的細微差別、上下文、背景知識、常識以及推理性元素。這一切,都足以難倒當前最先進的機器智能。單在視覺角度來講,即使是騎馬者雕像這類看似單純的對象,都同樣可能讓機器摸不著頭腦。

也可以說,儘管我們通過大量訓練構建起一套能夠識別雕塑的系統,它也仍然無法重現人類智能在識別方面的表現。具體來講,人類能夠體會到雕塑中的藝術氣息、瞭解背景信息、識別出材質,這一切都是現在的機器智能所無法做到的。

Topol: 沒錯。在醫學領域,情況也差不多,帶有註釋的數據集在體量上仍然無法令人滿意。由於沒有像 ImageNet 這樣包含上千萬張經過精心標記的圖像,醫學從業者只能不斷使用相同的數據集訓練自己的模型。

那麼,我們有必要投入專門的精力構建新的數據集嗎?或者說,自我監督或者無監督學習才代表著真正的未來?

李飛飛: 問得好,Eric。相信你也清楚,我認為答案絕不會非此即彼。在大多數情況下,高質量數據集的匱乏確實讓醫學研究人員與開發人員感到沮喪不已。但在這方面,匱乏也有匱乏的理由。出於患者隱私與安全保護的原因,醫療數據往往需要受到更精心的管理,其中涉及的數據偏見問題也有可能引發更嚴重的後果。

在識別小貓時,有點偏見可能沒啥大問題。但一旦涉及到人類的生活、健康甚至是福祉時,偏見就會惹出大麻煩。正是由於這些問題,再加上法規的嚴格限制,導致醫學數據很難得到大規模彙總。我認為我們確實有必要為此付出努力,而且目前世界各地的研究人員也開始自發聯合起來,共同為攻擊這道難關而奮鬥。

與此同時,技術本身的改進也有望從另一個角度帶來新的曙光。如你之前提到,除了需要高質量的數據集以訓練有監督學習算法之外,機器學習領域在其他一些非常有趣的方向上也取得了重大進展,包括自我監督、遷移學習、聯邦學習以及無監督學習等。

我認為未來這些方法將相互結合。在某些特定場景下,我們仍然需要高質量的大規模數據集。而在另一些場景中,多模與混合數據集可能功效更為顯著。

Topol: 既然醫學領域已經掀起了第一波 AI 浪潮,那麼圖像識別肯定是最直接的受益場景吧此外,患者與醫生也開始與會話式 AI 系統交互,整個過程終於不用通過鍵盤實現,而且傳統錄入方式一直是患者跟醫生的共同敵人。在你看來,最終臨床醫生能不能在 AI 技術的幫助下徹底從枯燥的轉錄工作中解放出來?

李飛飛:我百分之百相信這一點。這不只是是因為樂觀,也是因為我真心希望能夠通過 AI 技術的發展,在醫療保健領域減輕長期以來困擾著臨床醫生的機械重複負擔。

我的父母也已經年邁,在醫院裡照顧他們的時候,我曾經認真觀察過護士和醫生們的工作內容。我認為,在 AI 領域當中,像我這樣的研究者們真心希望幫助他們拿出更多時間來照料病人,而不是把大量精力浪費在盯著屏幕跟圖表上。無論是從患者、臨床醫生還是經濟效益的角度出發,我都真心希望這一領域儘快迎來堅實有效的進步。

Topol: 我對你當時的經歷很好奇。你需要照料父母,他們需要在醫院裡調養身體。那麼能不能談談切身體會在現在的一流醫療中心裡,作為患者家庭成員,你的實際感受如何?

畢竟歸根到底,醫療保健的本質在於由人類照料人類。

李飛飛 : 首先,作為患者的家屬,人類的焦慮、恐懼以及希望等情緒波動仍然非常重要。如果沒有個人體驗,那麼人類很難對事物表現出充分的信任。 我堅信技術能夠在這一領域擴大並增強人類的工作能力,但絕對不是要替代人類。** 我自己的個人研究,以及斯坦福大學 HAI 研究院的相關工作,一直在以此為核心主題。這一點在醫學領域也體現得尤其明顯。

我聽說過不少關於 AI 系統徹底替代醫生的討論,因為機器在某些診斷當中擁有更好的表現。但是在經歷了從外科手術到重症監護病房(ICU)的整個醫療體驗之後,再加上我在醫院裡長期看護年邁父母的真實感受,我越來越無法想象沒有護士與醫生到底會是怎樣的情景。

歸根到底,醫療保健的本質在於由人類照料人類。我之所以如此堅定,是因為如果技術能夠在處理文書工作方面發揮顯著的輔助作用,同時通過更快的早期診斷提升歸類效率,那麼這樣一雙保障患者安全的關注之眼才是患者與醫護人員真正想要的。我目前所從事的正是這方面的工作,我對這一切也抱有極高的熱情。

Topol: 你與Arnold Milstein在這方面開展了不少合作,你也開始努力嘗試在 ICU 當中引入機器視覺方案,能不能跟我們分享一點經驗心得?

李飛飛:Arnold Milstein 博士是斯坦福大學的醫學教授,同時也是美國醫療領域的意見領袖,一直致力於從研究、政策以及商業實踐等不同角度提高醫療質量並削減醫療成本。

大約七、八年前,她和我偶然相遇,兩個人馬上就碰撞出了火花。作為 AI 教授,我感受到深度學習時代的到來,特別是通過無人駕駛汽車、智能傳感器、AI 算法進步以及相關技術成本下降所帶來的全新可能性。我相信,與目前主要依賴人類駕駛員的汽車不同,未來的運輸技術將呈現出完全不同的面貌。

我和 Arnold 最初的話題就是探討這項技術,分享心得,進而聊起醫療保健領域的種種問題,包括因系統低效、計時錯誤、人手不足等問題給患者安全帶來的巨大威脅。我們都希望能夠讓醫護工作者將更多時間花在患者身上,並幫助他們在工作中充分享受由智能傳感器與 AI 算法等成果帶來的全新體驗。

我們開始討論如何在醫療保健交付系統的典型場景中,通過智能傳感器原型設計為醫護人員提供幫助。我們首先確定的場景就是 ICU——畢竟作為挽救生命的有力武器,ICU 意義重大而且有著極廣的社會認知度。患者正在與死神對抗,而我們的臨床醫生每分每秒都在緊張工作。這個時候,任何小小的失誤都有可能改變個人甚至家庭的命運。

接下來,我們與猶他州 Intermountain 醫院以及斯坦福醫院交流,希望瞭解能否在 ICU 當中試行患者護理項目,幫助臨床醫生記錄其是否按照規程完成了正確的患者護理(包括口腔護理與復健指導等)。醫生們的日常總是忙忙碌碌的,這方面記錄工作確實給他們增添了不少負擔。

在項目當中,我們安裝了成本低廉的深度傳感器,能夠在不侵犯患者及臨床醫生隱私的前提下收集行動數據——之所以安全,是因為其中不涉及任何面部或者身份信息。有了這些數據,我們就能 24/7 全天候觀察患者是否得到妥善護理,並在醫療交付系統中提交反饋。

我們在斯坦福兒童醫院裡也做了類似的實驗,包括推動手部清潔項目。很多人可能不清楚,由於的手部清潔不當而造成的院內交叉感染,每年在美國造成數千人喪生。同樣利用之前提到的低成本傳感器以及深度學習算法,我們得以勾勒出臨床醫生的手部清潔習慣,併發送反饋信息以提醒他們嚴格按照世界衛生組織提出的標準認真洗手。

Topol: 確實,利用不起眼的傳感器,機器視覺技術確實能夠顯著提高住院患者的安全性以及治療效果,這項工作絕對意義深遠。我注意到在斯坦福大學的醫學中心,你們有專門配備 AI 的病床,是真的嗎?

李飛飛:確實是這樣。但目前還處於項目發展早期,我們正在與醫院合作,希望進一步擴大傳感器項目的部署規模。現在我還沒辦法討論具體部署效果,但這項工作已經得到臨床醫生、醫院領導以及 AI 研究人員們的大力支持。

尤其讓我興奮的是,我們正在邀請倫理學家、法律學者以及生物倫理學家,共同討論這項技術可能面臨的前沿性挑戰。我們希望牢牢把握這方面原則,確保患者、臨床醫生、病患家屬以及其他利益相關者不致因此遭受意外損失。

Topol: 肯定的,對於醫學界來說,實施 AI 技術的一大基本前提,就是在保證臨床醫生能夠輕鬆適應的同時,透徹分析各項問題中的深層細節。

由 Pearse Keane 領導的一支英國研究團隊就發表了一篇論文,他們邀請從未編寫過代碼也毫無計算機科學背景的醫生們嘗試使用圖像數據集。通過這種方式,醫生們逐漸見識到了計算機圖像識別的本事。你覺得這是個好主意嗎?畢竟我們不可能要求醫生自己上陣開發算法,對吧?

李飛飛: 我對這個項目不太熟悉。不過,在過去七、八年中,我也一直在進行類似的嘗試,研究如何在跨學科小組當中引導醫生和計算機科學家共同討論同一個常規問題。我覺得這段體驗讓人印象深刻。

我自己也仍然在學習,目前我得出的一大重要結論,就是人們應當學會相處並理解彼此的工作性質、對方的顧慮、他們的價值主張,同時始終保持耐心與開放的胸懷。當然,接納對方的專業領域不輕鬆,也絕對不是什麼線性過程,其中有不少問題需要克服。

我還記得研究團隊剛剛成立時,計算機科學家們是如何跟臨床醫生相互交流的。即使是在今天,當有新的學生或者成員加入時,我們也會組織多輪會議,引導大家儘快熟悉溝通環境。

作為計算機科學家,我對參加 AI 醫療保健項目的計算機專業學生們只有一項基本要求——在討論代碼與算法之前,先融入醫護人員的日常生活。他們需要進入 ICU、病房、手術室甚至是醫護人員 / 患者家中,瞭解這些人的生活方式並跟他們的家人面對面接觸。完成了這一切之後,我們才有資格開始討論計算機科學問題。

李飛飛最新訪談:希望AI領域泡沫儘快消散,尤其是醫療部分


Topol: 你做出的另一項貢獻當屬 AI4ALL。通過這個項目,你不僅希望引導計算機科學家與臨床醫生合作,同時也在嘗試培養下一代計算機科學家。快給我們講講關於 AI4ALL 的故事。

李飛飛:非常感謝,Eric。AI4ALL 項目誕生至今已經有五年多時間了。當時是 2014 年左右,可以說是深度學習革命的發展初期。整個世界,特別是科技領域,尤其是硅谷,全面充斥著對於深度學習技術的興奮、爭論與擔憂。

我很快意識到,大家在面對 AI 技術時都有些精神分裂——一方面,人們擔心終結者和天網變成現實,人類淪為機器的奴隸;另一方面,我們生活在一個極度缺乏多樣性的世界當中。在 AI 專業領域,像我這樣的女性真的非常少見。在大多數技術會議當中,女性參會者的比例不足 15%。更誇張的是,少數族裔始終存在代表性不足的問題,由於相關統計數據太過有限,我們一直無法建立起有效且可靠的統計結果。

大家可能覺得這根本就是兩碼事,但在我看來這兩件事之間有著極為深遠的關聯。作為人類,如果說我們關注 AI 的理由是關注人類社會的未來,那麼我們就必須要關注這樣的未來到底由誰所創造。如果 AI 技術的設計與導向權只掌握在一小部分人手裡,那麼我們恐怕真的只能接受強大但卻根本不打算代表全人類的 AI 成果。

我之前帶過一名出色的博士生,當時她馬上就要博士畢業了。Olga Russakovsky,她現在是普林斯頓大學的 AI 教授。她和我就這方面擔憂進行了深入探討,我們達成了共識,並決定為此做點什麼。

在 2015 年到 2016 年期間,我們在斯坦福大學試行一個新項目,邀請高中女生通過夏令營活動在 AI 實驗室中與我們一道研究人工智能技術。項目取得了巨大的成功,因此在 2017 年,Melinda Gates(蓋茨夫人)與黃仁勳鼓勵我們將項目正規化,這就是全國性非營利組織 AI4ALL 的由來。

我們的使命是為各行各業教育並啟發下一代 AI 技術專家與意見領袖。AI4ALL 現在已經三歲多了。在 2019 年的夏令營中,我們為北美地區的 11 所大學在校生準備了時期課程,專門面向少數族裔學生以及公共服務嚴重短缺的社區——包括低收入家庭學生、農村學生以及女生等等。

我們仍在為此不懈努力,我們的目標是在未來 10 到 15 年之內培養出優秀的繼任者,讓這些學生在告別校園之後投身技術、特別是 AI 領域並做出一番成就。目前,我們已經迎來了不少早期案例,效果相當喜人。

Topol: 在撰寫《深度醫學(Deep Medicine)》一書的過程中,你的事蹟給了我很大的啟發。之所以印象深刻,是因為我關注過不少 AI 領域的大牛,從專潑冷水的批判者到炒作大師應有盡有。但你在其中非常獨特,你就像是權衡中的標杆。你一直在努力尋求真理,而且絲毫不避諱 AI 技術的種種缺點。

在這裡,我想聽聽你的個人觀點。如今的 AI 技術就像是雨後的春筍,每個禮拜都會出現不少重大事件,來自醫學、來自純 AI 技術等等。在這一輪上升期當中,必然充斥著大量關於 AI 技術的炒作之詞。那麼這一切,特別是與醫學相關的消息,到底有多真或者說多假?我們的 AI 到底發展到什麼程度了?

李飛飛:這個話題可就大了。有些人認為如今的 AI 技術全是泡沫,也有人覺得這些都是真實的結果。在我看來,泡沫確實存在,但 AI 技術同時也擁有著堅實可靠的內核。而且我始終堅信,AI 技術擁有在給醫療保健與醫學領域帶來深遠影響的巨大潛力。

但說回泡沫,泡沫確實存在,過度誇張、炒作可以說鋪天蓋地。作為科學家,我希望這些泡沫都儘快消散。只有關注堅實內核的人們才能推動 AI 進步並帶來真正的收益,這一點在醫療保健與醫藥等領域尤其重要。

另外,我們絕不應該利用技術製造不公、偏見或者擴大原已存在的不平等現象。對於 AI 技術,我希望儘可能降低它的接觸門檻、增加公平性並緩解種種相關矛盾。只要處理得當,我們完全有機會利用 AI 技術創造出更美好的未來。當然,前提是我們得認真梳理現有 AI 成果,弄清哪些是捏造的、哪些是真實的。

Topol: 非常感謝你參加這次訪談。跟你聊天非常開心,也很高興能聽到你親口為我解答關於 AI 技術的種種疑惑。我們將繼續關注你和你的團隊未來帶來的更多成果。

李飛飛:我也會繼續關注你的研究,期待你在醫學數字化與公共意見表達方面的新進展。感謝你,Eric。

Topol: 謝謝。

原文鏈接:

https://www.medscape.com/viewarticle/923406?faf=1&class="lazy" data-original=soc_tw_200208_mscpedt_news_mdscp_medicineandthemachine


分享到:


相關文章: