AI 預測未來? 雖然有曙光,但路還很長

如果瞭解一個家庭的經濟實力、教育水平、生活環境等基礎狀況數據,你能預測未來十年或者二十年的生活樣子嗎?


答案是可想而知的 —— 畢竟複雜的社會網絡、難測的生活經歷,以及每個帶有個人主觀性質的小小決定,都有可能對未來生活造成不可逆轉的方向的改變。


但是,當擁有大量基礎數據後,我們或許可以判斷個人在特定生活環境下怎樣成長或者趨向性做出怎樣的決定,某個事件對於家庭會造成怎樣積極或者消極的影響, 這也許就會讓不可能變成可能。


而 AI 強大的分析數據的能力,給這種預測未來的可能帶來了一絲曙光。


AI 預測未來? 雖然有曙光,但路還很長


如今,科學家們正開始在這一領域的嘗試。


來自普林斯頓大學 (Princeton University) 與弗吉尼亞理工大學 (Virginia Tech) 等多家機構的研究人員合作進行的一項大規模研究,通過建立統計和機器學習模型來預測和衡量美國各地兒童、父母和家庭的生活結果,這個大規模的合作項目被稱為 “脆弱的家庭挑戰”。


來自弗吉尼亞理工大學弗拉林生命科學研究所的研究科學家 Brian Goode 是脆弱家庭挑戰中的數據和社會科學家之一。“這是一項努力,試圖捕捉數據和模型中構成人類生活結構的複雜性和複雜性。但是,為了更好地推斷預測的不確定性和侷限性,必須採取下一步行動,將模型置於如何應用它們的環境中。這是一個很難解決的問題,我認為脆弱家庭的挑戰表明,我們需要在這一領域提供更多的研究支持,特別是在機器學習對我們日常生活產生更大影響的情況下。”Brian Goode 說道。


AI 預測未來? 雖然有曙光,但路還很長

Goode 博士


該研究對 1998 年至 2000 年間出生在美國大城市的約 5000 名兒童進行了研究,其中未婚父母所生兒童的樣本數量過多。這項縱向研究的目的是瞭解出生在未婚家庭的孩子的生活。


通過收集六次調查 (孩子出生的時間,然後孩子長到 1、3、5、9、15 歲時),這項研究已經收集了數百萬關於兒童及其家庭的數據點。另一組數據將在孩子們 22 歲時被獲取。


AI 預測未來? 雖然有曙光,但路還很長


在研究人員設計這個項目的時候,15 歲的數據 (研究人員在論文中稱其為 “保留數據”) 還沒有公開。這同時也創造了一個機會,讓其他科學家通過大規模合作來預測研究對象的生活結果。


聯合組織者收到了來自世界各地 68 所大學的 457 份申請,其中包括來自普林斯頓的幾個團隊。利用該項目的家庭數據,參與者被要求預測 15 歲時六種生活結果中的一種或多種。其中包括兒童平均績點 (GPA)、孩子毅力、家庭物質困難、主要照顧者裁員、主要照顧者參與工作培訓等。


麥克拉納漢是普林斯頓大學和哥倫比亞大學 “脆弱家庭與兒童健康研究”(Fragile Families and Child happiness Study) 的首席研究員。“剛開始的時候,我真的不知道什麼是大規模協作,但我知道把我們的數據介紹給一組新的研究人員是個好主意, 那就是數據科學家,” 麥克拉納漢說。


“結果讓人大開眼界,” 她說,“要麼運氣在人們的生活中扮演著重要角色,要麼我們作為社會科學家的理論遺漏了一些重要的變量。”


這項挑戰是基於 “共同任務法”,這是一種在計算機科學中經常使用的研究設計,但在社會科學中卻不常用。這種方法釋放了部分但不是全部的數據,允許人們使用任何他們想要的技術來確定結果。目標是準確地預測保留的數據,不管達到這個目標需要多麼複雜的技術。

研究結果由 112 名共同作者發表在《美國國家科學院院刊》(PNAS) 雜誌上。結果表明,即使使用了最先進的建模技術和包含 4000 多個家庭 1.3 萬個數據點的高質量數據集,最好的人工智能預測模型也不是很準確。因此,社會學家和數據科學家對於 AI 預測模型時應謹慎使用,尤其是在刑事司法系統和社會項目中。


AI 預測未來? 雖然有曙光,但路還很長


弗吉尼亞理工大學的研究小組還在美國社會學協會 (American Sociological Association) 新出版的開放獲取期刊《社會學》(Socius) 的一期特刊上發表了研究成果。為了支持這一領域的進一步研究,所有提交的挑戰 —— 代碼、預測和敘事解釋 —— 都是公開的。


研究人員表示,結果向我們表明,

我們有很多要學,科學家用來預測大數據集結果的機器學習技術,在預測人們的生活結果方面可能存在不足。


https://www.eurekalert.org/pub_releases/2020-03/puww-pto032520.php

https://www.eurekalert.org/pub_releases/2020-03/vt-pto032720.php


分享到:


相關文章: