斯坦福AI幾小時發現元素周期表

斯坦福AI幾小時發現元素週期表

斯坦福張首晟團隊創造了一個人工智能程序Atom2Vec,只用幾個小時就重新得出了元素週期表。這項研究更宏大的目標是設計出替代作為機器智能標準的圖靈檢驗的新標準。張首晟教授在接受新智元採訪時認為,實驗是檢驗規律的唯一標準,人類可以通過實驗來認證人工智能做出的理論預言。

元素週期表可以說是化學歷史上最重要的科學成就,人類科學家們經過將近一個世紀的摸索和嘗試來把元素週期表整理成當前的形式; 而一個來自斯坦福的物理學家們的人工智能程序只需要幾個小時。

這個程序叫Atom2Vec(從原子到矢量)。它能夠分析從網絡數據庫得到的不同元素組合而成的化合物名稱來學習區分不同的原子,整個過程是獨立無監督的,並沒有人類智能的參與。這個程序的開發借用了自然語言處理中的簡單概念:一個詞語的特性是可以從它周圍出現的其他單詞來得出的;把化學元素根據它們所出的化學環境聚類。

項目的負責斯坦福人文與科學學院J. G. Jackson and C. J. Wood

教授張首晟說:“我們想知道是否一個人工智能可以智慧到獨立發現元素週期表,我們的團隊證明了這一點。”

借鑑NLP概念搭配化合物中的原子,Atom2Vec將來可用於發現和設計新材料

張教授和他的團隊對於Atom2Vec的開發基於谷歌工程師們分析自然語言使用的Word2Vec。這是一個可以把單詞濃縮成為電腦中有限的幾個數字(矢量)。通過分析這些矢量,這個人工智能程序可以估計在這個單詞周圍可能出現哪些其他單詞,他們的概率是多少,之間的組合關係如何。

例如,單詞“國王”經常和“王后”出現在一起,而“男人”經常和“女人”出現在一起。因此,Word2Vec分析出的代表“國王”的矢量可以跟代表“王后”,“男人”和“女人”的矢量有如下簡單的關係:“國王”=“王后”-“女人”+“男人”。

張教授指出,“我們可以把類似的想法用到原子上,就像輸入給谷歌的Word2Vec很多文本里不同單詞組成的句子,我們可以輸入給我們的Atom2Vec不同原子組成的化合物,就像NaCl(氯化鈉), KCl(氯化鉀), H2O(水) 等等。”

從這些數據的分析中,人工智能程序可以發現鉀和鈉有著類似的性質,因為它們都可以跟鹵素結合成化合物,張教授說,“就像國王和王后很類似一樣,鉀和鈉也是類似的。”

斯坦福AI幾小時發現元素週期表

Atom2Vec工作流學習材料數據庫中的原子。對材料數據庫中的每一種化合物生成原子-環境對,在此基礎上構造原子-環境矩陣。這裡使用一個包含7個化合物的小數據集作為示例。原子-環境矩陣的條目表示原子-環境對的數量。插圖顯示化合物

斯坦福AI幾小時發現元素週期表

的單元中和對應於目標原子Bi和環境(2)Se3的條目。只考慮成分信息,而忽略結構信息。Atom2Vec學習算法從原子環境矩陣中提取原子的知識,並對原子向量中學習的屬性進行編碼。

張教授希望在未來,科學家們可以使用Atom2Vec的知識來發現和設計新材料,“在這個項目裡,我們的程序是無監督的,但是你可以給它一個特定的目標去優化,例如,找到最有效率轉換太陽能的材料。”

張教授的團隊已經開始團隊人工智能程序2.0版本的研究,集中攻克一個生物醫學上很困難的問題:設計出正確可以攻擊抗原的抗體,通常來講,抗體是由免疫機制生成的。這對於癌症的研究極其重要,當前最有前景的治療癌症方案之一——免疫治療,就試圖找到並且控制能夠攻擊癌細胞抗原的抗體。

然而人類身體可以創造超過1000萬種不同的抗體,每一種都是大約50個基因的一種不同組合,“如果我們可以把這些基因數據裡的信息濃縮到一個數學矢量裡去,像排列元素週期表一樣排列它們,那麼,如果我們發現其中一種抗體對一個抗原有效然而有毒,我們可以從我們的表中接著尋找它同類的但毒性更小的抗體。”

更宏大的目標:設計出替代圖靈檢驗的新標準

張首晟表示,這項發表於6月25日美國國家科學院院刊的研究將是實現更宏大的目標之前的重要的第一步。更宏大的目標是設計出替代作為機器智能標準的圖靈檢驗的新標準

圖靈檢驗裡面,一個機器如果可以和人類一樣回覆檢驗者的問題,讓檢驗者無法區分其是否是人類,就可以通過檢驗。但張教授認為,這種檢驗是有瑕疵的,主觀的,“人類是一個漫長進化的結果,人類的心智裡充滿了種種不理性的因素,如果一個人工智能要通過圖靈檢驗,它需要能夠重複這些人類複雜的非理性的一面,這是非常困難而瑣碎的,因此並不能夠有效利用程序設計者的時間創造價值。”

張教授提出,對於一個機器智能可以有另一種標準,“我們想試試我們是否可以設計出在發現自然規律上可以擊敗人類的人工智能,但是在此之前,我們要先測試我們的人工智能是否可以重複人類已經完成的一些偉大發現。而Atom2Vec獨立發現元素週期表就是後者的一個成果”。

新智元向張首晟教授提問:如果AI發現了自然規律,我們怎麼知道那就是事實呢?

張首晟教授認為,實驗是檢驗規律的唯一標準,人類可以通過實驗來認證人工智能做出的理論預言。

張首晟教授還認為,純理性的標準才是客觀的,人機競智的標準一定要客觀才行。

此外,這個項目中其他的參與者有,斯坦福的博士生周權和劉慎修,博士後湯沛哲等。


分享到:


相關文章: