生物神經網絡與機器學習的碰撞,Nature論文DNA試管網絡識別

近日,來自加州理工學院的研究人員開發出一種由 DNA 製成的新型人工神經網絡。該網絡解決了一個經典的機器學習問題:正確識別手寫數字。該項研究中,研究者用了 36 個手寫數字 6 和 7 作為測試例子,結果表明這種新型神經網絡能夠正確識別出所有的數字。該研究是在生物工程助理教授 Lulu Qian 的實驗室中完成的。相關論文於 7 月 4 日上傳網絡,並將出現在 7 月 19 日的紙質版《Nature》雜誌上。

生物神經網絡與機器學習的碰撞,Nature論文DNA試管網絡識別

科學家們已經從 DNA 中開發出一種人工神經網絡,能夠識別嘈雜和高度複雜的分子信息。

包含由 DNA 構成的人工神經網絡的一個微滴概念圖(droplet Conception),該網絡被設計成可以識別複雜和嘈雜的分子信息,即「分子筆跡」。

加州理工學院的研究人員開發了一種由 DNA 製成的人工神經網絡,可以解決一個經典的機器學習問題:正確識別手寫數字。這項研究邁出了重要一步,證明我們具備了將人工智能編程到合成生物分子迴路中的能力。

「儘管研究者剛剛開始嘗試在分子機器中創造人工智能,但其潛力是不可否認的,」Qian 表示。「電子計算機和智能手機使得現代人類的能力高於 100 多年前,與此類似,在未來的近百年裡,人工分子機器可能製造出由分子組成的一切事物,甚至可能包括油漆和繃帶,使得人類更有能力,適應環境的能力也更強。」

人工神經網絡是在人類大腦的啟發下創造的數學模型。儘管比真實的大腦簡單得多,但該網絡可以像神經元網絡一樣工作,也能處理複雜信息。Qian 的實驗室進行該研究的最終目標是用由 DNA 組成的神經網絡編程智能行為(計算、做出選擇等方面的能力)。

Qian 表示,「每個人大腦中有 800 億個神經元,用來做出高度複雜的決策。蛔蟲等小動物可以僅利用幾百個神經元做出簡單決策。在本研究中,我們設計、創造了可以像一個小的神經網絡一樣工作的生化迴路,用來對可能比以前的信息複雜得多的分子信息進行分類。」

為了證明基於 DNA 的神經網絡的能力,Qian 實驗室的研究生 Kevin Cherry 選擇了一項任務:識別手寫內容,該任務是電子人工神經網絡面臨的一個經典挑戰。

人的筆跡可以有很大的不同,所以當一個人仔細檢查潦草的數字序列時,大腦會執行復雜的計算任務來識別它們。因為甚至對人類來說,識別他人潦草的筆跡也很難,所以識別手寫數字是將智能編程到人工神經網絡中的常見測試。這些網絡必須被「教導」如何識別數字,考慮手寫的變化,然後將未知數字與它們所謂的記憶進行比較,並確定數字的身份。

在《Nature》上發表的一篇論文(第一作者是 Cherry)證明,由精心設計的 DNA 序列構成的神經網絡可以進行規定的化學反應,準確識別「分子筆跡」。「與幾何形狀不同的視覺筆跡不同,分子筆跡的每個例子實際上並不具有數字的形狀。相反,每個分子數字由從 100 個分子中選出的 20 個獨特的 DNA 鏈組成,每個 DNA 鏈被指定代表任何 10×10 圖案中的單個像素。這些 DNA 鏈在試管中混合在一起。

Qian 說:「缺乏幾何形狀在自然分子特徵中並不少見,但仍需要複雜的生物神經網絡來識別它們:例如,一種獨特氣味分子的混合物包含一種氣味。」

給定分子筆跡的特定例子,DNA 神經網絡可以將其分類為九個類別之多,每個類別代表從 1 到 9 的九個可能手寫數字中的一個。

首先,Cherry 構建了一個 DNA 神經網絡來區分手寫的 6 和 7。他測試了 36 個手寫數字,而試管神經網絡正確地識別了所有數字。理論上來說,他的系統可以將 12000 多個手寫的 6 和 7——其中 90 % 取自廣泛用於機器學習的手寫數字數據庫——進行兩種可能的分類。

這一過程的關鍵是用 Qian 和 Cherry 開發的 DNA 分子編碼一種「勝者通吃」的競爭策略。在這種策略中,一種特殊類型的 DNA 分子被稱為「殲滅者」,用於在確定未知數字的身份時選擇獲勝者。

Cherry 說:「殲滅者與一個競爭對手的一個分子和另一個競爭對手的一個分子形成複合物,並反應形成惰性、不發生反應的新品種。殲滅者迅速吞噬所有競爭分子,直到只剩下一個競爭者。隨後獲勝的競爭者被恢復到高濃度,併產生代表網絡決策的熒光信號。」

接下來,Cherry 基於其第一個 DNA 神經網絡的原理開發了一個更復雜的、可以將 1 到 9 進行分類的神經網絡。當給定一個未知的數字時,這種「smart soup」將經歷一系列反應並輸出兩種熒光信號,例如綠色和黃色代表 5,綠色和紅色代表 9。

Qian 和 Cherry 計劃開發可以學習的人工神經網絡,從添加至試管的例子中形成「記憶」。Qian 表明,通過這種方式,該「smart soup」可以被訓練來執行不同的任務。

「普通醫學診斷只能發現很少的生物分子,比如膽固醇和血糖,」Cherry 說道,「使用我們這種更復雜的生物分子迴路,有朝一日診斷測試可能囊括數百種生物分子,分析和反應直接在分子環境中進行。」


分享到:


相關文章: