驚豔!當科學家把SARS-CoV-2棘突蛋白序列轉變成音樂之後...

麻省理工學院教授馬庫斯 · 比埃勒借助人工智能設計新的蛋白質。 他最近將新型冠狀病毒(SARS-Cov-2)的棘突蛋白翻譯成聲音,使其振動特性可視化,如圖所示,這可能有助於找到阻止病毒的方法。

驚豔!當科學家把SARS-CoV-2棘突蛋白序列轉變成音樂之後...

圖片來源: Markus Buehler,三原色代表穗的三個蛋白質鏈。

構成生物的蛋白質都能賦予音樂生命。 問問馬庫斯 · 比埃勒就知道了:這位音樂家和麻省理工學院的教授開發了人工智能模型來設計新的蛋白質,有時是通過將它們轉換成聲音。 他的目標是為可持續、無毒的應用創造新的生物材料。 在 MIT-IBM 沃森人工智能實驗室的一個項目中,比埃勒正在尋找一種能延長易腐食品保質期的蛋白質。 在《極限力學快報》的一項新研究中,他和他的同事們提出了一個有前途的候選物質: 一種由蜜蜂製造用於建造蜂巢的絲蛋白。

驚豔!當科學家把SARS-CoV-2棘突蛋白序列轉變成音樂之後...

在 APL 生物工程最近的另一項研究中,他更進一步,利用人工智能發現了一種全新的蛋白質。 隨著這兩項研究的發表,新型冠狀病毒肺炎病毒在美國爆發,Buehler 將他的注意力轉向 SARS-CoV-2的棘突蛋白,它是使這種新型冠狀病毒具有傳染性的附屬物。 他和他的同事們正在試圖通過基於分子的聲譜分析它的振動特性,這可能是阻止病毒的一個關鍵。 比埃勒最近坐下來討論他的工作的藝術和科學。

驚豔!當科學家把SARS-CoV-2棘突蛋白序列轉變成音樂之後...

問: 你的工作重點是在皮膚和頭髮中發現的a-螺旋蛋白質。為什麼這種蛋白質如此吸引人?

答: 蛋白質是組成我們的細胞、器官和身體的磚和灰漿。 a螺旋蛋白質尤其重要。 它們像彈簧一樣的結構賦予了它們彈性和彈性,這就是為什麼皮膚、毛髮、羽毛、蹄子甚至細胞膜如此耐用的原因。 但是它們不僅僅是機械上的堅硬,它們還有內置的抗菌特性。 通過 IBM,我們正試圖利用這種生物化學特性來創造一種蛋白質塗層,這種塗層可以減緩像草莓這樣快速腐爛的食物的變質。

問: 你是如何利用人工智能來生產這種絲蛋白的?

答: 我們在蛋白質數據庫上訓練了一個深度學習模型,它包含了大約12萬個蛋白質的氨基酸序列和三維形狀。 然後,我們給模型輸入蜜蜂絲的一段氨基酸鏈,並要求它逐個原子地預測蛋白質的形狀。 我們首次在實驗室合成了這種蛋白質,從而驗證了我們的工作。這是開發一種薄的、抗菌的、結構耐用的、可用於食品的塗層的第一步。 我的同事,Benedetto Marelli,專門研究這個過程的這一部分。 我們還利用這個平臺來預測自然界中尚不存在的蛋白質的結構。 這就是我們如何在 APL 生物工程研究中設計我們全新的蛋白質。


問: 你的模型如何改進其他蛋白質預測方法?

答: 我們使用端到端的預測。 該模型直接根據蛋白質的序列構建蛋白質的結構,將氨基酸模式轉換成三維幾何圖形。 這就像把一套宜家的說明書翻譯成一個內置的書架,減少了挫敗感。 通過這種方法,該模型有效地學習瞭如何通過蛋白質自身的氨基酸語言來構建蛋白質。 值得注意的是,我們的方法不需要模板就可以精確地預測蛋白質結構。 它優於其他的摺疊方法,並且明顯快於基於物理的建模。 因為蛋白質數據庫僅限於在自然界中發現的蛋白質,我們需要一種方法來可視化新的結構,從零開始製造新的蛋白質。

驚豔!當科學家把SARS-CoV-2棘突蛋白序列轉變成音樂之後...

問: 這個模型如何能用來設計一個真正的蛋白質?

答: 我們可以為自然界中尚未被研究的序列逐個建立原子模型,就像我們在 APL 生物工程研究中使用的另一種方法那樣。 我們可以通過分析蛋白質的穩定性和它在細胞中結合的其他蛋白質來可視化蛋白質的結構和使用其他計算方法來評估它的功能。 我們的模型可以用於藥物設計或干擾傳染病中蛋白質介導的生化途徑。

在 MIT-IBM 沃森人工智能實驗室,馬庫斯 · 比埃勒和他的同事們利用人工智能繁殖出蜜蜂在製造絲來建造蜂巢時產生的阿爾法螺旋蛋白質。 圖片來源: Markus Buehler

問: 將蛋白質轉化為聲音有什麼好處?

答: 我們的大腦處理聲音的能力很強! 在一次掃描中,我們的耳朵能聽出它所有的層次特徵: 音高、音色、音量、旋律、節奏和和絃。 我們需要一臺高倍顯微鏡來觀察圖像中的同等細節,但我們永遠不可能一下子看到所有細節。 聲音是獲取存儲在蛋白質中信息的一種非常優雅的方式。

一般來說,聲音是由振動材料產生的,比如吉他弦,而音樂則是通過按等級模式排列聲音而產生的。 通過人工智能,我們可以將這些概念結合起來,利用分子振動和神經網絡來構建新的音樂形式。 我們一直致力於研究將蛋白質結構轉化為聲音表徵的方法,並將這些表徵轉化為新的材料。

問: SARS-CoV-2的“棘突”蛋白的超聲處理能告訴我們什麼?

答: 它的蛋白質尖峰包含三條摺疊成有趣圖案的蛋白質鏈。 這些結構太小了,肉眼看不到,但是可以聽到。 我們用糾纏鏈表示蛋白質的物理結構,將其編織成多層次的旋律。 穗蛋白的氨基酸序列、二級結構模式和複雜的三維摺疊都具有特徵性。 由此產生的樂曲是對位音樂的一種形式,在這種音樂中,音符是對著音符演奏的。 就像交響樂一樣,音樂模式反映了蛋白質通過具體化其 DNA 編碼而實現的交叉幾何形狀。

問: 你學到了什麼?

答: 這種病毒具有不可思議的欺騙和利用宿主進行自我繁殖的能力。 它的基因組劫持了宿主細胞的蛋白質製造機制,迫使宿主細胞複製病毒的基因組,產生病毒蛋白質來製造新的病毒。 當你聆聽的時候,你可能會驚訝於音樂中愉悅甚至放鬆的基調。 但是它欺騙我們的耳朵就像病毒欺騙我們的細胞一樣。 這是一個偽裝成友好訪客的入侵者。 通過音樂,我們可以從一個新的角度看到 SARS-CoV-2尖峰,體會到學習蛋白質語言的迫切需要。

問: 這些地址中有沒有新型冠狀病毒肺炎地址,以及引起這些地址的病毒?

從長遠來看,是的。 將蛋白質翻譯成聲音給了科學家們另一種理解和設計蛋白質的工具。 即使是微小的突變也能限制或增強 SARS-CoV-2的致病能力。 通過超聲處理,我們還可以將其棘突蛋白的生化過程與以前的冠狀病毒(如 SARS 或 MERS)進行比較。


在我們創造的音樂中,我們分析了感染宿主的穗蛋白的振動結構。 理解這些振動模式對於藥物設計是至關重要的。 例如,振動可能隨著溫度的升高而改變,它們也可能告訴我們為什麼 SARS-CoV-2尖峰病毒比其他病毒更容易受到人類細胞的吸引。 我們正在和我的研究生們一起探索這些問題。

我們也可以使用組合方法來設計藥物來攻擊病毒。 我們可以尋找一種與抗體的旋律和節奏相匹配的新蛋白質,這種抗體可以結合到棘突蛋白上,干擾其感染能力。

問: 音樂如何幫助蛋白質設計?


答: 你可以把音樂看作是結構的算法反映。 例如,巴赫的哥德堡變奏曲是對位法的傑出實現,我們在蛋白質中也發現了這一原理。 我們現在可以在大自然創造這個概念時聽到這個概念,並將它與我們想象中的想法進行比較,或者使用人工智能講述蛋白質設計的語言,並讓它想象新的結構。 我們相信對聲音和音樂的分析可以幫助我們更好地理解物質世界。 畢竟,藝術表達只是我們內心和周圍世界的一個模型。


Zhao Qin et al. Artificial intelligence method to design and fold alpha-helical structural proteins from the primary amino acid sequence, Extreme Mechanics Letters (2020). DOI: 10.1016/j.eml.2020.100652


驚豔!當科學家把SARS-CoV-2棘突蛋白序列轉變成音樂之後...



分享到:


相關文章: