在DNA上存儲信息的成本已足夠便宜,商業化可期

據國外媒體Quartz報道,如今,將數據信息存儲在DNA上的成本已經足夠便宜,因此該技術有望實現商業化。

我們需要承認這樣一個事實:我們已經成為數碼囤積者,耗費大量的空間來存儲我們的數據。

2016年,人類共計產生了16.1萬億GB的數字信息;到2025年,這一數字預計將增加十倍以上。我們的個人照片、文本和電子郵件只是佔很小的一部分;真正的數據洪流來自於科學家們在其研究活動中所創造的海量信息,比如進行實驗和臨床試驗,深入研究生物的最小組成部分;觀察其他行星,儘可能深入地觀察浩瀚的宇宙。而我們目前放置數據的地方——外部硬盤和雲服務器機房——大部分都稱不上完美的解決方案。它們佔用大量的空間,而且每隔十年左右就需要升級一次。

生物技術創業公司正在尋找從我們的身體內部來解決這個問題。具體地說,就是利用我們的細胞。

大容量存儲的最新趨勢是在DNA中編碼數據。畢竟,基因材料已經是一種編碼技術。它編碼的生活:每個人體細胞包含30億個鹼基對。配對的核苷酸要麼是腺嘌呤(A)與胸腺嘧啶(T),要麼是鳥嘌呤(G)與胞嘧啶(C)。它們的序列,是所有執行我們(和所有生物)存活所需的功能的蛋白質的秘訣所在。

包括美國國防高級研究計劃局(DARPA)在內的幾家機構已經開發了基於DNA的存儲系統,這種系統能夠將各種信息編碼到微小而穩定的分子鏈中,分子鏈能夠持續數千年。

只有一個問題:製造編碼信息的獨特DNA成本十分高昂。據《連線》雜誌報道,印製目前錄製一分鐘立體聲音所需的150萬對鹼基對,成本約為10萬美元。

總部位於波士頓的Catalog公司正試圖降低那些成本。該公司是由麻省理工學院的前研究人員創辦的。Catalog並不是用信息填充一長串DNA,而是製作20到30個鹼基對長的DNA片段,這些片段可以用酶縫合在一起。這些片段的排列決定了它們的意義。本質上,它就像一種語言:在英語中,只有26個字母,但通過各種組合,理論上,我們可以創造出無數不同的單詞。Catalog估計,存儲1MB數據的成本將不到0.001美分。作為參照,在Spotify上,一分鐘最高質量的立體聲音約為2.4MB。

6月26日,Catalog宣佈,它已經使用這一系統將道格拉斯·亞當斯(Douglas Adams)的小說《銀河系漫遊指南》(A Hitchhiker’s Guide to the Galaxy)和羅伯特·弗羅斯特(Robert Frost)的詩《未選擇的路》(the Road Not Taken)存儲到基因材料當中。該公司還表示,已經獲得了來自不同風險投資公司的900萬美元投資。它計劃明年將其技術商業化。

任何對該技術感興趣的公司可以將其想要存儲的數據提交給Catalog,然後Catalog會將那些信息轉換成二進制代碼,即由0和1組成的長鏈。接著,該公司的流程為每個核苷酸分配一對0和1;例如,“A”可以是00,“C”可以是01,“T”可以是11,“G”可以是10。之後,通過使用這種DNA代碼,數據被轉換到一小瓶的基因材料裡。小瓶子可以安全地存放在任何溫度達到4攝氏度的冰箱裡,比如餐館使用的那種冰箱。

當信息以這種方式存儲時,你需要使用密鑰來將DNA解碼回二進制代碼,然後轉換回可讀的格式。Catalog的創始人之一Hyunjun Park表示,一旦公司開始對信息進行編碼,他們就會將他們的密鑰公開,這樣客戶就可讓任何人都能夠對他們的信息進行重新排序。然而,企業可以請求獲得一個新的私有密鑰,這樣他們的信息就有了額外的加密層。

如果Catalog的技術真如它所說的那樣有效,那麼該公司將有望為使得基因數據存儲可為任何人所用和持續數百年鋪平道路。Hyunjun Park說,該公司正與檔案學家合作,尋找在DNA編碼中加入清晰而持久的密鑰的最佳方式,以便未來我們的曾曾孫(或外星入侵者)能夠自己解碼Catalog DNA。

本文摘自 網易科技


分享到:


相關文章: