任志方



在著名的電子游戲《刺客信條》中,玩家可以通過祖先的DNA穿越到過去,重溫他們的記憶、他們的生活。這不是天馬行空,研究人員現在已經將DNA用作存儲介質。
2019年12月,瑞士科學家公布了一項研究成果,他們使用一種含有DNA數據的材料3D打印出一只塑料兔子,之后切下一部分塑料,解碼其中的DNA信息后,就可以再造一只一模一樣的兔子。這意味著,DNA真的能夠實現無所不在的存儲,未來我們的信息可以存在DNA里,而且不受形狀所限。
也就是說,甚至你家里的鍋碗瓢盆,都能攜帶“遺傳信息”了!當千年后的考古學家得到了一堆被注入DNA的碎瓷片,通過基因測序,他不僅能打造出一個一模一樣的碗,甚至還能從中還原整個文明的面貌。
一只擁有DNA的塑料兔子
在電影《侏羅紀公園》里,科學家通過琥珀中的蚊子提取恐龍的DNA,成功讓恐龍復活。現實世界中,這項來自瑞士蘇黎世聯邦理工學院和以色列Erlich實驗室的神奇研究,首次將“萬物DNA”材料作為信息存儲工具,注入日常物品當中,而且通過DNA“復活”的并非有生命的物體,而是一個塑料模型,這個模型被稱為“斯坦福兔子”。這不是某個藝術工作者隨意創作的作品,而是一種計算機圖形學領域廣泛采用的3D測試模型。
實驗中,研究人員將“斯坦福兔子”O和1的二進制數據轉換為DNA中四種堿基的數據(A、G、C、T),進而將DNA片段封裝在二氧化硅小球內(小球大小為160納米),這些小球則被嵌入可生物降解的熱塑性聚酯中,最后使用所得的熱塑性聚酯來進行3D兔子的打印。
這是一個DNA存儲編碼的過程,由壓縮、糾錯和轉換三部分組成。在轉換為DNA數據之前,“斯坦福兔子”的二進制立體光刻文件大小為100KB,用以合成DNA編碼的數字藍圖被壓縮到了45KB,這是為了最大化地利用DNA存儲空間,需要對信息去除冗余以達到壓縮的目的。
研究人員利用一種特殊的編碼技術,將數碼信息轉換為DNA序列信息,再將其封裝到二氧化硅小球內,每個小球包含了數十個合成DNA分子。將DNA鏈封裝于二氧化硅小球中,是為了防止DNA降解。
解碼,則是對存儲的DNA片段進行復制擴增以備份,再對擴增得到的DNA片段進行測序,獲取堿基序列后對序列糾錯、去冗余、解碼,即可得到原始信息。如何“克隆”塑料兔子
在這個研究中,研究人員利用存儲在塑料兔子中的DNA來復制兔子數據。具體而言,研究人員從3D兔子耳朵處剪下10毫克的打印材料,這占兔子總重量(3.2克)的0.3%,然后提取出其中的DNA(至此需4小時),擴增并測序(需17小時)。盡管有5_g%的原始信息丟失以及存在測序誤差,但研究人員還是完美解讀了“斯坦福兔子”的數據。解碼過程只需要在普通筆記本電腦上運行數分鐘即可完成。
由此循環,由前一代擴增的DNA被封裝到下一代中,研究人員連續創造出了5代兔子,且沒有任何信息損失。即使第四代和第五代之間相隔了9個月,DNA信息一直保持高保真性和穩定性。
為了擴展這個研究的場景,研究人員還將一段視頻編碼進樹脂玻璃中,再用該樹脂玻璃制造了一副眼鏡,只需一小塊樹脂玻璃,就能恢復其中隱藏的信息。
研究人員表示,這項研究最大的突破在于證實了萬物皆可實現DNA存儲的理論。美國加州大學洛杉磯分校的生物化學家Sriram Kosuri評價道,“這項研究最酷的地方,是證明了DNA真的能實現無處不在的存儲。甚至你家里的鍋碗瓢盆,以后都能攜帶‘遺傳信息了!當千年后的考古學家得到了一堆被注入DNA的碎瓷片,通過基因測序,他不僅能打造出一個一模一樣的碗,甚至還能從中還原整個文明的面貌”。
海置數據需要DNA存儲技術
如今,我們所有的思想和行為,甚至日常活動,都可以通過照片和視頻,以數據的形式進行存儲。除了當手機里的存儲空間快用完了時,我們很少會想起自己的數據痕跡。但是研究顯示,在過去的幾年里,我們共同產生的數據比以往人類歷史上所有的數據都要多。
大數據已經成為一個大問題。我們可能會產生一個幻覺,那就是存儲問題已經解決了,但實際上,我們只是把它外部化了。數字存儲很昂貴,而且我們所擁有的存儲設備都很難經得起時間的考驗。
1956年,IBM發布了第一款硬盤。它的存儲量相當于一首MP3歌曲,重量則超過1噸。很少有人會有興趣購買這個東西,但這是當時科學家能做的最好的程度了。
如今,數據存儲技術已經取得了長足的進步,全球的數據量不斷增加,傳統的存儲介質,如硬盤和磁帶,越來越難以跟上數據存儲的需要。如果今天還有人在用軟盤來備份文件,你可能會覺得他有點奇怪,而且如今的電腦已經用不了這個過時的東西。
當傳統的存儲介質逐漸達到存儲極限時,DNA被當作一種長期存儲方案提出來。過去的研究已經強調了DNA的持久性和存儲海量信息的能力,現在研究人員已經發現了一種前所未有的方式,可利用其持久性進行存儲。
在計算機中,所有的數據都是由O、1構成的二進制編碼,而DNA數據存儲技術則是將0、1數據通過一定的編碼方法,轉換成DNA中的A、G、C、T四種堿基,通過合成含有這些堿基序列的DNA即可實現數據信息存儲。
與傳統的存儲介質相比,DNA數據存儲具有存儲密度高、保存時間長、易獲取、易維護、能耗低等特點。根據哈佛大學此前的研究,裝滿一鞋盒的DNA(約1kq)就能存儲全球數據。
早在1999年,《自然》雜志上就發表了關于DNA隱寫術的文章,即把有用信息存放于一堆垃圾信息里面。作者將一段有用的DNA信息與人類基因組信息混合在一起,再通過特殊方式提取目的片段,測序、解碼后,即可獲得原始信息。
經過多年的努力,現代生物科技公司正在加速推進DNA存儲的開發與商業化應用。對于數據存儲,我們正處在一個新的早期節點。
DNA存儲將顛覆人們對數據存儲的認知。在我們目前的存儲世界里,硬盤必須是硬盤的樣子,磁帶必須是磁帶的形狀,光盤也必須是光盤的外形,而DNA硬盤則不受形狀所限。
雖然DNA存儲技術目前還存在著諸多缺陷,但是其海量的存儲性能、精巧的存儲體積以及極長的存儲時間,對于大數據來說是一種十分誘人和極具潛力的存儲方式。相信在未來的某一天,我們會扔掉沉重的硬盤,拿起U盤大小的DNA存儲介質,而在這里面存儲的,是整個世界的知識。
(責任編輯:白玉磊 責任校對:趙夢祺)