從人類結繩記事到書籍再到硬盤,存儲信息一直是人類文明的基礎性支撐。可以說,人類每一次文明的突破,都與存儲信息技術的革命直接相關。然而,任何存儲方式都有局限性,拿今天的數字存儲技術來說,雖然和之前的技術相比,這種技術的容量和讀取方式都更能滿足數字社會的需要,并且還在不斷改進,但是仍然有不足。比如,硬盤壽命一般在20年以下,而十年之后,硬盤中存儲的信息就不完整了。再者,數字存儲技術耗能驚人。因此,科學界開始尋找更方便的、更低耗能的存儲新技術。
其實,目前人類已知的效率最高的、保存最穩定的、耗能最低的存儲技術,就是DNA存儲技術。DNA存儲技術歷史極其悠久,可以說,從有生命開始,DNA存儲技術就已經廣泛運用。這種技術能夠輕松地將我們的鼻子、眉毛、眼睛的位置,蛋白質合成途徑,人類進化過程等海量的生物信息,存儲在比細胞還要小的DNA上,而且可以形成一種超級穩定的結構,幾乎可以說這些信息是長在DNA上的。從存儲密度來看,理論上每一克DNA可以存儲數據215PB(千兆字節),約225443840GB(吉字節),相當于22萬個1TB(太字節)硬盤的存儲量。在理想狀態下,目前1千克左右的DNA就可以存儲全世界的信息。然而,這項技術尚不成熟,其難度在于寫入、讀取、還原和檢索都比較麻煩。
前不久,天津大學的元英進團隊在DNA存儲技術方面取得突破性進展,他們精選了十幅敦煌壁畫,寫入DNA。經過實驗室檢測,科研人員認為在室溫9.4℃的情況下,這些信息可以保存兩萬年,且成本非常低廉。元英進指出,DNA存儲技術最大的優勢就在于存儲的密度遠遠高于傳統的存儲介質。
那么,怎樣才能把圖片信息存儲到DNA中呢?DNA是脫氧核糖核酸的簡稱,其中包含“A”“T”“C”“G”四種堿基,可以構建一種四進制的存儲機制。而計算機采用的是二進制代碼,只要運用某種轉化方法,把計算機的二進制系統轉化為四進制系統,就可以把信息寫入DNA。科研人員先把十幅敦煌壁畫轉化成數字圖像,這些數字圖像本質上就是一些二進制的比特串,“我們通過編碼,將這些二進制的比特串轉化為四進制的A、T、C、G堿基序列,再通過DNA合成技術,將堿基序列寫入DNA,敦煌壁畫的數據圖像就‘變’為DNA了。”
如果僅僅把數字圖像寫入DNA,那么這項成就還不算突出。元英進團隊成員韓明哲解釋說,他們團隊這一成就的獨特之處在于,可以在較為寬松的條件下寫入與讀取數據。即便是天然界的DNA,也存在長期存放出現裂解的問題,而元英進團隊通過一些特殊的重建算法,完整讀取了已經裂解的DNA。在實驗室中,團隊模擬了一些比較惡劣的環境,如將溫度升高到70℃,之后通過重建算法,仍然可以讀取DNA中96.4%的信息。至于其他信息,團隊也通過另一種編碼方式完整地讀取了出來。
元英進表示團隊未來將在寫入、存儲、讀取與存放等方面繼續這項研究,“距離實用化并不遙遠”。或許在不遠的將來,我們可以把電腦和一根木頭或者一杯溶液連起來,讀取里面的海量信息。