999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

新技術(shù)使DNA數(shù)據(jù)存儲(chǔ)成為可能

2022-04-16 17:13:07
中國(guó)科學(xué)探險(xiǎn) 2022年1期
關(guān)鍵詞:方法

在日前的一項(xiàng)新研究中,美國(guó)麻省理工學(xué)院的科學(xué)家開(kāi)發(fā)了一種標(biāo)記和檢索DNA數(shù)據(jù)文件的技術(shù),這或許能讓DNA數(shù)據(jù)存儲(chǔ)成為可能。

此時(shí)此刻,地球上大約有10萬(wàn)億吉字節(jié)(GB)的數(shù)據(jù)量,而每一天,人類制造出來(lái)的電子郵件、照片、社交媒體動(dòng)態(tài)和其他數(shù)字文件加起來(lái),又有250萬(wàn)吉字節(jié)的數(shù)據(jù)。這些數(shù)據(jù)中的大部分都存儲(chǔ)在名為“艾字節(jié)(exabyte,簡(jiǎn)稱EB)數(shù)據(jù)中心”的巨大設(shè)施中(1EB相當(dāng)于10億GB),其規(guī)模可能有幾個(gè)足球場(chǎng)那么大,建造和維護(hù)成本約為10億美元。

許多科學(xué)家認(rèn)為,解決天量數(shù)據(jù)存儲(chǔ)問(wèn)題的另一種辦法在于包含我們遺傳信息的生物大分子:脫氧核糖核酸(DNA)。從地球生命誕生至今,DNA已經(jīng)進(jìn)化到可以以極高的密度存儲(chǔ)大量信息。麻省理工學(xué)院的生物工程學(xué)教授馬克·巴思表示,理論上一個(gè)裝滿DNA的咖啡杯就可以存儲(chǔ)世界上所有的數(shù)據(jù)。

“我們需要新的解決方案,來(lái)存儲(chǔ)世界正不斷積累的大量數(shù)據(jù),尤其是檔案數(shù)據(jù),”他說(shuō),“DNA的密度甚至是閃存的1000倍。另一個(gè)有趣的特性是,DNA聚合物一旦制造出來(lái),它就不會(huì)再消耗任何能量。你可以把數(shù)據(jù)寫(xiě)入DNA,然后永久存儲(chǔ)起來(lái)。”

科學(xué)家已經(jīng)證明,圖像和文本可以編碼為DNA,但我們還需要一種從許多DNA片段混合物中挑選出所需文件的簡(jiǎn)單方法。在新研究中,馬克·巴思及其同事展示了一種方法,能將每個(gè)數(shù)據(jù)文件封裝到一個(gè)6微米的二氧化硅球形“膠囊”中,并使用DNA短序列作為標(biāo)簽,以顯示其文件內(nèi)容。

利用這種方法,研究人員從包含20張圖像的DNA文件中準(zhǔn)確提取出了以DNA序列形式存儲(chǔ)的單個(gè)圖像。考慮到可以用到的標(biāo)簽數(shù)量,這種方法最多能擴(kuò)展到1020個(gè)文件。

穩(wěn)定的存儲(chǔ)介質(zhì)

數(shù)字存儲(chǔ)系統(tǒng)將文本、照片和其他類型的信息都編碼為一系列的0和1,同樣的信息也可以用構(gòu)成遺傳密碼的4種核苷酸(A、T、G和C,即腺嘌呤、胸腺嘧啶、鳥(niǎo)嘌呤和胞嘧啶)編碼在DNA中。例如,G和C可以代表0,而A和T代表1。

作為存儲(chǔ)介質(zhì),DNA還具有其他幾個(gè)特點(diǎn)。首先,它非常穩(wěn)定,而且合成和測(cè)序都相當(dāng)容易(但目前還十分昂貴)。其次,它具有非常高的存儲(chǔ)密度——1個(gè)核苷酸相當(dāng)于2個(gè)比特,大約為1立方納米。因此,以DNA形式存儲(chǔ)的數(shù)據(jù)完全可以放在我們的手掌中。

這種存儲(chǔ)數(shù)據(jù)的新方法面臨著諸多障礙,首先就是合成如此大量DNA需要耗費(fèi)的成本。目前,寫(xiě)入1拍字節(jié)(100萬(wàn)GB)的數(shù)據(jù)需要花費(fèi)1萬(wàn)億美元。為了與磁帶(通常用于存儲(chǔ)檔案數(shù)據(jù))競(jìng)爭(zhēng),巴思估計(jì)DNA合成的成本需要降低約6個(gè)數(shù)量級(jí)。他指出,這一目標(biāo)可能會(huì)在10年或20年內(nèi)實(shí)現(xiàn),就像過(guò)去幾十年來(lái)閃存存儲(chǔ)信息的成本大幅下降一樣。

除了成本之外,使用DNA存儲(chǔ)數(shù)據(jù)的另一個(gè)主要瓶頸是,我們很難從所有文件中挑選出想要的文件。

“假設(shè)寫(xiě)入DNA的技術(shù)已經(jīng)很先進(jìn),可以實(shí)現(xiàn)在DNA中寫(xiě)入1艾字節(jié)或1澤字節(jié)(zettabyte,簡(jiǎn)稱ZB,1 ZB=1 000 EB)數(shù)據(jù)的成本效益,會(huì)發(fā)生什么?你會(huì)有一大堆的DNA,也就是無(wú)數(shù)的文件、圖像或電影和其他東西,但你需要在其中找到想要的某一張圖片或某一部電影,”巴思說(shuō),“這就像大海撈針。”

目前,DNA文件通常使用PCR(聚合酶鏈?zhǔn)椒磻?yīng))方法來(lái)檢索。每個(gè)DNA數(shù)據(jù)文件都包含一個(gè)與特定PCR引物結(jié)合的序列。為了讀取某個(gè)特定的文件,需要將該引物添加到樣品中,找到并放大所想要的序列。然而,這種方法的一個(gè)缺點(diǎn)是,引物與目標(biāo)序列以外的DNA序列之間可能存在串?dāng)_,導(dǎo)致不必要的文件輸出。此外,PCR的檢索過(guò)程需要用到酶,最終會(huì)消耗庫(kù)中的大部分DNA。

“這有點(diǎn)像在干草堆里找一根針,因?yàn)槠渌蠨NA都沒(méi)有被放大,因此基本上它們都被扔掉了。”巴思說(shuō)。

解決DNA文件檢索難題

麻省理工學(xué)院的研究小組開(kāi)發(fā)了一種新的檢索技術(shù),希望取代PCR方法。他們將每個(gè)DNA文件封裝到一個(gè)微小的二氧化硅膠囊中,每個(gè)膠囊都貼上了由單鏈DNA組成的“條形碼”,與文件內(nèi)容相對(duì)應(yīng)。為了證明這種方法的成本效益,研究人員將20個(gè)不同的圖像編碼到大約長(zhǎng)度為3 000個(gè)核苷酸的DNA片段中,這大致相當(dāng)于100個(gè)字節(jié)(他們的研究還顯示,這些膠囊可以容納高達(dá)1 GB的DNA文件)。

研究中的每個(gè)文件都有相應(yīng)的條形碼標(biāo)簽,如“貓”或“飛機(jī)”等。當(dāng)研究人員想要提取一個(gè)特定的圖像時(shí),他們會(huì)取出一個(gè)DNA樣本,加入與目標(biāo)標(biāo)簽相對(duì)應(yīng)的引物。例如,老虎的圖像對(duì)應(yīng)的標(biāo)簽是“貓”“橘色”和“野生”,而家貓的圖像對(duì)應(yīng)“貓”“橘色”和“家養(yǎng)”。

這些引物用熒光或磁性顆粒標(biāo)記,便于從樣本中提取并識(shí)別匹配片段。通過(guò)這種方法,研究人員可以將需要的文件移出來(lái),剩下的DNA則完整地放回去,繼續(xù)存儲(chǔ)數(shù)據(jù)。他們的檢索過(guò)程允許布爾邏輯語(yǔ)句,如“總統(tǒng)和18世紀(jì)”會(huì)生成“喬治·華盛頓”的結(jié)果,這很類似谷歌的圖像檢索。

論文的另一主要作者麻省理工學(xué)院的詹姆斯·巴納爾說(shuō):“在目前的概念驗(yàn)證階段,我們的搜索速度是每秒1 000字節(jié)(1KB)。我們的文件系統(tǒng)的搜索速度是由每個(gè)膠囊的數(shù)據(jù)量大小決定的,而目前限制數(shù)據(jù)量大小的因素就是在DNA上寫(xiě)入100兆字節(jié)(MB)數(shù)據(jù)所需的高昂成本,以及可以并行使用的分類器的數(shù)量。如果DNA合成變得足夠便宜,我們就能夠用這種方法將每個(gè)文件存儲(chǔ)的數(shù)據(jù)量最大化。”

研究人員所使用的條形碼——單鏈DNA序列——取自哈佛醫(yī)學(xué)院遺傳學(xué)和醫(yī)學(xué)教授史蒂芬·埃利奇開(kāi)發(fā)的序列庫(kù),其中包含了10萬(wàn)個(gè)序列。如果給每個(gè)文件貼上2個(gè)這樣的標(biāo)簽,就可以唯一地標(biāo)記1 010個(gè)不同的文件;如果每個(gè)文件上有4個(gè)標(biāo)簽,就可以唯一地標(biāo)記1 020個(gè)文件。

哈佛醫(yī)學(xué)院遺傳學(xué)教授喬治·丘奇并沒(méi)有參與這項(xiàng)研究,但他將這項(xiàng)技術(shù)描述為“知識(shí)管理和搜索技術(shù)的巨大飛躍”。

“在DNA中寫(xiě)入、復(fù)制、讀取,以及用DNA進(jìn)行低能耗的檔案數(shù)據(jù)存儲(chǔ)方面,我們?nèi)〉昧丝焖龠M(jìn)步,但這也使得從巨大的數(shù)據(jù)庫(kù)(1021字節(jié),澤字節(jié)規(guī)模)中精確檢索數(shù)據(jù)文件變得極為困難,”丘奇說(shuō),“這項(xiàng)新研究引人注目的地方在于,它使用一個(gè)完全獨(dú)立的DNA外層解決了這個(gè)問(wèn)題,擴(kuò)展了DNA的不同屬性(雜交而非測(cè)序),而且使用的是現(xiàn)有的儀器和化學(xué)試劑。”

巴思設(shè)想這種DNA封裝技術(shù)可以用于存儲(chǔ)“冷”數(shù)據(jù),即保存在檔案中但不經(jīng)常訪問(wèn)的數(shù)據(jù)。目前,他的實(shí)驗(yàn)室已經(jīng)成立了一家名為Cache DNA的初創(chuàng)公司,正在開(kāi)發(fā)DNA的長(zhǎng)期存儲(chǔ)技術(shù),既可以用于長(zhǎng)期的DNA數(shù)據(jù)存儲(chǔ),也能用于短期的臨床和其他現(xiàn)有的DNA樣品存儲(chǔ)。

“雖然我們可能還需要一段時(shí)間才能將DNA作為數(shù)據(jù)存儲(chǔ)介質(zhì),但目前在COVID-19檢測(cè)、人類基因組測(cè)序和其他基因組學(xué)領(lǐng)域中,對(duì)于DNA和RNA樣品的低成本和大規(guī)模存儲(chǔ)的解決方案都有很緊迫的需求。”巴思說(shuō)道。

猜你喜歡
方法
中醫(yī)特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數(shù)學(xué)教學(xué)改革的方法
化學(xué)反應(yīng)多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學(xué)習(xí)方法
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡(jiǎn)單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢(qián)方法
捕魚(yú)
主站蜘蛛池模板: 日韩色图在线观看| 国产成人免费手机在线观看视频| 91在线免费公开视频| 免费国产一级 片内射老| 在线毛片网站| 中文字幕第4页| 免费不卡在线观看av| 国产69精品久久久久妇女| 亚洲国产亚洲综合在线尤物| 亚洲国产精品VA在线看黑人| 激情六月丁香婷婷四房播| 欧美国产日产一区二区| аⅴ资源中文在线天堂| 亚洲中文精品人人永久免费| 亚洲第一中文字幕| 久久婷婷六月| 97成人在线视频| 真实国产精品vr专区| 欧美精品亚洲精品日韩专区va| 日韩a在线观看免费观看| 成人av手机在线观看| 久久国产精品无码hdav| 亚洲成A人V欧美综合天堂| 91色在线观看| 伊伊人成亚洲综合人网7777| 久久永久精品免费视频| 久久国产黑丝袜视频| 欧美日韩成人| 国产剧情无码视频在线观看| 国产精品毛片一区视频播| 国产精品成人不卡在线观看| 亚洲乱强伦| 亚洲欧美在线综合一区二区三区 | AV不卡在线永久免费观看| 国产乱人伦精品一区二区| 直接黄91麻豆网站| 国产乱码精品一区二区三区中文| 欧美日韩国产在线观看一区二区三区 | 亚洲成人在线免费观看| 欧美亚洲一区二区三区在线| 茄子视频毛片免费观看| 九九九精品成人免费视频7| 免费av一区二区三区在线| 国产精品污污在线观看网站| 日韩视频免费| 欧美亚洲国产一区| 欧洲成人在线观看| 精品亚洲国产成人AV| 91精品久久久久久无码人妻| 欧美中文字幕一区| 久久久久久久久久国产精品| 亚洲国产中文在线二区三区免| www.精品国产| 国产欧美日韩18| 在线免费观看a视频| 欧美高清国产| 国产网站免费观看| 欧美国产菊爆免费观看 | 国产精品免费久久久久影院无码| 久久成人18免费| 精品国产乱码久久久久久一区二区| 亚洲 日韩 激情 无码 中出| 国产农村1级毛片| 国产精品性| 日本影院一区| 青青青国产在线播放| 波多野结衣亚洲一区| 亚洲第一精品福利| 欧美日韩综合网| 精品久久人人爽人人玩人人妻| 精品久久久久久中文字幕女| 成人午夜精品一级毛片| 久久国产成人精品国产成人亚洲 | 亚洲天堂免费观看| 亚洲成人在线网| 亚洲视频四区| 欧美激情综合一区二区| 亚洲国产精品美女| 日韩午夜福利在线观看| 久久天天躁狠狠躁夜夜躁| 成人午夜免费观看| 国产高潮流白浆视频|