郭禮和
“垃圾DNA”這個名字出自上世紀70年代。在這之前已經發現真核細胞(有細胞核結構的細胞)染色體上的基因之間是不連續的,也就是說,基因之間存在著很大的間隔,就像上海到北京的鐵路有許多火車站,但這些火車站只占據鐵路總長的1.5%(也就是基因只占DNA總長的1.5%)。故而,1972年美國加州理工學院大野乾把不編碼蛋白的染色體片斷稱為“垃圾基因”。70年代后期,由于DNA測序技術的誕生和使用,證明不僅基因之間有很長的不編碼DNA,就是基因內部也存在有許多不編碼的間隔,說明一個完整的基因實際上是由許多不連續的DNA編碼片斷拼接起來的。因此,科學家把這些不編碼蛋白信息的DNA統稱為“垃圾DNA”。但是,對原核生物(沒有細胞核的單細胞生物)DNA測序,發現它們的基因內部卻是連續編碼,基因之間的間隔也很短,說明它們的垃圾DNA很少。真核細胞與原核細胞的基因組和基因結構為什么有這樣大的差異,這使人們產生很多聯想和推測。
真核細胞產生這么多的“垃圾DNA”究竟干什么?到了上世紀80年代后期,DNA測序技術已經完全實現了自動化,故而人們提出將人類的基因組(人的細胞染色體全部DNA)序列進行分析,這就是所謂“人類基因組計劃”。此計劃從1990年啟動到2003年完成,但是,這項人類歷史上最大的科學工程實際上只是完成了一個草圖。因為,研究人員只是將人類基因組的序列測出一部分,還有很多空隙未測出,主要是涉及到一些重復序列,它們的序列用現有技術很難測出。根據已測出的序列和結構分析,基因只有2.6萬個左右,占基因組總長度約1.5%,而98.5%的DNA為非編碼區,也就是人們通常所說的“垃圾DNA”。這98.5%的“垃圾DNA”究竟有什么用處?于是,科學家們在完成“人類基因組計劃”的草圖之后,啟動了ENCODE研究計劃,進一步對那些基因組空白處進行測序,并探索這些大量的“垃圾DNA”的功能,編纂DNA元件百科全書。上述兩個研究計劃可以分別稱為“結構基因組計劃”和“功能基因組計劃”。
“結構基因組計劃”的完成證明:人類和小鼠的基因組大小、基因種類和數量甚至基因的結構都很相似,但在個體形態和智慧方面的差異卻有天壤之別。他們的基因組最大的差異就是“垃圾DNA”,由此可見“垃圾DNA”并不“垃圾”,它可能與物種進化、胚胎發育、個體生長、疾病發生、機體衰老和死亡等生命現象都有著密切關系,也就是與控制基因的變異、突變、表達、調控等密切相關。
可以把生命活動簡單地理解為一臺電腦在進行一項工程設計,例如用電腦設計飛機。要完成這項任務需要兩樣東西,一個是“數據庫”,另一個是“軟件包”。有了這兩項工具就可以設計出各種類型的飛機。生命活動中的基因庫可以把它理解為“數據庫”,因為小鼠、猴子與人類的基因庫大同小異,而且可以相互替代。“垃圾DNA”可以把它理解為“軟件包”,利用不同物種的“軟件包”(也就是不同物種的“垃圾DNA”)可以設計出小鼠、猴子或人的有機體。
可以把生命活動理解為拍一部電影,基因組就是電影的劇本,基因編碼的蛋白質可以理解為演員,“垃圾DNA”就是導演。不同演員的出場和退場或再次出場都是導演根據劇本的情節來安排,這樣就可以展現出一部有血有肉有情感的動人場面。導演不僅要指導演員的表演,而且要安排舞臺燈光變幻和道具的變化來烘托舞臺場景和故事情節。“垃圾DNA”在生命活動中的演繹也是像電影導演那樣如此忙碌,故而需要大量的“垃圾DNA”,但它們不出場,也就是不編碼蛋白在細胞的生命活動舞臺上出現,可是不同蛋白何時出場何時退場或再出場卻是由“垃圾DNA”來決定的。
從某種意義上來說,物種相近的基因組主要差異不在基因(當然基因也可有差異),而是“垃圾DNA”。例如,人和猴子,尤其人與人之間的遺傳差異主要是“垃圾DNA”。這就造成人與人對疾病的發生和藥物敏感性有差異,也就是為什么需要個體化醫療的原因。
閱讀上面的文字,按要求回答問題。
1.作者認為“垃圾DNA”有哪些方面的作用?
答:
2.這篇科普文的語言形象生動,請指出其手法,并舉兩例簡要說明。
答:
3.請談談你對本文標題的理解。
答: