☉[英]本·米勒 著 金立峰 陳青石 譯
DNA到底是什么呢?這三個字母代表deoxyribonucleic acid,就是“脫氧核糖核酸”,它是一種非常特別的分子。它的名字聽起來好像很復雜,但其實不然。核糖(ribo)是一種糖類,是DNA的主要成分之一。你可能已經猜到了deoxy的意思——脫氧,就是每一個核糖分子都被移走了一個氧原子。而nucleic(核)之所以會出現,是因為DNA是在細胞的核中出現的。所以,總結來說:DNA是一種很長的分子,存在于細胞核中,由脫氧核糖構成。
你可能還記得在中學生物課上看到的細胞的樣子,為了更好地幫你回憶起來,我在下面畫了一個。如果你從口腔內壁刮下一些上皮細胞,滴一滴染色劑在上面,然后在顯微鏡下觀察,你就能看到生物學家所謂的“真核細胞”的所有重要特征了。真核細胞的中央有一個細胞核,細胞核周圍有一層看起來有點起泡的果凍狀物質,然后最外層的細胞膜把它們都包起來。你的DNA,整齊地打包成了23對染色體,就位于細胞核中。果凍狀物質叫做細胞質,其中的氣泡則是能幫助細胞進行各種生物機制的各種小玩意兒。
首先,DNA很穩定。DNA的結構非常不尋常,使它很難被破壞,因此科學家可以成功獲取數萬年以前原始人的DNA。其次,DNA可以儲存信息,事實上,如果要復制一個你,所需要的全部信息就保存在DNA中。再次,DNA有能力復制自己。沒有DNA的話,孩子就得不到父母的遺傳,進化也不能進行。
所以讓我們總結一下:DNA是一種特殊的分子,可以攜帶信息,相當于某個特定生命體的藍圖。DNA存在于細胞核中,在這里它被切成稱為染色體的小段。染色體成對出現,人類一共有23對。那么,它是怎么發揮作用的呢?怎么把DNA里蘊含的信息傳遞到一個能走能說的人體里去呢?
現在是時候討論一下蛋白質了。

口腔上皮細胞染色體和一條DNA
植物和動物都含有大量的蛋白質。比如說,你可能知道,你的肌肉、骨骼、毛發和皮膚都是由蛋白質構成。但是你可能不知道,蛋白質也是在細胞的層次讓各種事情辦成的:從助你消化食物的酶,到調節血糖濃度的激素,到給血液輸送氧氣的血紅蛋白都是蛋白質。雖說聽起來可能不夠浪漫,但是把植物和動物說成是一袋袋蛋白質,袋子里充滿水,一點也不夸張。
現在據估計人體里有數十萬甚至上百萬種不同的蛋白質,但是它們由僅僅20種不同的氨基酸組成。我們的身體可以合成出大部分氨基酸,但是并不是全部。我們的身體不能自行制造的氨基酸,我們只能從食物中攝取。換句話說,我們吃肉、蛋、魚類和植物蛋白的原因就是可以把它們分解成單個的氨基酸,然后用這些氨基酸來合成我們需要的蛋白質。
最神奇的地方就是這里。對于你身上的每一種蛋白質,都有對應的密碼在你的某條染色體的某個區域上,告訴身體要用哪些氨基酸。以及要用什么樣的順序連接氨基酸,從而制造出這個蛋白質。染色體上的這類區域有專門的名稱、你應該很熟悉——它叫基因。
我曾經與弗蘭西斯·克里克有過一面之緣,他就是發現DNA結構與功能的兩位著名科學家中的一位。
克里克和沃森推斷出的DNA分子有雙螺旋結構,就好像盤旋扭轉的梯子一樣。
克里克和沃森不僅解決了DNA結構之謎,還破解了DNA密碼。如果DNA是一個梯子的話,那兩邊的梯柱就是由交替出現的糖和磷酸基組成的。每個糖類分子會與一個堿基連接,共有4種不同的堿基:腺嘌呤(adenine)、胸腺嘧啶(thymine)、鳥嘌呤(guanine)、胞嘧啶(cytosine)。我們先不管它們到底是什么,因為如果要理解這個密碼,我們只需要用每個堿基的英文首字母,也就是A、T、G、C來稱呼DNA的密碼就可以了。這些堿基成雙配對,連接構成梯子中間的橫杠;A總是跟T連接,而G總是跟C相連。
接下來是最令人驚奇的部分:這些堿基構成了一種密碼,而我們的身體可以像拉拉鏈一樣將一個DNA分子從中間拉開,閱讀密碼并且用它來制造蛋白質。而且,這個密碼極為簡單。在基因里,這些堿基組成許多個單字,每個單字由三個字母組成。這些由三個字母組合的單字,正好對應了建構我們身體的20種氨基酸。換句話說,基因基本上是制造特定蛋白質的食譜;它簡單地告訴身體,哪些氨基酸需要按什么次序放在一起,來制造出某個蛋白質。
你可能聽說過“人類基因組計劃”,這個計劃的目標就是要定出完整的人類染色體的堿基測序。最早的一組完整序列于2003年完成,從那以后,我們一直在研究每個基因到底位于哪條染色體上的哪個位置,以及它能制造出哪一種蛋白質。
DNA是跟人類歷史直接相關的。每個人的DNA上面都有他們祖先的標記,而如果用一點偵探的高明技巧,我們就能往前推導,不僅能回溯到我們的近親,而且可以回溯到幾百萬甚至幾十億年前。
一個典型的動物或植物細胞,里面都有個塞滿了以染色體形式存在的DNA,細胞核在果凍般的細胞質中飄忽游蕩,最外邊還包著一層細胞膜。還記得我說過細胞質里有各種各樣的小玩意嗎?線粒體(“線型顆粒”)就是其中的小玩意之一,它為細胞提供能量。線粒體有著自己的DNA,而且下面這點很重要:它只存在于女性的卵細胞中,而男性精子中沒有。所以你從母親那里遺傳了線粒體DNA,而這個DNA并沒有經過重組。
那線粒體DNA怎樣幫助我們追溯祖先呢?好吧,DNA很善于復制自己,但是做得并不完美。每一次在復制DNA時(就是制造新細胞時),就會發生錯誤。因為這個復制過程,時間長了以后,即使是線粒體DNA中的單體型都可能發生突變。由于染色體DNA在傳遞到下一代時,都會與父母的DNA混合,產生重組,所以線粒體DNA的變化速度跟染色體DNA相比是很慢的,但是,經過人類5000代傳承之后,這個突變還是會為線粒體DNA帶來顯著效應。
觀察個人的單體型以后,你就可以很容易地把這個人放到一個更大的相似單體型所構成的集合里,我們稱之為“單倍群”。整個人類被分成大概20個線體單倍群,這些群組都可以按年代順序進行排列。而且,就像你期望的那樣,作為一個從非洲進化出來,然后移民到全球各角落的物種來說,肯定存在一個非洲單倍群是地球上其他單倍群的祖先。
確定每一個單倍群出現的年代,是目前很多人感興趣的研究方向,但是基本原則還是很好掌握的。我們知道人類跟黑猩猩有一個共同祖先,而且我們可以向前追溯,看看這個祖先的線粒體DNA是什么樣子。從化石證據中我們大概知道人類與黑猩猩是什么時候分開的;最新的證據顯示大概是600萬年前。所以,我們知道了人類的線粒體DNA在600萬年前的樣子,以及現在的樣子,我們就可以拿中間任何一種DNA進行分析,然后很有把握地計算出它最初的出現時間。
人們一直都在改進這個基本的方法,因為每一代線粒體的變化速度都可能被比如自然選擇和人口瓶頸等因素干擾。我之前所描繪的人類遷徙圖從非洲開始,沿著海岸到達印度尼西亞,然后回到歐洲,或到達新世界——由于需要因應新的研究成果,科學家們會對其中的路線和年代進行調整和修改,但是大家在大致輪廓上已有了共識,在細節看法上也越來越趨向一致。而且,在下面這個重要的事實上,大家都沒有分歧:我們都是20萬年前生活在非洲的一個女人的后代。她被稱為最近共同祖先(MRCA),但是我更喜歡另外一個富有詩意的名字:“線粒體夏娃”。

現在你知道了:你的線粒體DNA是從你母親那一條線遺傳下來的,它告訴我們你來自非洲。不僅如此,不管你是不是跟英王征服者威廉或者演員威廉·夏特納有親戚關系,如果你追溯你的線粒體家譜夠早的話,你就會找到一個生活在20萬年前的女人:線粒體夏娃。
如果要準確地說,線粒體夏娃當然不是第一個存活在地球上的女人,她只是遠古女性人類中最幸運的那個而已。在她之前地球上可能已經出現過其他女人,跟她同時期也可能有其他女人活著,但是她們的線粒體DNA剛好已經絕跡了,只有她的存留了下來。對于這一點,我們只能說她的運氣很好了;以任何可遺傳的性狀來說,如果一個小群體延續了足夠多代,這個性狀最終表現得比其他性狀頻繁,完全要靠好運氣。最初的人類只是一個小群體,而且碰巧早期的線粒體DNA中,只有一種流傳了數千年到數萬年。
但是,從你的母親那里遺傳過來的線粒體DNA,并不是你跟最初的人類唯一的聯系。人類的基因組中還有一部分可以讓你從父系這邊進行追溯,一直可以追溯到一位幸運的男人,那個部分就是他Y染色體中的DNA。