人類作為靈長類中的一員,長期以來一直對(duì)靈長類動(dòng)物的起源和演化過程熱切關(guān)注。該方向研究不僅有助于我們回答人類的起源問題,也有助于更多地了解我們?nèi)祟惇?dú)特身體結(jié)構(gòu)特征的演變歷史。隨著分子生物學(xué)的發(fā)展,近年來我們已經(jīng)有能力通過基因來回答有關(guān)問題。浙江大學(xué)生命演化研究中心的張國捷教授團(tuán)隊(duì),昆明動(dòng)物研究所吳東東研究員團(tuán)隊(duì),西北大學(xué)齊曉光教授團(tuán)隊(duì),云南大學(xué)于黎研究員團(tuán)隊(duì)等聯(lián)合國內(nèi)外多個(gè)研究中心組成聯(lián)盟開展靈長類基因組比較研究,通過多學(xué)科交叉技術(shù)手段和團(tuán)隊(duì)合作,研究人類在內(nèi)的靈長類物種的起源和分化過程、靈長類社會(huì)行為和社會(huì)組織的起源以及大腦等各種生理特征的演化和遺傳基礎(chǔ)。該聯(lián)盟還旨在研究靈長類基因演化變異圖譜及其對(duì)人類致病基因變異模式的提示意義。這一計(jì)劃的主要階段性研究成果共計(jì)8篇論文于2023年6月2日以研究專刊的形式登上《科學(xué)》(Science)雜志。新的研究回答了一系列相關(guān)問題,為理解人類在內(nèi)的靈長類演化過程帶來了許多新的發(fā)現(xiàn)。
靈長類祖先出現(xiàn)在白堊紀(jì)界限附近
靈長類動(dòng)物有超過500個(gè)物種,分屬于16科共79個(gè)屬中。其中,原猴類(原猴亞目,Strepsirrhini)是比較原始的一類靈長類,它們分布在非洲、南亞和東亞,狐猴、懶猴和叢猴等屬于這個(gè)類;而簡鼻類(簡鼻亞目,Haplorrhini)是現(xiàn)代靈長類的主體,分布在歐亞非大陸的狹鼻類(含舊世界猴)和分布在美洲大陸的闊鼻類(即新世界猴)都屬于這個(gè)類群。人類屬于狹鼻類,與黑猩猩、紅毛猩猩、大猩猩等大猿的親緣關(guān)系較近。浙江大學(xué)生命演化研究中心張國捷教授團(tuán)隊(duì)、昆明動(dòng)物所吳東東研究員團(tuán)隊(duì)聯(lián)合多個(gè)課題組分析了14科38屬共50種靈長類動(dòng)物的基因組數(shù)據(jù),包括27個(gè)新的高質(zhì)量基因組數(shù)據(jù),涵蓋了靈長類動(dòng)物的各主要類群。
通過分析基因組數(shù)據(jù)和化石時(shí)間數(shù)據(jù),研究人員推斷了靈長動(dòng)物各主要類群的演化時(shí)間,并推斷出所有靈長類的最近共同祖先出現(xiàn)在大約6 829萬到6 495萬年前。這個(gè)時(shí)間距離6 550萬年前那次造成非鳥恐龍滅絕的白堊紀(jì)末期大滅絕事件非常近,大致位于白堊紀(jì)的界限附近。這意味著靈長類動(dòng)物的演化可能受到了物種大滅絕事件的影響。
靈長類物種分化的過程中往往伴隨著染色體的融合和斷裂。該項(xiàng)目通過引入更多染色體級(jí)別的原猴物種數(shù)據(jù),修正了人類8號(hào)染色體起源的假說。舊的假說中認(rèn)為,人的8號(hào)染色體完整繼承自靈長類祖先的一條染色體,而這條染色體在新世界猴中發(fā)生了斷裂事件,形成兩條新的染色體。此次研究發(fā)現(xiàn),原猴中8號(hào)染色體實(shí)際也是處于斷裂而非合并狀態(tài)。因此,研究人員推測,真實(shí)情況可能和原來的假說正好相反,即人類8號(hào)染色體與靈長類祖先的兩條染色體同源,在舊世界猴的演化過程中這兩條染色體融合成了一條染色體形成現(xiàn)在人類8號(hào)染色體。
大腦曾在靈長類多個(gè)演化節(jié)點(diǎn)處快速變大
靈長類動(dòng)物在漫長的演化歷程中逐漸適應(yīng)各種各樣的環(huán)境和食物,發(fā)展出獨(dú)特的大腦、骨骼、體型和消化系統(tǒng)。腦,作為人類智力的源泉,其演化過程尤其受到關(guān)注。
在漫長的演化過程中,靈長類的腦部容量逐漸增加,占身體的比例也逐步增加,且皮層折疊程度不斷復(fù)雜化。相對(duì)腦容量在靈長類演化過程的四個(gè)關(guān)鍵節(jié)點(diǎn)顯著增大,分別發(fā)生在類人猿下目的祖先、狹鼻類祖先、大猿祖先和人類的祖先上。在猩猩等大猿物種出現(xiàn)之后,這種趨勢變得尤其突出,并在人類中達(dá)到了頂峰。人類不僅擁有了靈長類動(dòng)物中最大的腦容量,還擁有折疊程度最為復(fù)雜的大腦皮層。
本項(xiàng)目研究發(fā)現(xiàn),一些大腦相關(guān)的基因在靈長類的演化歷程中經(jīng)歷了正向選擇,即功能被特異性地強(qiáng)化了。若這些基因發(fā)生紊亂,往往會(huì)導(dǎo)致大腦疾病的產(chǎn)生。比如小頭畸形,即腦容量由于神經(jīng)細(xì)胞無法正常增殖而變小,是人類嚴(yán)重的神經(jīng)系統(tǒng)缺陷,小頭癥基因在人類演化過程中特異性地受到強(qiáng)烈的正向選擇,被認(rèn)為可能在靈長類腦容量擴(kuò)張中發(fā)揮了作用。研究人員還發(fā)現(xiàn)了許多其他受到正向選擇的基因在靈長類腦容量擴(kuò)張的演化過程中發(fā)揮了重要作用,特別在伴隨著皮層折疊和腦容量顯著增加的關(guān)鍵演化節(jié)點(diǎn)上尤為突出。
與此同時(shí),研究人員還在非編碼區(qū)域發(fā)現(xiàn)了一些DNA序列,它們?cè)诓溉閯?dòng)物中高度保守且受到強(qiáng)烈選擇,卻在四個(gè)靈長類大腦演化的關(guān)鍵節(jié)點(diǎn)中發(fā)生了加速演化。這些區(qū)域?qū)儆诖竽X發(fā)育相關(guān)基因的調(diào)控區(qū)域,表明了靈長類動(dòng)物在漫長的演化過程中會(huì)通過調(diào)節(jié)基因表達(dá)不斷地優(yōu)化大腦。這種非編碼區(qū)DNA序列的加速演化可能與靈長類動(dòng)物的大腦發(fā)育和演化密不可分。上述發(fā)現(xiàn)表明,靈長類動(dòng)物逐步演化成大腦更為發(fā)達(dá)的形態(tài)是有很多基因和調(diào)控區(qū)域參與其中的,這一發(fā)現(xiàn)豐富了人們對(duì)靈長類大腦演化的認(rèn)識(shí)。
此外,本研究項(xiàng)目還揭示了靈長類前肢形態(tài)的形成以及猿類尾部的消失等現(xiàn)象背后的分子機(jī)制。NEK1基因是長臂猿中受到正向選擇的基因之一,其基因變異可能會(huì)影響前臂骨長,對(duì)于長臂猿獨(dú)特的擺臂運(yùn)動(dòng)方式的適應(yīng)性進(jìn)化可能非常重要。而KIAA1217基因可能會(huì)影響脊柱的發(fā)育,其突變會(huì)導(dǎo)致小鼠尾椎數(shù)量的減少。本研究發(fā)現(xiàn),猿類中這個(gè)基因的調(diào)控區(qū)域出現(xiàn)了快速演化的情況,進(jìn)而推測這個(gè)區(qū)域的突變可能是讓猿類失去尾巴的原因之一。
不完全譜系分流改寫靈長類演化分子鐘
在遺傳學(xué)上,有一個(gè)很特別的演化現(xiàn)象,叫不完全譜系分流(incomplete lineage sorting,ILS)。比如我們都知道,相較于大猩猩,人與黑猩猩的親緣關(guān)系更近,但事實(shí)上,在人的基因組里卻有超過15%的基因組區(qū)域反而跟大猩猩更相似。這就是不完全譜系分流造成的。在不完全譜系分流下,祖先的一部分基因多態(tài)性會(huì)被隨機(jī)分流到分化出的不同物種里,從而造成了親緣關(guān)系較遠(yuǎn)的物種之間在某些基因上也會(huì)存在相似性。不完全譜系分流在多個(gè)物種類群中都被觀察到過。不完全譜系分流多大程度影響靈長類的物種分化,以及對(duì)哪些基因區(qū)域有影響仍待解密。
浙江大學(xué)張國捷團(tuán)隊(duì)與丹麥奧胡斯大學(xué)米凱爾 · 舒爾普(Mikkel H. Schierup)團(tuán)隊(duì)共同合作,利用全基因組數(shù)據(jù),對(duì)29個(gè)靈長類祖先節(jié)點(diǎn)的不完全譜系分流現(xiàn)象進(jìn)行了分析。研究發(fā)現(xiàn)在靈長類所有演化節(jié)點(diǎn)上,靈長類基因組上有5%至64%的區(qū)域發(fā)生了不完全譜系分流,說明在靈長類的演化歷程中,不完全譜系分流對(duì)靈長類的物種分化過程產(chǎn)生了較大的影響。而有些基因組區(qū)域在多個(gè)物種分化事件中都經(jīng)歷不完全譜系分流,反映了這些區(qū)域受到特殊的選擇壓力。例如與膚色和免疫相關(guān)的基因一直處于較高不完全譜系分流水平,豐富了這些基因在靈長類物種間的多樣性。相反,極度保守的、維持細(xì)胞最基本功能所必需的看家基因則較少經(jīng)歷不完全譜系分流,基本遵循著物種的分化過程中在物種間形成的差異。
此外,研究人員還建立了推斷物種分化時(shí)間的新方法。以往利用基因組序列計(jì)算物種分化時(shí)間的方法主要是基于分子鐘的原理,但這樣獲得的物種間遺傳分化的時(shí)間結(jié)果往往早于實(shí)際的物種分化時(shí)間。因此,計(jì)算結(jié)果通常需要用化石記錄來對(duì)推斷的物種分化時(shí)間進(jìn)行修正。該研究中,研究人員結(jié)合基因組上的不完全譜系分流特征,在沒有化石時(shí)間校正的情況下,重新估算靈長類物種遺傳分化時(shí)間,發(fā)現(xiàn)與已知的化石時(shí)間基本一致。這說明不完全譜系分流的分析方法可以不需要依賴化石證據(jù),只用基因組數(shù)據(jù)和某些群體相關(guān)參數(shù)就能得到較為準(zhǔn)確的物種分化時(shí)間。
雜交驅(qū)動(dòng)靈長類新物種的形成
在中國,金絲猴是家喻戶曉的動(dòng)物。其實(shí)金絲猴并不都是金色的,例如滇金絲猴(R. bieti)和怒江金絲猴(R. strykeri),雖然名為金絲猴,毛發(fā)卻是黑色與白色的。事實(shí)上,金絲猴有5個(gè)物種,除了上述兩個(gè)外,還有川金絲猴(R. roxellana)、黔金絲猴(R. brelichi)和越南金絲猴(R. avunculus),其中只有川金絲猴是渾身金色毛發(fā)的,而它也是最早被命名的金絲猴。有意思的是,黔金絲猴的頭部與肩膀等處的毛發(fā)是金色的,但身體其他部位卻覆蓋著深色的毛發(fā)。云南大學(xué)于黎教授聯(lián)合多個(gè)課題組,通過比較基因組學(xué)分析解開了黔金絲猴的身世之謎。
研究發(fā)現(xiàn)黔金絲猴是川金絲猴和滇金絲猴/怒江金絲猴共同祖先雜交后形成的物種,在演化過程中與兩個(gè)祖先物種形成了生殖隔離,進(jìn)而成為一個(gè)新的獨(dú)立物種。該研究也在演化層面解釋了黔金絲猴特有毛色的來源:黔金絲猴的毛發(fā)顏色實(shí)際是川、滇金絲猴毛色的嵌合體,其毛發(fā)基因有些來源于川金絲猴,有些來源于滇/怒江金絲猴。
著名生物學(xué)家恩斯特 · 邁爾(Ernst Walter Mayr)早在20世紀(jì)40年代就提出了基于生殖隔離的生物學(xué)物種的概念,即認(rèn)為一個(gè)物種的定義關(guān)鍵看某個(gè)種群是否能和其他種群交配并產(chǎn)生可育后代。這一論點(diǎn)被無數(shù)人奉為圭臬,并被寫入高中教科書成為演化理論的重要概念,為人們所熟知。但是,幾十年來,物種之間的雜交不斷見諸報(bào)端,剛分化不久的近緣種之間的生殖隔離往往沒有那么強(qiáng),個(gè)體之間仍然有概率突破生殖隔離,產(chǎn)生可育后代,并導(dǎo)致物種間的基因交流,也就是所謂的跨物種基因流(gene flow)。進(jìn)一步地,若雜交后代和祖先再反復(fù)回交,導(dǎo)致祖先物種的基因庫中有了雜交后代的部分基因,便產(chǎn)生了基因漸滲(genetic introgression)現(xiàn)象,這也常常是物種適應(yīng)性性狀的來源。然而,通過物種之間雜交形成全新的物種,這一成種機(jī)制在動(dòng)物界比較罕見,尤其在靈長類里,這是首次報(bào)道。
除了金絲猴,本研究項(xiàng)目中在另外兩個(gè)類群里也報(bào)道了類似的雜交成種現(xiàn)象。如食蟹猴類可能源自古老的雜交事件,即是由獅尾猴的祖先與斯里蘭卡獼猴的祖先雜交而來的;而東非狒狒和黃狒狒之間復(fù)雜的遺傳背景和演化歷史與雄性狒狒離群活動(dòng)而驅(qū)動(dòng)的近緣物種間的基因交流有關(guān)。這表明雜交是靈長類動(dòng)物物種形成的重要驅(qū)動(dòng)力之一,物種的系統(tǒng)的演化也并不完全是樹狀的,可能因?yàn)榭缥锓N的基因交流而呈現(xiàn)局部的網(wǎng)狀結(jié)構(gòu)。
基因組揭示靈長類復(fù)雜社會(huì)結(jié)構(gòu)的演化機(jī)制
部分靈長類動(dòng)物具有動(dòng)物界中少有的重層社會(huì)(multilevel society),如社會(huì)可以分成家庭、家族、氏族等不同的組織層次,其中就包括人類的社會(huì)。重層社會(huì)的演化形成也受到學(xué)術(shù)界廣泛的關(guān)注和興趣。疣猴類是舊世界猴的主要分支之一,它們主要為植食性且具有可以發(fā)酵纖維素的復(fù)雜的胃結(jié)構(gòu),而不同物種具有從簡單到復(fù)雜的多樣社會(huì)組織形式。因此,包括金絲猴在內(nèi)的亞洲葉猴(疣猴類)正是研究靈長類重層社會(huì)結(jié)構(gòu)演化的絕佳對(duì)象。西北大學(xué)齊曉光教授聯(lián)合多個(gè)課題組,對(duì)亞洲葉猴的基因組進(jìn)行了研究,回答了一系列相關(guān)問題。
本研究分析了亞洲葉猴全部七個(gè)屬的基因組,并根據(jù)4 992個(gè)直系同源基因,結(jié)合最新的化石證據(jù),構(gòu)建了可靠的系統(tǒng)發(fā)育樹,由此支持了亞洲葉猴的兩大分支是由其他葉猴和金絲猴等奇鼻猴類在約750萬年前分化而成的觀點(diǎn)。同時(shí),本研究還推翻了亞洲葉猴的祖先從北方南下進(jìn)入東亞的觀點(diǎn),提出它們是經(jīng)喜馬拉雅山南麓到達(dá)東亞、東南亞地區(qū)的新觀點(diǎn)。研究團(tuán)隊(duì)根據(jù)新的系統(tǒng)發(fā)育樹,擴(kuò)散路線并結(jié)合古氣候地理認(rèn)為,寒冷氣候是推動(dòng)亞洲葉猴類產(chǎn)生重層社會(huì)的重要因素。
此外,本研究通過對(duì)葉猴基因組的比較分析以及細(xì)胞生物學(xué)實(shí)驗(yàn)的驗(yàn)證,發(fā)現(xiàn)與能量代謝、神經(jīng)內(nèi)分泌調(diào)控相關(guān)的通路在奇鼻猴類中經(jīng)歷了快速演化。其中,催產(chǎn)素通路和多巴胺通路的作用和功能在重層社會(huì)的物種中有進(jìn)一步的加強(qiáng),這些通路與社會(huì)依戀的正相關(guān)性已經(jīng)被廣泛報(bào)道。這些結(jié)果表明,寒冷可能促進(jìn)了奇鼻猴類的代謝與神經(jīng)系統(tǒng)的重塑,在加強(qiáng)親代撫育和后代存活率的同時(shí),還加強(qiáng)了社群個(gè)體間的凝聚力,從而為亞洲葉猴更大、更穩(wěn)定的社會(huì)提供了生理基礎(chǔ)。
基因組多樣性與物種滅絕風(fēng)險(xiǎn)不完全匹配
物種滅絕風(fēng)險(xiǎn)是否與遺傳多樣性的喪失存在相關(guān)性是一個(gè)長期被討論的話題,也就是瀕危物種是否具有更低的遺傳多樣性。它直接決定了遺傳多態(tài)性能否作為衡量物種滅絕風(fēng)險(xiǎn)的指標(biāo)之一。由西班牙托馬斯 · 馬奎斯-博內(nèi)特(Tomàs Marquès-Bonet)教授領(lǐng)銜的合作團(tuán)隊(duì),對(duì)來自233種靈長類動(dòng)物的809個(gè)個(gè)體基因組的重測序數(shù)據(jù)進(jìn)行分析,而基于基因組雜合性和連續(xù)性純合片段(RoH)長度的結(jié)果表明,基因組多樣性與世界自然保護(hù)聯(lián)盟劃定的滅絕風(fēng)險(xiǎn)類別之間在整體上沒有直接關(guān)聯(lián)。
不過在較小的分類階元內(nèi),例如在同一個(gè)科內(nèi),未受威脅和受威脅物種在遺傳多樣性上存在差異。雖然并非所有的比較都達(dá)到了統(tǒng)計(jì)學(xué)意義上的顯著性,如懶猴科(Lorisidae)內(nèi)的未受脅和受脅物種之間的遺傳多樣性就沒有差異;但多個(gè)極度瀕危物種含有比例更高的連續(xù)性純合片段比例,如白頭葉猴(Trachypithecus leucocephalus)、東部大猩猩(Gorilla beringei)和蒙狐猴(Eulemur mongoz)等。這個(gè)結(jié)果說明這些極度瀕危物種的有效種群數(shù)量較小,存在近親繁殖加劇的風(fēng)險(xiǎn)。而一些目前未被歸類為瀕危的物種也有很大一部分的基因組處于連續(xù)性純合片段狀態(tài),例如阿氏夜猴(Aotus azarae)和小耳大嬰猴(Otolemur garnettii)。
總的來說,遺傳多樣性并不能完全表征物種的瀕危程度。前者取決于長期的種群動(dòng)態(tài)歷史,而目前瀕危狀態(tài)的形成很大程度上是受到非遺傳因素的威脅,種群數(shù)量的短時(shí)間快速下降可能無法在基因組水平上得到體現(xiàn)。
人工智能幫助識(shí)別人類致病基因變異
基因變異是導(dǎo)致疾病的最主要原因之一,基于靈長類與人類的親緣關(guān)系,相同的基因突變可能帶來相似的結(jié)果。以此類推,在靈長類中常見的突變可能意味著這些變異更可能是無害或有限低害的。西班牙托馬斯 · 馬奎斯-博內(nèi)特教授團(tuán)隊(duì)、Illumina人工智能實(shí)驗(yàn)室聯(lián)合多個(gè)課題組,通過對(duì)233種靈長類物種共809個(gè)樣本的全基因組測序數(shù)據(jù)進(jìn)行比較,鑒定出人類直系同源蛋白上430萬個(gè)可能導(dǎo)致蛋白結(jié)構(gòu)變化的基因變異位點(diǎn)。研究人員以此為數(shù)據(jù)集基礎(chǔ)加入人類疾病基因數(shù)據(jù),用包含450萬種可能造成良性變異的數(shù)據(jù)集訓(xùn)練了PrimateAI-3D的人工智能神經(jīng)網(wǎng)絡(luò)。與以往的深度學(xué)習(xí)架構(gòu)不同,PrimateAI-3D將蛋白質(zhì)的三維結(jié)構(gòu)在0.2納米的分辨率下進(jìn)行體素化,并使用三維卷積識(shí)別不明顯的關(guān)鍵結(jié)構(gòu)區(qū)域,使得PrimateAI-3D能夠準(zhǔn)別識(shí)別不太明顯的關(guān)鍵區(qū)域,從而更準(zhǔn)確地預(yù)測基因變異的致病性。這一研究成功演示了將靈長類群體測序數(shù)據(jù)和深度學(xué)習(xí)模型相結(jié)合的應(yīng)用,有助于我們了解人類基因變異的致病性,能幫助個(gè)性化基因組醫(yī)學(xué)在臨床上提供更好的診斷指導(dǎo)。
每個(gè)人平均攜帶了幾十個(gè)潛在有害罕見變異,如何預(yù)測一個(gè)人的遺傳因素對(duì)常見疾病,如糖尿病和心血管疾病等的患病風(fēng)險(xiǎn)?是用數(shù)千種影響較小的常見遺傳變異的總和來進(jìn)行評(píng)估,還是用少數(shù)影響顯著的罕見突變的總和來進(jìn)行評(píng)估更好呢?區(qū)分能力弱、不能有效地識(shí)別有高風(fēng)險(xiǎn)的個(gè)體,是通過常見變異來進(jìn)行臨床學(xué)上評(píng)估所遇到的最大困難之一。利用PrimateAI-3D可以實(shí)現(xiàn)“用最罕見的變異找到最容易患病的個(gè)體”的思路,即通過演化分析定位高致病性的罕見突變,用于預(yù)測患病的風(fēng)險(xiǎn)。基于人和其他靈長類動(dòng)物訓(xùn)練的PrimateAI-3D,在樣本差異上遠(yuǎn)遠(yuǎn)大于基于某個(gè)人類族群獲得的數(shù)據(jù)集,因此能在不同的人類族群中具有更好的可遷移性。隨著樣本量的增加,PrimateAI-3D的性能還可以進(jìn)一步得到提升。
綜合研究發(fā)現(xiàn)表明,常見變異和罕見變異在預(yù)測人類疾病風(fēng)險(xiǎn)方面具有互補(bǔ)的效用。常見變異可以平均識(shí)別出更多可能患病的個(gè)體,而罕見變異則更容易識(shí)別出最高風(fēng)險(xiǎn)的異常個(gè)體。因此,在臨床評(píng)估上納入罕見變異可能比僅使用常見變異更能識(shí)別出極端個(gè)體。這樣的調(diào)整具有重要的臨床意義,因?yàn)檫@些極端個(gè)體才是大部分疾病最終的病人群體,也是最需要治療或遭受嚴(yán)重的早期病變表現(xiàn)的群體,這對(duì)于預(yù)防性篩查具有重要的意義。