李聯萍,陳寧博,雷初朝*
(1.青海省海西州動物疫病預防控制中心,青海 德令哈 817099;2.西北農林科技大學動物科技學院,陜西 楊凌 712100)
因不同的形態特征和生活習性,家牛分為無肩峰的普通牛(Bostaurus)和有肩峰的瘤牛(Bosindicus)兩個牛種。普通牛主要分布在整個歐亞大陸、非洲北部和非洲西部;瘤牛主要分布在印度次大陸、東南亞和東亞南部,在中東和非洲南部及美洲也有分布。隨著測序技術發展和測序成本的降低,全基因組遺傳變異的檢測主要經歷了基因芯片和重測序兩個階段。目前在豬、牛、羊、馬、雞等畜禽進行了廣泛系統的全基因組重測序研究,取得了許多令人矚目的科研成果。本文將從通過基因芯片和重測序技術研究世界家牛的起源、遺傳多樣性以及原牛和近緣野牛對家牛的漸滲進行綜述,以期為今后家牛重要經濟性狀相關功能基因的定位、家牛的起源和馴化研究提供參考。
牛的基因芯片主要有50 K和770 K 2種,其中50 K的芯片應用最廣泛。牛單倍型計劃聯盟(The Bovine HapMap Consortium)構建了牛的SNP數據庫,定制了包含37 470個SNP的芯片,應用于19個品種共497頭牛的遺傳結構分析,使用InSTRUCT軟件估計不同祖先群體的結果表明,不同牛品種的聚類結果與已知牛品種的馴化歷史相似,普通牛和瘤牛分別在近東和印度次大陸獨立馴化,非洲普通牛和歐洲普通牛可能在馴化早期或馴化前就已經分化[1]。Decker等[2]采用牛50 K SNP芯片對全世界134個品種1 543個個體的43 043個SNP位點進行分析,將全世界家牛劃分為非洲普通牛、歐亞普通牛和亞洲瘤牛三大類群。普通牛和瘤牛在馴化后隨著農業社會的擴張和人類的活動而遷徙。普通牛和瘤牛之間可以雜交并且沒有生殖隔離,因此隨著群體的擴散,不同的普通牛和瘤牛群體之間發生廣泛的融合。在非洲,瘤牛血統的滲入,導致部分非洲牛為普通牛與瘤牛的雜種;在亞洲中部則發現明顯的歐亞普通牛和印度瘤牛的雜交群體;在歐洲,短角牛對歐洲牛的品種形成具有一定的影響;歐洲南部的意大利和西班牙普通牛擁有非洲普通牛和瘤牛的血統,表明羅馬人將近東具有混合血統的家牛帶入歐洲南部;在亞洲,牛的近緣亞種對瘤牛有較大的影響,如巴厘牛對中國南方的海南牛有明顯的滲入。Gautier等[3]通過50 K芯片對法國牛的分析也得出相同的結論。盡管非洲普通牛和歐亞大陸的普通牛分化程度非常高,但是泛基因組SNP研究結果顯示,三個大陸的普通牛都來自于一個唯一的祖先,證實普通牛在中東獨立馴化。隨著農業的擴張,中東馴化的普通牛在向非洲和東亞遷移的過程中可能吸收了少量的當地原牛,使原牛的基因組進入了現代家牛的基因池中。McTavish等[4]研究發現,美洲新大陸的家牛屬于1493年西班牙人帶來的歐洲普通牛的后代,這些普通牛在引入美洲前,已經含有非洲普通牛的血統。隨后美洲又從印度引進了更加適應南美氣候的瘤牛,故美洲家牛為歐洲普通牛、非洲普通牛和瘤牛的混合起源,具有豐富的遺傳多樣性。Yurchenko等[5]通過比較俄羅斯18個牛品種和世界上135個品種的遺傳多樣性,研究了俄羅斯當地牛的祖先和歷史。發現大部分俄羅斯牛品種和歐洲普通牛品種擁有共同的祖先,只有少量品種和亞洲普通牛共享祖先,其中雅庫特牛屬于一個高度分化的品種。Gao等[6]對中國20個地方牛品種進行50 K芯片分析,發現中國地方黃牛品種擁有普通牛和瘤牛的祖先成分,北方黃牛含有10% 以下的瘤牛血統,西南地區的黃牛含有90% 的瘤牛血統;且發現中國南方黃牛均有不同程度的爪哇牛和大額牛的滲入,西藏牛則有零星的牦牛基因組滲入。Chen等[7]利用77 K芯片對秦川牛的起源進行分析,發現秦川牛屬于瘤牛和普通牛的混合起源,并伴有少量的爪哇牛血統。由于牛的基因芯片是基于歐洲普通牛參考基因組設計的,具有很大的偏向性,并不適于研究其他地域家牛的遺傳多樣性和起源。例如印度瘤牛和中國瘤牛。而利用全基因組數據可以獲得更多的基因組信息,從而更加精確地闡述家牛的遺傳多樣性和起源。
2003年9月,“牛基因組工程”正式啟動,歷時6年,牛的基因組序列終于呈現在世人面前[8]。牛基因組包含22 000個基因,通過比對基因同義突變和非同義突變的比例,發現在多個免疫基因上存在選擇信號。Gibbs等[9]利用這個參考基因組設計了牛的SNP芯片,對19個牛品種進行SNP分型,發現馴化和人工選擇導致普通牛的有效群體大小不斷下降。自2003年牛基因組測序計劃實施以來,先后公布了多個版本的參考基因組,分別為:2018年新組裝和注釋的ARS-UCD1.2,2014年的UMD 3.1.1和Bostaurus5.0,可以在多個公共數據庫查詢。UMD 3.1.1版本的基因組包含85 046個蛋白,26 410個基因和10 047個假基因[10]。為了更快地提高家牛的遺傳進展,歐美發達國家牽頭實施了“千牛基因組”計劃,現已進行到第7輪。“千牛基因組”計劃旨在提供一個基因組變異數據庫,對用于全基因組關聯分析和基因組選育的數據進行填充。自從2012年“千牛基因組”計劃實施以來,其測序的樣本數已經從第1輪的3個品種234頭種公牛鑒定出28.3 M SNPs 到第6輪的2 700頭(大于100個普通牛和瘤牛品種),鑒定出大于88 M 高質量的 SNPs,該計劃已經收集了涵蓋全世界不同區域家牛的全基因組數據。2014 年,“千牛基因組”計劃組織者通過分析荷斯坦牛、弗萊維赫牛、娟珊牛和安格斯牛種公牛的重測序數據,共發現28.3 M的SNPs,其中每1 kb雜合位點為1.44。利用重測序數據找到一個隱性胚胎致死的突變,一個導致軟骨發育異常的顯性突變,同時也對幾個復雜性狀如產奶量和卷毛性狀進行了全基因組關聯分析,并找到其因果突變位點[11]。緊接著全世界科學家對各自國家的牛品種,如:日本見島牛[12]、口之島牛[13]、韓國斑紋牛[14]、韓國韓牛[15]、中國南陽牛[16]、中國延邊牛[14]、非洲5個牛品種[17]、美洲瘤牛[18-19]、伊比利亞牛[20]、北歐牛[21]等肉牛品種進行了全基因組重測序分析。阿爾伯塔大學的加拿大肉牛基因組計劃[22],對397頭普通牛(包括肉用和乳用品種)進行了全基因組測序,這些結果將為肉牛的基因組選育提供重要數據。Lee等[15]對1頭韓牛公牛進行全基因組分析,發現大量SNPs和Indels位點。Kawahara-Miki等[13]對1頭日本地方牛公牛進行全基因組分析,發現6.3 M的SNPs,其中5.5 M是新的SNPs,表明該品種與歐洲家牛完全不同。Tsuda等[12]對日本和牛的原始牛種見島牛進行重測序,發現 6.54 M的SNPs,并在313個基因中發現400個見島牛特異的錯義突變。Choi等[14]分別對10頭韓牛和10頭延邊牛進行全基因組比較分析,發現17 M的SNPs,其中22.3% 是新的SNPs,并發現PPP1R12A是一個潛在的影響牛肌內脂肪含量的基因。Rosse等[18]對1頭巴西的Guzera牛進行全基因組測序,發現純合的2 M SNPs和463 158 個InDels,共發現1 069個新的非同義突變、剪切突變和編碼區插入缺失,這些變異位于935個基因內,參與細胞信號、環境適應、感官和免疫系統相關信號通路。Kim等[17]對非洲大陸5個地方群體48頭家牛的全基因組進行重測序,發現非洲瘤牛具有很高的遺傳多樣性,找到非洲牛受選擇的基因組區域,為了解非洲牛廣泛的適應性提供了全基因組水平的證據,對非洲大陸家牛可持續發展提供了遺傳學依據。Liao等[19]對瘤牛品種Gir牛3頭種公牛的全基因組變異進行分析,發現9.99 M的SNPs和604 308個InDels;并檢測到79個受選擇信號,這些信號區域包含一些重要的抗病基因家族;另外一些區域包含促分裂原激活蛋白激酶,該酶直接參與滲透壓和熱應激引起的反應,與瘤牛的耐熱性相關。Mei等[23]對中國6個地方黃牛品種(37頭秦川牛,2頭南陽牛,2頭魯西牛,1頭延邊牛,2頭雷瓊牛,2頭云南牛)共46個個體進行全基因組分析,表明中國黃牛屬于瘤牛和普通牛的混合起源;但由于該文主要研究秦川牛的遺傳多樣性和受選擇信號,找到一些與毛色及產肉性狀相關的受選擇基因。Weldenegodguad等[21]對俄羅斯最北部的三個品種進行測序,共發現17.45 M的SNPs,說明雅庫特牛比歐洲普通牛擁有更多的品種特異性變異和遺傳多樣性,并發現一些與亞北極環境適應相關的受選擇基因。Chen等[24]通過全基因組測序,首次證明全世界家牛至少可以分為5個類群,即:歐洲普通牛、歐亞普通牛、東亞普通牛、中國瘤牛和印度瘤牛。歐洲普通牛血統主要分布在歐洲西部的牛種中;歐亞普通牛血統,主要分布在歐亞大陸;地理位置相分離的西藏和亞洲東北部的品種形成了一個獨特的東亞普通牛;瘤牛分為中國瘤牛和印度瘤牛兩個類群。中國地方黃牛品種主要來源于3個祖先血統:東亞普通牛、歐亞普通牛和中國瘤牛。家牛的祖先原牛在史前廣泛的分布在整個歐亞大陸,并且形成不同的群體。除了家牛之外,還有其他牛亞科動物也與家牛的棲息地相互重疊,并且都可以與普通牛和瘤牛雜交,因此牛亞科的其他動物對家牛的遺傳多樣性有獨特的貢獻。
通過對線粒體基因組的研究,已經證明現代和古代普通牛中發現少量歐洲原牛的線粒體單倍型P,說明歐洲北部、中部或東部的原牛對馴化的家牛有基因滲入[25]。隨著全基因組測序技術的發展,科學家希望能復原更多古代原牛的DNA,并與現代牛的參考基因組進行比對。2015年,Park等[26]對一頭距今6 750年的英國歐洲原牛樣本進行了重測序。通過分析這頭原牛的基因組數據,并將其與73頭現代牛的基因組數據相比較,發現這頭歐洲原牛對現代歐洲普通牛具有明顯的基因滲入。英國的Highland、Dexter、Kerry、Welsh Black和White Park牛品種都擁有該原牛的血統,而歐洲其他國家的牛種則沒有受到該原牛的影響,表明古代不同地域的原牛會對當地牛品種產生影響。英國當地原牛的滲入事件證明,不同的原牛群體對古代馴化的家牛群體有基因貢獻而且很好地保留在現代牛的基因組中。Upadhyay等[20]通過基因芯片技術進一步研究了英國原牛對歐洲現代普通牛的影響,證明歐洲原牛和愛爾蘭當地原牛存在基因交流,同時也證明伊比利亞半島上的家牛和原牛也有基因交流,表明歐洲原牛曾在歐洲有廣泛分布。
家牛的遺傳多樣性主要來自于兩個可雜交的牛種—普通牛和瘤牛。亞洲還馴化了其他牛亞科動物,包括在青藏高原及周邊地區的牦牛、印度東北部、中國云南及緬甸的大額牛、印度尼西亞的爪哇牛,這些動物的棲息地都與瘤牛和普通牛的棲息地相互重疊,因為這三種動物都可以與普通牛和瘤牛雜交,因此亞洲地區的一些牛品種屬于混合起源,對家牛的遺傳資源有獨特的貢獻。有關家牛與近緣牛種的線粒體DNA結果已經證明亞洲家牛與牦牛和爪哇牛都曾雜交過;大量基于線粒體DNA、Y染色體、微衛星標記的研究證明爪哇牛與瘤牛之間存在基因滲入。Medugorac等[27]通過對2頭蒙古牦牛的重測序數據和76頭牦牛高密度芯片的基因分型,發現這76頭家養牦牛在1 500年前受到黃牛的影響,基因組中大約保留了約1.3%的黃牛基因組,這些滲入區域包含大量與神經系統發育相關的基因,這對于選育脾性溫和的牦牛具有重要作用。該研究還發現牦牛的無角性狀來自蒙古牛。Hartat等[28]提出爪哇牛是瘤牛的部分祖先,從基因組水平證明印度尼西亞的Ongole牛是爪哇牛和瘤牛的雜交后代,并證明印尼現代牛中攜帶有非洲普通牛和瘤牛的基因組成分。Wangkumhang等[29]通過50K芯片分析發現,泰國牛中存在一些特異的SNPs,提出東南亞瘤牛特異的SNPs可能來自一個未知的或者已經滅絕的祖先。最新的研究結果表明,牛屬不同牛種之間存在廣泛的基因交流,這對于不同牛屬動物適應不同生存環境具有重要作用[30]。研究發現瘤牛與大額牛、瘤牛與巴厘牛、普通牛與牦牛、普通牛與歐洲野牛之間存在廣泛的基因組滲入。瘤牛到半野生的大額牛和巴厘牛的滲入基因中存在許多與神經和免疫系統相關的基因。通過與牦牛雜交,西藏牛獲得部分牦牛基因,提高了西藏牛對青藏高原低氧環境的適應性[30]。Chen等[24]發現中國黃牛與近緣牛種存在廣泛的基因交流,中國瘤牛基因組中保留了約2.93%的爪哇牛血統,西藏普通牛中保留了約1.2%的牦牛血統;富集分析表明爪哇牛對中國瘤牛的滲入區域主要富集在感官和免疫相關通路,牦牛對西藏牛的滲入片段主要富集在嗅覺、抗病和免疫等通路;在家牛從馴化中心擴散到其他地域的過程中,家牛不斷吸收了當地原牛的血統和近緣野牛的滲入導致了不同地方品種獨特的基因組遺傳多樣性;同時這些滲入事件使當地品種快速適應了當地的極端環境,說明基因交流是家牛適應環境的重要方式之一。
隨著二代測序成本的不斷降低和三代測序技術的更新,利用全基因組重測序技術對于檢測家牛全基因組中的序列變異和結構變異將更加全面和精確;除了商業品種和培育品種的重測序數據不斷增加,世界各地當地家牛品種的基因組數據的不斷公布將更有利于研究世界家牛的遺傳多樣性;同時隨著動物考古學和古DNA處理和分析方法的不斷進步,有助于更深入解析家牛起源和品種的形成。