王鵬杰,楊江帆,張興坦,葉乃興
茶樹基因組與測序技術的研究進展
王鵬杰1,2,楊江帆1,張興坦1,2*,葉乃興1*
1.福建農林大學園藝學院,茶學福建省高校重點實驗室,福建 福州 350002;2. 中國農業科學院深圳農業基因組研究所,廣東 深圳 518120
茶樹具有高度雜合、基因組龐大及高度重復等特點,這導致茶樹基因組的前期研究進展緩慢。基因組測序技術的迅速發展有力推動茶樹基因組的解析與完善。綜述了基因組測序技術的發展,將近年來茶樹基因組的組裝與研究進展按照草圖水平、染色體水平和單體型水平進行分類,探討茶樹基因組未來的應用與發展方向,為茶樹功能基因組學研究和精確分子育種提供參考。
茶樹;測序技術;基因組;染色體水平;單體型
茶樹[(L.) O. Kuntze]是我國重要的經濟作物,我國是世界上最早栽培茶樹和利用茶葉的國家[1]。據統計,茶樹已在60多個國家和地區進行商業種植,每年采摘的茶葉超過500萬t[2]。目前,全球范圍內的消費者每天飲茶超過20億杯,這些茶產品主要是通過茶樹芽葉加工而成的,并富含特征性的次級代謝物,包括兒茶素、茶氨酸、咖啡堿和多種揮發性化合物,有益于人們身體健康[3]。2019年聯合國大會(General Assembly of the United Nations,UNGA)將每年的5月21日指定為“國際茶日”,表彰茶在國際社會、經濟與文化發展中的重要價值,尤其是其在發展中國家農村減貧和發展中的寶貴作用。然而,與茶在全球經濟產業中的巨大貢獻相比,茶樹的基礎生物學研究和育種效率仍較為落后[4],迫切需要高質量的茶樹基因組以促進茶樹的基礎生物學研究和分子育種。而由于茶樹龐大的3?Gb大小基因組、超過70%的重復序列含量以及自交不親和導致的高度雜合特性[5-11],對茶樹基因組的測序和組裝是巨大挑戰。隨著基因組測序技術的迅速發展,2017年中國科學院昆明植物研究所的研究團隊發布了基于二代測序獲得的大葉種云抗10號茶樹基因組[5],茶學研究人員開始在茶樹全基因組范圍內進行深入的基礎科學研究。本文主要綜述了基因組測序技術及茶樹基因組學的研究進展,探討茶樹基因組未來的應用與發展方向,以期為茶樹功能基因組學和精確分子育種提供參考。
DNA測序技術在過去四十多年以來經歷了三代革新,極大地推動基因組學的研究進展,為動植物的基礎生命科學研究奠定了雄厚基礎。第一代測序技術始于Sanger等[12]1977年開創的雙脫氧鏈末端終止法,該方法將附有放射性同位素標記的ddNTP分別混入4個DNA合成反應過程中,以電泳條帶的位置確定DNA序列?;赟anger測序法,ABI公司生產了第一代3730XL測序儀器,其有效讀長可以達到1?kb,且每個堿基的準確程度達到99.999%。依靠著一代測序技術的精確性,模式植物擬南芥()的基因組于2000年被解析[13],成功開啟了植物基因組學研究的新紀元。2001年在[14]和[15]雜志發表的人類基因組研究成果就是在Sanger測序基礎上改進完成的,該成果成為人類生命科學研究的重要豐碑。此后,陸續有不少植物通過一代測序被解析,包括水稻()[16]、楊樹()[17]、葡萄()[18]、番木瓜()[19]、高粱()[20]、玉米()[21]等重要植物。雖然一代測序技術獲得的序列準確程度極高,但是成本昂貴、低通量、耗時長的缺點制約其進一步發展,在目前的大規模測序中只能成為輔助手段。
由于功能基因組學時代的到來和測序技術的巨大進步,454焦磷酸測序[22]、Solexa測序及SOLiD測序等新一代技術興起,并統稱為二代測序技術[23]。二代測序技術依靠著低成本、高通量、少耗時等優勢逐漸取代第一代測序技術成為大規模動植物基因組測序的主要技術。盡管二代測序技術的準確性不如一代測序,且獲得reads的讀長較短,但通過提高測序深度,可以很好的彌補這些缺陷。當前,美國Illumina公司的Solexa技術占據了市場主要份額,其開發的Illumina平臺特點為邊合成邊測序,在DNA合成反應體系中添加接頭引物、DNA聚合酶及擁有堿基特異性熒光的dNTP,不同的堿基特異熒光可以區分堿基信號,并根據熒光顏色判斷堿基組成類型。此外,通過橋式PCR技術,可對Illumina文庫進行雙端測序。目前公布的大部分植物基因組均是基于Illumina測序平臺完成的,包括黃瓜()[24]、可可樹()[25]、白菜()[26]、木豆()[27]、甜橙()[28]、西瓜()[29]等。然而,由于讀長短的劣勢,二代測序不能較好的組裝那些高重復性、高雜合性及高度結構變異的動植物基因組。
近年來,隨著測序技術進一步發展,被稱為單分子實時測序技術的三代測序技術,在動植物測序中大量使用。該測序技術不需要擴增文庫,直接對每一個單DNA分子進行測序。三代測序相比于二代測序最典型的特征為超長讀長,且耗時更短。然而,其隨機錯誤率較高,準確性不如二代和一代測序技術[30-31]。目前,三代測序以Pacific Biosciences公司的PacBio SMRT測序技術和Oxford Nanopore公司的納米孔測序技術為主。其中,PacBio SMRT測序技術同樣以邊測序邊合成為原理,DNA分子在測序過程中進入10~50?nm的納米孔,然后成為模板在DNA聚合酶的幫助下進行復制;帶有4種堿基特異熒光的標記基團在與模板配對過程中可顯示特異熒光,最后通過分析熒光波長和峰值判斷堿基類型。PacBio SMRT測序技術獲得的數據隨機錯誤率高,限制了該技術的應用。而在2019年最新發布的PacBio Sequl技術,通過循環一致性測序(Circular consensus sequencing,CCS)模式可產生99.8%的高精確、高保真數據,且平均讀長可達到13.5?kb[32]。納米孔測序技術的測序原理則是基于單DNA分子穿過生物納米孔時由于堿基類型差異引起電流強度變化,以此判斷堿基組成類型。最近3年的植物基因組測序大多選擇了三代測序技術[33-35],包括最近發表的多個茶樹染色體級別參考基因組[7-10]。由于三代測序技術超長的reads,使其在超大、高重復、高雜合的基因組測序與組裝層面上具有顯著優勢,隨著價格的不斷下降,將在后續動植物基因組組裝中大量運用。
無論是幾代基因組測序技術,最后獲得的reads都需要進行組裝。而之前的植物基因組組裝大都只能組裝至contigs和scaffolds層次,或通過對子代群體測序構建遺傳圖譜以進一步將contigs或scaffolds掛載到接近染色體級別的基因組。但是由于技術的限制,其遺傳圖譜的標記一般很難滿足長度較短的contigs或scaffolds的掛載需求,導致掛載率和準確性較低。近年來發展起來的新一代基因組輔助組裝技術很好地解決了這些問題,其中應用最廣的當屬高通量染色體構象捕獲(High-through chromosome conformation capture,Hi-C)技術[36]。Hi-C技術通過高通量測序在較短時間內獲得大量染色質DNA在空間上的互作關系。該技術輔助基因組組裝的原理是界定不同染色體間存在一定的“疆域”,而單條染色體內的互作頻率應大于不同染色體間的互作頻率,且染色體內近端的互作頻率也應大于遠端的,由此可初步將獲得的原始基因組裝配分配到不同染色體上。此外,還有BioNano光學圖譜技術,其原理主要是通過添加多個基因組標記位點,將DNA分子在納米孔上線性展開,并通過熒光成像掃描位點轉化成基因組物理圖譜信息以改善基因組質量[37-38]。相比于BioNano光學圖譜技術,Hi-C技術在植物基因組輔助組裝上應用更為廣泛,不僅節約成本與時間,且掛載率和準確性極高。此外,由于部分植物的雜合度極高,其測定的基因組信息折疊了大量的遺傳變異信息,而基于Hi-C數據的多種算法程序可較好地構建二倍體或多倍體植物的單體型基因組,例如FALCON-Phase[39]和ALLHiC等[40]。FALCON-Phase可通過整合二倍體植物三代測序和Hi-C數據,將初級裝配構建為高質量的單體型基因組裝配體。ALLHiC通過“修剪”步驟,刪除等位基因之間的鏈接,即單體型之間的鏈接,不僅可以構建高度雜合的二倍體植物的單體型基因組,也適用于多倍體基因組的單體型定相,并且已成功應用于幾種植物的基因組組裝中,包括同源四倍體[33]和同源八倍體[41]的甘蔗基因組、同源四倍體的紫花苜?;蚪M[35]和榕樹基因組[34]。
茶樹高質量基因組有助于茶樹的起源馴化與生理特性研究,能加速理想性狀茶樹種質的分子育種。如圖1所示,自2017年至今,已正式發表了多篇茶樹基因組相關的高水平論文[3,5-10],其中持續提高的茶樹基因組質量、不斷深入的茶樹生物學問題,均有力地促進了科研工作者對茶樹基礎理論研究的整體認識。正如自21世紀元年宏偉的人類基因組初次公布至今,基因組帶給人類對生命奧秘的認識已經大大超出了預期。
2017年,中國科學院昆明植物研究所的研究團隊基于二代測序技術率先公布了大葉種茶樹云抗10號的基因組序列[5],拉開了茶樹基因組學研究的帷幕。云抗10號的基因組大小為3.02?Gb,含有36?951個注釋編碼蛋白,其中contig N50為19.96?kb,scaffold N50為0.45?Mb。該研究首次觀察到茶樹中的重復序列含量在基因組中占極高比例,幾乎達到80.9%,并認為這可能是由于茶樹在長達5?000萬年的時間維度內長末端重復序列反轉錄轉座子家族大量爆發擴張,而缺少相應的DNA刪除機制,使得茶樹基因組龐大且重復序列含量極高。此外,還發現云抗10號部分與茶葉風味品質相關的基因家族發生擴張,例如類黃酮、萜類等化合物合成相關基因。該研究觀察到茶樹的咖啡堿合成途徑相比于可可和咖啡,存在獨立且迅速的馴化過程。這些結果可能影響茶樹的環境適應性和制茶品質。2018年,安徽農業大學的茶學團隊基于二代Illumina測序為主、三代PacBio測序補洞的方法測序獲得了茶樹小葉種品種舒茶早的基因組序列[6]。該基因組基于scaffold水平的大小為3.14?Gb,具有33?932個注釋編碼蛋白,其中contig N50為67.07?kb,scaffold N50為1.39?Mb,重復序列的基因組占比為64%,組裝質量較云抗10號基因組有較大提升。該研究發現,茶樹的祖先種與獼猴桃的物種分化時間可能在8?000萬年前。進一步的分析發現大葉種和小葉種可能是在38至154萬年前從其原始祖先種中分化而來,兩者具有極高的共線性。在舒茶早基因組中觀察到兩次全基因組復制事件,其中近期的一次復制事件影響了大量次生代謝相關基因的擴張,尤其是與兒茶素合成相關的基因,這可能可以解釋栽培茶樹兒茶素組分的高含量。該研究還挖掘了影響茶氨酸合成的關鍵酶基因并驗證功能。此外,通過比較基因組學發現,在茶葉香氣組成中占重要位置的萜烯類化合物,其合成酶基因也經歷顯著擴增。后續該團隊進一步改善舒茶早基因組的注釋質量[42],并整合茶樹基因組、轉錄組、代謝組等數據開發TPIA數據庫(http://tpia.teaplant.org/index.html)[43],有力推進了茶樹的基礎研究與數據共享。
圖1 茶樹基因組研究進展時間線
隨著三代測序和Hi-C技術的成熟和價格的下降,2020年度茶學領域涌現了多個組裝到染色體水平的高質量茶樹基因組。中國農業科學院茶葉研究所的種質資源團隊采用Hi-C技術將之前公布的舒茶早基因組組裝至染色體水平[3],scaffold N50達到218.1?Mb。該研究重點分析了茶樹的全基因組復制情況,發現茶樹在1.466~1.527億年前及5.89~6.17千萬年前分別經歷了一次古六倍體事件和古四倍體事件。QTL數據的染色體定位發現部分兒茶素相關QTL在古四倍體化事件后發生分化。
安徽農業大學的茶學團隊進一步在之前組裝的舒茶早草圖基因組基礎上,通過PacBio SMRT和Hi-C技術構建了染色體級別的茶樹基因組[10],該基因組基于contig水平的大小為2.94?Gb,具有50?525個注釋編碼蛋白,其中contig N50為600.46?kb,scaffold N50為167?Mb,顯著提升了茶樹基因組的組裝質量。該研究發現了2.55?Gb的重復序列,達到整個基因組的86.87%。首次系統鑒定了茶樹基因組的雜合區域,該區域占整個基因組的18.8%,包含3?440個基因,參與多個生物學過程。研究還揭示了萜類合成酶基因家族在茶樹染色體上以基因簇形式分布并在近期發生串聯重復事件。最重要的是,通過81份國內外茶樹種質的重測序,發現了栽培種和野生種茶樹的基因變異與馴化足跡,開啟了茶樹起源與馴化研究的新階段。與此同時,華南農業大學的研究團隊也公布了小葉種碧云的染色體級別基因組序列[7],該基因組基于scaffold水平的大小為2.92?Gb,共有40?812個高質量注釋基因,其中contig N50為625.11?kb,scaffold N50為195.68?Mb,重復序列占基因組的74.13%,并著重揭示了LTR逆轉錄轉座子在茶樹中的起源、進化與變異。此外,中國農業科學院茶葉研究所的研究團隊也公布了優質綠茶適制品種龍井43的染色體級別基因組序列[8],該基因組共3.26?Gb,編碼33?556個注釋蛋白,contig N50為271.33?kb,scaffold N50為143.85?Mb。作為抗逆性極強的茶樹品種,龍井43基因組的抗逆相關基因經歷正選擇,抗逆、品質、自交不親和等相關基因經歷擴張。139份國內外代表種質的重測序表明茶樹的馴化過程中,小葉種茶樹的萜類相關基因與抗病基因受到相對于大葉種茶樹更強的人工選擇。
對古茶樹的研究有利于揭示茶樹的起源與馴化。華中農業大學的研究團隊也于2020年7月公布了取自云南省野外深山的古茶樹DASZ基因組序列[9],該基因組為3.11?Gb,編碼33?021個注釋蛋白,contig N50為2.59?Mb。通過對主要產茶省份217份茶樹資源的轉錄組測序,發現古茶樹與栽培種茶樹并未有顯著分化,且論證了福鼎大白茶與鐵觀音等品種作為中國茶樹骨干親本的重要地位,并通過全基因組關聯分析鑒定了多個與兒茶素合成有關的遺傳位點與相關基因。
福建農林大學與中國農業科學院農業基因組研究所的研究團隊于2021年5月和7月先后發表了烏龍茶品種黃棪[44]和鐵觀音[45]的染色體級別基因組。黃棪茶樹基因組大小為2.94?Gb,雜合度為2.79%~3.40%,contig N50達到2.61?Mb,注釋獲得43?779個蛋白質編碼基因,70.75%的黃棪基因組序列被注釋為重復序列。研究發現黃棪與古茶樹DASZ之間具有最多的結構變異注釋基因,與綠茶品種舒茶早及龍井43之間的結構變異注釋基因與香氣途徑相關,表明結構變異可能影響黃棪的高香品種特性。結合結構變異、轉錄組和揮發物測定結果發現萜類合成酶(Terpene synthase,TPS)家族基因的結構變異、廣泛且特異地高表達是黃棪品種高香特性的分子基礎?;邳S棪的高質量基因組,該團隊還探究了茶樹在低溫脅迫的染色質可及性、轉錄與翻譯圖譜[46],有助于闡明茶樹乃至植物如何靈活地協調染色質、轉錄和翻譯的效應以應對低溫脅迫。鐵觀音茶樹基因組大小為3.06?Gb,contig N50為1.94?Mb,BUSCO完整性達到93.7%,注釋獲得42?825個蛋白質編碼基因,并確定了2.39?Gb的重復序列,占基因組大小的78.2%。重要的是,通過190份茶樹種質的基因組學分析揭示了大葉和小葉茶的獨立進化與平行馴化歷史,發現了廣泛的種內和種間滲入,并且揭示茶樹潛在的“綠色革命”基因和,這有助于現今茶樹品種的遺傳多樣性和不同樹型的形成。
茶樹和其他植物的二倍體或多倍體基因組往往由兩套或多套染色體組組成。值得注意的是,大多數植物二倍體參考基因組的組裝結果混雜了雙親等位基因組的嵌合序列,盡管這樣的組裝便于比較和分析數據,但都忽略了可能具有潛在生物學功能并影響高度雜合基因組質量的等位基因變異[40]。單體型解析的基因組組裝是植物基因組學領域的新趨勢,有助于植物雜種優勢與進化研究,并為準確、可靠的基因組編輯提供了堅實的基礎,但是具體的分型方法仍是一個巨大的挑戰[47]。
茶樹具有自交不親和特性,導致其基因組高度雜合并存在大量等位基因變異。華中農業大學的研究團隊對茶樹品種福鼎大白茶135個精細胞進行分離與全基因組測序,基于古茶樹DASZ的二倍體基因組數據進行單體型分型[48],并系統地分析了被譽為“華茶1號”的福鼎大白茶與中國各省份106份茶樹資源的親緣關系,為茶樹的品種選育以及基因表達調控研究提供了新的見解。
二倍體植物兩套單體型基因組的等位基因變異可能在表型調控、雜種優勢和進化中起重要作用。前人的研究支持雜交水稻具有雜種優勢的關鍵因素是具有高轉錄活性和顯性表達的等位基因[49-50]。通過結合三代HiFi數據、Hi-C技術、Hifiasm及ALLHiC程序,福建農林大學與中國農業科學院深圳農業基因組的研究團隊首次公布了高雜合性茶樹的單體型染色體級別基因組[44-45]。其中,茶樹品種黃棪的兩套單體型基因組總共包含30條假染色體,單體型A長度為2.90?Gb,單體型B為2.97?Gb。兩組單體型基因組間存在大量遺傳變異,包括2?357萬個SNP,114萬個插入和113萬個缺失。59.38%的編碼基因可定義為等位基因,平均相似度為92.60%。茶樹品種鐵觀音的兩套單體型基因組長度分別為3.06?Gb和2.92?Gb,其中34.46%的注釋基因可定義為等位基因,并發現1?528個表達模式一致性的和386個不一致的等位特異性表達基因。這表明在茶樹長期的繁殖培育過程中,顯性效應在克服突變負荷中起著重要作用。
茶樹基因組學研究的重大進展,有效推動了茶樹功能基因組學與重要農藝性狀基因的相關研究,也為茶樹的起源與演化等基礎生物學問題提供借鑒,并深化了人們對茶的基礎認識與加工利用。在未來的茶樹基因組學研究與應用中,可以關注以下幾個方向:
(1)茶樹具有高度的雜合性,單體型水平的分型基因組更能代表茶樹的真實基因信息,后續的研究可通過單體型基因組數據進一步挖掘茶樹的等位基因差異對表型和代謝產物的影響。值得關注的是,由于親本基因組數據資源的缺失,茶樹雜種優勢遺傳機理的研究一直較為落后。最近公布的鐵觀音和黃棪基因組可以成為茶樹雜種優勢研究的模式數據。鐵觀音和黃棪是烏龍茶育種的核心親本,具有互補的優質性狀。鐵觀音具有天然“蘭花香”和獨特“觀音韻”,但存在萌芽期晚、產量較低及制優率偏低等不足之處;而黃棪具有高香、萌芽期早、產量較高、制優率高等優點,是國家茶樹品種區域試驗的烏龍茶對照種。以鐵觀音和黃棪為親本創新衍生了一系列茶樹優良品種[51-53],包括金觀音(國審2002017)[54-55]、黃觀音(國審2002015)[56]、金牡丹(國品2010024)、紫牡丹(國品2010026)、黃玫瑰(國品2010025)、春蘭(國品2010016)、黃奇(國審2002018)[57]、瑞香(國品2010017)[58]、紫玫瑰(閩審2005003)、春閨(閩審2015001)[59]、鳳圓春(閩審99001)、鴻雁1號(國品2010022)、鴻雁12號(國品2010020)、鴻雁13號(國品2014010)等國家級或省級良種,還包括春桃香和金茗早[60]等多個新品系。因此,鐵觀音和黃棪家系是烏龍茶品種資源中最為重要的組成群體?;谝寻l表的鐵觀音和黃棪高質量二倍體與單體型基因組,后續可以定量該后代雜交群體的親本等位基因雜種優勢,挖掘不同雜種優勢代謝物的等位基因調控,為茶樹高香優質雜交品種的選育提供理論依據。
(2)由于不同茶樹種質之間特有的遺傳性狀,單一品種的基因組已經無法代表茶樹所有的遺傳信息。通過重新整合已經公布的云抗10號、舒茶早、龍井43、碧云、古茶樹DASZ、鐵觀音及黃棪基因組原始數據,并且補測不同茶區的代表性茶樹品種基因組數據,共同構建泛基因組(Pan-genome),將是茶樹基因組未來的發展趨勢?;诖硇圆铇浞N質的泛基因組可以全面捕捉茶樹的遺傳信息,為茶樹功能基因組學研究和精確分子育種提供寶貴資源。
(3)基于高質量的茶樹基因組數據進行更為前沿的組學分析。例如:三維基因組學、單細胞系列組學、空間組學等。這些數據可以讓我們在染色質三維結構層面、單細胞層面和空間層面上挖掘細致深入的轉錄調控事件,從而全面地解析茶樹的基礎生物學問題。
(4)栽培茶樹的起源與馴化一直是眾多研究者關注的焦點,盡管已經有了一些文獻學、語音學、考古學及遺傳學上的認識,但仍需要更多的證據去證明茶樹祖先類型、起源地點、時間以及馴化史等[61]。隨著測序技術的飛速發展,如今二代測序的每Gb數據價格已經降到了50元以內[62]。因此,可以通過整合目前已經發表的多個茶樹基因組以及數百份茶樹種質重測序數據,并且補測更多的代表性茶樹種質與近緣種質資源的重測序數據,包括其他國家的茶樹種質在內,從而在更大樣本的基因組水平上提供茶樹起源與馴化的遺傳學證據。
(5)基于茶樹全基因組信息與重要農藝性狀的全基因組關聯分析(GWAS)是今后重要的研究應用方向。盡管目前已經通過簡化基因組測序等獲得的相關數據對少數性狀進行了初步定位[63-66],仍需要通過結合覆蓋度更廣的基因組重測序數據與更全面的性狀調查數據,在高精度的茶樹基因組上進行重要農藝性狀的關鍵位點鑒定,為后續茶樹遺傳轉化體系化時代的到來提供分子育種的核心基因資源。
[1] 葉乃興. 茶學研究法[M]. 北京: 中國農業出版社, 2011.
Ye N X. Research methods of tea science [M]. Beijing: China Agriculture Press, 2011.
[2] Drew L. The growth of tea [J]. Nature, 2019, 566: s2-s4.
[3] Chen J D, Zheng C, Ma J Q, et al. The chromosome-scale genome reveals the evolution and diversification after the recent tetraploidization event in tea plant [J]. Horticulture Research, 2020, 7: 63. doi:10.1038/s41438-020-0288-2.
[4] Xia E H, Tong W, Wu Q, et al. Tea plant genomics: achievements, challenges and perspectives [J]. Horticulture Research, 2020, 7: 7. doi: 10.1038/s41438-019-0225-4.
[5] Xia E H, Zhang H B, Sheng J, et al. The tea tree genome provides insights into tea flavor and independent evolution of caffeine biosynthesis [J]. Molecular Plant, 2017, 10(6): 866-877.
[6] Wei C L, Yang H, Wang S, et al. Draft genome sequence ofvar.provides insights into the evolution of the tea genome and tea quality [J]. Proceedings of the National Academy of Sciences of the United States of America, 2018, 115(18): E4151-E4158.
[7] Zhang Q J, Li W, Li K, et al. The chromosome-level reference genome of tea tree unveils recent bursts of non-autonomous LTR retrotransposons to drive genome size evolution [J]. Molecular Plant, 2020, 13(7): 935-938.
[8] Wang X, Feng H, Chang Y, et al. Population sequencing enhances understanding of tea plant evolution [J]. Nature Communications, 2020, 11(1): 4447.doi: 10.1038/s41467-020-18228-8.
[9] Zhang W Y, Zhang Y J, Qiu H J, et al. Genome assembly of wild tea tree DASZ reveals pedigree and selection history of tea varieties [J]. Nature Communication, 2020, 11(1): 3719.doi: 10.1038/s41467-020-17498-6.
[10] Xia E H, Tong W, Hou Y, et al. The reference genome of tea plant and resequencing of 81 diverse accessions provide insights into genome evolution and adaptation of tea plants [J]. Molecular Plant, 2020, 13(7): 1013-1026.
[11] Jia X, Zhang W, Fernie A R, et al.(Tea) [J]. Trends in Genetics, 2021, 37(1): 201-202.
[12] Sanger F, Nicklen S, Coulson A R. DNA sequencing with chain-terminating inhibitors [J]. Proceedings of the National Academy of Sciences of the United States of America, 1977, 74(12): 5463-5467.
[13] Arabidopsis G I. Analysis of the genome sequence of the flowering plant[J]. Nature, 2000, 408(6814): 796-815.
[14] Venter J C, Adams M D, Myers E W, et al. The sequence of the human genome [J]. Science, 2001, 291(5507): 1304-1351.
[15] Lander E S, Linton L M, Birren B, et al. Initial sequencing and analysis of the human genome [J]. Nature, 2001, 409(6822): 860-921.
[16] Yu J, Hu S, Wang J, et al. A draft sequence of the rice genome (L. ssp.) [J]. Science, 2002, 296(5565): 79-92.
[17] Tuskan G A, Difazio S, Jansson S, et al. The genome of black cottonwood,(Torr. & Gray) [J]. Science, 2006, 313(5793): 1596-1604.
[18] Jaillon O, Aury J, Noel B, et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla [J]. Nature, 2007, 449(7161): 463-467.
[19] Ming R, Hou S, Feng Y, et al. The draft genome of the transgenic tropical fruit tree papaya (Linnaeus) [J]. Nature, 2008, 452(7190): 991-996.
[20] Paterson A H, Bowers J E, Bruggmann R, et al. The Sorghum bicolor genome and the diversification of grasses [J]. Nature, 2009, 457(7229): 551-556.
[21] Schnable P S, Ware D, Fulton R S, et al. The B73 maize genome: complexity, diversity, and dynamics [J]. Science, 2009, 326(5956): 1112-1115.
[22] Margulies M, Egholm M, Altman W E, et al. Genome sequencing in microfabricated high-density picolitre reactors [J]. Nature, 2005, 437(7057): 376-380.
[23] Levy S E, Myers R M. Advancements in next-generation sequencing [J]. Annual Review of Genomics and Human Genetics, 2016, 17: 95-115.
[24] Huang S, Li R, Zhang Z, et al. The genome of the cucumber,L. [J]. Nature Genetics, 2009, 41(12): 1275-1281.
[25] Argout X, Salse J, Aury J, et al. The genome of Theobroma cacao [J]. Nature Genetics, 2011, 43(2): 101-108.
[26] Wang X, Wang H, Wang J, et al. The genome of the mesopolyploid crop species[J]. Nature Genetics, 2011, 43(10): 1035-1039.
[27] Varshney R K, Chen W, Li Y, et al. Draft genome sequence of pigeonpea (), an orphan legume crop of resource-poor farmers [J]. Nature Biotechnology, 2011, 30(1): 83-89.
[28] Xu Q, Chen L L, Ruan X, et al. The draft genome of sweet orange () [J]. Nature Genetics, 2013, 45(1): 59-92.
[29] Guo S, Zhang J, Sun H, et al. The draft genome of watermelon () and resequencing of 20 diverse accessions [J]. Nature Genetics, 2013, 45(1): 51-58.
[30] 楊官品, 郭栗. 基因組的測序技術及其發展趨勢[J]. 中國海洋大學學報(自然科學版), 2017, 47(s1): 48-57.
Yang G P, Guo L. Technologies available for genome sequencing and their advancements [J]. Periodical of Ocean University of China, 2017, 47(s1): 48-57.
[31] Levy S E, Boone B E. Next-generation sequencing strategies [J]. Cold Spring Harbor Perspectives in Medicine, 2019, 9(7): a25791.doi: 10.1101/cshperspect.a025791.
[32] Wenger A M, Peluso P, Rowell W J, et al. Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome [J]. Nature Biotechnology, 2019, 37(11): 1155-1162.
[33] Zhang J S, Zhang X T, Tang H B, et al. Allele-defined genome of the autopolyploid sugarcaneL. [J]. Nature Genetics, 2018, 50(11): 1565-1573.
[34] Zhang X, Wang G, Zhang S, et al. Genomes of the banyan tree and pollinator wasp provide insights into fig-wasp coevolution [J]. Cell, 2020, 183(4): 875-889.
[35] Chen H T, Zeng Y, Yang Y Z, et al. Allele-aware chromosome-level genome assembly and efficient transgene-free genome editing for the autotetraploid cultivated alfalfa [J]. Nature Communications, 2020, 11(1): 2494.doi: 10.1038/s41467-020-16338-x.
[36] Burton J N, Adey A, Patwardhan R P, et al. Chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions [J]. Nature Biotechnology, 2013, 31(12): 1119-1125.
[37] Dong Y, Xie M, Jiang Y, et al. Sequencing and automated whole-genome optical mapping of the genome of a domestic goat () [J]. Nature Biotechnology, 2013, 31(2): 135-141.
[38] 陳萍. BioNano圖譜數據建模及光學圖譜在水稻基因組的應用研究[D]. 北京: 中國科學院大學, 2019.
Chen P. BioNano data modeling and application research of optical atlas in rice genome [D]. Beijing: Chinese Academy of Sciences University, 2019.
[39] Kronenberg Z N, Rhie A, Koren S, et al. Extended haplotype-phasing of long-read de novo genome assemblies using Hi-C [J]. Nature Communications, 2021, 12(1): 1935.doi: 10.1038/s41467-020-20536-y.
[40] Zhang X T, Wu R X, Wang Y B, et al. Unzipping haplotypes in diploid and polyploid genomes [J]. Computational and Structural Biotechnology Journal, 2019, 18: 66-72.
[41] Zhang X T, Zhang S C, Zhao Q, et al. Assembly of allele-aware, chromosomal-scale autopolyploid genomes based on Hi-C data [J]. Nature Plants, 2019, 5(8): 833-845.
[42] Xia E, Li F, Tong W, et al. The tea plant reference genome and improved gene annotation using long-read and paired-end sequencing data [J]. Scientific Data, 2019, 6(1): 122. doi: 10.1038/s41597-019-0127-1.
[43] Xia E H, Li F D, Tong W, et al. Tea Plant Information Archive (TPIA): A comprehensive genomics and bioinformatics platform for tea plant [J]. Plant Biotechnology Journal, 2019, 17(10): 1938-1953.
[44] Wang P, Yu J, Jin S, et al. Genetic basis of high aroma and stress tolerance in the oolong tea cultivar genome [J]. Horticulture Research, 2021, 8: 107. doi: 10.1038/s41438-021-00542-x.
[45] Zhang X. Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant,[J]. Nature Genetics, 2021. doi: 10.1038/s41588-021-00895-y.
[46] Wang P, Jin S, Chen X, et al. Chromatin accessibility and translational landscapes of tea plants under chilling stress [J]. Horticulture Research, 2021, 8: 96.doi: 10.1038/s41438-021-00542-x.
[47] Zhou Q, Tang D, Huang W, et al. Haplotype-resolved genome analyses of a heterozygous diploid potato [J]. Nature Genetics, 2020, 52(10): 1018-1023.
[48] Zhang W, Luo C, Scossa F, et al. A phased genome based on single sperm sequencing reveals crossover pattern and complex relatedness in tea plants [J]. Plant Journal, 2020, 105(1): 197-208.
[49] Huang X H, Yang S H, Gong J Y, et al. Genomic analysis of hybrid rice varieties reveals numerous superior alleles that contribute to heterosis [J]. Nature Communications, 2015, 6: 6258.doi: 10.1038/ncomms7258.
[50] Shao L, Xing F, Xu C, et al. Patterns of genome-wide allele-specific expression in hybrid rice and the implications on the genetic basis of heterosis [J]. Proceedings of the National Academy of Sciences of the United States of America, 2019, 116(12): 5653-5658.
[51] Zheng Y C, Wang P J, Chen X J, et al. Transcriptome and metabolite profiling reveal novel insights into volatile heterosis in the tea plant () [J]. Molecules, 2019, 24(18): 3380.doi: 10.3390/molecules24183380.
[52] 葉乃興. 烏龍茶種質資源的利用與品種創新[J]. 福建茶葉, 2006(3): 2-4.
Ye N X. Utilization of oolong tea germplasm resources and cultivar innovation [J]. Tea In Fujian, 2006(3): 2-4.
[53] Zeng L, Zhou X, Su X, et al. Chinese oolong tea: an aromatic beverage produced under multiple stresses [J]. Trends in Food Science and Technology, 2020, 106: 242-253.
[54] 王讓劍, 楊軍, 孔祥瑞, 等. 利用SSR標記分析金觀音(半)同胞茶樹品種遺傳差異[J]. 茶葉科學, 2017, 37(2): 139-148.
Wang R J, Yang J, Kong X R, et al. Genetic analysis of full- and half-sib families of tea cultivar jinguanyin based on SSR molecular markers [J]. Journal of Tea Science, 2017, 37(2): 139-148.
[55] 姚雪倩, 鄭玉成, 王鵬杰, 等. 金觀音與其親本差異基因表達的遺傳分析[J]. 福建農林大學學報(自然科學版), 2019, 48(2): 155-160.
Yao X Q, Zheng Y C, Wang P J, et al. Genetic analysis of differential gene expression between Jinguanyin and its parents [J]. Journal of Fujian Agriculture and Forestry University (Natural Science Edition), 2019, 48(2): 155-160.
[56] 郭吉春, 楊如興, 張文錦, 等. 茶樹雜交種金觀音與黃觀音的選育及應用[J]. 貴州科學, 2008, 26(2): 20-24.
Guo J C, Yang R X, Zhang W J, et al. Breeding and application of two tea hybrid Jinguanyin and Huangguanyin [J]. Guizhou Science, 2008, 26(2): 20-24.
[57] 郭吉春, 葉乃興, 何孝延. 茶樹雜交一代展葉期的遺傳變異[J]. 茶葉科學, 2004, 24(4): 255-259.
Guo J C, Ye N X, He X Y. Genetic variation in the leaf-expansion period of the first hybrid generation tea plants [J]. Journal of Tea Science, 2004, 24(4): 255-259.
[58] 陳榮冰, 黃福平, 陳常頌, 等. 高香型優質烏龍茶新品系瑞香選育簡報[J]. 茶葉科學, 2004, 24(1): 29-32.
Chen R B, Huang F P, Chen C S, et al. Breeding report on strong aroma and good quality newly bred oolong variety Rui xiang [J]. Journal of Tea Science, 2004, 24(1): 29-32.
[59] 鐘秋生, 林鄭和, 陳常頌, 等. “春閨”綠茶香氣成分鑒定分析[J]. 茶葉通訊, 2021, 48(1): 33-39.
Zhong Q S, Lin Z H, Chen C S, et al. Identification and analysis of aroma components in Chungui green tea [J]. Journal of Tea Communication, 2021, 48(1): 33-39.
[60] Chen X, Wang P, Zheng Y, et al. Comparison of metabolome and transcriptome of flavonoid biosynthesis pathway in a purple-leaf tea germplasm Jinmingzao and a green-leaf tea germplasm Huangdan reveals their relationship with genetic mechanisms of color formation [J]. International Journal of Molecular Sciences, 2020, 21(11): 4167. doi: 10.3390/ijms21114167.
[61] 張文駒, 戎俊, 韋朝領, 等. 栽培茶樹的馴化起源與傳播[J]. 生物多樣性, 2018, 26(4): 357-372.
Zhang W J, Rong J, Wei C L, et al. Domestication origin and spread of cultivated tea plants [J]. Biodiversity Science, 2018, 26(4): 357-372.
[62] 唐蝶, 周倩. 植物基因組組裝技術研究進展[J]. 生物技術通報, 2021, 37(6): 1-12.
Tang D, Zhou Q. Research advances in plant genome assembly [J]. Biotechnology Bulletin, 2021, 37(6): 1-12.
[63] Ma J, Yao M, Ma C, et al. Construction of a SSR-based genetic map and identification of QTLs for catechins content in tea plant () [J]. PLoS One, 2016, 9(3): e93131.doi: 10.1371/journal.pone.0093131.
[64] 李小杰, 馬建強, 姚明哲, 等. 茶氨酸合成酶基因的SNP挖掘和遺傳定位[J]. 茶葉科學, 2017, 37(3): 251-257.
Li X J, Ma J Q, Yao M Z, et al. SNP detection and mapping of theanine synthetase gene in tea plant [J]. Journal of Tea Science, 2017, 37(3): 251-257.
[65] Xu L, Wang L, Wei K, et al. High-density SNP linkage map construction and QTL mapping for flavonoid-related traits in a tea plant () using 2b-RAD sequencing [J]. BMC Genomics, 2018, 19(1): 955.doi: 10.1186/s12864-018-5291-8.
[66] Fang K, Xia Z, Li H, et al. Genome-wide association analysis identified molecular markers associated with important tea flavor-related metabolites [J]. Horticulture Research, 2021, 8(1): 42.doi: 10.1038/s41438-021-00477-3.
Research Advance of Tea Plant Genome and Sequencing Technologies
WANG Pengjie1,2, YANG Jiangfan1, ZHANG Xingtan1,2*, YE Naixing1*
1. College of Horticulture, Fujian Agriculture and Forestry University, Key Laboratory of Tea Science at Universities in Fujian, Fuzhou 350002, China; 2. China Agricultural Genome Institute at Shenzhen, Chinese Academy of Agricultural Sciences, Shenzhen 518120, China
The tea plant has the characteristics of high heterozygosity, large genome and high duplication, which has led to the slow progress of the preliminary research on the tea plant genomes. The rapid development of genome sequencing technologies has strongly promoted the deciphering and improvement of the tea plant genomes. This article reviewed the development of genome sequencing technologies, and classified the assembly and research progress of tea plant genomes in recent years according to the draft level, chromosome level and haplotype level. By discussing the future application and development direction of tea plant genomes, it provided a reference for the functional genomics research and precision molecular breeding in tea plants.
, sequencing technology, genome, chromosome level, haplotype
S571.1;Q52
A
1000-369X(2021)06-743-10
2021-07-27
2021-08-31
福建省“2011協同創新中心”中國烏龍茶產業協同創新中心專項(閩教科〔2015〕75號)、福建農林大學茶產業鏈科技創新與服務體系建設項目(K1520005A01)
王鵬杰,男,博士,主要從事茶樹遺傳育種與生物技術研究。*通信作者:zhangxingtan@caas.cn;ynxtea@126.com
(責任編輯:趙鋒)