周新成 夏志強 陳新 鄒枚伶 盧誠 王海燕 王文泉



摘? 要:基因組學的發展,不僅能獲得物種個體水平染色體的精準DNA序列,解析生命科學的基本問題,而且其超高通量技術使得在群體水平詮釋物種遺傳多樣性成為可能,從而改變了現代生命科學的進程和研究方式。本文概述了基因組技術的最新進展,以及與相關組學技術結合,在物種群體遺傳結構多樣性、功能基因發掘、生物進化以及精準育種領域的廣泛應用;同時簡述了熱帶作物的生物學特性、基因組研究進展及其存在的問題,并對未來基因組學發展與新的應用領域進行了簡評。
關鍵詞:基因組學;第三代測序技術;遺傳多樣性;進化;精準育種;熱帶作物
中圖分類號:Q-1? ? ? 文獻標識碼:A
Abstract: Genomics not only makes the development of genetics up to the ultimate dream, to obtain precision DNA sequence in chromosome level for individual species, resolve the basic problems of life science, but also, the ultra-high throughput sequencing technology makes it easy and accuracy to interprete the population genetic diversity for a species, thus changing the way and the process of modern life science and research. Here is an overview of the latest progress of genome technology and its extensive application in the fields of genetic structure diversity of species populations, functional gene exploration, biological evolution and precision breeding in combination with relevant omics technology, so as to comprehensively analyze biological inheritance and character variation. Meanwhile, the biological characteristics, genome research progress and existing problems of tropical crops were briefly reviewed, and perspective the future development and new applications of genomics.
Keywords: genomics; the third generation sequencing technology; genetic diversity; evolution; precision breeding; tropical crops
DOI: 10.3969/j.issn.1000-2561.2020.10.019
1? 基因組學的概念、內涵與外延
自美國進化生物學家托馬斯·亨特·摩爾根創作的《基因論》(1926年)為標志的遺傳學問世,近百年來基因概念經歷了深度的發展,從單基因遺傳因子,到DNA雙螺旋結構、轉座子、細胞遺傳學、群體遺傳學到表觀遺傳學,分子生物學技術的進步催生了基因組學(genomics)。美國科學家Thomas Roderick提出基因組學的概念(1986年),是指對物種所有基因進行基因組作圖、核苷酸序列分析、基因定位和基因功能分析的一門科學。基因組學是現代遺傳學的基本形式,特別是核苷酸高通量測序技術的發展,以有限的成本測定所有經濟物種基因組序列成為現實,進而從基因組草圖升級為基因組精細圖譜,結合生物學相關技術的進步,基因組學的內涵發生了顯著的變化,已成為生命科學的前沿和熱點領域。狹義的基因組學包括結構基因組、功能基因組和比較基因組學幾個方面,而廣義的基因組學還包括由生物學中心法則演化的生物遺傳信息流的整合研究。如測定全基因組特定時空和組織器官的基因表達譜,即轉錄組學,也包括全基因組范圍mRNA指導完成的蛋白質合成與調控,即蛋白質組學,還包括新興的代謝組學,及由生物蛋白酶系統組織完成的數量更加復雜的代謝產物分析及其與遺傳關系的研究[1]。有的學者贊同后者是基因組學研究的外延,這種外延還包括在DNA、RNA和蛋白質水平修飾的甲基化、泛素化、磷酸化等,及非編碼RNA介導的遺傳調控相關表觀遺傳學[1]。基因組學從個體或者細胞的單個基因研究上升到對相關基因群和全部基因的協同作用研究,構建特定生物學過程的基因網絡,促進了可量化的系統生物學發展。尚包括針對物種群體的基因組解析,挖掘物種水平的遺傳變異及其進化信息。
2? 基因組學技術改變了生命科學進程
2.1? 基因組學技術將生命科學推進到精準研究的時代
2007年第二代基因組測序技術取得突破,以454、Illumina測序技術為代表的高通量短片段測序與拼接技術,將DNA/RNA序列分析成本大大降低,導致迄今主要經濟物種基因組草圖全面問世,物種演化和遺傳多樣性等基礎生物學問題取得大量數據和全新的進展,非編碼RNA和表觀遺傳學調控初見端倪;然而由于物種基因組的復雜性,特別是重復序列的大量存在,使得現有基因組草圖只具有參考價值,基因組大都不夠完整,全基因組測序覆蓋度一般為65%~90%[2],并且不可避免存在許多堿基序列錯誤和拼接次序的錯誤。2017年以Pac-Bio和Oxford Nanopore為代表的第三代測序儀取得顯著的改進,Pac-Bio目前允許單個片段測序讀長達到15 kb,測序通量和準確率進一步提升,這樣將可以解決基因組重復序列的障礙;Bionano單分子納米孔測序及光學物理圖譜技術,則通過對大片段基因組DNA分子特定位點的標記,建立高覆蓋度的光學物理圖譜,適度拼裝可以達到N50為5 Mb的超長序列[3]。該項技術不僅能夠為大基因組組裝提供精確的骨架,整合三代測序數據組裝染色體級別的物種基因組精細圖,而且通過基因轉錄起始區、甲基化、特定類型基因等多重標記,能夠為物種群體提供功能性狀的染色體鏡像,解決長期以來細胞學與分子水平遺傳研究的銜接問題[4]。這些三代測序技術與二代測序技術及Hi-C技術的整合,可以有限成本將物種基因組組裝到染色體級別的精細圖譜,覆蓋度達到90%~99%,Scaffold N50達到30~50 Mb[4],標志著基因組學研究進入精準科學時代,許多基因組草圖將被改寫為基因組精細圖譜。蛋白質組學中iTRAQ技術發展使得單次測序獲得6000~10000個蛋白質片段[5],這些新技術的組合和綜合應用,建立了精準生命科學研究的技術基礎。以精準生命科學的基因組學、表觀遺傳學、蛋白質組學和代謝組學、基因組編輯技術等為基礎的生命科學即將進入一個全新的時代。揭示生命活動的精細調控,生物重構,經濟作物產量與品質調節,實現精準人類健康管理等精準操作,并將衍生大量的應用性技術乃至產業。基因組學技術在未來的應用圖景歸納為圖1。
2.2? 高分辨率群體基因型分析破解物種多樣性終極變異及其演化
群體基因型分析從傳統的分子標記(RAPD,SSR,AFLP等)、芯片技術逐步轉向簡化重測序和重測序,其檢測通量成等比級數上升,而分析成本則成等比級數下降。芯片雜交技術由于信號的噪聲問題,加上需要多個重復增加了成本,而逐漸被重測序取代。全基因組重測序是對基因組序列已知的個體進行全基因組范圍的測序,并在個體或群體水平上進行差異性分析的方法。過去10年由于重測序成本尚比較高,幾種簡化重測序技術應運而生。最典型的是康內爾大學推出的genotyping by sequencing(GBS)技術[6],在對物種DNA酶切基礎上的隨機擴增,獲取基因組約5%~7%的序列,并采用加barcode混合樣本測序策略,測序成本大大降低;另外一種AFSM技術,進一步選擇了對甲基化敏感的酶切位點,且對基因區有一定偏置性,可同時檢測全基因組的甲基化水平[7]。簡化重測序技術主要用于解析物種大群體遺傳多樣性變異(SNPs,InDels)和性狀關聯分析,以及育種群體的標記選擇,目前已得到廣泛的應用。隨著基因組測序成本的進一步降低,采用二代測序技術的完全重測序及其新型建庫技術得到更多的應用,可以獲得幾乎完整的基因區序列信息,并可以部分檢測基因組一些結構變異SV(小于50 bp)信息[8],在作物物種群體遺傳多樣性、育種標記檢測、人類疾病的致病突變研究及物種演化中有越來越多的應用,具有重大的科研和產業價值。現將若干種應用分述如下。
2.2.1? 全基因組重測序實現目標性狀的精細標記? 第二(NGS)、第三代測序技術與遺傳學的結合,加快了作物農藝性狀相關基因的識別和分離。由于標記密度的顯著增大,提高了QTL位置的分辨率,有助于確定基因的功能性變異。通過重測序可以發現大量的單核苷酸多態性位點(SNPs)、拷貝數變異(copy number variation,CNV)、插入缺失(insertions/deletions,InDels)、結構變異(structure variation,SV)等變異位點。基于以上變異位點作為分子遺傳標記,在人類復雜疾病、動植物經濟性狀和育種研究及物種起源、馴化、群體歷史動態等方面具有重要的指導意義[9-10]。一系列在獲取物種基因組精細圖基礎上,對栽培及野生種大群體重測序解析育種重要性狀QTL和關聯位點的研究問世,包括對于桃樹主要品質性狀的系統研究[11],這些研究在方法學上采用批量分離分析(BSA)、基因組遺傳多態數據庫的構建,結合多年多點表型數據以精確QTL和關聯位點的檢測[12]。全基因組重測序基礎上的GWAS分析已經取得顯著的成果,在生物醫學領域揭示了數百個復雜的疾病性狀,可以肯定未來的GWAS將以全基因組測序為基礎[13]。
2.2.2? 群體重測序發現新基因? 通過經濟物種自然群體基因型標記與表型性狀的全基因組關聯分析,或者實驗群體的QTL定位獲取性狀的分子標記,進而通過圖位克隆是新基因發掘的重要方法。然而傳統意義上由于群體遺傳標記密度過低問題,基因圖位克隆需要輔之以大片段DNA文庫篩選,以及染色體步移等復雜的技術程序,通過圖位克隆獲得動植物基因[14]。隨著群體重測序技術的廣泛應用,一次性獲得物種超高密度的單倍型圖譜變得簡單可行,一旦有可靠的群體表型數據,圖位克隆過程變得比過去更為簡單,因而更加實用。迄今在大豆、木豆、油菜、棉花及動物山羊等經濟物種中有大量成功的范例,獲得具有重要經濟價值的基因資源[12, 15-18]。
高分辨率基因組分析技術為農作物基因組的結構多樣性提供了前所未有的視角。除了用于復雜農藝性狀的遺傳作圖或全基因組關聯研究外,高密度基因分型陣列也非常適用于基因組選擇策略,它們還能以前所未有的染色體尺度分辨率描述作物多樣性。這些研究深入了解了作物進化和選擇的歷史,同時發現了新的多樣性以提高產量和雜種優勢[19]。
2.2.3? 全基因組重測序解析生物適應性進化? 對于物種演化研究,到目前為止,大部分知識來自基于短片段測序的分析,而長讀測序技術正開始應用于所有物種的基因組分析,其遺傳變異信息接近完整,也包括在染色體水平的基因組結構變異,會在更大尺度上影響基因組功能,展示基因組進化圖景[20]。在獲得物種參考基因組基礎上,對多個基因組深度重測序,特別是野生與栽培類型的比較解析,提供了栽培物種進化、馴化和物種形成的更加完整的證據[21]。如迄今在辣椒[22]、桃樹[23]和鷹嘴豆[24]等物種所發現的演化途徑,揭示了選擇性刪除(selective sweeping)、轉座調控等在物種演化與形成中具有重要的作用。
在相關研究中,首先,需要獲取物種地域分布演化過程群體的原始樣本,一般具有栽培類型的祖先種(亞種)或近緣種群體,加上農家種和改良品種,每個類型選擇具有統計學意義的小群體,栽培類型適當增加,總居群數量應在100份以上。通過對若干代表性樣本的精細圖譜構建,結合群體全部居群的重測序,能夠獲得百萬至千萬級別的SNPs、InDels多樣本變異標記,以及部分SV信息(小于50 bp),從而構建全基因組單倍型圖譜,通過栽培種內部及與野生祖先種的比較,可以清晰構建種群結構圖,解析物種演化歷程,發現進化中的關鍵事件[25]。如對72個牦牛野生和馴化群體的重測序研究,比較了中國26個地區野牦牛和家養牦牛的全基因組遺傳變異圖譜,發現人們早在公元7300年前新石器早期的青藏高原就已馴化了野生牦牛,而馴化數量則在公元3600年前增長了約6倍。該項研究還估算出牦牛種群大量增加和全新世晚期人類群體在此地理區域的擴散是同時發生的;研究還發現家養牦牛的基因組中,大約有200個基因受到了人為的馴化選擇,這些選擇可能影響到了動物的行為,尤其是溫順性。而這種馴化基因與狗等其他馴化動物中發現的基因也十分相似[26]。
2.3? 泛基因組測序——整合物種完全遺傳變異信息
泛基因組(pan genome)是指涵蓋物種各種生物類型群體的整合基因組。迄今,物種的參考基因組已經達到精細圖譜水平,但是其對于物種群體遺傳變異的代表性仍然具有局限性。過去5年大量的重測序、簡化重測序信息為在群體水平挖掘遺傳變異、發現育種標記提供了巨大的機遇,在結構基因組領域發揮了重要作用。然而,其主要檢測的是SNP和InDel(小于50 bp)的多樣性,對于基因組SV信息,包括大的插入/缺失、倒位、轉位和重復等,尚不足以解析。隨著第三代測序技術的進步,以及測序成本的大幅度下降,針對物種平行性測定多個基因型序列,并獨立組裝注釋,繪制物種泛基因組結構圖景,并挖掘其SV取得顯著進展[27]。為此,生物信息學專家設計了專門的算法和軟件應用于不同程度多基因組序列的整合和注釋[28]。由26個大豆品系獨立組裝的泛基因組中,每個品系平均有約16%序列是不存在的[29],而在油菜8個獨立組裝的泛基因組分析中,發現僅有76%~84%的共線性序列存在于參考基因組中[30]。植物中受到復雜基因組、多倍化等影響,泛基因組結構可以涵蓋多個來源基因組序列信息,發現新的基因、新的大尺度SV,揭示染色體水平的基因重排和劑量效應。
在技術方面,泛基因組主要依賴于第三代單分子測序技術,包括Pac-Bio的天然DNA鏈的單分子實時(SMRT)測序[31],牛津大學的Nanopore單分子技術[32]。它們可以克服第二代短鏈高通量測序技術的3個基本缺陷:即重復序列區排序錯誤而不能檢測大的結構變異、組裝引入非隨機誤差阻礙了基因變異的檢測以及包括聚合酶鏈式反應擴增的偏倚和測序覆蓋范圍的非均勻分布[33]。當然,已有的技術并不能夠解決所有的讀長問題,光學物理圖譜(BioNano)及基于二代測序的特有組裝策略10×Genomics等為泛基因組分析提供了補充方法。在計算層面,泛基因組數據具有“大數據”的所有標準屬性,由于所生成的測序數據的巨大規模、數據的極端異質性和不同層次上復雜的交互作用,泛基因組學給算法和軟件開發帶來了巨大的挑戰。國際癌癥基因組聯合會在短短5年內積累了一套超過2兆字節的數據集,其結論是一般以云層存儲數據,提供了一種以廉價、靈活、可靠和安全的方式處理數據的彈性、動態和并行方式[34]。在基因組測序技術不斷發展的今天,獲取物種所有可能的基因組已經成為可能,將很快在許多物種、群體和癌癥基因組中實現。換句話說,生命科學已經進入了“泛基因組學”的時代,這個時代的特征是了解一組感興趣的基因組的所有重大遺傳變異。如何挖掘和分析這些令人難以置信的知識財富,以及如何使其走向應用是一項神圣的使命。
2.4? 轉錄組學建立生物特定時空基因表達全景
轉錄組學(transcriptomics),或RNA-seq測序及分析,肇始于第二代高通量測序技術,理論上可以揭示生物組織、器官在特定時間基因組上所有轉錄本,進而用于建立一定信號調節生物學過程中相關基因的共表達網絡(Co-expression network),從而發現起到交互作用的節點基因(hub genes)。在過去的10年中,轉錄組測序(RNA-seq)已經成為分析差異基因表達和mRNAs差異剪接的不可缺少的工具[35]。轉錄組分析應用于動植物、微生物生長發育的所有方面,主要獲取基因轉錄本類型、數量及表達豐度。轉錄組與基因組、表型組、代謝組等大數據的整合,衍生了更多具有生物學意義的基因組信息。通過試驗設計,多組學及生物學技術分析,如與表型、DNA序列及基因組甲基化的關聯分析,分別解析群體E-QTLs,甲基化偏好的基因表達信息,能夠有效獲取特定生物學過程相關關鍵基因和代謝途徑,已經有廣泛的應用,如在水稻產量品質[36]、葡萄黃酮類代謝途徑[37]及人類遺傳病[38]等方面的高效解析。
隨著第三代基因組測序技術的發展,RNA- seq方法可用于研究RNA生物學的許多不同方面,包括單細胞基因的表達、翻譯組(translatome)和RNA結構。新的長讀和直接RNA-seq技術,提供了無擴增的、單分子的cDNAs測序,可以在不需要裝配步驟的情況下展示完整的轉錄本。長片段測序技術可能最終還原復雜cDNAs的全長及其豐度[39]。結合更好的數據分析計算工具,轉錄組學的創新有助于更全面地理解RNA生物學,從轉錄發生的時間和地點等問題到控制RNA功能的折疊和分子間相互作用。
最近,單細胞轉錄組測序成為熱點,尤其在人類醫學和動物研究領域。如免疫系統是由一個復雜層次的細胞類型組成,以保護機體免受疾病和維持動態平衡。識別免疫細胞的異質性是了解免疫系統的關鍵。先進的單細胞RNA測序(scRNA-seq)技術正在徹底改變我們研究免疫學的能力,通過在單細胞水平上測量轉錄水平,能夠比常規方法更詳細地識別細胞異質性[40]。在植物中單細胞RNA測序同樣前景廣闊,但目前主要受到單細胞材料分離的障礙。傳統的原生質體技術在許多物種中進行了嘗試,針對維管束細胞的分離已經具有成熟的材料與測序分析技術[41]。
2.5? 表型組學成為精確解析遺傳效應的新趨勢
表型組(phenome)是指某一生物的全部性狀特征,表型組學(phenomics)是一門在基因組水平上系統研究某一生物或細胞在各種不同環境條件下所有表型的學科。Steven A Garan(1996)首次提出了phenomics(表型組學)這一概念,比利時Crop Design公司成立并肇始研發植物性狀評價的高通量技術平臺(1998)。該公司發表了具有里程碑意義的論文,詳細闡述了稱之為“性狀工廠”(trait mill)的可大規模自動化分析全生育期植物表型的技術設施(2005)。2009年,第一屆國際植物表型組大會在澳大利亞堪培拉成功舉辦。南京農業大學與美國科學促進會聯合出版的《Plant Phenomics》正式發刊(2019年),標志著表型組學學科已經成為生物學研究的熱點領域,將是精準植物遺傳研究的重要工具。
基于消除遺傳學研究中不可控環境因素引起的表型數據噪聲的需要,表型組學發展出一套系統的研究方法。其范圍涵蓋高通量數據獲取、數據管理、數據解釋、建模和集成應用5個方面[42]。在技術層面,除了在控制環境下進行表型數據獲取外,更重要的是發展了新型植物生長發育及品質性狀檢測的專門設備。高通量數據獲取目前有室內固定平臺、室外移動監測平臺、無人機監測平臺、田間大型固定監測平臺、田間全自動表型機器人等多種設備。室內固定平臺集成了多光譜相機、RGB相機、激光雷達、熱成像儀以及高光譜相機等,采用“sensor-to-plant”的工作方式[43];室外表型監測平臺,通常還研發有車載及背包式移動平臺、田間固定監測平臺和無人機監測平臺。車載移動平臺將傳感器裝載在遙控的移動智能小車或大型特制車輛上,可實現長距離、大范圍的樣本數據采集[44];背包式移動平臺,將傳感器裝載在簡易的背負系統上,可方便、靈活地完成目標區域的數據采集;田間固定監測平臺,可長期、固定地對有效測區作物進行觀測[45];無人機監測平臺,可快速獲取大面積的作物三維點云,用于廣泛、復雜的農田冠層數據收集[46]。新型技術包括采用多種光譜技術檢測地上部光合作用、生長狀況及生物積累量。最新的3D激光掃描模塊能夠耐受全日照輻射而不影響測量,在高精度測量三維點云信息的同時,測量400~900 nm范圍內4個波段的多光譜成像,使得我們可以得到植物在X、Y和Z軸上所有坐標點的多光譜信息,通過對光譜信息進行完美的校準,從而獲得更加精準的數據[47]。紅外和近紅外熱成像技術用于對植物水分狀況及脅迫性狀的監測[48];根系CT成像模塊,可成功實現原位監測植株根系狀態,并對花盆內自然土壤中的根系進行掃描和重建[49]。表型組數據處理依賴生物信息學技術,將原始數據還原為有效性狀,涵蓋計算機視覺、信息過程、機器學習、統計學、生理等,然后通過對生態生理過程的詳細描述,對植物結構及其動態和植物功能進行建模。
植物和作物模擬模型是預測氣候變化、創新的作物管理實踐以及基于性狀或基因的新育種技術對作物生產和農業系統的影響的強大工具,部分模型已經有實證數據的支持,用于彌合基因、基因型和表型之間的差距[42]。對闊葉果樹葡萄果穗及葉型的群體光譜檢測,與實際測量數據的擬合程度達到95%[47],然而表型組工具在作物上的應用還剛剛開始[50],尚有大量的跨學科的技術空間需要完善,以期實現性狀的精確標記和分子育種建模,從而指導作物遺傳改良與新品種選育進入精準設計育種時代。
3? 熱帶作物及其基因組學研究
3.1? 熱帶作物基因組特性
熱帶地區是人類馴化經濟物種的主要起源中心之一,最典型的是茄科、葫蘆科、大戟科和禾本科作物,包括起源于南美洲的玉米、木薯、橡膠樹、馬鈴薯、番茄、辣椒等,以及起源于東南亞的水稻、甘蔗等。除了人類長期馴化已經全球分布的大宗作物外,木薯、橡膠樹、甘蔗、杧果、菠蘿等典型熱帶作物具有極其重要的經濟、社會價值。熱帶植物適應熱帶高光、高溫及充沛的降雨環境,形成高生物轉化能力,一般具有高生物量、高營養利用和環境適應力強等共性生物學特征。它們在適應其生存環境的長期過程中演化出多樣性的形態學、遺傳學適應機制。在基因組結構層面,由于其多數的開放授粉、營養體繁殖和生長周期長等習性,大多數熱帶植物基因組具有高雜合度,物種群體具有復雜的遺傳多樣性[21,51]。熱帶作物群體中一般連鎖不平衡(LD)相對較低,長期無性繁殖和開放授粉在不同程度上積累了遺傳冗余和不利的遺傳變異,使得育種所需求的優良等位基因位點分散在不同的自然品系群體中。這樣通過常規育種選擇優良變異聚合的新類型效率一般較低[52]。按照傳統的植物品種馴化與資源利用方式,開發新的品種和利用方式需要經過漫長的過程。熱帶作物雜合基因位點中有利等位基因挖掘需要依賴群體的基因型和表型數據解析,充分利用現代基因組、蛋白質組、代謝組學和表型組學方法,發現熱帶作物中高生物積累,具有人類健康、營養和環保價值的活性物質,挖掘代謝途徑,發掘基因資源,并通過設計育種培育新品種,將為資源利用開辟全新的途徑。
3.2? 熱帶作物基因組學研究進展
3.2.1? 主要熱帶農業生物基因組測序與精細圖譜繪制? 2008年首個熱帶水果番木瓜基因組草圖問世,此后先后繪制了油棕、椰棗、木薯、香蕉A、B基因組,以及菠蘿、橡膠樹、麻瘋樹、鐵皮石斛、甘蔗等基因組草圖;近年完成并公布了杧果、菠蘿、狼尾草等熱帶作物的基因組精細圖譜,據不完全統計26個重要熱帶作物完成基因組測序與注釋(表1),為相關物種的生物學研究和遺傳改良奠定了基礎。隨著第三代基因組技術的進步,基因組測序成本大大降低,速度加快,基因組組裝難度下降,組裝水平提升,獲得基因組精細圖譜已經成為新的技術標準。越來越多的熱帶農業物種基因組圖譜將被公布,為熱帶作物的遺傳多樣性評價、基因挖掘和精準育種提供了全新的基礎。基因組數據與其它多組學數據的整合,在熱帶作物中尚很少報道。目前基因組測序工作大都依賴為數不多的生物技術公司,研究機構對于基因組學技術的認知程度有限,從業人數較少,在基因組研究方案設計、材料選擇及所能夠解決的科學問題認知方面均存在較多問題,特別是對于基因組學的地位和價值認識不足,短視行為普遍,往往片面追求論文,而忽視數據價值。
基因組學新技術的發展,允許一個基礎研究落后的物種,直接完成染色體級別的精細參考基因組,同時借助重測序和簡化重測序技術,解析其核心種群的遺傳多樣性、物種起源與演化、關鍵經濟農藝性狀的遺傳結構,開展原創性研究。從熱帶作物育種研究的頂層設計,組織相關研究計劃對于從根本上改變其遺傳改良的技術水平,提升育種效率,可以起到事半功倍的效應。
3.2.2? 熱帶作物基因組數據庫建設? 基因組測序的真正價值不是一篇文章,而是大數據庫。美國生物技術中心(NCBI Genbank數據庫)成為全球農業與生物學研究者無可替代的信息源,此外歐洲生物技術研究所數據庫,日本生物技術數據庫,美國能源部的基因組數據庫等確立了在全球學術領域的地位。所有一流期刊發表文章均要求提供原始數據到三大數據庫。我國北京基因組研究所,華大基因及相關大學也建立了不同程度的基因組數據庫,但與基因組學技術發展相匹配的更加專業化數據庫仍然欠缺。上述數據庫更多為基礎數據庫,承擔數據淀積、基因序列檢索、文獻查詢等功能。而針對物種從基因組完全序列,到轉錄組、蛋白組、代謝組到性狀的全景信息,及整合育種需求的指導性方案,鮮有報道。在熱帶作物領域,重要國際研究機構、相關大學擁有分散的、相對簡單的數據庫,如康內爾大學建立的木薯育種數據庫(Cassavabase. org)[81]。中國熱帶農業科學院建立了木薯的基因組數據庫(Cassava-genome. cn),并通過國家重點研發計劃項目與北京基因組研究所合作建立熱帶作物的整合基因組數據庫。建立一個熱帶作物的專業數據庫和分子育種服務平臺極為重要,其必要性在于:(1)基因組數據是極為重要的資源和知識產權,需要搜集和整合針對重要熱帶經濟作物的基因組和多組學數據,并不斷豐富完善,提供更加有價值的服務;(2)大數據的服務功能,隨著數據庫的進一步完善,現代基礎生物學研究和遺傳改良將更加依賴數據庫,成為必不可少的工具;(3)基因組數據庫是新型科學形式,機器學習和系統化將讓數據庫自我完善,具有智能特征,衍生多元化功能。
3.2.3? 熱帶作物基因組研究中存在的問題? 盡管高通量、低成本的基因組測序技術已經為全面解析物種遺傳特性和遺傳育種提供了全新的工具,但是新技術應用的廣泛性和效率仍然存在許多不確定因素。主要包括:(1)研究者特別是應用研究專家對基因組技術的認知度不夠。由于技術更新很快,且高通量測序技術依賴于生物信息學專家的大數據處理,海量數據與常規研究方法的契合點常常不能夠被有效認知;(2)新技術的規模化應用還未達到成熟的階段,數據迅速積累,理論需要不斷完善。針對大多數經濟物種,在群體水平精準解析性狀遺傳位點需要花費大量的人力和物力,特別是表型性狀易受到環境因素影響,需要在多個環境下或者不同群體中加以驗證。因此基因組選擇育種還沒有在多數物種中應用;(3)大群體重測序和表型數據獲取的成本仍然較高。盡管相關測定與數據分析的成本已經大幅度下降,但是若要完成數百份種質的群體重測序和所有育種表型性狀,從單個實驗室來看,確實難以承受,但是國家針對物種的研究計劃若能夠從源頭系統進行,則成本就在可控范圍;(4)缺乏高效、完整的數據庫服務系統。基因組及多組學數據除了那些典型的性狀關聯區域外,其全基因組變異特征及其與多種表型特征的對應關系需要信賴生物信息學專家的數據處理與圖形化等一系列的數據管理工作。現有全球性基因組數據庫一般均比較綜合,尚未達到針對物種的全景式數據服務水平。因此,針對特定作物的基因組數據庫是未來作物育種的必然條件。
4? 基因組學技術的應用前景
4.1? 結構基因組學將成為傳統線性遺傳學的終結,走向三維空間遺傳學
物種全基因組精細圖譜構建,不僅可以闡明控制物種性狀的基因位點在全套染色體上的分布,構建染色體DNA序列圖譜,而且能夠提供物種群體在染色體上所有位點堿基序列的變異譜;同時,注釋在不同生育環境下基因位點甲基化、泛素化和磷酸化等修飾導致基因“閉合”與開放表達的信息。然而,真核生物的細胞核是一個復雜的三維環境,基因組的功能不僅依賴于調控序列元件的線性排列,還依賴于它們的空間組織來有效控制基因表達。轉錄調控部分是通過調控元件和基因啟動子的空間鄰近發生的,這些相互作用對于真核生物的機體發育和對環境刺激的反應至關重要。全基因組染色質接觸圖為基因組的三維組織與基因表達之間的關系提供了重要的見解[82]。出于對生物細胞核整體染色體組織的興趣,科學家提出3D基因組的觀點,借助物理學技術,審查沿染色體和染色體之間的通信[83]。相關研究開始受到重視,并在轉錄因子蛋白與DNA結合算法等方面取得了可喜的進展[84]。
4.2? 多組學數據整合構建生物物種遺傳調控的信號網絡
植物生長、發育、繁殖和適應,反應到分子層面是一個極為復雜的網絡系統。如果說傳統遺傳學只是在挖掘單個的遺傳調控點,迄今的結構基因組成果構建了一個線性的多基因結構,而多組學可能提供不同的平面遺傳結構。如何建立復雜遺傳系統中多基因的互作關系?實驗生物學經過漫長的積累,根據生物產物化學結構的邏輯關系建立主要生物學過程如光合作用、呼吸作用、免疫應答等的代謝通路。借助人工誘導和遺傳轉化突變體庫及蛋白互作等正向遺傳學分析,發現許多代謝途徑的調控相關蛋白基因,初步形成單個過程與相關環境信號因子、內源激素基因的互作網絡,但是這些網絡還遠不夠完善。多組學數據可以大大加快多基因互作網絡的構建。轉錄組學數據真實反應物種在特定環境和生育時期哪些基因表達和不表達,以及控制生物過程的大量基因之間是如何協同表達。共同表達網絡(gene co-expression network,GCN)分析是解釋大型轉錄數據集的最強大的方法之一,它能夠映射功能相關基因的共同表達基因模塊的特性。一個針對擬南芥和玉米葉片發育的全轉錄組比較分析,在近1000個同源基因群中鑒定出19個轉錄因子家族,提供了雙子葉和單子葉植物間葉片發育的共性功能基因網絡[85]。基因共表達網絡(GCN)分析被廣泛應用于生物醫學鑒定特定疾病的特異性生物標志物。針對前列腺癌的單細胞轉錄組數據,采用加權相關網絡分析(WGCNA)鑒定出29個基因模塊,結合雄性激素受體(AR)基因篩選發現兩個新基因具有AR結合位點,并用雄激素治療試驗證明其可以作為前列腺癌的早期靶標,具有重要的醫學價值[86]。
蛋白質、代謝組學數據的積累,同樣可為生物學過程中多基因關系提供豐富的互作信息[87]。蛋白質-蛋白質相互作用網絡(PIN)是系統研究細胞內復雜生物活性的有用工具。隨著測序、晶體學、光譜分析和雙雜交篩選等領域的發展,包括病毒、細菌、植物、動物和人類,大量的蛋白質-蛋白質相互作用(PPIs)被發現。基于序列和基于結構的PPI預測工具發揮重要的作用,而真實豐富的數據庫資源是基礎[88]。
建立在實驗生物學基礎上的植物環境信號感知以及多基因調控的信號網絡是了解生命過程的前沿。植物對環境信號反應的最新研究表明,非生物脅迫作用于單個葉片時,植物會產生一種全面的應激特異性系統反應,包括許多不同的應激特異性轉錄產物和代謝物的積累,且植物可以整合不同的局部和系統組合信號高效地適應環境[89]。根毛發育相關基因調節網絡描述了控制細胞命運和(或)根毛細胞生長的關鍵轉錄調節因子[90]。同時,非編碼小分子RNA在過程調節中的作用也會耦合其間。這樣從基因組、轉錄組、蛋白質組及表觀組,就構建了生命過程的立體結構,闡釋了物種特異性及其過程的復雜性,在組學水平建立物種的遺傳調控網絡,這些均需要體現在專門的基因組數據庫中,為生物基礎研究及應用服務。
4.3? 基因組學技術與實驗生物學的結合驅動生物功能模塊解析
實驗生物學在建立基因的精確功能及生物遺傳修飾走向應用等方面具有不可替代性。基因組學的發展不僅加速了功能基因的發現,而且可以規模化建立基因之間的互作關系,結合多組學及其整合技術為生物功能研究提供愈益直接而強有力的支持。基因組學除了解析物種精細遺傳結構外,在功能基因挖掘方面也有顯著的進展。在大量物種基因組注釋信息不斷積累基礎上,人們開發了專門富集DNA結合蛋白、轉錄因子等調節蛋白的實驗流程,并采用深度學習方法建模基因組調控景觀中的復雜依賴關系,并為遺傳變異的調用和解釋提供預測因子[91]。深度學習主要應用是在功能基因組學中預測DNA和RNA結合蛋白以及增強子和順式調控蛋白的序列特異性區域,甲基化狀態和剪接的控制。人類基因組中已經可以通過高通量功能分析鑒定功能性遺傳變異和預測性狀(如有害變異和疾病)[92]。由于實驗生物學研究受到材料、單基因突變、環境均一性等諸多限制因素,實證基因功能及其互作關系進展緩慢;事實上,植物整合廣泛的細胞、發育和環境信號來調節復雜的基因表達模式,進而形成多樣化的蛋白體和代謝產物,因而在特定實驗設計下,基因表達譜、蛋白譜集合代謝產物變異譜,就可以用于對基因間調控相互作用網絡進行推斷,這些基因調控網絡用于可視化調控因子與其下游靶基因之間的因果調控關系,而對于相關結果的實驗驗證是必不可少的[93]。生物定向遺傳改良是傳統育種家的夢想,而不斷改進的基因組編輯系統提供了一種以精確和可預測的方式快速修改基因組的方法,使直接改進優良品種成為可能[94]。
4.4? 精準育種,群體結構單倍型分析建立設計育種及全基因組選擇育種基礎
建立在物種精細參考基因組及種質資源群體大規模重測序基因型分析基礎上,作物遺傳改良即將進入精準設計和快速選擇的時代[95]。而基因組編輯技術(genome editing)將為單個基因或者寡基因控制性狀改良提供精確的手術刀[96]。無論作物類型、染色體遺傳結構和雜合程度,擁有多樣化的遺傳資源始終為遺傳改良的第一步。綜合傳統遺傳學、現代分子遺傳和表觀遺傳學的知識,所有育種目標性狀的調控基因均存在于物種遺傳群體,而且大多數性狀會受到系列多基因調控,作物在生長周期的不同階段均對環境因子做出響應,并通過復雜的內源激素直接或間接作用于多個生物學過程,形成產量、品質和抗逆的表型。過去對于生物基因型的檢測有如大海撈針掛一漏萬,所以育種家依賴直覺和抓主要矛盾培育新品種,而今,基因型分析技術已經可以達到無遺漏的監測,只是我們對于生物基因功能的認知尚沒有達到完全的水平,一般物種中尚有約20%~30%的注釋基因功能未知,需要整體的知識積累;而表型分析成為育種瓶頸,這就是為什么代謝組學和表型組學會成為生物育種的熱點技術。借助于物理學和材料科學的進步,基因組和育種學者希望通過過程解析將育種目標性狀進行分解,獲取更有價值的中間性狀基因調控基因,支持最終產量、品質和抗逆表型。這里對如何通過群體的重測序和多年多點表型分析、結合控制環境下的表型解析,構建針對特定物種的育種指標體系,進而篩選親本群、多重雜交、標記選擇、品系鑒定再結合基因組編輯實現精準育種繪制一個策略圖(圖2),為基因組和育種專家提供參考。
參考文獻
詹姆森, 魏? 瑪, 維斯特霍夫. 系統生物學方法(導讀版)[M]. 1版. 北京: 科學出版社, 2013.
Bolger M E, Weisshaar B, Scholz U, et al. Plant genome sequencing - applications for crop improvement[J]. Current Opinion in Biotechnology, 2014, 26: 31-37.
Sedlazeck F J, Rescheneder P, Smolka M, et al. Accurate detection of complex structural variations using single- molecule sequencing[J]. Nature Methods, 2018, 15(6): 461-468.
Bocklandt S, Hastie A, Cao H. Bionano genome mapping: High-throughput, ultra-long molecule genome analysis system for precision genome assembly and haploid-resolved structural variation discovery[J]. Advances in Experimental Medicine and Biology, 2019(1129): 97-118.
Castey T M, Khan J M, Bringans S D, et al. Analysis of reproducibility of proteome coverage and quantitation using isobaric mass tags (iTRAQ and TMT)[J]. Journal of Proteome Research, 2017, 16(2): 384-392.
Elshire R J, Glaubitz J C, Sun Q, et al. A robust, simple genotyping-by-sequencing (GBS) approach for high diversity species[J]. PLoS One, 2011, 6(5): e19379.
Xia Z Q, Zou M L, Zhang S K, et al. AFSM sequencing approach: a simple and rapid method for genome-wide SNP and methylation site discovery and genetic mapping[J]. Scientific Reports, 2014(4): 7300.
Iqbal N, Liu X, Yang T, et al. Genomic variants identified from whole-genome resequencing of indicine cattle breeds from Pakistan[J]. PLoS One, 2019, 14(4): e0215065.
Bentley D R. Whole-genome re-sequencing[J]. Current Opinion in Genetics & Development, 2006, 16(6): 545-552.
Sònia Casillas, Antonio Barbadilla. Molecular population genetics[J]. Genetics, 2017, 205(3): 1003-1035.
Li Y, Cao K, Zhu G, et al. Genomic analyses of an extensive collection of wild and cultivated accessions provide new insights into peach breeding history[J]. Genome Biology, 2019, 20: 36.
Nguyen K L, Grondin A, Courtois B, et al. Next-generation sequencing accelerates crop gene discovery[J]. Trends in Plant Science, 2019, 24(3): 263-274.
Visscher P M, Wray N R, Zhang Q, et al. 10 years of GWAS discovery: Biology, function and translation[J]. American Journal of Human Genetics, 2017, 101(1): 5-22.
Remington D L, Ungerer M C, Purugganan M D. Map-based cloning of quantitative trait loci: progress and prospects[J]. Genetical Research, 2001, 78(3): 213-218.
Zhou Z, Jiang Y, Wang Z, et al. Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean[J]. Nature Biotechnology, 2015, 4(33): 408-414.
Fang L, Wang Q, Hu Y, et al. Genomic analyses in cotton identify signatures of selection and loci associated with fiber quality and yield traits[J]. Nature Genetics, 2017, 49(7): 1089-1098.
Varshney R K, Saxena R K, Upadhyaya H D, et al. Whole- genome resequencing of 292 pigeonpea accessions identifies genomic regions associated with domestication and agronomic traits[J]. Nature Genetics, 2017, 49(7): 1082-1088.
Li X, Yang J, Shen M, et al. Whole-genome resequencing of wild and domestic sheep identifies genes associated with morphological and agronomic traits[J]. Nature Communications , 2020, 11(1): 2815.
Voss-Fels K, Snowdon R J. Understanding and utilizing crop genome diversity via high-resolution genotyping[J]. Plant Biotechnology Journal, 2016, 14(4): 1086-1094.
Guirao-Rico S, González J. Evolutionary insights from large scale resequencing datasets in Drosophila melanogaster[J]. Current Opinion in Insect Science, 2019, 31: 70-76.
Silva-Junior, Orzenil B, Grattapaglia D. Genome-wide patterns of recombination, linkage disequilibrium and nucleotide diversity from pooled resequencing and single nucleotide polymorphism genotyping unlock the evolutionary history of Eucalyptus grandis[J]. New Phytologist, 2015, 208(3): 830-845.
Qin C, Yu C, Shen Y, et al. Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization[J]. Proceedings of the National Academy of Sciences of the United States of America, 2014, 111(14): 5135-5140.
Yu Y, Fu J, Xu Y, et al. Genome re-sequencing reveals the evolutionary history of peach fruit edibility[J]. Nature Communications, 2018, 9: 5404.
Varshney R K, Thudi M, Roorkiwal M, et al. Resequencing of 429 chickpea accessions from 45 countries provides insights into genome diversity, domestication and agronomic traits[J]. Nature Genetics, 2019, 51(5): 857-864.
Guo S, Zhao S, Sun H, et al. Resequencing of 414 cultivated and wild watermelon accessions identifies selection for fruit quality traits[J]. Nature Genetics, 2019, 51(11): 1616-1623.
Qiu Q, Wang L, Wang K, et al. Yak whole-genome resequencing reveals domestication signatures and prehistoric population expansions[J]. Nature Communications, 2015(6): 10283.
Yang Z, Ge X, Yang Z, et al. Extensive intraspecific gene order and gene structural variations in upland cotton cultivars[J]. Nature Communications, 2019(10): 2989.
The computational pan-genomics consortium. Computational pan-genomics: Status, promises and challenges[J]. Briefings in Bioinformatics, 2018, 19(1): 118-135.
Liu Y, Du H, Li P, et al. Pan-genome of wild and cultivated soybeans[J]. Cell, 2020, 182(1): 162-176.
Song J M, Guan Z, Hu J, et al. Eight high-quality genomes reveal pan-genome architecture and ecotype differentiation of Brassica napus[J]. Nature Plants, 2020, 6(1): 34-45.
Chaisson M J P, Huddleston J, Dennis M Y, et al. Resolving the complexity of the human genome using single-molecule sequencing[J]. Nature, 2015, 517: 608-611.
Schneider G F, Dekker C. DNA sequencing with nanopores[J]. Nature Biotechnology, 2012, 30(4): 326-328.
Snyder M W, Adey A, Kitzman J O, et al. Haplotype- resolved genome sequencing: experimental methods and app lications[J]. Nature Reviews Genetics, 2015, 16(6): 344-358.
Stein L D, Knoppers B M, Campbell P, et al. Data analysis: Create a cloud commons[J]. Nature, 2015, 523(7559): 149- 151.
Stark R, Grzelak M, Hadfield J. RNA sequencing: the teenage years[J]. Nature Reviews, Genetics, 2019, 20(11): 631-656.
Wang J, Yu H, Weng X, et al. An expression quantitative trait loci-guided co-expression analysis for constructing regulatory network using a rice recombinant inbred line population[J]. Journal of Experimental Botany, 2014, 65(4): 1069-1079.
Huang Y F, Vialet S, Guiraud J L, et al. A negative MYB regulator of proanthocyanidin accumulation, identified through expression quantitative locus mapping in the grape berry[J]. The New Phytologist, 2014, 201(3): 795-809.
Westra H J, Peters M J, Esko T, et al. Systematic identification of trans eQTLs as putative drivers of known disease associations[J]. Nature Genetics, 2013, 45(10): 1238-1243.
SEQC/MAQC-III Consortium. A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the sequencing quality control consortium[J]. Nature Biotechnology, 2014, 32(9): 903-914.
Chen H, Ye F, Guo G. Revolutionizing immunology with single-cell RNA sequencing[J]. Cell & Molecular Immunology, 2019, 16(3): 242-249.
Rodriguez-Villalon A, Brady S M. Single cell RNA sequencing and its promise in reconstructing plant vascular cell lineages[J]. Current Opinion in Plant Biology, 2019, 48: 47-56.
Muller B, Martre P. Plant and crop simulation models: Powerful tools to link physiology, genetics, and phenomics[J]. Journal of Experimental Botany, 2019, 70(9): 2339-2344.
Kuchen E E, Fox S, de Reuille P B, et al. Generation of leaf shape through early patterns of growth and tissue polarity[J]. Science, 2012, 335: 1092-1096.
Rebetzke G J, Jimenez-Berni J A, Bovill W D, et al. High-throughput phenotyping technologies allow accurate selection of stay-green[J]. Journal of Experimental Botany, 2016, 67: 4919-4924.
Virlet N, Sabermanesh K, Sadeghi-Tehran P, et al. Field scanalyzer: An automated robotic field phenotyping platform for detailed crop monitoring[J]. Funct Plant Biol, 2016, 44: 143-153.
Liebisch F, Kirchgessner N, Schneider D, et al. Remote, aerial phenotyping of maize traits with a mobile multi-sensor approach[J]. Plant Methods, 2015, 11: 9.
Rist F, Herzog K, Mack J, et al. High-precision phenotyping of grape bunch architecture using fast 3D sensor and automation[J]. Sensors (Basel), 2018, 18(3): 763.
Gennaro S F D, Rizza F, Badeck F W, et al. UAV-based high-throughput phenotyping to discriminate barley vigour with visible and near-infrared vegetation indices[J]. Int J Remote Sens, 2018, 39: 5330-5344.
Jeudy C, Adrian M, Baussard C, et al. Rhizotubes as a new tool for high throughput imaging of plant root development and architecture: test, comparison with pot grown plants and validation[J]. Plant Methods, 2016, 12: 31.
Tardieu F, Cabrera-Bosquet L, Pridmore T, et al. Plant phenomics, from sensors to knowledge[J]. Current Biology, 2017, 27(15): R770-R783.
Wang W, Feng B, Xiao J, et al. Cassava genome from a wild ancestor to cultivated varieties[J]. Nature Communications, 2014(5): 5110.
Zhang J, Zhang X, Tang H, et al. Allele-defined genome of the autopolyploid sugarcane Saccharum spontaneum L.[J]. Nature Genetics, 2018, 50(11): 1565-1573.
Ming R, Hou S, Feng Y, et al. The draft genome of the transgenic tropical fruit tree papaya (Carica papaya Linnaeus)[J]. Nature, 2008, 452(7190): 991-996.
Motamayor J C, Mockaitis K, Schmutz J, et al. The genome sequence of the most widely cultivated cacao type and its use to identify candidate genes regulating pod color[J]. Genome Biology, 2013, 14(6): r53.
Bredeson J V, Lyons J B, Prochnik S E, et al. Sequencing wild and cultivated cassava and related species reveals extensive interspecific hybridization and genetic diversity[J]. Nature Biotechnology, 2016, 34(5): 562-570.
Wu G A, Prochnik S, Jenkins J, et al. Sequencing of diverse mandarin, pummelo and orange genomes reveals complex history of admixture during citrus domestication[J]. Nature Biotechnology, 2014, 32(7): 656-662.
Xu Q, Chen L L, Ruan X, et al. The draft genome of sweet orange (Citrus sinensis)[J]. Nature Genetics, 2013, 45(1): 59-66.
Denoeud F, Carretero-Paulet L, Dereeper A, et al. The coffee genome provides insight into the convergent evolution of caffeine biosynthesis[J]. Science, 2014, 345(6201): 1181- 1184.
Myburg A A, Grattapaglia D, Tuskan G A, et al. The genome of Eucalyptus grandis[J]. Nature, 2014, 510(7505): 356-362.
Jain M, Misra G, Patel R K, et al. A draft genome sequence of the pulse crop chickpea (Cicer arietinum L.)[J]. The Plant Journal, 2013, 74(5): 715-729.
Wu P, Zhou C, Cheng S, et al. Integrated genome sequence and linkage map of physic nut (Jatropha curcas L.), a biodiesel plant[J]. The Plant Journal, 2015, 81(5): 810-821.
Ha J, Shim S, Lee T, et al. Genome sequence of Jatropha curcas L., a non-edible biodiesel plant, provides a resource to improve seed-related traits[J]. Plant Biotechnology Journal, 2019, 17(2): 517-530.
Kim S, Park M, Yeom S I, et al. Genome sequence of the hot pepper provides insights into the evolution of pungency in Capsicum species[J]. Nature Genetcs, 2014, 46(3): 270-278.
Hu L, Xu Z, Wang M, et al. The chromosome-scale reference genome of black pepper provides insight into piperine biosynthesis[J]. Nature Communications, 2019, 10(1): 4702.
Lin Y, Min J, Lai R, et al. Genome-wide sequencing of longan (Dimocarpus longan Lour.) provides insights into molecular basis of its polyphenol-rich characteristics[J]. GigaScience, 2017, 6(5): 1-14.
Rahman A Y, Usharraj A O, Misra B B, et al. Draft genome sequence of the rubber tree Hevea brasiliensis[J]. BMC Genomics, 2013, 14: 75.
Tang C, Yang M, Fang Y, et al. The rubber tree genome reveals new insights into rubber production and species adaptation[J]. Nature Plants, 2016, 2(6): 16073.
D Hont A, Denoeud F, Aury J M, et al. The banana (Musa acuminata) genome and the evolution of monocotyledonous plants[J]. Nature, 2012, 488(7410): 213-217.
Wang Z, Miao H X, Liu J H, et al. Musa balbisiana genome reveals subgenome evolution and functional divergence[J]. Nature Plants, 2019, 5(8): 810-821.
Wang P, Luo Y, Huang J, et al. The genome evolution and domestication of tropical fruit mango[J]. Genome Biology, 2020, 21(1): 60
Singh R, Ong-Abdullah M, Low E T, et al. Oil palm genome sequence reveals divergence of interfertile species in old and New worlds[J]. Nature, 2013, 500(7462): 335-339.
Xiao Y, Xu P, Fan H, et al. The genome draft of coconut (Cocos nucifera)[J]. GigaScience, 2017, 6(11): 1-11.
Ming R, VanBuren R, Wai C M, et al. The pineapple genome and the evolution of CAM photosynthesis[J]. Nature Genetics, 2015, 47(12): 1435-1442.
Chen L Y, VanBuren R, Pairs M, et al. The bracteatus pineapple genome and domestication of clonally propagated crops[J]. Nature Genetics, 2019, 51(10): 1549-1558.
Garsmeur O, Droc G, Antonise R, et al. A mosaic monoploid reference sequence for the highly complex genome of sugarcane[J]. Nature Communications, 2018(9): 2638.
Rendón-Anaya M, Ibarra-Laclette E, Méndez-Bravo A, et al. The avocado genome informs deep angiosperm phylogeny, highlights introgressive hybridization, and reveals pathogen- influenced gene space adaptation[J]. Proceedings of the National Academy of Sciences of the United States of America, 2019, 116(34): 17 081-17 089.
Tian Y, Zeng Y, Zhang J, et al. High quality reference genome of drumstick tree (Moringa oleifera Lam.), a potential perennial crop[J]. Science China, Life Sciences, 2015, 58(7): 627-638.
Yan L, Wang X, Liu H, et al. The genome of Dendrobium officinale illuminates the biology of the important traditional Chinese Orchid Herb[J]. Molecular Plant, 2015, 8(6): 922-934.
Varshney R K, Shi C, Thudi M, et al. Pearl millet genome sequence provides a resource to improve agronomic traits in arid environments[J]. Nature Biotechnology, 2017, 35(10): 969-976.
Zhang S, Xia Z, Zhang W, et al. Chromosome-scale genome assembly provides insights into speciation of allotetraploid and massive biomass accumulation of elephant grass (Pennisetum purpureum Schum.)[J]. BioRxiv Online, 2020, doi: https://doi.org/10.1101/2020.02.28.970749.
Tecle I Y, Edwards J D, Menda N, et al. solGS: a web-based tool for genomic selection[J]. BMC Bioinformatics, 2014, 15(1): 398.
Rowley M J, Corces V G. The three-dimensional genome: Principles and roles of long-distance interactions[J]. Current Opinion in Cell Biology, 2016, 40: 8-14.
Dekker J, Mirny L. The 3D genome as moderator of chromosomal communication[J]. Cell, 2016, 164(6): 1110- 1121.
Xu H, Zhang S, Yi X, et al. Exploring 3D chromatin contacts in gene regulation: The evolution of approaches for the identification of functional enhancer-promoter interaction[J]. Computational and Structural Biotechnology Journal, 2020, 18: 558-570.
Vercruysse J, Van Bel M, Osuna-Cruz C M, et al. Comparative transcriptomics enables the identification of functional orthologous genes involved in early leaf growth[J]. Plant Biotechnology Journal, 2020, 18(2): 553-567.
Chen X, Hu L, Wang Y, et al. Single cell gene co-expression network reveals fech/crot signature as a prognostic marker[J]. Cells, 2019, 8(7): 698.
Yilmaz L S, Walhout A J. Metabolic network modeling with model organisms[J]. Current Opinion in Chemical Biology, 2017, 36: 32-39.
Gemovic B, Sumonja N, Davidovic R, et al. Mapping of protein-protein interactions: Web-based resources for revea ling interactomes[J]. Current Medicinal Chemistry, 2019, 26(21): 3890-3910.
Zandalinas S I, Fichman Y, Devireddy A R, et al. Systemic signaling during abiotic stress combination in plants[J]. Proceedings of the National Academy of Sciences of the United States of America, 2020, 117(24): 13 810-13 820.
Shibata M, Sugimoto K. A gene regulatory network for root hair development[J]. Journal of Plant Research, 2019, 132(3): 301-309.
Telenti A, Lippert C, Chang P C, et al. Deep learning of genomic variation and regulatory network data[J]. Human Molecular Genetics, 2018, 27(R1): R63-R71.
Zou J, Huss M, Abid A, et al. A primer on deep learning in genomics[J]. Nature Genetics, 2019, 51(1): 12-18.
Haque S, Ahmad J S, Clark N M, et al. Computational prediction of gene regulatory networks in plant growth and development[J]. Current Opinion in Plant Biology, 2019, 47: 96-105.
Hua K, Zhang J, Botella J R, et al. Perspectives on the application of genome-editing technologies in crop breeding[J]. Molecular Plant, 2019, 12(8): 1047-1059.
Varshney R K, Pandey M K, Bohra A, et al. Toward the sequence-based breeding in legumes in the post-genome sequencing era[J]. Theoretical and Applied Genetics, 2019, 132(3): 797-816.
Chen K, Wang Y, Zhang R, et al. CRISPR/Cas genome editing and precision plant breeding in agriculture[J]. Annual Review of Plant Biology, 2019, 70: 667-697.