劉淑娟 ,朱 艷 ,張曉軍 ,李 欣 ,郭慧娟 ,暢志堅 ,喬麟軼
(1.山西大學生物工程學院,山西太原 030006;2.山西省農業科學院作物科學研究所,作物遺傳與分子改良山西省重點實驗室,農業部黃土高原作物基因資源與種質創制重點實驗室,山西太原 030031)
谷類作物提供了人體每天所需20%的熱量和25%的蛋白(www.fao.org/faostat)。其中,小麥是最為重要的糧食作物。異源六倍體小麥的全基因組是由來自3個不同祖先、親緣關系較近的基因組組成,因此,存在大量同源的3個等位基因(大于85%)。與模式植物擬南芥(基因組大小130~140 Mb)和禾谷類模式植物水稻(基因組大小400 Mb)相比,小麥的基因組較大,為17 Gb。除了在模式體系中需要較小基因組外,基因發現策略的一個重要組成部分依賴于植物的轉化效率,這2點使得其在基因組學的研究遠落后于水稻和玉米等二倍體作物[1]。隨著近年來測序技術和功能基因組學的飛速發展,以及基因組學研究方法的不斷改進和完善,為小麥基因組研究創造了機會,因而,小麥基因組學迎來了新的時代。
多倍體小麥主要有2種類型:四倍體栽培小麥(硬粒小麥,Triticum durum,AABB)和六倍體面包小麥(Triticum aestivum,AABBDD),二者祖先均為四倍體野生二粒小麥。早期野生二粒小麥經馴化成為四倍體栽培小麥,與二倍體粗山羊草(Aegilops tauschii)雜交形成普通小麥[2]。鑒于小麥多倍體物種的同源性,存在于四倍體和六倍體小麥中的基因大部分呈現2~3個功能拷貝,稱為“同源”,編碼序列間的相似性高達97%。
缺乏完整的參考基因組一直限制著小麥測序的研究進展[3]。最初致力于用long-insert法構建個體染色體BAC文庫。隨著第2代測序技術的出現,可以對全基因組或單染色體臂進行鳥槍法測序。盡管這是個階段性成果,但數百萬個contigs仍是高度片段化的。自2017年起,公共和私人領域的組裝技術有了質的飛躍[4-5],使六倍體小麥“中國春”的參考基因組組裝到了其21條染色體上。
小麥的研究領域已進入“后中國春”時代,即實現了對不同小麥品種進行快速且低成本的完整測序和組裝。該技術已經用于小麥祖先品種和栽培品種中,已新公布了5個小麥品種:Robigus,Paragon,Claire,Cadenza和Kronos。盡管與中國春相比,這些品種數據庫的組裝序列較少,但包含了大量的編碼蛋白質序列,可對其進行詳細的功能分析。2017年小麥基因組研究領域從擁有一個高度片段化的單一參考基因組到擁有一個麥族泛基因組,包括了大麥、小麥和多個祖先種的全基因組數據以及15個四倍體和六倍體小麥品種的重測序數據。
隨著小麥參考基因組序列的不斷改進,可以對這些序列進行額外的注釋,在已測序完成的幾個小麥品種中,最初的基因注釋側重于描述小麥啟動子區DNA的甲基化模式。這些模式在同源群間大都是保守的,只有少部分存在基因組特異性[6]。RNA測序分析結果也顯示,整體上不存在單個基因組優勢,盡管在某種細胞類型或某個特異階段確實觀察到一定程度的基因組特異現象。最近發布了一套基于PacBio cDNA reads技術改進的編碼蛋白和長非編碼RNA的基因注釋[4],這將有利于鑒定出那些具有重要農藝性狀的完整基因家族。另外,這些注釋已被用于比對400多個公共RNA-seq樣本數據,從而完善小麥的基因表達圖譜[7-8]。
此外,改進的基因組和基因注釋[9]為研究選擇壓力在不同倍性水平下對同源基因的作用提供了可能。這將更好的理解編碼和非編碼序列(如啟動子)的進化過程、表觀遺傳變化[6]和開放染色質結構[10],進而了解多倍體是如何將各自同源基因組的信息整合后呈現最終的表型。
中國春物理圖譜和多個品種重測序數據也為小麥育種提供了新的研究方法。例如,小麥科研人員和育種家已經普遍將單核苷酸多態性標記(SNP)芯片技術用于研究[11],但這些SNP只是基于拼接不完全的短序列開發,并被粗略地定位在很大的基因區域中[12]。而新的物理圖譜和多品種重測序數據將使得建立長序列的單倍型成為可能[13]。利用大規模的SNP數據,可以鑒定出與重測序結果一致的基因組區段,而不一致的位點則可以用來預測新的單倍型。例如,2005—2018年英國推廣了118個小麥品種,其中69%的品種來源于1個親本,這個親本與已經重測序的Cadenza,Robigus和Claire具有相關性。這類結果對于關聯分析[14]、圖位克隆、基因丟失和結構重排診斷等研究都有很好的促進作用,此外還能確定基因的拷貝數變異,這對于一些重要調節基因(如 VRN-A1,Ppd-B1,CBF等)的功能變異是非常關鍵的。更重要的是,通過鑒定出目前優良品種中的單倍型,可以據此有針對性的從小麥祖先種和地方種中發掘變異類型。這使得對那些在馴化過程中或20世紀小麥育種早期丟失的單倍型進行選擇和評估成為可能[15]。
在模式作物中,已經可以用測序作圖的方法對控制質量性狀或數量性狀的基因進行克隆[16]。而在多倍體小麥中,龐大基因組的測序費用高昂導致近幾年一直缺乏一個完整的參考基因組圖譜,使得在該領域落后于模式作物。而大部分精力都集中在簡化基因組上,研究對象就是那些基于RNA-seq[17-18],DNA捕獲[19-20]或測序分型得到的特定序列。這些方法最初被用于自然變異定位,最近則擴展到誘變突變群體中的多態性鑒定。這些基于構建突變群體的方法被統稱為“突變基因組學”[21],為在小麥等龐大復雜的基因組中發現變異類型提供了一個新的思路。例如,最早為抗病基因[21-22]開發的外顯子捕獲平臺(主要是抗病基因)已被用于對大量突變體中的DNA進行捕獲和測序,從而診斷出目標基因的隱性等位基因。而為了避免那些無法預測的新基因類型還開發了基于染色體的研究方法。這些方法已經在多倍體小麥被證實對那些由單基因控制的功能缺失表型非常有價值,但是對于大部分復雜性狀,NGS遺傳學可能不具有很高的效率。
與二倍體模式物種相比,小麥中一直缺乏反向遺傳中用于驗證基因功能的材料。這是由于小麥同源群之間序列的高度相似性,隱性等位基因的效應被其他同源群的等位變異所掩蓋,緩沖了小麥中正常的自然變異。當然,這種掩蓋效應也使小麥獲得了比二倍體物種更耐受高突變密度的能力[2]。然而,這種冗余也提供給多倍體小麥一種與二倍體物種相比的高突變密度的持續耐受力。高蘭英等[23-24]最近開發了一套用于小麥功能基因組學分析的新材料。他們對2 735份EMS誘導的四倍體小麥(Kronos)突變體和六倍體小麥(Cadenza)突變體材料進行DNA外顯子捕獲測序,從編碼區鑒定出1 000多萬個高度可信(P>0.99)的突變位點,平均每個四倍體和六倍體小麥中分別有2 705,5 351個突變位點,然后將66%的突變位點進行了定位。進一步研究發現,大約有3%的突變造成了讀碼框提前終止或轉錄本錯誤剪接,而有38%的突變為錯義突變。
除了突變群體以外,基因編輯技術的進步同樣為多倍體小麥中基因的缺失驗證提供了新途徑。WANG等[25]利用類轉錄激活因子效應核酶技術(Transcription activator-like effector nucleases,TALENs)首次同時下調了小麥MLO的3個同源拷貝,從而使植株表現出對白粉病的抗性。隨后,他們又運用最新的CRISPR/Cas9技術實現了同樣的實驗結果。此外,病毒誘導基因沉默技術(virus induced gene silencing,VIGS)[26]和 RNA 干涉技術(RNA-interference,RNAi)也被充分應用在小麥的功能驗證中。
毫無疑問,目前取得的進展將在未來幾年內大大促進小麥研究。目前人們已經可以分離出定位圖譜區間內的所有基因序列,并能通過分析數百個RNA-seq樣本來驗證這些序列的表達模式,還能比對基因在不同品種間的序列差異來確定單倍型,甚至可以在幾天內通過篩選突變體庫來驗證功能。這些進展有助于快速、準確地檢測小麥品種資源所攜帶的基因,并將用于抗病、優質小麥品種和遺傳材料的選育,可大大加快育種步伐[11]。面對不斷更新的基因組數據和資源,需要科研人員和育種家加強學科交流,有效地將基因組學與大田育種相結合,從而更快更好的將小麥科研的最新成果盡快轉化為農民和消費者需要的優良小麥品種。
[1]代君麗,李振岐.小麥的比較基因組學和功能基因組學[J].西北植物學報,2004,24(5):949-953.
[2] DUBCOVSKY J,DVORAK J.Genome plasticity a key factor in the success of polyploid wheat under domestication [J].Science,2007,316:1862-1866.
[3]凌宏清.小麥及其近緣種基因組測序研究進展與發展趨勢[J].麥類作物學報,2016,36(4):397-403.
[4]CLAVIJO B J,VENTURINI L,SCHUDOMA C,et al.An improved assembly and annotation of the allohexaploid wheat genome identifies complete families of agronomic genes and provides genomic evidence for chromosomal translocations [J].Genome Research,2017,27(5):885.
[5]POZNIAK C.IWGSC whole genome shotgun sequencing of Chinese Spring:towards a reference sequence of wheat[C]//Plant and animal genome XXIV.San Diego:The International Wheat Genome SequencingConsortium,2016.
[6]GARDINER L J,QUINTON M,OLOHAN L,et al.A genome-wide survey of DNA methylation in hexaploid wheat[J].Genome Biol,2015,16:273.
[7] BORRILL P,RAMIREZ R,UAUY C.expVIP:a customizable RNA-seq data analysis and visualisation platform[J].Plant Physiol,2016,170:2172-2186.
[8] PEARCE S,VAZQUEZ H,HERIN S Y,et al.WheatExp:an RNA-seq expression database for polyploid wheat[J].BMC Plant Biol,2015,15:299.
[9]王長彪,韓斌,劉江,等.小麥相關功能基因的全基因組電子定位及基因注釋[J].山西農業科學,2016,44(7):894-899.
[10] RODGERS E,VERA D L,BASS H W,et al.Open chromatin reveals the functional maize genome[J].Proc Natl Acad Sci USA,2016,113:3177-3184.
[11]韓斌,王長彪,任永康,等.小麥分子育種研究進展IV.小麥相關分子標記[J].山西農業科學,2015,43(4):489-492.
[12] MASCHER M,MUEHLBAUER G J,ROKHSAR D S,et al.Anchoring and ordering NGS contig assemblies by population sequencing(POPSEQ)[J].Plant J,2013,76:718-727.
[13] JORDAN K W,WANG S,LUN Y,et al.A haplotype map of allohexaploid wheat reveals distinct patterns of selection on homoeologous genomes[J].Genome Biol,2015,16:48.
[14]HUANG X,HAN B.Natural variations and genome-wide association studies in crop plants[J].Annu Rev Plant Biol,2014,65:531-551.
[15]UAUY C,DISTELFELD A,FAHIMA T,et al.A NAC gene regulating senescence improves grain protein,zinc,andiron content in wheat[J].Science,2006,314:1298-1301.
[16]SCHNEEBERGER K.Using next-generation sequencing to isolate mutant genes from forward genetic screens[J].Nat Rev Genet,2014,15:662-676.
[17] RAMIREZ R H,SEGOVIA V,BIRD N,et al.RNA-Seq bulked segregant analysis enables the identification of high-resolution genetic markers for breedingin hexaploid wheat[J].Plant Biotechnol J,2015,13:613-624.
[18]TRICKM,ADAMSKI NM,MUGFORDSG,et al.CombiningSNP discoveryfromnext-generation sequencingdata with bulked segregant analysis(BSA)tofine-map genes in polyploid wheat[J].BMC Plant Biol,2012,12:14.
[19] GARDINERLJ,BANSEPTP,OLOHANL,etal.Map-ping-by-sequencing in complex polyploid genomes using genic sequence capture:a case study to map yellow rust resistance in hexaploid wheat[J].Plant J,2016,87:403-419.
[20]KING R,BIRD N,RAMIREZ R,et al.Mutation scanning in wheat by exon capture and next-generation sequencing[J].PLoS One,2015,10:e0137549.
[21] STEUERNAGEL B,PERIYANNAN S K,HERNANDEZ I,et al.Rapid cloning of disease-resistance genes in plants using mutagenesis and sequence capture [J].Nat Biotechnol,2016,34:652-655.
[22] JUPE F,WITEK K,VERWEIJ W,et al.Resistance gene enrichment sequencing(RenSeq)enables reannotation of the NB-LRR gene family from sequenced plant genomes and rapid mapping of resistance loci in segregating populations[J].Plant J,2013,76:530-544.
[23]高蘭英,馬慶.誘發突變技術在小麥育種研究中的應用[J].山西農業科學,2009,37(6):7-12.
[24] KRASILEVA KV,VASQUEZ H,HOWELL T,et al.Uncovering hidden variation in polyploid wheat[J].Proc Natl Acad Sci USA,2017,114:912-913.
[25]WANGY,CHENGX,SHANQ,et al.Simultaneous editingofthree homoeoalleles in hexaploid bread wheat confers heritable resistance topowderymildew[J].Nat Biotechnol,2014,32:947-951.
[26]張鵬鈺,袁珍,王國瑞,等.普通小麥Trx59基因的克隆及功能驗證[J].華北農學報,2017,32(5):1-6.