牛迎鳳,李國華,劉紫艷,鄭 誠,柳 覲
(云南省熱帶作物科學研究所,云南 景洪 666100)
橡膠樹Hevea brasiliensis是大戟科Euphorbiaceae橡膠樹屬Hevea重要的熱帶經濟林木[1-2],也是目前用來大規模產業化生產天然橡膠的唯一原料物 種[3],因橡膠樹野生種質在巴西分布的最多,其葉片為三出復葉,因此其又被稱為巴西橡膠樹或三葉橡膠樹。天然橡膠是重要的工業原料和戰略資源[4],因其具有合成橡膠無法替代的綜合化學和物理性 能[5-6],故其在國防等領域不可或缺。近年來,盡管我國天然橡膠產量超過80 萬t,但由于國內消費量巨大,我國天然橡膠原料自給率僅占1/4 左右,極不利于國家戰略資源安全。而且橡膠樹是典型的熱帶樹種,受氣候條件制約,我國僅有海南、云南、廣東、廣西的部分地區可以種植橡膠樹,目前種植范圍已達到甚至超過國內橡膠樹宜植區的極限,僅僅依靠擴大種植面積來提高我國天然橡膠自給率的可能性已不存在,只有培育高產優良品種才是提高國內天然橡膠產量的最為可行的途徑。
無論對于植物還是動物而言,種質資源是品種選育的物質基礎,充分了解種質資源的遺傳背景信息是對其進行育種利用的前提,種質資源的遺傳多樣性也決定著品種改良的深度和廣度[7]。目前我國保存的橡膠樹種質資源已有上萬份,直接或間接來源于其原生地亞馬遜河流域,主要包括3 大類[8],其分別是魏克漢種質、1981′IRRDB種質和近緣野生種質。其中,橡膠樹魏克漢種質和1981′IRRDB 種質已在育種中被廣泛利用和研究報道,而關于橡膠樹近緣野生種質的研究和利用的報道尚不多見。因近緣野生種質遺傳背景信息豐富,往往含有抗逆、抗病等有利基因,具有較高的育種利用價值,故在多種作物中這已成為種質資源創新和利用研究的熱點[9]。隨著基因測序通量的提高和測序成本的降低,對作物近緣野生種的核基因組、線粒體基因組和葉綠體基因組的測序,已成為了解近緣野生種遺傳背景、提高近緣野生種利用效率的有效手段。
葉綠體基因組作為植物特有的相對獨立的遺傳系統,編碼著與光合作用等重要生物學過程相關的上百種基因[10-11],對于研究植物近緣野生種的遺傳背景而言,解析其葉綠體基因組包含的基因數量、基因功能和基因序列等信息顯得尤為關鍵[12]。截止目前,國內外研究者已完成對油桐[13]、核桃[14]、茶樹[15]、杜仲[16]、板栗[17]等重要經濟林物種的葉綠體基因組的測序工作,為這些物種種質資源的深度評價和分子育種提供了豐富的原始數據。
橡膠樹屬包含11 個種,其分別是巴西橡膠H.brasiliensis、矮生小葉橡膠H.camargoana、邊沁橡膠H.benthamiana、光亮橡膠H.nitida、小葉橡膠H.microphylla、少花橡膠H.pauciflora、硬葉橡膠H.rigidifolia、色寶橡膠H.spruceana、澤生橡膠H.paludosa、圭亞那橡膠H.guianensis和坎普橡膠H.camporum[18]。其中的光亮橡膠,因為植株矮小、枝條柔軟下垂,具有較強的抗風性[19],對于培育橡膠樹抗風品種而言,是很有價值的野生近緣種質材料。截止目前,國內外研究者已完成對巴西橡膠[20]、矮生小葉橡膠[21]和邊沁橡膠[22]的葉綠體基因組的測序工作,而有關其他8 個近緣野生種的葉綠體基因組的測序工作尚未見諸報道。為給光亮橡膠樹的育種和利用提供重要理論參考依據,本研究對光亮橡膠樹的葉綠體基因組進行了測序、組裝和注釋,并依據葉綠體基因組的蛋白編碼基因序列,將其與大戟科其他已完成葉綠體基因組測序的物種進行了進化分析,現將研究結果分析報道如下。
光亮橡膠樹葉樣品采自于中國熱帶農業科學院橡膠研究所的農業部儋州橡膠樹種質資源圃中,采集淺綠色嫩葉,以液氮速凍后放入-80 ℃的超低溫冰箱中保存以備用。
1.2.1 DNA 的提取
將采集的光亮橡膠樹淺綠色嫩葉置于研缽中加入液氮研碎,用生工生物工程(上海)股份有限公司的Rapid Plant Genomic DNA Isolation Kit 提取高質量基因組DNA(包括核基因組DNA、葉綠體基因組DNA 和線粒體基因組DNA),并用Agilent 2100 Bioanalyzer 對所提DNA 的質量進行檢測。
1.2.2 測序文庫的構建
根據illumina DNA 文庫構建標準流程,構建插入片段大小為350 bp 的DNA 雙末端測序文庫,采用qPCR 方法和Agilent 2100 Bioanalyzer 對DNA 文庫進行質量控制。
1.2.3 DNA 的測序
采用illumina HiSeq 2000 平臺對質量控制合格的DNA 文庫進行測序,測序策略為Pair-End 150,測序數據量為15 G。
1.2.4 葉綠體基因組的拼接和注釋
對測序得到的Raw Reads 去除低質量序列、去除接頭污染,得到Clean Reads,采用CLC Genomics Workbench v3.6(http://www.clcbio.com) 和DOGMA 軟件[23]對葉綠體基因組進行拼接、組裝和注釋,對重復序列區域進行PCR+常規測序驗證。
1.2.5 進化分析
通過NCBI網站(https://www.ncbi.nlm.nih.gov/) 檢索,篩選出已完成葉綠體基因組測序的所有大戟科物種,選擇其共有的蛋白編碼基因序列,采用 jModelTest 2.1.7(http://code.google.com/p/jmodeltest2/) 對所選DNA 序列進行核酸模型測試[24],采用RAxML8.1.5 軟件(https://sco.h-its.org/exelixis/web/ software/raxml/index.html)用最大似然法(Maximum Likelihood method,ML 法)構建系統發育樹[25],Bootstrap 值設置為1 000。
以超低溫保存的光亮橡膠樹淺綠色嫩葉為材料,按照試劑盒規定的流程提取了基因組DNA,經Agilent 2100 Bioanalyzer 質量檢測發現,DNA未降解、不包含RNA 或蛋白質等雜質,DNA 質量符合構建測序文庫的要求。然后采用1.2.2 中所述的方法構建了DNA 測序文庫,并采用qPCR 方法和Agilent 2100 Bioanalyzer 完成了測序文庫的質量控制,且測序文庫質量和拷貝數均符合上機要求。通過DNA 文庫的上機測序和測序數據的質量控制,得到了可用于葉綠體基因組拼接的Clean Reads。利用DOGMA 軟件對Clean Reads 進行了拼接、組裝和注釋,得到了完整的光亮橡膠樹葉綠體基因組圖譜(圖1),并上傳至美國NCBI 網站(https://www.ncbi.nlm.nih.gov/),序列接收號為MT413435。

圖1 光亮橡膠樹葉綠體基因組圖譜Fig.1 Chloroplast genome mapping of H.nitida
組裝和注釋結果表明,光亮橡膠樹葉綠體基因組為典型的雙鏈環狀結構,其大小為161 124 bp, 包含A 堿基51 495 個、T 堿基52 022 個、G 堿基28 915 個、C 堿基28 692 個,GC 含量為35.75%。從 基因組結構來說,該基因組由如下4 個區域組成:1 個大單拷貝區域(Large single copy,LSC),其GC 含量為33.18%,在葉綠體基因組中的位置是第1—89110 bp;1 個小單拷貝區域(Small single copy,SSC),其GC 含量為29.42%,在葉綠體基因組中的位置是第115930—134305 bp;中間由2 個反向重復區域分開(Inverted repeat,IR),其GC 含量為42.20%,在葉綠體基因組中的位置分別是第89111—115929 bp(IRa)和第134306—161124 bp(IRb)。
采用上述生物信息學手段對光亮橡膠樹葉綠體基因組進行了注釋,共注釋得到134 個基因,其中86 個為蛋白編碼基因(Protein coding genes),4 個為假基因(Pseudo genes),36 個為tRNA 基因(Transfer RNAs),8 個為rRNA 基因(Ribosomal RNAs),除4 個假基因外,其他130 個基因在葉綠體基因組中的位置和序列信息詳見表1。

表1 光亮橡膠樹葉綠體基因組注釋結果?Table 1 Annotation of chloroplast genome of H.nitida

續表1Continuation of Table 1

續表1Continuation of Table 1

續表1Continuation of Table 1
從基因功能來看,86 個蛋白編碼基因主要參與光合系統I、光合系統II、細胞色素b/f 復合體、ATP 合成酶、NADH 脫氫酶、核糖體蛋白、RNA聚合酶等生物學過程;從基因大小來看,86 個蛋白編碼基因中最大的5 個基因分別是ycf2基因(編碼2 303 個氨基酸殘基)、ycf1基因(編碼1 899 個 氨基酸殘基)、rpoC2基因(編碼1 395 個氨基酸殘基)、rpoB基因(編碼1 070 個氨基酸殘基)和psaA基因(編碼750 個氨基酸殘基),最小的5 個基因分別是petL基因(編碼31 個氨基酸殘基)、petN基因(編碼31 個氨基酸殘基)、infA基因(編碼34 個氨基酸殘基)、psbM基因(編碼34 個氨基酸殘基)和psbI基因(編碼36 個氨基酸殘基)。
在NCBI 數據庫中,分別以“橡膠樹屬”和“葉綠體基因組”為關鍵詞,對橡膠樹屬物種葉綠體基因組的測序完成情況進行了檢索,結果發現,包括光亮橡膠樹在內的橡膠樹屬的11 個物種中,共有4 個物種完成了葉綠體基因組的測序、組裝和注釋,這4 個物種分別是光亮橡膠樹、邊沁橡膠樹、小葉矮生橡膠樹和橡膠樹(栽培種)。除橡膠樹葉綠體基因組的測序由泰國學者完成外,其他3 個物種葉綠體基因組的測序工作均由本研究組率先完成和報道。利用生物信息學手段,筆者對橡膠樹屬4 個物種的葉綠體基因組進行了比對。就其葉綠體基因組的大小而言,最大的是小葉矮生橡膠樹(161 291 bp),其次為橡膠樹 (161 191 bp),而邊沁橡膠樹和光亮橡膠樹的葉綠體基因組均最小,均為161 124 bp;從其包含的基因數量來說,光亮橡膠樹、邊沁橡膠樹和小葉矮生橡膠樹的葉綠體基因組均包含了134 個基因,而橡膠樹的葉綠體基因組僅包含了128 個基因,其中有16 個基因位于反向重復區域;從葉綠體基因組結構來說,4 個橡膠樹屬物種的葉綠體基因組具有相同的結構,均由1 個大單拷貝區域、1 個小單拷貝區域和2 個反向重復區域組成,其結構均是典型的雙鏈環狀結構。
在NCBI 數據庫中,分別以“大戟科”和“葉綠體基因組”為關鍵詞,對大戟科物種葉綠體基因組的測序完成情況進行了檢索,結果發現,除橡膠樹屬4 個物種外,截止目前,還有大戟科的9 個物種的葉綠體基因組測序工作均已完成,這9 個物種分別是木薯Manihot esculenta、油桐Vernicia fordii、東 京 桐Deutzianthus tonkinensis、麻瘋樹Jatropha curcas、巴豆Croton tiglium、蓖麻Ricinus communis、乳漿大戟Euphorbia esula、甘遂Euphorbia kansui和綠玉樹Euphorbia tirucalli。利用上述大戟科的13 個物種的葉綠體基因組中所共有的蛋白編碼基因序列,選擇樺木科植物白樺Betula platyphylla作為外類群,以其葉綠體基因組中的同源序列進行輔助分析,利用RAxML8.1.5 軟件,采用最大似然法構建了拓撲結構的系統發育樹,大戟科植物系統發育樹如圖2 所示。圖2 中的數據表示自舉值,自舉值越大,說明系統發育樹的拓撲結構越準確。
基于大戟科的13 種植物葉綠體基因組蛋白編碼基因序列的進化分析結果表明,13 個物種在其進化中可明顯地分為3 個類群。其中,4 種橡膠樹屬植物和木薯分為1 類群,麻瘋樹、巴豆、油桐、東京桐和蓖麻5 個物種分為1 類群,甘遂、乳漿大戟和綠玉樹3 個物種分為1 類群。這一分析結果與傳統分類學中依據形態特征分類的結果基本一致。
橡膠樹作為一種重要的戰略資源植物,其基因組層面的遺傳信息可為其種質資源評價、關鍵基因挖掘、野生近緣種利用等提供重要的基礎數據。近10年來,馬來西亞理科大學化學生物學中心[26-27]、 中國熱帶農業科學院橡膠研究所[28]、泰國國家科學技術發展局遺傳工程和生物技術中心[29]、 中國云南省熱帶作物科學研究所[30]等國內外研究機構陸續發布了越來越精細的橡膠樹基因組圖譜,目前已拼裝到了染色體水平。但是,作為一種馴化歷史僅有一百多年的外來物種,經過數代群體內雜交和篩選后,國內橡膠樹育種材料的遺傳基礎已非常狹窄,從中篩選出突破性品系或品種的可能性極小。因此,能否從近緣野生種質中獲得育種所需的有利基因,這是橡膠樹育種者近年來關注的焦點,而從基因組層面研究近緣野生種質的遺傳背景,則是其育種利用研究的前提。
葉綠體作為植物細胞中必不可少的細胞器,是植物進行光合作用這一生長發育基礎性反應[31]的場所,具有將無機物轉換成為有機物的重要生物學功能。相比核基因組而言,葉綠體基因組較小;相比線粒體基因組而言,葉綠體基因組結構相對保守。因此,葉綠體基因組測序是近年來研究植物種質資源親緣關系和物種進化關系的絕佳途徑。本研究對具有抗風特性的橡膠樹近緣野生種光亮橡膠樹的葉綠體基因組進行了測序,并獲得了較好的組裝和注釋結果。
大戟科是被子植物中包含物種數量較多的一個科,也是經濟價值比較高的一個科,全世界大戟科植物約有300屬、8 000種,很多大戟科植物(如橡膠樹、木薯、油桐、麻瘋樹、蓖麻等)都是重要的工業或能源植物,解析其葉綠體基因組信息對于其遺傳背景分析和分子育種而言都非常重要。但是,因葉綠體基因組測序工作涉及到分子生物學、基因組學和生物信息學等多個學科的研究平臺和技術,目前已完成葉綠體基因組測序的大戟科物種僅約占其物種總數的0.16%,而絕大多數具有重大經濟價值的大戟科植物的葉綠體基因組信息仍然有待解析。
研究中發現,已公布了葉綠體基因組的橡膠樹屬4 個物種的葉綠體基因組,不僅其結構相同,而且其序列同源性非常高,尤其是光亮橡膠樹和邊沁橡膠樹的葉綠體基因組其大小和所包含的基因數量均相同,且與栽培種橡膠樹的葉綠體基因組(161 191 bp)[20]僅有67 bp 的差別,其相似性高達99.96%,說明這幾個物種的遺傳關系非常密切。這一研究結果表明,就橡膠樹育種而言,光亮橡膠樹、邊沁橡膠樹和矮生小葉橡膠樹均有較高的潛在利用價值。
一般來說,葉綠體基因組序列在物種進化過程中是極為保守的。但是,研究中發現,在其葉綠體基因組已被報道的橡膠樹屬3 個近緣野生種中,光亮橡膠樹與邊沁橡膠樹的葉綠體基因組序列幾乎完全一致,對于兩個不同的物種而言,這種現象并不常見。因此,本研究組重新采集了光亮橡膠樹與邊沁橡膠樹不同植株的葉樣,再次進行了高通量測序和組裝,并對重復序列區域進行了PCR 擴增和常規測序驗證,獲得的組裝結果與本研究報道的完全一致。因此推測,光亮橡膠樹和邊沁橡膠樹應該是由同一個祖先種進化而來的,僅僅因為其生境不同,導致其在進化過程中逐漸出現了性狀上的差別,對此還需要利用核基因組重測序等手段予以進一步驗證。