池 偉,池雷均,潘賀威,夏小李,黃振華
(1.瑞安市自然資源和規劃局,浙江 瑞安 325200;2.浙江省海洋水產養殖研究所,浙江 溫州 325005;3.浙江省近岸水域生物資源開發與保護重點實驗室,浙江 溫州 325005)
近無柄雅榕(Ficus concinna Miq.var.subsessilis Corner)又稱無柄小葉榕[1],屬桑科榕屬,是小葉榕的一個變種,主要分布在中國浙江南部、江西南部、廣東、云南等地,在泰國西北部、印度東北部也有分布。近無柄雅榕樹冠大,枝葉繁茂,四季常青,耐低溫,耐鹽堿,是生態景觀和泥質海岸防護林的重要構成樹種,是福建省樹,也是福州、贛州、溫州等地的市樹。
葉綠體是植物進行光合作用的細胞器,含有少量的遺傳物質。1986年,煙草和地錢的葉綠體基因組全序列被首次公布,開創了葉綠體全基因組測序的先河。之后,陸續有其他物種的葉綠體基因組序列被公布。目前,NCBI 收錄的葉綠體基因組序列已經超過4200 個。研究表明,葉綠體基因組在結構和功能上較為保守,含有大量的功能基因,且其序列片段的變異速率適中,可用作DNA條形碼,開展分子鑒定、物種進化、遷徒等方面的研究[2-4]。目前葉綠體基因組研究多側重于農作物、經濟作物、藥用植物和具有進化意義的古老物種,關于榕屬植物葉綠體基因組序列的研究較少。本研究擬以一株樹齡近千年的近無柄雅榕古樹為研究對象,測定其葉綠體基因組序列并對其特點進行分析,以期為榕屬種間的分子標記開發、桑科植物系統發育研究提供參考。
本研究中的近無柄雅榕古樹位于浙江省瑞安市塘下鎮上馬村,是瑞安市文物保護古樹。樹齡917年(至2019年),樹高14 m,胸圍1000 cm,平均冠幅29 m。
利用Plant DNAzol試劑提取新鮮幼嫩葉片DNA,用plasmid-safe ATP-Dependent DNase 降解線性的染色體DNA。采用超聲法Covaris 將大片段葉綠體基因組DNA 隨機打斷并產生300~500 bp DNA 片段,然后用T4 DNA Polymerase、Klenow DNA Polymerase和T4 PNK將打斷形成的粘性末端修復成平末端,再在3′端加堿基“A”,以使DNA片段隨后能與3′端帶有“T”堿基的特殊接頭連接,用電泳法回收所需長度的DNA片斷,并加接頭進行cluster制備。最后利用諾禾致源科技股份有限公司的Illumina HiSeq平臺上機測序。
對下機數據進行過濾質控,包括去除質量值連續≤20的堿基數達到一定程度的reads(默認40%,設置為36個),去除含N的堿基數目總和達到一定比例的reads(默認10%,設置為9 bp),去除adapter污染(默認adaper序列與read序列有15 bp的overlap,設置為10 bp),去除duplication污染等,得到clean data。利用CLC Genomics Workbanch、SOAP、SSPACE 等軟件組裝葉綠體基因組,組裝后的完整序列利用Dogma 網站在線工具進行注釋;用OGDRAW 軟件[5]呈現葉綠體基因組序列圖;用MISA(MIcroSAtellite identification tool)軟件[6]分析SSR;用MEGA X 軟件構建進化樹。
樣品經Illumina HiSeq 平臺測序得到的下機數據為1.0 G,過濾后的數據為0.9 G,平均長度為150 bp,覆蓋度為158×。葉綠體基因組大小為160 292 bp,CDS 的總長度為76 521 bp,GC 含量為35.8%。與其他大多數被子植物一樣,近無柄雅榕葉綠體基因組是典型的環狀結構[7-8],包括1個大單拷貝區(LSC)、1個小單拷貝區(SSC)和一對分開的反向重復區域(IR)。LSC區長度為88 565 bp,GC含量為33.5%;SSC區長度為20 145 bp,GC含量為28.9%;IR 區長度為25 791 bp,GC 含量為42.7%(見圖1、表1)。由于4個rRNA 基因均分布在IR區,導致IR區的GC含量高于2個單拷貝區。
植物葉綠體基因組一般有110~130個基因[9],本研究中的葉綠體基因組共注釋出118個基因,包括83個蛋白質編碼基因、31個tRNA基因和4個rRNA基因,其中IR區有11個蛋白質編碼基因、7個tRNA基因和4個rRNA基因。上述118個基因主要分為3類:與光合作用相關的基因有45個,主要包括光合系統Ⅰ(psa)、光合系統Ⅱ(psb)、細胞色素b/f復合體(pet)、ATP合成酶(atp)、NAD(P)H脫氫酶(ndh)等基因;與葉綠體轉錄、翻譯、表達相關的基因有60 個,主要包括轉運RNA(trn)、核糖體RNA(rrn)、RNA 聚合酶(rpo)和核糖體蛋白(rpl/rps)等基因;與開放式閱讀框和其他蛋白編碼相關的基因有13個,主要包括ycf、matk等基因。
與大部分葉綠體一樣,近無柄雅榕葉綠體基因組內含子數量較少[10-11],僅注釋出11 個含內含子的基因(見表2),包括7個蛋白質編碼基因和4個tRNA 基因。其中,9個基因僅含1個內含子;2個基因含有2個內含子的,分別為ycf3和clpP基因;ndhA基因的內含子最長,長度為1179 bp。

圖1 近無柄雅榕葉綠體基因組圖譜Figure 1 Map of the chloroplast genome of Ficus concinna

表1 近無柄雅榕葉綠體基因組堿基組成Table 1 Base composition of chloroplast genome of Ficus concinna

表2 近無柄雅榕葉綠體基因組中含內含子的基因信息Table 2 The genes including introns in the Ficus concinna chloroplast genome
微衛星(Simple Sequence Repeats,SSR)標記具有標記數量豐富、共顯性遺傳、重復性好等特點,被廣泛用于構建遺傳圖譜、分析親緣關系和種群結構等[12-16]。本研究從近無柄雅榕葉綠體基因組中檢索到68個SSR,其中包括11個復合型SSR、52個單堿基重復、4個二堿基重復和1個三堿基重復,出現次數最多的SSR是單堿基重復,約占76.47%;葉綠體基因組中平均每2.36 kb有一個SSR位點(見表3)。檢索到的SSR中共有4種重復單元類型,其中2種為單堿基重復,分別為A/T和C/G,絕大多數為A/T類型,占98.61%;二堿基重復和三堿基重復各有1種,主要重復單元類型分別為AT/TA和TTA/AAT(見表4)。
SSR的序列長度為10~133 bp,平均長度為19.06 bp,其中復合型SSR的平均長度為59.09 bp,單堿基重復的平均長度為11.1 bp,二堿基重復的平均長度為12 bp,三堿基重復的平均長度為21 bp;重復序列長度為10~20 bp的最多(占82.35%),重復序列長度為21~40 bp的占10.3%,重復序列長度大于40 bp的占7.35%。SSR重復單元的重復次數為6~14次(不計算復合型SSR),其中重復次數為5~10次的有26個(占SSR總數的38.24%),重復次數為11~15次的有31個(占SSR總數的45.59%)。

表3 近無柄雅榕葉綠體基因組中SSR重復單元的分布特征Table 3 Distribution of SSR repeat units in chloroplast genome for Ficus concinna

表4 近無柄雅榕葉綠體基因組中SSR不同重復單元的出現頻數Table4 Frequency of SSR different repeat units in chloroplast genome of Ficus concinna
葉綠體基因組的蛋白編碼基因共包含53 430個密碼子,其中編碼亮氨酸(Leu)的密碼子最多,有5471個(占10.24%);其次為絲氨酸(Ser)和異亮氨酸(Ile),分別為4957 個(占9.28%)和4946 個(占9.26%);編碼色氨酸(Trp)的密碼子最少,僅672個(占1.26%)。在3個終止密碼子中,UAA使用最頻繁,其數量占終止密碼子總數的43.33%;UGA的數量占終止密碼子總數的32.84%;UAG的數量占終止密碼子總數的23.83%。同義密碼子相對使用度(RSCU)指某個密碼子在編碼對應氨基酸的同義密碼子中出現的相對概率,在進行密碼子編好性分析時可去除氨基酸組成的影響。RSCU>1表示該密碼子為偏好密碼子,RSCU<1表示該密碼子使用率較低,RSCU=1表示該密碼子沒有偏好性(見表5)。近無柄雅榕葉綠體基因組的密碼子偏好使用A/T堿基,其中第一個、第二個和第三個堿基為A/T 堿基的密碼子分別占密碼子總數的64.53%、63.50%和64.35%。

表5 近無柄雅榕葉綠體基因組密碼子使用率Table 5 Codon usage of chloroplast genome of Ficus concinna
選取Genbank 數據庫中Ficus religiosa L.、Ficus carica L.、Ficus racemosa L.等10 個桑科植物葉綠體基因組數據(見表6),以榆科醉翁榆(Ulmus gaussenii)的葉綠體基因組作為外群,采用鄰接(Neighbor-joining)法構建系統進化樹,結果見圖2。自舉分析(Bootstrap)1000次重復檢測各分支的置信度,結果顯示進化樹的置信值均大于90%,表明聚類結果的可信度較高。在系統發育樹中,桑科桑屬的5個物種聚到一個大分支中;桑科榕屬和構屬的5 個物種共同聚到另一個大分支中,該分支又分為2 個亞分支,分別是榕屬分支和構屬分支。近無柄雅榕在發育樹上與菩提樹(Ficus religiosa)的親緣關系最近,同源性達99%以上。

表6 物種信息表Table 6 Species Information

圖2 基于桑科葉綠體全基因組序列構建的系統發育樹Figure 2 Phylogenetic tree based on chloroplast genome sequence of Moraceae
大多數葉綠體基因組具有典型的四段式環狀結構,即2個反向重復區(IR)被一個大單拷貝區(LSC)和小單拷貝區(SSC)分開;大小一般為100~218 kb;GC含量高度保守,通常在30%~40%。近無柄雅榕葉綠體基因組大小為160 292 bp,IR區長25 791 bp,GC含量為35.8%,密碼子偏好使用A/T堿基,結果與典型的被子植物葉綠體基因組特征吻合[17-22]。在系統進化分析中,榕屬植物的葉綠體基因組大小、結構、GC含量相差不大,說明葉綠體基因組具有高保守性[23]。
高等植物葉綠體微衛星(chloroplast SSR,cpSSR)既具有核基因組SSR的高多態性、多等位性、共顯性等特點,還兼有單親遺傳模式的結構簡單、相對保守等特點[24-25],具有良好的種間、種內遺傳變異區分能力,被廣泛應用于農作物和林業資源研究[26-27]。基于葉綠體特定基因片段的DNA 條形碼技術在植物的快速識別和物種鑒定中也發揮了巨大作用[28]。在近無柄雅榕葉綠體基因組中檢索到68個SSR,共有4種類型的重復單元,單堿基重復中絕大多數為A/T類型(98.61%),具有堿基偏好性。下一步,筆者將利用近無柄雅榕葉綠體基因組中的SSR標記深入研究榕屬植物的起源、遷徙和進化等。
榕樹主要分布于熱帶和亞熱帶地區,屬熱帶植物區系中最大的木本屬之一——桑科榕屬。中國榕屬植物數量雖不多,但多樣性豐富,榕屬的亞屬種類均有不同程度的分布[1],其獨特的地理分布特征對全世界榕屬植物進化史和種間協同進化研究具有重要參考價值。近年來,科研人員已在榕樹種類及其生理、群落生態等方面開展了相關研究[29-35],但關于中國榕屬植物分子遺傳特征及其地域性信息等方面的研究還非常有限。本研究通過系統進化分析發現,近無柄雅榕與菩提樹的親緣關系最近,同源性達99%以上。由于NCBI數據庫中的葉綠體基因組序列有限,本研究構建的進化關系還不夠全面,有待于進一步完善。