李建輝,劉麗麗
(浙江省衢州市農業科學研究院,浙江衢州 324000;衢州學院化學與材料學院,浙江衢州 324000)
王蕾
(國家林業局林產工業規劃設計院,北京 100010)
榧屬(Torreya)植物隸屬于紅豆杉科(Taxaceae),共有7種2變種,我國有5種2變種,包括榧樹(T.grandis)、長葉榧(T.jackii)、巴山榧(T.fargesii)、四川榧(T.parvifolia)、云南榧(T.fargesiivar.yunnanensis)、九龍山榧(T.grandisvar.jiulongshanensis)和日本榧(T.nucifera),其中日本榧為引進栽培種,榧樹、長葉榧、巴山榧、四川榧、九龍山榧為我國亞熱帶地區的特有種,但九龍山榧植株數量極為有限,四川榧則是近年來發表的新種[1]。榧屬植物是一類古老珍稀的孑遺植物,具有重要的經濟價值和科學研究價值,我國榧屬所有種類均被列為國家二級重點保護野生植物[2],且大部分被收錄于IUCN瀕危物種紅色名錄[3]和《中國物種紅色名錄》[4],目前亟需制定合理有效的保護策略。
微衛星序列(simple sequence repeat,SSR)廣泛分布于真核生物的核基因組DNA和葉綠體基因組DNA(chloroplast genome DNA,cpDNA)中,由于其具有共顯性、分布廣泛、多態性豐富等優點,使得SSR標記成為遺傳學分析中極為有用的分子工具[5~7]。另一方面,與核基因組 DNA的SSR相比,葉綠體微衛星標記(chloroplast simple sequence repeat,cpSSR)又兼有葉綠體基因組單親遺傳、分子量小、結構簡單、相對保守等特點,因而近年來發展很快,現已成為一種新型高效的分子標記技術并廣泛應用于物種鑒定以及種群和個體水平的遺傳學分析[8~10]。
為此,本研究選擇我國亞熱帶地區榧屬植物的3個代表性物種即榧樹、長葉榧和巴山榧為對象,對長葉榧和榧樹進行葉綠體全基因組序列的測定,再與已公布的的巴山榧進行比較,同時應用生物信息學軟件對三者的葉綠體微衛星分布特征和規律進行全面分析,以獲得更多榧屬植物葉綠體基因組數據并為開發榧屬植物葉綠體通用微衛星引物提供基礎信息。
供試的長葉榧樣品采自浙江省桐廬縣白云源森林公園,榧樹樣品采自浙江省杭州植物園。在長葉榧和榧樹的植株上分別采集健康幼嫩葉片,擦拭干凈后裝入放有足量干冰的低溫貯藏箱中送上海翰宇生物科技有限公司在Illumina Hiseq 2500中進行葉綠體基因組測序。
將長葉榧和榧樹的葉綠體基因組測序結果提交至NCBI中的GenBank數據庫(https:// www.ncbi.nlm.nih.gov/),獲得基因組入庫序列號。同時,在GenBank 中下載已公布的巴山榧葉綠體基因組全序列測序結果(入庫序列號為KT027377)。采用MIcroSAtellite (MISA)軟件(http://pgrc.ipk-gatersleben.de/misa/)搜索SSR重復序列,設定單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的最少重復分別為10、5、4、4、3和 3次[11]。
長葉榧和榧樹的葉綠體基因組測序結果在GenBank數據庫中入庫序列號分別為KX902234、KY369757。從測序結果來看,3種榧屬植物葉綠體基因組均為環狀雙鏈DNA,全序列總大小以巴山榧最大,榧樹次之,長葉榧最小,依次為137075、136949、136720bp。在巴山榧、榧樹、長葉榧中,利用MISA軟件分別搜索到34、42、36個重復序列,總大小分別為407、522、463bp,各占 cpDNA 全序列的 0.30%、0.38%、0.34%。3個物種葉綠體基因組上cpSSR分布范圍都較廣,其中巴山榧的cpSSR分布于4061bp~132480bp之間,榧樹的cpSSR分布于8762bp~132419bp之間,長葉榧的cpSSR分布于4051bp~114413bp之間,但這種分布并不平衡,有集中區與稀疏區之分。從圖1可以看出,3種榧屬植物的 cpSSR 主要集中分布在20~120kb區域,這個區域分布的cpSSR占微衛星總數的90%以上,而0~20kb和120~140kb的區域分布的數量較少。

圖1 cpSSR在3種榧屬植物葉綠體DNA中的分布
從3種榧屬植物cpSSR不同堿基重復類型的分布特征來看,在搜索到的cpSSR中,3種榧屬植物cpSSR重復序列主要由單堿基和四堿基微衛星構成,其他堿基重復的微衛星較少(表1)。在巴山榧cpSSR中,單堿基微衛星占總數的58.82%、四堿基微衛星占總數的23.53%;在長葉榧cpSSR中,單堿基微衛星占總數的63.89%、四堿基微衛星占總數的22.22%;在榧樹cpSSR中,單堿基微衛星占總數的57.14%、四堿基微衛星占總數的23.81%。

表1 3種榧屬植物葉綠體DNA中cpSSR不同堿基重復類型比較
在單堿基微衛星重復中,3種榧屬植物均以A和T的單堿基重復為主,C的重復極少,而且都沒有出現G的重復。在巴山榧cpSSR中,A和T的單堿基重復占單堿基微衛星總數的100%;在長葉榧cpSSR中,A和T的單堿基重復占單堿基微衛星總數的95.65%;在榧樹cpSSR中,A和T的單堿基重復占單堿基微衛星總數的95.83%。
此外,在二堿基微衛星的堿基分布中,3種榧屬植物均以AT重復為主,且只有在榧樹中出現TA重復;三堿基微衛星均為ATT重復;四堿基微衛星不同堿基重復類型較多,但每種類型的數量相對較少,整體呈現出相對分散的格局;五堿基微衛星僅在榧樹中出現1種類型。
從3種榧屬植物cpDNA中單堿基重復次數的總體分布情況來看(表2),單堿基微衛星重復以(A)n和(T)n為主,其中(A)n微衛星重復多于(T)n,且堿基重復數主要集中在10個至14個,堿基重復數在15個以上的相對較少。在巴山榧中,微衛星(A)n重復以10次最多,共6個;微衛星(T)n重復以11次最多,共3個。在長葉榧中,微衛星(A)n重復以10次和11次最多,均為5個;微衛星(T)n重復以10次最多,共2個。在榧樹中,微衛星(A)n重復以10次最多,共6個;微衛星(T)n重復以10次最多,共3個。

表2 3種榧屬植物葉綠體DNA中cpSSR單堿基不同重復次數比較
明確 cpSSR在葉綠體基因組中的分布規律是開發cpSSR分子標記的前提。為獲取更多榧屬植物葉綠體基因組數據,本研究對長葉榧和榧樹進行了葉綠體全基因組序列的測定,并已登記于GenBank 數據庫中,再加上先前已公布的巴山榧葉綠體基因組全序列信息,可為后續開發榧屬植物cpSSR通用引物奠定重要基礎。
從本研究結果來看,3種榧屬植物葉綠體基因組均為環狀雙鏈DNA,總長度在136720 ~137075bp之間。3種榧屬植物的葉綠體微衛星以榧樹中最多,為42個,其次為長葉榧(36個),巴山榧中最少(34個)。3種榧屬植物葉綠體微衛星均呈現出單堿基重復較多、3核苷酸重復數較少的特點,且單堿基重復主要以(A)n和(T)n為主,這一分布特征在其他科屬植物的cpDNA中也同樣存在[12~14]。此外,3種榧屬植物的cpSSR中均不存在單核苷酸G的微衛星標記,這可能與榧屬植物本身的生物學特性有關。
在微衛星的重復基元類型和重復次數方面,3種榧屬植物均呈現出重復基元類型不多、重復次數較少且以單堿基重復為主的特點,這可能與葉綠體基因組本身的特點和進化方向有關。與核基因組相比,葉綠體基因組相對較小,進化速率僅為核基因組的1/5,平均每年每個位點進化速率為(0.2~1.0)×10-9[15]。同時葉綠體基因組呈單親遺傳,其遺傳物質在由親代向子代傳遞過程中不涉及基因重組,也不受選擇壓力,因而序列結構相對穩定,保守性較強,從而使得葉綠體SSR的變異類型要少于核基因SSR[16,17]。
已有的研究表明,從一個物種基因組中分離出來的SSR可用于同屬中的其他物種的遺傳學分析,如此可極大降低SSR的開發成本,并為其廣泛應用創造有利條件[18~20]。Powell等[21]在松屬(Pinus)不同植物中篩選得到一批葉綠體微衛星標記,并成功用于松科(Pinaceae)其他植物的種質資源研究。Weising等[22]利用 cpSSR側翼序列的保守性開發了10對可用于不同物種分析的cpSSR通用引物;Grivet等[23]通過對煙草(Nicotianatabacum)的研究開發了一批通用的cpSSR引物。Cheng等[24]從不同物種的22對cpSSR引物中篩選得到9對可用于柑橘(Citrusreticulata)親緣關系分析的通用引物。因此,通過對3種榧屬植物cpSSR分布特點和規律的研究,可為后續榧屬甚至紅豆杉科其他屬植物通用cpSSR分子標記的開發提供重要信息。