劉 宇,鄭勇奇,李長紅,林富榮,黃 平*
(1.林木遺傳育種國家重點實驗室,中國林業科學研究院林業研究所,國家林業和草原局森林培育重點實驗室,北京 100091;2.溫州市資源植物創新利用重點實驗室,浙江省農業科學院浙江省亞熱帶作物研究所,浙江 溫州 325005)
刀狀黑黃檀(Dalbergia cultrata Graham ex Benth)隸屬于豆科(Fabaceae)黃檀屬(Dalbergia),高大落葉喬木,其主要分布區位于中國云南省南部以及相毗鄰的中南半島的熱帶與亞熱帶地區[1]。刀狀黑黃檀是珍貴的紅木樹種,由于其心材呈黑褐色,新切面具有酸香氣味,新切面紫、黑或栗褐,常帶紫或黑褐窄條紋,在中國《紅木》(GB/T 18 107-2017)國家標準中被歸類于黑酸枝木系,是制作高檔家具、樂器以及工藝品的優質材料;同時,心材和根可入藥,具有較好的藥用價值[2];刀狀黑黃檀根系發達,對土壤要求不高,且具有良好的抗病、抗蟲等特性,是困難立地生態修復的優良樹種[3]。以往研究主要關注了刀狀黑黃檀的野生資源分布以及氣候變化對其影響、育苗方法、木材內含物化學成分等方面[3-6]。刀狀黑黃檀心材形成周期長導致了突出的供需矛盾,也造成了野生資源的過度開發,而經濟社會高速發展過程中的土地利用轉變以及氣候變化的風險可能進一步擠壓其原生棲息地范圍,致使野生資源數量進一步減少,野生資源正在遭受遺傳侵蝕的風險[4]。盡管刀狀黑黃檀早已被列入IUCN(International Union for Conservation of Nature)紅色名錄(近危級,Near threatened,NT)以及《中國高等植物受威脅物種名錄》(易危級,Vulnerable,VU A2c)[7],但是關于該物種種群遺傳保護研究尚未見報道,也缺少相關背景基因組信息以及物種特異性的遺傳標記。
分子標記是有效量化和科學評價種群遺傳變異程度的分析工具,被廣泛應用于遺傳圖譜構建、數量性狀定位、遺傳多樣性與遺傳結構評價等方面[8]。SSR分子標記是群體遺傳學研究中最常用的DNA分子標記之一,隨著NGS測序技術的發展與成本降低,基于測序數據,通過生物信息學分析方法可快速、高效的發掘出大量的潛在SSR標記位點,進一步結合分子實驗篩選驗證則可對多態性基因組SSR標記進行鑒定,在林草遺傳分析中已有諸多應用,如元寶楓(Acer truncatum Bunge)、象草(Pennisetum purpureum Schum.)和開心果(Pistacia vera L.)等[9-11]。
為了掌握刀狀黑黃檀的遺傳信息,開發一套可用于遺傳分析的適宜分子標記,本研究基于NGS測序技術對刀狀黑黃檀基因組的基本特征進行了初步評估,通過實驗篩選開發了一套重復性高、多態性好的SSR標記,并在其野生種群中進行了初步驗證與評價分析。研究結果不僅可為刀狀黑黃檀群體遺傳學研究提供可靠分析工具,而且為進一步深入開展種質資源收集保存、分析評價提供科學依據。
基因組測序試驗材料:2018年3月在云南省普洱市六順鄉(LSX)采集刀狀黑黃檀成熟種子,采種母樹憑證標本存放于中國林業科學研究院林業研究所。于當年在中國林科院科研溫室播種育苗,育苗基質為草炭土與蛭石(3:1),常規水肥管理,選擇長勢良好且健康的植株,采集新鮮葉片,液氮保存,用于基因組DNA提取。
SSR分子標記篩選試驗材料:選擇云南省普洱市六順鄉(LSX)、江城(JC),西雙版納傣族自治州景洪(JH)等3個地點進行采樣,采樣地理環境信息見表1。每個采樣點隨機選擇30個個體,共計90個樣品,不同個體間距離大于50 m。采集新鮮葉片,經硅膠完全干燥后,放置于?20 ℃冰箱保存,用于DNA提取。

表1 刀狀黑黃檀采樣點信息Table 1 Sampling information of D.cultrata
采用CTAB法[12]從葉片樣品中提取基因組DNA,分別用1.0%瓊脂糖凝膠電泳和ScanDrop 100分光光度計(Molecular Device,California,United States)檢測DNA濃度及質量。利用illumina HiSeqTM2500測序平臺(illumina,San Francisco,United States),基于標準規程構建一個插入片段大小為300 bp的文庫。基于K-mer分析,估計基因組大小、雜合度以及重復序列比率[13]。
參考Luo等的方法[14],利用SOAPdenovo v 2.04軟件進行基因組初步組裝。構建Contig序列(K-mer=17)并進一步組裝為Scaffold,使用GapCloser v 1.12-r6修補Scaffold內部缺口。以每10 kb作為1個窗口,進行非重疊滑窗統計,計算每個窗口的平均深度與GC含量,獲得GC-depth點圖,進而估計基因組GC含量。
采用MISA(http://pgrc.ipk-gatersleben.de/misa/misa.html)對初步組裝Scaffold進行潛在SSR位點檢索,挖掘候選SSR標記。參數設置為:二至六核苷酸基序重復單元最小重復次數值分別設置為6、5、4、4、4。利用Primer Premier v 5.0軟件設計引物,引物參數分別為:引物長度18~22 bp,產物大小100~300 bp,退火溫度55~62 ℃,最優值為60 ℃。隨機挑選300對引物,由睿博興科生物公司(北京)合成。
從六順鄉(LSX)、江城(JC)和景洪(JH)3個種群90個樣品中隨機挑選出4個樣品對300對引物進行瓊脂糖凝膠電泳初篩,選擇擴增條帶清晰,穩定性良好的引物進行復篩。復篩時在90個樣品中隨機挑選8個樣品進行8.00%非變性聚丙烯酰胺凝膠電泳檢測,擴增產物條帶明亮、清晰,無背景噪音,即復篩合格引物。然后,利用熒光毛細管電泳檢測候選SSR位點多態性,最后利用多態性SSR位點分析3個種群(90個個體)遺傳變異程度,初步評估SSR位點適用性以及種群遺傳變異程度。
PCR反應體系為:基因組DNA 50 ng,2×Taq MasterMix(Dye)(康為世紀,北京)12.5 μL,正向引物(10 μmol·L?1)0.5 μL,反向引物(10 μmol·L?1)0.5 μL,用 ddH2O 補至 25 μL。PCR程序為:96 ℃ 預變性 3 min,然后96 ℃ 變性30 s,60 ℃退火30 s,72 ℃延伸45 s,共30個循環,最后72 ℃延伸7 min。
利用GeneMaker v 2.2.0對SSR位點進行基因分型,并進行二次人工復核。
采用GenAlEx v 6.502[15]計算下列群體遺傳參數,包括觀測等位基因數(Na),有效等位基因數(Ne),觀測雜合度(Ho),期望雜合度(He),Shannon's信息指數(I),種群間遺傳分化系數(FST),哈溫平衡偏離顯著性(HWE(p))等。采用GeneALEx v 6.502[15]進行分子方差分析(AMOVA)以檢測遺傳變異來源。采用CERVUS v 3.0.4[16]計算位點多態性信息含量(PIC)。
基于illumina HiSeqTM2500平臺測序共生成94.52 Gb高質量數據,覆蓋度約為基因組的137倍。測序質量值Q20和Q30分別為96.24%和90.23%,表明測序質量良好,可用于后續分析。使用SOAPdenovo軟件進行組裝和拼接,選擇K-mer為17,初步組裝基因組,共獲得463 258個Scaffold,Scaffold N50長度約為2 381 bp(表2)。將所有高質量數據用于K-mer分析,K-mer分布曲線結果顯示:K-mer期望深度(主峰)對應的測序深度為126×,GenomeScope估計基因組約為706.92 Mb,基因組雜合度為1.26%,重復序列比率為55.74%,平均GC含量為34.11%。

表2 刀狀黑黃檀基因組組裝信息Table 2 Information of the assembled genome sequences of D.cultrata
利用MISA進行SSR候選位點檢索,從463 258個Scaffold中總共鑒定出142 891個SSR標記(表3),其中,二核苷酸(Di-)位點數量最多,占總數的61.21%,主要重復類型為AT/AT,占54.75%;三核苷酸(Tri-)次之(24.88%),主要類型為AAT/ATT,占54.23%;四核苷酸(Tetra-)占比為7.45%,主要類型為AAAT/ATTT,占比為68.11%;五核苷酸(Penta-)占比為1.11%,主要類型為AAAAT/ATTTT。

表3 刀狀黑黃檀的基因組 SSR 分布特征Table 3 Characteristic and distribution of SSR in D.cultrata genome
瓊脂糖凝膠電泳初篩結果顯示:128對引物具有清晰穩定的擴增條帶,占檢測引物比例為42.67%;經過8.00%非變性聚丙烯酰胺凝膠復篩檢測,最終共篩選了27對擴增穩定,條帶清晰明亮,多態性良好的引物,約占檢測引物總數的9.00%,引物詳細信息見表4。

表4 刀狀黑黃檀27個SSR位點的側翼引物信息Table 4 Characteristics of flanking primers of 27 SSR markers developed for D.cultrata
利用篩選后具有多態性的SSR位點對3個種群的90個刀狀黑黃檀個體進行SSR基因分型(圖1)。檢測結果顯示:在27個SSR位點上共檢測到117個等位基因,觀測等位基因數(Na)最少為2個,最多為10個,均值為4.333;有效等位基因數(Ne)最少為1.193,最多為5.757,均值為2.397。位點水平的觀測雜合度(Ho)最小值為0.111(HHT226),最大值為0.833(HHT119),均值為0.451;期望雜合度(He)最小值為0.162(HHT226),最大值為0.826(HHT121),均值為0.523。多態性信息含量(PIC)最小值為0.149(HHT226),最大值為0.803(HHT121),均值為0.463,其中,11個位點具有高多態性(PIC>0.5),13個位點具有中等多態性(0.25 表5 27個SSR位點多態性信息Table 5 Characterization of locus-level polymorphic information at 27 SSR loci 圖1 部分 SSR 位點毛細管電泳檢測結果Fig.1 Fluorescence capillary electrophoresis test results of part of SSR loci 在3個野生種群中檢驗了27個SSR位點在群體遺傳分析中有效性與適用性,結果(表6)顯示:在六順鄉(LSX)、江城(JC)以及景洪(JH)種群中,觀測等位基因(Na)數量分別為3.407、3.444、3.741;有效等位基因(Ne)數量分別為2.194、2.225、2.453。在3個種群中,具有中高度多態性的SSR位點分別占比85.19%(LSX)、88.89%(JC)、85.19%(JH)。種群水平的期望雜合度(He)分別為0.491(LSX)、0.493(JC)、0.528(JH),均值為0.504;觀測雜合度(Ho)分別為0.472(LSX)、0.416(JC)、0.461(JH),均值為0.450,結果表明3個刀狀黑黃檀野生種群具有中等的遺傳多樣性。 表6 3個刀狀黑黃檀野生種群遺傳多樣性Table 6 Genetic diversity of 3 wild populations of D.cultrata in China FST值可用于評價種群間遺傳分化程度,3個種群之間的遺傳分化系數(FST)為0.002~0.115,平均值為0.034(表5)。AMOVA分析結果顯示:刀狀黑黃檀種群內遺傳變異和種群間遺傳變異分別為96.54%和3.46%,這表明刀狀黑黃檀遺傳變異主要來源于種群內(表7)。 表7 刀狀黑黃檀種群間和種群內 AMOVA 分析Table 7 AMOVA analysis among and within D.cultrata populations 自Galbraith等[17]利用流式細胞術測定植物細胞核DNA含量以來,流式細胞術成為了測定植物基因組大小的標準方法。隨著高通量測序技術的發展,基于K-mer分析的生物信息學估計基因組特征方法的出現,對于探索未知基因組物種提供了極大幫助,已經廣泛應用于植物基因組大小評估和特征分析[18],并且K-mer分析相較于流式細胞術分析法的預測結果可信度更高、信息更豐富。以往普遍認為黃檀屬植物的基因組可能比較大,在DNAC值數據庫中黃檀屬植物基因組(1C)大小范圍為1 430~1 928 Mb,平均值為1 729 Mb[19]。然而,在本研究中,基于K-mer分析結果估計刀狀黑黃檀的基因組大小約為706.92 Mb,基因組雜合度為1.26%,重復序列比率為55.74%。這一結果表明,其基因組屬于高雜合、高重復的復雜基因組,基因組大小略高于降香黃檀(Dalbergia odorifera T.Chen)的653.45 Mb[20],這可能是由于物種差異以及較高的基因組雜合度等因素共同導致的[21]。刀狀黑黃檀的基因組高雜合性可能與該物種復雜的分化過程有關,Vatanparast等[22]基于分子證據認為,黃檀屬起源于南美洲,但其只用了ITS片段,結果缺乏有力支撐;崔菲等[23]利用核基因和葉綠體片段構建了系統發育樹,但基部類群也并未明確,暫未確定黃檀屬的明確起源地區與分化趨勢。然而,從基因組水平來解讀物種系統演化的過程將是未來植物分類與系統進化研究發展的趨勢。因此,對于刀狀黑黃檀基因組特征初步分析和評價有利于制定合適的基因組精細組裝策略,選用最新的三代Pacbio測序平臺HiFi模式測序可能對于解決高雜合度在基因組組裝時所產生的不利影響具有較大幫助,結合Hi-C技術和三代測序平臺的全長轉錄組分析,將有助于基因組染色體水平的組裝并獲得更加精確的基因組注釋信息。 SSR分子標記是保護遺傳學中最常用的DNA標記之一,與RFLP、AFLP和RAPD相比,SSR標記具有信息豐富、易于判定、穩定和共顯性的特點[24]。以往研究也發現,在遺傳分析方面,基因組SSR相比于EST-SSR以及SNP具有更高的多態性[25]。刀狀黑黃檀基因組包含了大量的SSR分子標記位點,平均5 442 bp存在1個,且重復類型豐富,變異基序多樣,以雙、三核苷酸重復基序的占比較高。以往研究認為,重復單元長度變化與選擇壓力有關,重復單元長度越長,所受的選擇壓力越大,拷貝數就越少,因此,基因組中長度較短的微衛星變異速率較快,而較長的重復單元變異速率較慢,所以,基因組中低級重復單元較多則表示該物種進化水平較高,而高級重復單元比例高的物種其進化時間短或變異頻率較低[26-27]。 本研究基于NGS測序和初步組裝數據發掘了刀狀黑黃檀基因組SSR候選位點,并結合實驗室篩選,驗證了27個多態性較好,擴增穩定的SSR位點。位點水平的觀測等位基因數量(Na)變異范圍為2~10個,均值為4.333,這也表明篩選驗證的位點具有較好的等位基因變異,其中,超過80%以上的SSR位點具有中高度的多態性信息含量。研究發現,27個SSR位點中僅有8個位點符合哈溫平衡,類似的狀況在生態位較為接近的降香黃檀種群中也有所體現,同樣具有一定比率的SSR位點不符合哈溫平衡[28]。符合哈溫平衡需要滿足隨機交配且足夠大的種群數量,而在資源調查中發現,刀狀黑黃檀的野生種群均為零星分布,且遭遇了嚴重的生境片段化,幾乎沒有連續分布的刀狀黑黃檀純林[4],因此,種群有效個體數量偏低,非隨機交配等因素可能是造成SSR標記位點偏離哈溫平衡的主要原因。 以3個野生種群為對象,對刀狀黑黃檀遺傳多樣性進行了初步分析與評價,結果顯示3個種群的期望雜合度(He)均值為0.504,明顯低于異交植物的平均值0.65[29],通過與其他黃檀屬內植物遺傳多樣性比較發現(表8),3個刀狀黑黃檀野生種群的期望雜合度明顯高于海南分布的降香黃檀(He=0.370)[28],但低于泰國、老撾等地分布的交趾黃檀(Dalbergia cochinchinensis Pierre)(He=0.550 & uHe=0.570)以及柬埔寨和越南等地分布的奧氏黃檀(Dalbergia oliveri Gamble ex Prain)(He=0.730)[30-31]和南美洲巴西熱帶地區分布的巴西黑黃檀(Dalbergia nigra (Vell.) Benth.)(He=0.735 & He=0.682)[32-33]。比較結果表明:中國野生分布的刀狀黑黃檀種群遺傳多樣性處于較低的水平,這也暗示中國分布的刀狀黑黃檀野生資源遭受了明顯的遺傳侵蝕,這可能是由于過去的過度砍伐與土地利用轉變等因素造成的。在IUCN紅色名錄中,交趾黃檀(VU,A1cd)和降香黃檀(VU,A1d)瀕危等級都高于刀狀黑黃檀(NT級別),在中國受威脅高等植物名錄中,刀狀黑黃檀被列為VU級,從野生種群遺傳多樣性水平角度而言,本研究結果也支持將刀狀黑黃檀的瀕危等級提高到與交趾黃檀和降香黃檀相同的級別。盡管刀狀黑黃檀已經被列入國家二級保護植物,但在野外調查研究中發現,土地利用轉變導致的生境片段化也可能影響其野生種群的穩定性及限制種群間的基因交流與種群內的繁殖更新[3]。因此,今后的工作應將全面深入開展遺傳多樣性評估、繁殖生物學及景觀遺傳學等方面的研究作為重點方向,用于制定科學合理的資源保護與種群恢復策略。 表8 黃檀屬不同物種遺傳多樣性比較Table 8 Comparative analysis of genetic diversity in Dalbergia genus 本研究利用NGS技術對刀狀黑黃檀基因組特征進行了分析,結果表明,其基因組大小約為706.92 Mb,雜合度為1.26%,屬于高雜合的復雜基因組,提出了基于PacBio三代測序和Hi-C輔助組裝的精細測序組裝策略。通過實驗發掘并驗證了27個擴增條帶清晰、多態性良好的SSR位點,并初步評估了3個野生刀狀黑黃檀種群的遺傳多樣性,結果表明其具有中等水平的遺傳多樣性和較低的遺傳分化程度。

2.4 遺傳多樣性分析評價


3 討論
3.1 基因組特征與精細組裝策略
3.2 基因組SSR標記特征
3.3 多態性SSR驗證與多樣性評價
3.4 黃檀屬重要樹種遺傳多樣性比較

4 結論