向如雙 段寶忠 孫偉 宋馳 王艷 Atia tul Wahab 孟祥霄
臘腸樹(Cassia fistulaL.)屬于豆科決明屬植物,在我國南部及西南部地區有種植[1],它原產于印度,廣泛分布于世界各地[2],是一種具有較高的藥用、觀賞與工業經濟價值的天然藥用植物[1]。 臘腸樹在許多傳統醫藥系統中被使用,包括:印度采用的阿育吠陀體系、我國采用的傳統醫藥體系和巴基斯坦采用的希臘阿拉伯體系[3-4],臘腸樹的果實、種子、樹皮、樹根、葉和花等部位均可入藥,在印度,它被用于治療肝臟疾病、糖尿病、結核病和泌尿道感染等[1,5-6],在巴基斯坦它被用于治療便秘、感冒、發燒[7],在我國,它被用于通便與抗菌[1]。
現代研究表明,因臘腸樹不同部位均富含大量活性化學物質,且這些活性化學物質大多數尚未被開發,它整體的藥理作用不明確[8],所以目前國內外大多數研究主要集中于化學成分研究[3,9-10]和藥理作用研究[6,11-12]。 但是,在植物分類領域學術界對決明屬(Cassia)植物種類的劃分一直存在著較大爭議[13-15]。 近年來,隨著分子生物學領域研究的發展,葉綠體基因組研究越來越受到廣大科研人員的青睞,葉綠體基因組分析方法的出現為植物物種鑒定和系統發育研究提供了可靠手段[16],基于葉綠體基因組的系統發育研究已為毛重樓[17]、人參[18]、虎杖[19]等藥用植物更好地發揮其應用價值提供了理論基礎,由于臘腸樹分子生物學領域方面的研究進程緩慢,極大地限制了臘腸樹的開發與利用。
鑒于此,本研究使用Illumina 測序技術及生物信息學方法對臘腸樹進行了葉綠體基因組特征和系統發育分析,以期從基因組學層面為決明屬植物分類提供依據,并為臘腸樹資源的有效開發、保護和利用奠定理論與數據基礎。
樣品的新鮮葉片采自廣東省云浮市云安區產業轉移工業園靄霖花園路邊(N23°2′5″, E112°10′52″),經昆明采智生物技術有限公司鑒定為臘腸樹C.fistula,憑證標本(標本號:GD20220115)存放于中國中醫科學院中藥研究所國家中藥基因庫。
葉片基因組總DNA 使用天根植物基因組DNA提取試劑盒(DP305)提取,總DNA 檢測合格后,通過安諾優達基因科技有限公司高通量測序平臺Illumina NovaSeq(Illumina,美國)進行文庫構建與測序[20]。 采用 SOAPnuke[21](版本:1.3.0)軟件對原始數據進行過濾,原始測序數據已上傳至NCBI 序列讀取檔案(SRA,登錄號:SRR18556254)。
采用GetOrganelle[22](版本:1.7.5;參數:-R 10)軟件對過濾后的數據進行基因組拼接;采用Bandage[23](版本:0.8.1)軟件手動解環得到完整的葉綠體基因組全序列;然后,以布魯斯特決明C.brewsteri(F.Muell.) Benth.(序列號:NC_047376)為參考序列,采用CPGAVAS2[24](網址:http:/ /47.96.249.172:16019/analyzer/home)對葉綠體全基因組序列進行注釋,組裝、注釋的葉綠體基因組已上傳至GenBank(登錄號:ON099431);采用在線工具Chloroplot ( 網 址: https:/ /irscope.shinyapps.io/Chloroplot/)繪制葉綠體全基因組的物理圖譜。
采用Codon W[25](版本:1.4.4)軟件對葉綠體全基因組密碼子偏好性進行分析,統計同義密碼子相對使用度(Relative Synonymous Codon Usage,RSCU) 的值。 采用 REPuter[26](網址: https:/ /bibiserv.cebitec.uni-bielefeld.de/reputer)在線工具(參數:minimal repeat size 30 bp; Hamming Distance 3; Maximum Computed Repeats 5000.)分析葉綠體基因組中的散在長重復序列片段。 簡單重復序列(simple sequence repeats, SSR)分析采用MISA[27](版本:1.0;參數:默認;unit size:1-10 2-5 3-4 4-3 5-3 6-3)軟件分析。
從NCBI 下載了與臘腸樹同屬的布魯斯特決明C.brewsteri(NC_047376)、美麗決明Senna spectabilis(DC.) H.S.Irwin et Barneby.(NC_054185)、山扁豆Chamaecrista mimosoidesStandl.(NC_047400)、望江南S.occidentalis(Linnaeus) Link.(NC_038222)、鐵刀木S.siamea(Lamarck)H.S.Irwin & Barneby.(MN525772)和決明S.tora(Linnaeus) Roxburgh.(NC_030193)的葉綠體基因組,使用Perl 中的SVG模塊,可視化了反向重復區(inverted repeat regions,IRa 和 IRb)、大單拷貝區(large single copy, LSC)和小單拷貝區(small single copy, SSC)區域的邊界差異信息。 并采用mVISTA 對其進行全基因組比對分析。
為探討臘腸樹C.fistula的系統發育位置,本研究從NCBI 下載了7 條葉綠體基因組序列(6 條為近緣物種葉綠體基因組序列,1 條為外類群)構建最大似然(maximum likelihood, ML)系統發育樹。 采用MAFFT(版本:7.471)軟件[28]對葉綠體基因組序列進行比對;采用RAxML(版本:8.2.12;核苷酸模型:GTRGAMMA;重復迭代次數:1000)軟件[29]使用ML構建系統發育樹。
臘腸樹C.fistula葉綠體基因組是全長為161,724 bp 的四分體結構,包括一對反向重復序列(IRA和IRB,26,032 bp)、小單拷貝區(SSC, 18,616 bp)和大單拷貝區(LSC, 91,044 bp)(圖1 和表1),葉綠體基因組總GC 含量為36.1%。 在決明屬已發布葉綠體基因組的物種中除了鐵刀木S.siamea和山扁豆Ch.mimosoides葉綠體全基因組序列長度較短外,其余物種的葉綠體基因組的序列長度特征均與臘腸樹具有相似性(表1)。

表1 決明屬葉綠體基因組的序列特征列表

圖1 臘腸樹葉綠體基因組圖譜
經CPGAVAS2 注釋結果顯示,其葉綠體基因組共包含128 個基因,其中83 個蛋白質編碼基因,37個 tRNA 基因和8 個 rRNA 基因(表 2)。 這些基因主要分為四類:與光合作用相關的基因、自我復制相關的基因、功能未知的基因,以及成熟酶(matK)、蛋白酶(clpP)等其他基因。 在這些基因中,共有17個基因是雙拷貝基因,包括6 個蛋白質編碼基因,7個tRNA 編碼基因和4 個rRNA 編碼基因。 決明屬已發布葉綠體基因組的物種中,美麗決明S.spectabilis和鐵刀木S.siamea注釋基因較少,其余物種的葉綠體基因組的基因個數與臘腸樹具有相似性(表3)。

表2 臘腸樹葉綠體基因組基因列表

表3 決明屬葉綠體基因組的基因個數統計表
在臘腸樹葉綠體基因組中,共有62 條散在長重復序列,包括4 種類型,正向重復序列(forward,F)28 條、回文重復序列(palindromic,P)25 條、反向重復序列(reverse,R) 7 條、互補重復序列(complement,C)2 條。 四種類型片段的長度范圍均在30 ~52 bp 長度,而且長度為30 bp 的長重復序列數量最多,包括正向重復序列10 條,回文重復序列9 條,反向重復序列5 條(圖2)。 在臘腸樹葉綠體基因組中共檢測到113 個SSRs 位點,SSRs由77 個單核苷酸、15 個二核苷酸、10 個三核苷酸、7 個四核苷酸、4 個五核苷酸組成,SSR 的類型主要以 A/T 為主(77 個),而且大多數 SSRs 以 A或T 結尾(圖3)。 SSR 位點在很大程度上分布在基因間隔區(intergenic spacer, IGS) 區(78 個,68%),其次是編碼區(19 個,17%)和內含子區(16 個,15%)(圖 3)。

圖2 臘腸樹葉綠體基因組長序列重復類型

圖3 臘腸樹葉綠體組SSR 統計及SSR 位點分布
本研究計算了臘腸樹葉綠體基因組密碼子RSCU 的值,統計結果顯示(圖4),檢測到共有20 種氨基酸被編碼,最常見的氨基酸是Leu(亮氨酸)、Arg(精氨酸)和Ser(絲氨酸),AUG 是20 種編碼氨基酸中最常用的密碼子(RSCU 值為3)。 同時,頻率最低的密碼子是 AGC(RSCU 值為 0.3509)。RSCU 值>1 的密碼子數量為32 個,其中以 A 結尾的有13 個,以U(T)結尾的有19 個,表明臘腸樹葉綠體基因組主要偏好以A 和U(T)結尾的密碼子。

圖4 臘腸樹葉綠體基因組密碼子RSCU 分布情況
臘腸樹與六個同屬物種(布魯斯特決明C.brewsteri、山扁豆Ch.mimosoides、望江南S.occidentalis、鐵刀木S.siamea、美麗決明S.spectabilis和決明S.tora)的葉綠體基因組的IR 邊界及基因分布見圖5。結果顯示,臘腸樹與六個同屬物種的葉綠體基因組共存在 4 個邊界,分別是 LSC/IRB、IRB/SSC、SSC/IRA 和IRA/LSC 邊界。 7 個決明屬物種的LSC/IRB邊界較為保守,LSC/IRB 邊界均位于rps19 基因內,且該基因跨越IRB 區域的長度范圍在103 ~109 bp內。 所有物種在IRB/SSC 處邊界存在較大分化,僅有布魯斯特決明和鐵刀木的ndhF基因位于該邊界區域,其余物種的該基因均位于SSC 區域。 SSC/IRA 邊界除了望江南,其余物種的ycf1 基因均位于該邊界。 所有物種的IRA/LSC 邊界均與基因trnH存在著0 ~12 bp 的間隙。

圖5 臘腸樹葉綠體基因組的大單拷貝、小單拷貝和反向重復區邊界區域的比較分析
本研究嘗試將臘腸樹與NCBI 中上述六個同屬物種的葉綠體基因組的物種進行比較,因鐵刀木物種的psaB、psaA和ycf3 等多個基因或基因間隔區大概缺失達5200 bp,因此,本研究以組裝的臘腸樹葉綠體基因組為參照,將臘腸樹與其余5 個同屬物種進行比較。 結果顯示(圖6),6 條葉綠體基因組序列中LSC 區序列變異明顯大于SSC 區,非編碼區域序列變異高于編碼區域。 結果顯示,絕大多數基因的相似度均在90%以上,變異較大的基因有rpoc2、ycf1 和ndhF等由圖可見。 六個決明屬植物的基因間區,如:trnK-UUU-rps16、rps16-trnQ-UGG、trnSGCU-trnG-UCC、trnC-GCA-petN、trnT-UGU-trnLUAA、ndhC-trnV-UAC、rps8-rp114、ycf2-trnL-CAA、trnN-GUU-ndhF等,其基因間區變異均大于基因區。
為了確定臘腸樹的系統發育關系,使用8 條葉綠體基因組序列(包括1 條豆科任豆屬的任豆Zenia insignisChun.序列為外類群,7 條豆科決明屬序列),構建ML 系統發育樹。 結果顯示(圖7),各節點的自展支持率均為100%,表明聚類結果的可靠性較高。 7 個決明屬物種被聚為3 個支,美麗決明S.spectabilis、 望 江 南S.occidentalis、 鐵 刀 木S.siamea和決明S.tora聚為一支,臘腸樹C.fistula與布魯斯特決明C.brewsteri聚為一支,山扁豆Ch.mimosoide單獨聚為一支,且臘腸樹親緣關系與布魯斯特決明C.brewsteri的親緣關系最近。

圖7 基于葉綠體全基因組序列構建ML 系統進化樹
植物葉綠體基因組在基因結構、基因組成等方面具有一定的保守性,進化速度相對適中[30-32],為植物物種鑒定、系統進化、遺傳多樣性提供了有價值的信息[33]。 本研究完成了葉綠體基因組組裝、注釋、密碼子的偏好性、簡單重復序列及系統發育分析等。 葉綠體全基因組分析結果顯示,臘腸樹綠體基因組全長為161,724 bp,有典型的環狀DNA 雙鏈結構,葉綠體基因組結構、基因功能分類與已發表的決明屬物種一致[34];重復序列分析結果顯示,臘腸樹葉綠體基因組中共檢測到113 個SSRs 位點,并且SSR 位點在很大程度上分布在基因間隔區,這與苦馬豆[Sphaerophysa salsula(Pall.) DC.][35]、苦參(Sophora flavescensAlt.)[36]和黃丹木姜子[Litsea elongata(Wall.ex Nees) Benth.et Hook.f.][37]等眾多植物分析結果一致,臘腸樹葉綠體基因組中檢測到的SSRs 位點可為決明屬植物分子標記開發提供理論依據。 葉綠體基因組序列變異分析結果顯示,非編碼區域序列變異高于編碼區域,變異較大的基因位點(rpoc2、ycf1、ndhF)和基因間區位點(trnK-UUU-rps16、rps16-trnQ-UGG、trnS-GCU-trnG-UCC等),為決明屬植物的分子鑒定提供了位點資源。
在之前的研究中, 學術界對決明亞族(Cassiinae)植物種類的劃分、學名的應用、屬下分類系統等方面一直存在著較大爭議[13-15]。 決明屬(Cassia)是由 Linnaeus 首次發表,1964 年 Hutch 使用了該屬名稱[13]。 Irwin 和Barneby[15,38]將其提升為決明亞族(Cassiinae),其下拆分成3 個屬,包括決明屬(Cassia)、山扁豆屬(Chamaecrista)和番瀉決明屬(Senna)。 而1988 版《中國植物志》[39]中決明族只分為長角豆屬(Ceratonia)、任豆屬(Zenia)和決明屬(Cassia)3 個屬,記載決明屬的物種有22 種[14],并且有些決明屬的物種在中國植物志上搜索顯示學名、拉丁名已被修訂,如Cassia siamea、Cassia spectabilis、Cassia tora拉丁名已修訂為Senna siamea、Senna spectabilis、Senna tora,而含羞草決明Cassiamimosoides的學名、拉丁名分別被修訂為山扁豆Chamaecrista mimosoides。 但在 2010 版的 Flora of China[40]中,豆科決明亞族下有決明屬、番瀉決明屬、長角豆屬和山扁豆屬4 個屬[14]。 本研究結果表明,基于葉綠體基因組的ML 樹顯示,7 個物種被聚為3 支,美麗決明S.spectabilis、望江南S.occidentalis、鐵刀木S.siamea和決明S.tora聚為一支,臘腸樹C.fistula與布魯斯特決明C.brewsteri聚為一支,山扁豆Ch.mimosoide單獨聚為一支。 從葉綠體基因組系統發育的角度來看,本研究支持2010 版的 Flora of China 的決明亞族植物種類的劃分結論[40],臘腸樹C.fistula歸為決明屬(Cassia), 美麗決明S.spectabilis、望江南S.occidentalis、鐵刀木S.siamea和決明S.tora歸為番瀉決明屬(Senna),山扁豆Ch.mimosoide應歸為山扁豆屬(Chamaecrista)。 關于決明亞族植物種類的劃分存在的問題,仍需要后續更多分子生物學和形態學的研究去提供證據。本研究的臘腸樹的葉綠體基因組特征和系統發育分析可為決明亞族植物種類的劃分提供重要的參考依據,對臘腸樹資源的有效開發、保護和利用奠定理論與數據基礎。