毛仁俊 白朕卿 何志貴 李秋月 吳佳文 陳浩 閻巖



摘 要 為了解析含羞草中黃酮類物質的生物合成途徑,利用Illumina platform 2000TM測序平臺對含羞草葉片進行轉錄組測序,共獲得94 182個Unigene,平均長度為695 bp,N50值為1 159 bp。共有30 243個Unigene注釋于50個GO功能組中,其中“代謝過程”“催化活性”以及“細胞”注釋的Unigene數量較多。KEGG通路分析鑒定出49個Unigene注釋在黃酮生物合成途徑,分別編碼查爾酮合成酶(CHS,12個Unigene)、查爾酮異構酶(CHI,4)、黃烷酮-3-羥化酶(F3H,3)、黃烷酮-3-羥化酶(F3H,9)、黃烷酮-3,5-羥化酶(F3,5H,1)、二氫黃酮醇4-還原酶(DFR,5)、黃酮醇合成酶(FLS,3)以及無色花色素還原酶(LAR,12)基因。從轉錄組數據庫中鑒定出7 382個以單核苷酸和三核苷酸為主要類型的SSR標記。隨機選出10對SSR引物進行擴增,其中有7對能夠擴增出清晰的條帶。
關鍵詞 含羞草; 轉錄組測序; 代謝途徑; 黃酮生物合成
含羞草(Mimosa pudica Linn)是豆科含羞草屬的一種多年生草本或小灌木,主要分布于熱帶和亞熱帶地區,具有較高的觀賞價值。含羞草以全草入藥,在印度、孟加拉國、菲律賓以及中國廣西、云南等少數民族地區是一種常用藥材[1-2]。中國古代醫學典籍《生草藥性備要》、《本草求原》以及《嶺南采藥錄》中均記載了含羞草味甘、性寒,具有清熱解毒、消腫止痛的功效?,F代藥理學研究表明含羞草具有愈合創傷[3]、抗菌消炎[4]、安神止痛[5]、降低血壓[6]以及緩解糖尿病病癥[7]等多種功效。此外,含羞草作為觸感性研究的模式植物,具有顯著的觸感特性,即在受到強光、震動、風吹、碰觸等外界刺激時會迅速閉合葉片、收緊枝條(圖1)。
含羞草中含有兒茶素、槲皮素、豆甾醇以及對香豆酸等黃酮類物質,也含有生物堿、皂苷以及酚酸類化合物[8-9],這些化合物是其發揮藥效功能的物質基礎。Zhang等[1]通過核磁共振氫譜(1H-NMR)、核磁共振碳譜(13C-NMR)以及質譜(MS)的方法從含羞草中分離出異紅草素、異牡荊素及牡荊素等黃酮類物質,并對其活性進行分析。Yuan等[10]利用紅外光譜(IR)、質譜(MS)以及核磁共振(NMR)的方法首次從含羞草中分離出黃酮類化合物6,7,3′,4′-四羥基-8-C-[α-L-鼠李糖-(1→2)]-β-D-葡糖黃酮碳苷和5,7,3′,4′-四羥基-8-C-[β-D-芹菜糖-(1→4)]-β-D-葡糖黃酮碳苷。喬文濤等[11]通過正交分析法對含羞草中黃酮類物質的研究表明,以10倍量的80%乙醇提取,利用大孔吸附樹脂進行分離,再以不同濃度的乙醇進行梯度洗脫,最后經過濃縮得到高濃度的黃酮。
目前,關于含羞草的研究主要集中于藥效功能[1,12]、觸感性效應[13-14]以及生理活性等方面[15-16],而分子水平的研究匱乏,組學研究鮮見報道。早期對于含羞草觸感性的研究已經證明含羞草枝條基部的葉枕是調節其葉片開合的主要器官[17],也鑒定出鉀-L-蘋果酸,鎂鉀反式烏頭酸等與其觸感性相關的化合物[13-14]。然而,近年來觸感性相關研究進展緩慢,制約其發展的重要因素是分子水平研究不足,次生代謝物合成途徑尚未解析。因此,本研究利用轉錄組測序技術對含羞草葉片進行分析,解析黃酮生物合成途徑,注釋途徑中的關鍵酶基因,以期為深入研究黃酮途徑中關鍵酶基因的功能以及進一步開發含羞草藥用價值提供參考。
1 材料與方法
1.1 植物材料
含羞草樣品于2019年6月采集于廣西藥用植物園。試驗樣品經過延安大學生命科學學院閻巖教授鑒定為豆科(Leguminosae)含羞草屬(Mimosa Linn)植物含羞草(Mimosa pudica L.)。采集6株長勢良好且無病蟲害的含羞草植株地上部分,選取葉片用于后續試驗分析。將含羞草葉片分為兩份,一份用錫箔紙包裹后立即置于液氮中速凍,隨后置于超低溫冰箱保存,另一份樣品陰干后用于黃酮類物質的測定。
1.2 總黃酮和兒茶素含量的測定
以亞硝酸鈉-氯化鋁-氫氧化鈉顯色法測定含羞草葉片中總黃酮的含量[18]。精確稱取過40目篩的含羞草葉片粉末1.0 g,置于具塞燒瓶中,加入25 mL體積分數為 70%的乙醇,稱量。加熱回流1 h,冷卻后再次稱量,并用70%乙醇補足質量,過濾后待用。取1 mL樣品溶液置于25 mL容量瓶中,加入6 mL超純水和1 mL 5%的亞硝酸鈉溶液,混勻后靜置6 min,再加入10% 硝酸鋁溶液1 mL,加入10 mL 4.3%氫氧化鈉,用70%乙醇定容,靜置15 min。利用分光光度計(UV-2450,Shimadzu)測定波長510 nm處的吸光度值,以蘆?。兌?98%,Sigma,USA)為對照品制作標準曲線計算總黃酮含量。以香莢蘭素比色法[19]測定兒茶素的含量。取含羞草葉片粉末1.0 g置于具塞燒瓶中,加入25 mL 70%甲醇,稱量。加熱回流0.5 h,放冷后再次稱量,用70%甲醇補足質量,過濾,取續濾液待測。以兒茶素(純度>98%,Sigma,USA)為對照品繪制標準曲線計算兒茶素含量。
1.3 RNA的提取和測序
利用RNeasy Plant Mini試劑盒(Qiagen,Hilden,Germany)提取含羞草葉片的總RNA,提取方法參照試劑盒說明。通過Nanodrop核酸蛋白檢測儀(Thermo Scientific,MA,USA)和Qubit 2.0核酸定量儀(Life Technologies,CA,USA)分析樣品RNA的質量。cDNA文庫的構建參照RNA-Seq文庫構建試劑盒(Illumina,USA)說明書進行。測序工作由北京百邁客生物科技有限公司利用Illumina HiSeq2000TM測序平臺完成。
1.4 轉錄組數據的拼接、組裝及功能注釋
剔除測序結果中的接頭讀序、低質量讀序以及包含ploy-N的讀序,獲得高質量讀序。利用Trinity軟件[20]對序列進行組裝,獲得Unigene和轉錄本(Transcript)。利用Blast2GO進行GO功能注釋[21],利用KOBAS 2.0進行KEGG代謝通路注釋[22]。通過BLASTX將Unigene分別與Nr(NCBI非冗余蛋白數據庫)、Swiss-Prot(Swiss-蛋白序列數據庫)、eggNOG(基因進化譜系:無監督的同源群體)、KEGG(京都基因和基因組百科全書)和KOG數據庫(蛋白直系同源數據庫)進行相似性比對,獲取Unigene的功能注釋和分類信息。
1.5 SSR標記的開發與鑒定
使用MicroSatellite(http://pgrc.ipk-gatersleben.de/misa/)軟件對轉錄組中的序列長度大于1 kb的Unigene進行串聯重復位點檢測。以單核苷酸重復不少于10次、二核苷酸重復不少于6次、三核苷酸、四核苷酸、五核苷酸、六核苷酸不少于4次為標準,統計分析SSR分子標記的種類與數量[23]。從轉錄組開發出的SSR數據庫中隨機選出10對引物進行PCR擴增驗證,引物序列信息見表1。
2 結果與分析
2.1 總黃酮與兒茶素含量測定
利用分光光度法測定含羞草葉片中總黃酮和兒茶素的含量。以不同濃度蘆丁為橫坐標,對應的吸光度值為縱坐標繪制標準曲線,得到總黃酮標準曲線為Y=0.998 5X+0.008 3,R2=0.999 7,線性范圍0~128.9 mg/g(圖2-A)。測定結果表明3份含羞草樣品中總黃酮含量為75.71 mg/g±0.42 mg/g;以同樣方法獲得兒茶素標準曲線為Y=1.178 4X-0.002 4,R2=0.999 8,線性范圍0~1.1 mg/g,3份樣品中兒茶素含量為0.223 mg/g±0.012 mg/g(圖2-B)。
2.2 序列組裝
3個樣本共獲得67 400 933個高質量讀序,對比成功的讀序數量為55 702 861,3個樣本中比對成功的讀序比例均超過82%(表2)。本次測序總數據量為20.08 GB。拼接后共獲得211 405個轉錄本,平均長度為1 178 bp,N50值為1 962 bp。共獲得94 182個Unigene,平均長度為695 bp,N50值為1 159 bp。樣本的平均GC含量為45.86%,Q30值均大于93.35%(表2)。測序錯誤率小于0.1%的堿基數量百分比為92.48%。Unigene長度分布結果表明,長度為1 000~2 000 bp和300~500 bp的Unigene占比較大,分別為37.30%(35 134個)和11.46%(10 795個)。這些指標表明本次測序結果良好,得到大量序列信息,能夠滿足后續生物信息學分析的要求。轉錄組數據已提交至美國國家生物技術信息中心數據庫,獲得序列號PRJNA634474。
2.3 Unigene的功能注釋
以E-value≤e-5且HMMER E-value≤e-10為標準進行BLAST,共獲得47 090個有注釋信息的Unigene。進一步分析表明分別有13 921、30 243、19 427、26 970、29 902、33 103、44 256和46 480個Unigene注釋在COG、GO、KEGG、KOG、Pfam、Swissprot、eggNOG和Nr數據庫中。注釋到長度大于1 kb的Unigene共有15 775個,占所有注釋Unigene的33.5%(表3)。Nr注釋的物種分類表明,比對到木豆(Cajanus cajan)的Unigene最多,為3 207個,占比6.90%,隨后為大豆(Glycine max)3 147個、橡膠樹(Hevea brasiliensis)2 709個、羽扇豆(Lupinus angustifolius)2 608個以及麻風樹(Jatropha curcas)2 144個(圖3)。
2.4 GO功能分類
按照GO功能分類,30 243個Unigene可分入細胞組成(CC)、分子功能(MF)和生物過程(BP)3大類,50個功能組(圖4)。細胞組成中的Unigene可進一步分為15個功能組,其中以“細胞”(3 887個Unigene)和“細胞部分”(13 813)數量較多;分子功能中的Unigene同樣被分入15個功能組,主要注釋在“催化活性”(16 651)和“結合”(14 544);在生物過程中,Unigene被分入20個功能組,以“代謝過程”(15 764)和“細胞過程”(1 416)中的Unigene數量較多(圖4)。
在KOG數據庫中比對Unigene信息,預測 Unigene功能并進行分類統計。結果表明共有94 182個Unigene獲得注釋信息,可分為25類(圖5)。其中“一般功能預測(R)”注釋的Unigene數量最多,為6 252個,占Unigene總數的23.18%。隨后依次為“翻譯后修飾、蛋白質轉換、分子伴侶(O)”(2 979,11.05%)、“信號轉導機制(T)”? ?(2 689,9.97%)、“翻譯-核糖體結構和生物發生(J)”(1 385,5.14%),而“細胞活動性”(N)(9,0.03%)、“細胞外部結構(W)”(89,0.33%)及“核結構(Y)”(113,0.42%)注釋到的Unigene數量較少(圖5)。
2.5 KEGG途徑分類注釋
為進一步研究含羞草的代謝途徑,將獲得功能注釋的Unigene進行KEGG通路分析。結果表明共有9 155個Unigene注釋在“新陳代謝”、“遺傳信息處理”、“環境信息處理”、“細胞過程”以及“有機系統”5個大類、28個小類(圖6)。注釋在“新陳代謝”中的Unigene數量最多,共有3 885個,其中又以“碳代謝(700)、氨基酸生物合成(619)”、“淀粉及糖類代謝(508)”注釋到的Unigene數量較多。共有3 243個Unigene注釋在“遺傳信息處理”,其中有603個Unigene注釋在“核糖體”,數量最多,“內質網蛋白加工”中注釋的Unigene次之(482個)?!碍h境信息處理”中注釋到的Unigene較少,其中“ABC轉運器”途徑僅有92個Unigene(圖6)。
2.6 含羞草黃酮生物合成途徑的解析
黃酮是含羞草中重要的藥效成分,本研究重點關注含羞草黃酮生物合成途徑(ko00941)。注釋分析的結果表明共有9 155個Unigene注釋在136條KEGG途徑,其中49個Unigene注釋在黃酮生物合成途徑,分別編碼查爾酮合成酶(CHS)、查爾酮異構酶(CHI)、黃烷酮-3-羥化酶(F3H)、黃烷酮-3-羥化酶(F3H)、黃烷酮-3,5-羥化酶(F3,5H)、二氫黃酮醇4-還原酶(DFR)、黃酮醇合成酶(FLS)以及無色花色素還原酶(LAR),涵蓋了途徑中所有已知的關鍵酶。其中,編碼CHS和LAR基因的Unigene數量最多,均為12個,而編碼F3,5H的Unigene最少,僅有1個。如圖7所示,苯丙氨酸解氨酶(PAL)催化苯丙氨酸轉化為反式肉桂酸,經過肉桂酸-4-羥化酶(C4H)、對香豆酸-輔酶A連接酶(4CL)的作用將苯丙烷代謝途徑(KEGG 數據庫通路 ID:ko00940)與黃酮生物合成途徑連接。香豆酰輔酶A在CHS的作用下形成查爾酮,隨后在CHI作用下形成柚皮素,再經過F3H的催化形成二氫山奈酚。二氫山奈酚是黃酮合成途徑下游的一個節點物質,能夠在不同酶的作用下生成多種黃酮類物質。例如,二氫山奈酚在F3,5H的作用下生成二氫楊梅素,隨后在LAR的催化下生成兒茶酚。兒茶酚是含羞草中一種主要的黃酮類物質。另外,二氫山奈酚在F3H的作用下生成二氫槲皮素,進而經過FLS的催化生成類黃酮(圖7)。本研究也鑒定出一些Unigene注釋在氮素代謝(ko00910)、萜類骨架的生物合成(ko00900)和苯丙素生物合成(ko00940)等次生代謝途徑中,其中注釋在苯丙素生物合成途徑的Unigene數量最多,為212條(表4)。
2.7 SSR標記的開發
在含羞草轉錄組數據庫中共鑒定出7 382個SSR標記。根據SSR的類型可分為單核苷酸(3 554)、二核苷酸(1 637)、三核苷酸(1 978)、四核苷酸(160)、五核苷酸(30)以及六核苷酸重復(23)。其中單核苷酸A/T(1 692/1 784)和三核苷酸GAA/TTC(172/125)為主要重復類型。從開發出的SSR標記中隨機選取10對引物,并進行PCR擴增驗證,結果如圖8所示,7對引物對能夠擴增出清晰條帶,泳道4的引物擴增出的條帶較暗,而泳道9、10的2對引物未能成功擴增出條帶。
3 討論與結論
轉錄組測序具有分析效率高、覆蓋面廣,且不需要了解物種基因組信息便可獲得大量轉錄水平的數據,在植物代謝途徑解析[24]、SSR標記位點挖掘[25]以及基因功能研究等[26]領域已有廣泛應用。含羞草作為一種非模式植物,轉錄水平研究匱乏,參與黃酮生物合成的相關基因未見報道。本研究利用轉錄組測序技術對含羞草葉片進行測序分析,共獲得20.08 GB數據,豐富了含羞草的轉錄組數據。原始數據經過拼接后得到94 182個Unigene,GO富集分析將Unigene注釋于50個GO功能組。共有9 155個Unigene注釋在136條KEGG代謝通路,其中包括黃酮生物合成、苯丙素生物合成以及萜類骨架生物合成等重要的次生代謝途徑。
利用轉錄組數據開發SSR標記具有廣闊的應用前景。肖亮等[27]從葛根轉錄組中鑒定出25 452個SSR標記,選取28對引物對不同葛根資源進行了遺傳分析,表明不同葛根種質具有很高的遺傳多樣性。梅利那等[28]基于轉錄組分析開發出大量馬尾松的SSR標記。以多態性較高的24對引物對27份馬尾松進行鑒定,發現供試樣品遺傳相似系數為0.32~0.92,UPGMA分析將樣品分為3大類。該研究結果為構建馬尾松遺傳圖譜、繪制指紋圖譜提供了參考。本研究結果表明含羞草具有豐富的SSR位點,以單核苷酸(A/T)和三核苷酸(GAA/TTC)為主要類型。楊曉等[29]對秦艽,徐志軍等[30]對花生SSR的分析也得出相似的結果。開發出的SSR標記能夠為今后研究含羞草遺傳多樣性、種群結構以及分子輔助育種提供參考,也為后續有針對性的開發藥用型、觀賞型含羞草資源提供了分子水平的依據。
黃酮生物合成途徑是植物體內重要的次生代謝途徑之一。利用轉錄組測序能夠高效獲取黃酮合成相關的轉錄本,為解析黃酮合成途徑,分析基因功能提供參考。馬丹丹等[31]利用轉錄組測序技術對羅布麻進行研究,鑒定出查爾酮合成酶、查爾酮異構酶等參與黃酮合成的基因;姚運法等[32]分析黃秋葵花和果莢中的類黃酮代謝途徑,結果表明黃秋葵花是通過F3H、DFR、ANS以及葡萄糖基轉移酶將柚皮素催化生成花青素苷,而黃秋葵果莢則是通過F3,5H將柚皮素催化成為二氫楊梅素,表明黃酮途徑在花和莢果中存在差異。本研究以轉錄組分析為基礎,鑒定出含羞草中黃酮合成途徑中的8個關鍵酶基因CHS、CHI、F3H、F3H、F3,5H、FLS、LAR和DFR的Unigene,初步構建了黃酮生物合成途徑。此外,本研究也鑒定出參與異喹啉生物堿合成、萜類骨架生物合成以及苯丙素生物合成相關的Unigene。該結果與含羞草中含有L-含羞草堿、多酚類物質的情況相符,為解析含羞草中其他藥效物質的合成途徑提供了新的線索。
本研究對含羞草葉片進行了轉錄組測序分析,獲得大量轉錄水平數據。GO富集分析表明Unigene主要注釋在“代謝過程”、“催化活性”以及“細胞”三個功能組。KEGG通路分析鑒定出49個Unigene注釋在黃酮生物合成途徑,編碼該途徑中的查爾酮合成酶、查爾酮異構酶、黃烷酮-3-羥化酶、黃烷酮-3-羥化酶、黃烷酮-3,5-羥化酶、二氫黃酮醇4-還原酶、黃酮醇合成酶以及無色花色素還原酶基因。本研究結果豐富了含羞草的轉錄組數據,構建了黃酮生物合成通路,為深入研究黃酮合成途徑關鍵酶基因的功能以及探索含羞草葉片開合的分子機制奠定了基礎。
參考文獻 Reference:
PANG D D,LIU Y F,SUN Y N,et al.Full-length transcriptome and gene structure analysis of kucha(Camellia sinensis) [J].Acta Agriculturae Boreali-occidentalis Sinica,2021,30(4):563-571.
[27] 肖 亮,尚小紅,曹 升,等.基于轉錄組測序的葛根SSR標記研究與利用[J].西北植物學報,2019,39(1):59-67.
XIAO L,SHANG X H,CAO SH,et al.Utilization of simple sequence repeat(SSR) markers development from a de novo transcriptome assembly in Pueraria thomsonii Benth[J].Acta Botanica Boreali-Occidentalia Sinica,2019,39(1):59-67.
[28] 梅利那,范付華,崔博文,等.基于馬尾松轉錄組的SSR分子標記開發及種質鑒定[J].農業生物技術學報,2017,25(6):991-1002.
MEI L N,FAN F H,CUI B W,et al.Development of SSR molecular markers based on transcriptome sequences and germplasm identification in Masson pine(Pinus massoniana)[J].Journal of Agricultural Biotechnology,2017,?25(6):991-1002.
[29] 楊 曉,馬子豪,馬 婕,等.粗莖秦艽種子萌發過程的轉錄組及關鍵因子分析[J].中草藥,2021,52(1):219-226.
YANG X,MA Z H,MA J,et al.Transcriptome and key factors analysis of Gentiana crasicaulis in seed germination process[J].Chinese Traditional and Herbal Drugs,2021,52(1):219-226.
[30] 徐志軍,趙 勝,徐? 磊,等.基于 RNA-seq 數據的栽培種花生 SSR 位點鑒定和標記開發[J].中國農業科學,2020,53(4):695-706.
XU ZH J,ZHAO SH,XU L,et al.Discovery of microsatellite markers from RNA-seq data in cultivated peanut(Arachis hypogaea)[J].Scientia Agricultura Sinica,2020,53(4):695-706.
[31] 馬丹丹,周佳熠,馬鵬舉,等.羅布麻轉錄組數據的注釋和黃酮合成相關基因的挖掘[J].基因組學與應用生物學,2019,38(10):4580-4587.
MA D D,ZHOU J Y,MA P J,et al.Assembly on the data of Apocynum venetum transcriptome group and mining of genes involved in flavonoid synthesis[J].Genomics and Applied Biology,2019,38(10):4580-4587.
[32] 姚運法,張少平,練冬梅,等.黃秋葵花和果莢轉錄組測序及類黃酮代謝差異表達分析[J].西北植物學報,2018, 38(11):2000-2009.
YAO Y F,ZHANG SH P,LIAN D M,et al.Transcriptome sequencing and differential expression analysis of flavonoid metabolism in flowers and fruits of? okra[J].Acta Botanica Boreali-Occidentalia Sinica,2018,38(11):2000-2009.
Abstract To understand the flavonoid biosynthesis pathway of M.pudica,Illumina platform 2000TM platform was used to assemble the transcriptome of M.pudica leaf,a total of 94 182 unigene were obtained,with average length of 695 bp,the N50 value was 1 159 bp.Totally? of 30 243 unigene were annotated in 50 GO functional classification and dominated by “Metabolic process” “Catalytic activity” and “Cell”.A total of 7 382 SSR were explored from transcriptome database,among which mononucleotide and trinucleotide were the dominant types.Seven out of ten randomly selected primers could produce clear fragments.The results of KEGG analysis indicated that 49 unigene was identified in the flavonoid biosynthesis pathway,and chalcone synthase(CHS,12 unigene),chalcone isomerase(CHI,4),flavanone-3-hydroxylase(F3H,3),flavanone-3-hydroxylase(F3H,9),flavanone-3,5-hydroxylase(F3,5H,1),flavanone 4-reductase(DFR,5),flavonol synthase(FLS,3),and leucoanthocyanidin reductase(LAR,12) were encoded.
Key words Mimosa pudica Linn; Transcriptome sequencing; Metabolic pathway; Flavonoid biosynthesis