







摘要:【目的】為豐富血葉蘭轉錄組數據信息,以期幫助蘭科植物的功能基因挖掘。【方法】本試驗通過Illumina測序平臺對兩種葉色血葉蘭的葉片進行轉錄組測序和生物信息學分析。【結果】兩種葉色血葉蘭樣品各三個重復總計產出37.23 Gb Clean reads,共獲得97 089條Unigene序列,平均長度 1 038.76 bp,N50達到1 892 bp。將得到的 Unigene和8個公共數據庫進行比較,31 095個 Unigene獲得注釋。其中29 730條Unigene在NR數據庫中獲得注釋,與鐵皮石斛的同源序列最多。與 GO數據庫進行比對,23 871條Unigene在細胞組分、生物進程和分子功能三大類別中獲得注釋。通過與 KOG數據庫的比對,14 791個 Unigene獲得注釋,這些基因的功能主要集中在三大功能類別:普通功能預測、蛋白的翻譯后修飾以及信號轉導。在兩個品系間的差異表達基因共5 791個。與暗紫色葉片相比,綠色葉片中3 120個基因的表達量升高,2 671個基因表達量降低。差異表達基因的KEGG富集結果表明,最顯著性富集的是植物與病原菌相互作用,其次是植物MAPK信號途徑和植物激素信號轉導途徑、光合作用-天線蛋白、還有苯丙烷類代謝途徑、類黃酮代謝途徑、卟啉和葉綠素代謝途徑。【結論】研究結果將為深入發掘血葉蘭藥用植物的功能基因研究奠定一定的基礎。
關鍵詞:血葉蘭;轉錄組;基因注釋;葉色
中圖分類號:S682.31" " " " " " " " " " "文獻標識碼:A" " " " " " " " " " " "文章編號:2095-5774(2024)04-0285-11
Transcriptome Analysis of Ludisia discolor with two Leaf Colors
Wu Yingxiang1,Yang Junjie2,ChenYunyun3,Cai Kunxiu2,Chen Xiande3,Zhang Tianxiang2,
Wu Sihao2,Fu Wenqun3*,Zheng Tao2*
(1 Qiangyuan Agricultural Science and Technology Extension Service Center,Qingyuan,Guangdong 511518,China;
2 Fujian Institute of Tropical Crops,Fujian Zhangzhou,363001,China;
3 Minnan Normal University,School of Biological Science and Biotechnology,Zhangzhou,Fujian 363000,China)
Abstract:【Objective】To enrich transcriptome data of Ludisia discolor in order to assist in its functional gene mining.【Method】Leaves of two kinds of L.discolor cultivars with different leaf colors were sequenced by Illumina Hiseq 2 000 and further analyzed by bioinformatics.【Result】37.23 Gb clean reads were generated from three replicates of L. discolor with two leaf colors,which was the de novo assembled into 97 089 unigenes with a mean length of 1 038.76bp,N50 of 1 892 bp. 31 095 unigenes were annotated against 8 prominent bioinformatics databases. Within the NR database,a total of 29 730 unigenes were primarily annotated from L. discolor;with the most homologous sequences to Dendrobium officinale. 23 871 unigenes were annotated in GO database and were divided into three categories:cellular component,biological process and molecular function. There were 14 791 unigenes annotated in KOG function categories,which mainly focused on general function prediction,posttranslational modification and signal transduction. A total of 5 791 DEGs were screened out from‘XGH’vs‘BX’. Compared with the dark-purple leaves,the expression of 3 120 genes increased while the expression of 2 671 genes decreased in green leaves. KEGG enrichment analysis showed that the differentially expressed genes were most significantly enriched in plant-pathogen interaction;the secondary enriched was MAPK signaling pathway and plant hormone signal transduction,photosynthesis-antenna protein,and the other pathway including phenylpropanoid biosynthesis,flavonoid biosynthesis,porphyrin and chlorophyll metabolism. 【Conclusion】This investigation furnished scientific support for study of functional genes in L. discolor as medicinal plant.
Key words:Ludisia discolor L.;Transcriptome;Gene annotation;Leaf color
血葉蘭(Ludisia discolor(Ker-Gawl.)A. Rich.)
為蘭科(Orchidaceae)血葉蘭屬(Ludisia discolor)的多年生常綠草本植物,又名石蠶或石上藕或公石松,具有觀賞價值和藥用價值,是閩南民間珍稀中草藥。在中國的海南、福建和越南、馬來西亞等國家地區都有種植[1-2]。血葉蘭‘西貢紅’是目前市場主要流通的品種,屬于原生種,葉片顏色為暗紫色。前期人工選育過程中獲得了一株穩定遺傳的綠葉突變體單株,經組培擴繁后形成株系,命名為‘碧璽’,該株系葉片從一開始就表現淺綠,且整個生長期都保持這一特性,綠葉是其重要的觀賞特征。目前關于血葉蘭的研究主要集中在藥效[3-5]、藥用成分[6-8]、觀賞價值分析[9]、組織培養[10-13]、形態結構和遺傳多樣性[14]、黃酮類合成功能基因[15]等方面,鮮有人對血葉蘭的葉色進行研究,制約了血葉蘭不同葉色觀賞品種的選育。
轉錄組RNA-Seq測序技術能夠分析植物整體基因的轉錄特征,是研究彩葉植物呈色機制的一種有效手段,此技術可以分析植物不同葉色的差異表達基因進而挖掘關鍵候選基因[16]。陳燕等[17]通過RNA-seq測序技術,篩選出10個與類黃酮相關的基因,為研究杜梨葉色分子機制提供理論依據。武悅等[18]通過RNA-seq測序技術對瞿麥幼苗葉片的轉錄本進行測序,可見RNA-seq測序已廣泛應用于植物葉片呈色機制的分子機制研究中。由于目前關于血葉蘭葉片顏色變化的研究尚未見報道,有必要從分子層面探究血葉蘭葉片的呈色機制,為其不同葉色品種選育奠定基礎。鑒于此,本研究以暗紫色品系‘西貢紅’和綠葉突變體‘碧璽’的葉片為材料,采用RNA-Seq測序技術構建轉錄組數據庫,將得到的Unigene與8個公共數據庫比對后進行生物信息學分析,分析、確定葉色變化過程中的差異表達基因,以期為血葉蘭呈色機制的研究提供參考。
1 材料與方法
1.1 試驗材料
2023年3月上旬于福建省熱帶作物科學研究所血葉蘭種質資源圃中,采集移栽6個月左右健康的血葉蘭暗紫色‘西貢紅’和綠葉突變體‘碧璽’的葉片,每種重復3次,用錫箔紙包住葉片,快速放于液氮中保存,用于總RNA提取。
1.2 試驗方法
1.2.1總RNA提取及質量檢測
按照 Trizol RNA 試劑盒(Promega,USA)分別提取‘西貢紅’(XGH)和‘碧璽’(BX)葉片組織的總RNA,并利用超微量分光光度計檢測樣品中RNA的質量、含量和完整性。
1.2.2 cDNA文庫構建
以符合條件的 mRNA為模板,采用6-堿基隨機引物,AMPure XP bead核酸純化試劑盒,PCR擴增等方法,制備 cDNA庫。
1.2.3 文庫質控及測序
利用q-PCR技術,精確測定 cDNA文庫中的有效濃度(文庫有效濃度gt;2 nmol/L)。庫檢查通過后,委托北京百邁客生物科技有限公司利用 Illumina技術對其進行RNA-seq高通量測序。
1.2.4 De novo拼接和注釋
通過篩選和測序,可以獲取Raw reads,獲得Clean reads,De novo拼接是在 Trinity軟件[35]中執行的。利用 NCBI數據庫中的 BLAST將拼接完成的Unigene與NCBI無冗余蛋白質序列數據庫NR(NCBI Non-redundant Database)、Swiss-Prot數據庫、 KOG(euKaryotic Orthologous Groups)數據庫和 KEGG(Kyotoencyclopedia of Genes and Genomes)數據庫、COG (Clusters of Orthologous Groups of proteins)(E≤1e-5)數據庫、TrEMBL數據庫進行比對和注釋。利用 HMMER3.0package與Protein family(Pfam)進行比對(hmmscane-value≤1e-2)。利用Blast2go(http://www.blast2go.com/b2ghome)軟件和WEGO軟件進行GO(Gene Ontology)注釋和分類統計。
1.2.5差異基因表達分析
利用高通量測序技術對‘西貢紅’和‘碧璽’6個樣品葉片的轉錄組數據進行比較分析。使用DESeq R軟件包(1.10.1)對血葉蘭‘西貢紅’和‘碧璽’葉片進行組間的差異表達分析,用FPKM(fragments per kilobase of transcript per million fragments mapped)值表示基因的表達量,以兩組間差異倍數(fold change,FC)的對數值的絕對值即| log2FC |≥1,且FDR(1 discovery rate,FDR)lt;0.05作為篩選標準,滿足此篩選標準的基因即為差異表達基因(differential gene expression,DEGs)。將篩選到的DEGs分別在KEGG數據庫進行比對,對DEGs進行KEGG代謝通路富集分析。
2 結果與分析
2.1 血葉蘭轉錄組測序
為了提高物種低表達水平轉錄本的測序準確性,對血葉蘭的6份樣品進行轉錄組測序,獲得平均 37.23 Gb Clean reads,各樣品Clean Data均達到5.81 Gb,Q20、Q30的堿基百分比分別在97%、93%以上,GC堿基含量介于45.95%~46.91%(表1),研究結果顯示,基于高通量測序技術的血葉蘭轉錄組測序數據具有很高的質量,Clean reads質量合格,可以繼續進行后續的基因拼接。
2.2 數據拼接、組裝與注釋
由于血葉蘭沒有可供參考的基因組數據,通過Trinity軟件對獲取的測序數據進行Denovo組裝,總共獲得了254 585條轉錄本,這些轉錄本的總序列長度達343 971 647 bp,平均每條轉錄本的長度為1 351.11 bp。其中,N50值為2 145 bp。進一步地,從這些轉錄本中提取了97 089個Unigene片段,它們的總長度為100 851 717 bp,平均每個Unigene的長度為1 038.76 bp。Unigene的N50值為1 892 bp,這表明超過50%的Unigene長度超過了這一標準,說明數據組裝效果較好(表2)。
通過BLAST將Unigene與8個公共數據庫進行比對,共31 095 Unigene獲得注釋,占全部 Unigene的30.03%,不同數據庫注釋數量差別較大(表3)。獲得TrEMBL數據庫注釋的Unigene有29 786條,所占比例(30.68%)最大,其它注釋所占比例從大到小分別是 NR數據庫(30.62%)、 GO數據庫(24.59%)、 KEGG數據庫(18.19%)、Pfam數據庫(16.07%)、Pfam Swiss-Prot數據庫(15.57%)、KOG數據庫(15.23%)。獲得COG數據庫注釋的Unigene最少,只有5 274條。Unigene注釋結果顯示,長度為300~1 000 bp的有9 903條,占10.20%;長度大于1 000 bp 的Unigene18 012條,占18.55%(表3)。
2.3 血葉蘭Unigene的NR分類
將血葉蘭的Unigene與NR數據庫進行比對,29 730條獲得注釋,與鐵皮石斛(Dendrobium catenatum)的同源序列最多,注釋比占38.06%;其次為小蘭嶼蝴蝶蘭(Phalaenopsis equestris)注釋比為12.75%;深圳擬蘭(Apostasia shenzhenica)注釋比為5.82%;其他有一定匹配度的物種分別是葡萄(Vitis vinifera),占比 0.53%;玉米(Zea mays),占比2.19%;土瓶草(Cephalotus follicularis),占比1.23%;油棕(Elaeis guineensis),占比0.95%;鳳梨(Ananas comosus),占比0.94%;扁桃(Prunus dulcis),占比0.86%;紅車軸草(Trifolium pratense),占比0.85%;其他物種占比34.12%(圖 1)。
2.4血葉蘭Unigene 的GO分類
根據NR數據庫中的注釋結果,再利用WEGO,對所有比對的 23 871條Unigene按功能分類,將其劃分為3大類41種功能組,即:細胞組分(18 890條)、分子功能(27 660條)和生物進程(36 905條)。細胞組分類別中包含4種功能組, 其中定位于細胞質基因比例為34.39% (6 496條)、定位于細胞器和細胞膜基因占比56.95% (10 757條)。在分子功能的15種功能組中,最多的是具有結合功能的14 370種(占比51.95%),具有催化作用的有10 716種(占比38.74%)。在生物進程類別的22種功能性組中,12 972條(占比35.15%)屬于代謝過程,13 386條(占比36.27%)屬于細胞進程(圖 2)。
2.5 血葉蘭Unigene的KOG分類
通過與KOG數據庫的比對,發現了14,791條 Unigene,共注釋25種功能分類,高豐富度的基因類別為普通功能預測,占40.59%(6 004條)。其次是翻譯后修飾、蛋白轉運類群及信號傳導機制類群,分別占 8.35%(1 235條)和 6.84%
(1 012條)。而 Unigene中僅有極少數的細胞活性被注釋(圖 3)。
2.6 差異表達基因的鑒定
為了尋找血葉蘭葉片呈色相關的候選基因,對測序后得到的基因進行差異表達分析。結果表明,紅色葉片‘西貢紅’和綠色葉片‘碧璽’品系間共有5,791個差異表達基因(Padjlt; 0.05,| log2Fold Change | gt;1)。其中,與紅色葉片‘西貢紅’相比,綠色葉片‘碧璽’中表達量增加的基因有3 120個,而表達量降低的基因有
2 671個 (圖4a,4b)。
2.7差異表達基因的KEGG富集分析
將血葉蘭unigene 與KEGG 數據庫進行比對,共有18 341條 unigene 參與了136個代謝通路,占總unigene的18.89%,分為五大代謝通路類型,分別是細胞進程、新陳代謝、生物系統、基因信息進程、環境信息進程,參與新陳代謝途徑unigene的數量最多,其次為基因信息進程代謝途徑。本研究集中葉色形成相關因素富集分析,其中,共有64條unigene參與黃酮類化合物生物合成代謝通路,有58條unigene 參與胡蘿卜素生物合成代謝通路,有14條unigene參與黃酮和黃酮醇生物合成代謝通路,有213條unigene參與苯丙烷生物合成代謝通路,有110條unigene參與光合作用通路,有43條unigene參與光合作用-天線蛋白通路,有64條unigene參與卟啉和葉綠素代謝通路。
差異表達基因的 KEGG 富集分析能夠揭示相關代謝途徑的變化。紅色葉片‘西貢紅’和綠色葉片‘碧璽’差異表達的基因中共有123條被注釋到KEGG中,本研究中只列舉富集顯著性最可靠的前20個通路(圖5)。最顯著性富集的是植物與病原菌相互作用(plant-pathogen interaction),其次是植物MAPK信號途徑(mitogen-activated protein kinase,MAPK)和植物激素信號轉導途徑(plant hormone signal transduction),光合作用-天線蛋白,還有苯丙烷類代謝途徑、類黃酮代謝途徑、卟啉和葉綠素代謝途徑等。
3 討論
我們利用 llumina高通量測序方法,共檢測到了血葉蘭97 089個 Unigene,平均長度1 038.76 bp;
并通過對 Unigene全長、GC堿基含量、Q20及Q30分析,測序結果相對較好。Unigene的注釋資料有助于研究血葉蘭屬的基因功能。雖然還有部分血葉蘭Unigene沒有被完全解析,但是其功能基因鑒定和分子標記位點信息,也為進一步研究其基因資源和類群的遺傳多樣性奠定了基礎。經 NR數據庫比對,29 730條Unigenes獲得注釋,與鐵皮石斛匹配度較高,究其原因可能是二者同屬蘭科蘭亞科。與陳育青等[15]的測序結果有所差異,已報道的研究結果公石松(血葉蘭的別名)與油棕的同源性較高,本研究中的測序結果與油棕只有0.95%的同源性,造成這一差異的原因,可能是品種不同。蘭科物種基因組信息匱乏,公共基因組數據庫中缺乏完整的信息,且未發現新的獨特的功能信息,這是導致該物種與其它物種基因組不完全吻合的重要因素。
葉色呈色是一個十分復雜的生物學過程,它不僅受環境因子的影響,而且還與植物自身的色素合成代謝有關。近年來,高通量轉錄組測序技術的發展,為了解植物葉片呈色機理的研究提供了幫助[19]。但大多數蘭花物種的遺傳信息尚不清楚。轉錄組學是指一個器官某一具體生長階段中全部轉錄本的總和,它可以從某種意義上彌補基因組信息缺失的缺陷,從而可以從整體水平上解析基因之間的分子調控網絡及調節機制[20-21],綠色突變體‘碧璽’是研究葉色形成機制的良好材料。本研究中,通過轉錄組分析鑒定出5,791個在暗紫色品系‘西貢紅’和綠色突變體‘碧璽’葉片中差異表達的基因,通過對這些差異表達基因的篩選,發現差異表達基因被顯著富集到植物與病原菌相互作用,以及植物MAPK信號途徑、光合作用-天線蛋白、苯丙烷生物合成途徑、類黃酮合成途徑、卟啉和葉綠素代謝途徑等,為解析血葉蘭葉色形成分子機制提供了一定的科學依據。
參考文獻:
[1]趙國平,戴慎,陳仁壽. 中藥大辭典(上冊)[M]. 上海:上海科學技術出版社,2006:1281-1282.
[2]沈賢娟,黃澤豪. 民間藥公石松的文獻考證[J]. 中藥材,2015,38(3):629-631.
[3]石鶴坤,邱韻玲,陳開杰,等. 公石松抗運動性疲勞的活性部位篩選[J]. 中國藥房,2016,27(10):1343-1346.
[4]石鶴坤,陳開杰,林小鳳,等. 公石松水提液對小鼠運動能力與血清乳酸、尿素氮及肝糖原的影響[J]. 藥學實踐雜志,2016,34(5):399-402.
[5]李秋靜,陳育青,林美珍,等.公石松提取液抗氧化研究[J].中國中醫藥現代遠程教育,2021,19(10):156-159.
[6]李秋靜,謝偉容,黃建軍,等.響應面法提取公石松總黃酮工藝優化研究[J].中國藥師,2018,21(7):1141-1145.
[7]盧彩燕. 血葉蘭與金線蓮的糖分組成及含量比較[J].東南園藝,2019,7(4):16-19.
[8]沈穎,陳惠琴,吳妃,等.血葉蘭化學成分及其生物活性研究[J/OL]. 廣西植物,[2023-12-27],https://link.cnki.net/urlid/45.1134.q.20231225.1043.004.
[9]何叡穎. 錦葉玉花血葉蘭[J]. 中國花卉盆景,2009(4):9.
[10]蘇建睦,朱惠,黃肇宇,等. 血葉蘭叢生芽增殖及生根研究[J]. 玉林師范學院學報,2017,38(5):90‐92,104.
[11]蔡坤秀,盧彩燕,鄭濤.公石松組培初代培養研究[J].福建熱作科技,2018,43(3):26-27.
[12]朱育端.公石松組培技術的建立[J].寧德師范學院學報(自然科學版),2019,31(4):395-398.
[13]陳耀麗,尤燕平,鐘云芳,等.海南黎藥血葉蘭的無菌播種及高效繁育技術初探[J].熱帶林業,2023,51(1):40-45.
[14]鄭濤,鄒龍運,蔡坤秀,等.基于葉綠體DNA RPS16序列的血葉蘭多樣性分析[J].福建熱作科技,2022,47(2):1-5.
[15]陳育青,陳榮珠,鄒毅輝,等.閩草藥公石松轉錄組分析及黃酮類合成功能基因的挖掘[J].分子植物育種,2022,20(14):4654-4664.
[16]舒福興,黃瑤,賈啟,等. 胡蘿卜果膠桿菌侵染下半夏轉錄組中SSR位點信息分析[J]. 種子,2023,42(2):116-120.
[17]陳燕,郭聰,王瑩,等.杜梨葉片轉錄組分析[J].江蘇農業科學,2022,50(3):58-67.
[18]武悅,單飛彪,閆文芝,等. 基于高通量測序的瞿麥葉片轉錄組分析[J]. 分子植物育種,2022,20(5),1522-1529.
[19]Zhang G Q,Liu K W,Li Z,et al. The Apostasia genome and the evolution of orchids[J]. Nature,2017,549 :379-383.
[20]Zhang G Q,Xu Q,Bian C,et al. The Dendrobium catenatum Lindl. genome sequence provides insights into polysaccharide synthase,floral development and adaptive evolution[J]. Scientific Reports,2016,6:19029-19039.
[21]Sawettalake N,Bunnag S,Wang Y W,et al. DOAP1 promotes flowering in the orchid Dendrobium Chao Praya smile[J]. Frontiers in Plant Science,2017,8:400-417.
(責任編輯:馮" " 新)