洪森榮,黃丹丹,黃詩慧,黃夏夢,蔣 椰,李萬平,蔡 紅,陳榮華
(1. 上饒師范學院生命科學學院,江西 上饒 334001;2. 上饒市藥食同源植物資源保護與利用重點實驗室,江西上饒 334001;3. 上饒市三葉青保育與利用技術創新中心,江西 上饒 334001;4. 上饒農業技術創新研究院,江西 上饒 334001;5. 上饒市紅日農業開發有限公司,江西 上饒 334700)
【研究意義】三葉青(Tetrastigma hemsleyanumDiels et Gilg)為葡萄科(Vitaceae)崖爬藤屬(Tetrastigma)多年生蔓生藤本植物,為我國特有珍稀藥用植物[1],主要分布在長江以南的大部分地區,一般以塊根入藥,具清熱解毒、消腫散結、活血止痛之功效,多用于抗腫瘤、調節免疫力以及治療小兒熱性驚厥、黃疸、急性和慢性肝炎等[2?3],被譽為“植物抗生素”[4?6]。中藥材產區一般與其質量密切相關,不同產區的三葉青外觀性狀、藥理活性及質量和產量均有差異[7]。研究表明[8?11],懷玉山三葉青不但能減慢癌細胞生長、抑制癌細胞增殖、促進癌細胞凋亡,還可作為癌癥預防治療的功能性食品。由于懷玉山三葉青臨床療效顯著,市場需求劇增,野生資源已無法滿足其入藥需求,為此,上饒市紅日農業開發有限公司積極開展品種選育,篩選出兩個優良栽培品種懷玉1 號和懷玉2 號。這兩個品種與普通種的塊根相比具有顯著差異。懷玉1 號形成塊根早,個頭偏小,塊根紡錘形,葉薄而小;懷玉2 號形成塊根稍晚,個頭偏大,塊根長柱狀,葉厚且大。因此,對懷玉山三葉青2 個栽培種的塊根進行轉錄組分析具有重要的現實意義。【前人研究進展】轉錄組指植物體內所有表達基因的身份以及其轉錄水平,廣義上指所有信使RNA 、核糖體 RNA 、轉運RNA 及非編碼RNA,狹義上特指所有信使RNA[12]。轉錄組測序有助于植物新基因的發現、基因功能的注釋、基因的差異表達及其分子標記發展[13?15]。目前,對三葉青的研究主要集中在種質多樣性、主效活性成分分析、栽培管理和種苗繁育等方面[16],在轉錄組水平上研究三葉青野生種或栽培種與黃酮類化合物相關差異基因的表達研究未見報道。【本研究切入點】藥用成分分析表明,懷玉三葉青懷玉1 號和懷玉2 號兩者在黃酮類物質含量方面存在較大差異[17]。其分子機制尚無相關報道。懷玉三葉青2 個栽培種在轉錄組水平上的分子差異還有待深入研究。【擬解決的關鍵問題】本研究利用Illumina HiSeq 高通量測序技術對懷玉山三葉青懷玉1 號和懷玉2 號塊根的轉錄組進行研究,結合生物信息學分析方法對差異表達基因進行GO 功能富集分析和KEGG 代謝通路富集分析,研究懷玉山三葉青2 個栽培種差異基因的表達,挖掘與黃酮類化合物合成相關的基因,為懷玉山三葉青相關基因的克隆和功能驗證以及懷玉山三葉青后續新品種選育等研究奠定理論基礎。
懷玉山三葉青懷玉1 號(HY1 組)和懷玉2 號(HY2 組)塊根(同一大棚同一栽培基質同一栽培時間),由上饒市紅日農業開發有限公司提供(鑒定人:上饒師范學院生命科學學院王艾平教授,標本存于上饒市紅日農業開發有限公司懷玉山基地三葉青種質圃)。
1.2.1 RNA 提取和測序 從懷玉山三葉青懷玉1 號(HY1 組)和懷玉2 號(HY2 組)塊根中提取total RNA,利用Nanodrop2000 對所提RNA 的含量和純度進行檢測。利用上海美吉生物醫藥科技有限公司Illumina Novaseq 6000 測序平臺對完整 cDNA 文庫進行測序、序列拼接和組裝[17]。
1.2.2 數據分析 轉錄組分析采用3 次生物學重復。使用 Trinity 軟件對clean reads 進行de novo 拼接,形成一個不能在兩端擴展的 Unigene 序列。再將序列注釋 到 Swiss-Protein、KEGG 和 GO 數 據 庫 中 獲 得 基因功能信息。根據錯誤發現率(false discovery rate,FDR≤0.001)和表達量倍數變化(|foldchange|>1.5)的閾值篩選出兩個樣本間差異表達的基因(Degs)。對顯著性差異表達基因進行 KEGG Pathway 顯著性富集分析。
1.2.3 與黃酮類化合物合成相關差異表達基因的篩選通過KEGG 途徑分析找出參與了黃酮類化合物生物合成以及黃酮和黃酮醇生物合成的相關差異基因。
1.2.4 查爾酮合酶和黃酮醇合酶的熒光定量 PCR 驗證 在1.2.3 的基礎上,找出黃酮類化合物生物合成以及黃酮和黃酮醇生物合成的差異基因查爾酮合酶基因和黃酮醇合酶基因,以GAPDH 為內參基因,設計基因引物,查爾酮合酶的引物(F: CACGAGTCCC ACCTCGACTC;R: AGGGGACGCTCCACGGACA),黃酮醇合酶的引物(F: ATATGTACCCACCATGCC CACA;R: CGGCGATCCAGTTATCGTCTT),進行熒光定量 PCR 驗證。PCR 反應程序:預變性95 ℃10 min,變性95 ℃10 s,退火延伸60 ℃ 34 s,95 ℃ 15 s,40個循環。
經過測序質量控制, HY1 組Raw reads(統計原始序列數據的條數)為42 869 358,Raw bases(Raw reads 的條數乘以長度,得到測序的總堿基數)為6 473 273 058,Clean reads(計算方法同 Raw Reads,統計的文件為過濾后的測序數據)為42 311 662,Clean bases(Clean reads 的條數乘以長度,得到質控后的總堿基數)為6 293 446 534,Error rate(測序錯誤率)為0.023 4%,Q20 和Q30(分別計算 Phred 數值大于20、30 的堿基數占總堿基的百分比)分別為98.66%和95.75%,GC content(G、C 堿基的總數量占總堿基數量的百分比)為47.67%;
HY2 組Raw reads 為41 989 034,Raw bases 為6 340 344 134,Clean reads 為41 411 202,Clean bases為6 179 128 919,Error rate 為0.023 2%,Q20 和Q30分別為98.74%和96.02%,GC content 為47.54%。表明,此次轉錄組測序數據質量較好,可以滿足轉錄組分析的基本要求。
HY1 組Clean reads(pair reads,過濾后測序數據的條數)為42 311 662,Mapped reads(能比對到組裝轉 錄 本 上 的Clean reads 數)為33 375 480,Mapped ratio(能定位到組裝轉錄本上的Clean reads 所占百分比)為78.88%;HY2 組Clean reads 為41 411 202,Mapped reads 為33 321 456,Mapped ratio 為80.46%。
圖1 橫坐標為不同轉錄因子家族;縱坐標為落到該轉錄因子家族的unigene /transcript 數目。從圖1可知,HY1 組和HY2 組的轉錄因子家族多為MYBsuperfamily、bHLH、AP2/ERF、NAC、C2C2、WRKY 等。
獲得每個樣本中基因的表達量,是后續進行樣本間關系分析、表達量差異分析以及實驗驗證的基礎。為了從整體來看某一樣本的表達量水平和比較不同樣本表達量的整體分布情況,通常以不同類型的圖形直觀地展示。從圖2 的盒形圖(A)和密度圖(B)可知,HY1 組和HY2 組表達量密度在0-2。從盒形圖和密度圖的結果來看,懷玉1 號轉錄物的整體表達水平較高,懷玉2 號轉錄物的整體表達水平較低。

圖 1 HY1 組和HY2 組轉錄因子家族統計Fig. 1 Statistics on transcription factor families of HY1 and HY2

圖 2 HY1 組和HY2 組表達量分布盒形圖(A)和密度圖(B)Fig. 2 Diagrams of box (A) and density (B) on quantitative distribution of gene expressions in HY1 and HY2
通過樣本間Venn 分析可以獲得樣本間或組間的共表達和特表達基因/轉錄本,能夠幫助迅速鎖定目標基因。表達量樣本間Venn 分析一般以樣本間Venn圖表示:不同顏色的圓圈代表一組樣本中表達的unigene/transcript 數目,圓圈的交叉區域代表各組共有的 unigene/transcript 數目。從圖3 可知,HY1 組和HY2 組表達的共有基因數為22367,HY1 組單獨表達的基因數為18196,HY2 組單獨表達的基因數為8137。HY1 組單獨表達的基因數顯著高于HY2 組單獨表達的基因數。
表達量樣本間相關性分析是取全部基因的每一個基因,根據這些基因在任意兩兩比較樣本的表達量,計算每兩個樣本之間的相關系數,再把這些相關系數以熱圖形式直觀地展示任意兩個樣本之間的相關性的過程。該分析有助于理解樣本間特別是生物學重復間的相關性。從圖4 可知,HY1 組和HY2組表達量的相關系數為0.913,表明基因在樣本間的表達量相似度越高,即樣本間相關性越好。同時也表明這2 個樣本(HY1 組和HY2 組)具有相對相似的表達模式,保證了測序和采樣結果的可靠性。
HY1 組和 HY2 組共產生差異表達基因(differentially expressed gene,DEG)12199 個。與HY1組比較,HY2 組上調基因數為3 551,下調基因數為8 648。從圖5 和表1 可知,HY1 組和HY2 組的差異表達基因大多與光合作用碳同化有關。

圖 5 HY1 組和HY2 組表達量差異統計柱狀圖(A)以及表達量差異火山圖(B)和表達量差異散點圖(C)Fig. 5 Statistic histogram on expression difference (A), volcano map (B), and scatter map (C) of HY1 and HY2
從圖6 和表2 可知,通過富集,光合作用光系統I 光捕獲、光合作用捕獲、葉綠素代謝過程、蛋白質發色團連鎖、前體代謝產物和能量的產生、葉綠素生物合成過程、氧化應激反應、α-氨基酸代謝過程、光合作用、質體小葉、光系統I、光系統II、質體類核仁、光系統、葉綠素結合、單加氧酶活性、鐵離子結合、血紅素結合、裂解酶活性等GO term富集顯著。這些功能類別大多與光合作用相關。
從圖7 和表3 可知,HY1 組和HY2 組差異表達基因富集的KEGG 通路主要有光合作用-天線蛋白、核糖體、乙醛酸和二元酸代謝、苯丙酸生物合成、二苯乙烯類、二芳基庚烷類和姜辣素的生物合成、類黃酮生物合成、光合作用、光合生物的固碳作用、甘氨酸、絲氨酸和蘇氨酸代謝、植物激素信號轉導、谷胱甘肽代謝、丙酮酸代謝、苯丙氨酸代謝、植物晝夜節律、黃酮和黃酮醇的生物合成、半胱氨酸與蛋氨酸代謝、氰胺酸代謝、類胡蘿卜素生物合成、α-亞麻酸代謝、卟啉與葉綠素代謝等。其中核糖體(基因數306)、植物激素信號轉導(基因數132)、苯丙酸生物合成(基因數100)、丙酮酸代謝(基因數92)、乙醛酸和二元酸代謝(基因數90)、半胱氨酸與蛋氨酸代謝(基因數89)、光合生物的固碳作用(基因數82)注釋的基因數均超過80,這可能是HY1 組和HY2 組兩個栽培種的內在差異。
經江西省分析測試中心和南昌大學食品學院檢測,懷玉山三葉青懷玉1 號(HY1 組)和懷玉2 號(HY2 組)塊 根 的 總 黃 酮 含 量 分 別 為189 mg·hg?1和286 mg·hg?1,其中兒茶素含量分別為19.54 mg·g?1DW 和24.54 mg·g?1DW、蘆丁含量分別為38.21 mg·g?1DW 和46.47 mg·g?1DW、異槲皮素含量分別為25.64 mg·g?1DW 和38.39 mg·g?1DW、槲皮素含量分別為1.59 mg·g?1DW 和3.49 mg·g?1DW、山柰酚含量分別為1.96 mg·g?1DW和5.38 mg·g?1DW、綠原酸含量分別為0.68 mg·g?1DW和1.64 mg·g?1DW。由表4 可知,與黃酮類化合物相關差異表達基因如芪合酶(stilbene synthase) 、無色花色素雙加氧酶(leucoanthocyanidin dioxygenase)、查爾酮異構酶蛋白(CHI protein)、查爾酮合酶2(chalcone synthase 2)、黃烷酮3-羥化酶(flavanone 3-hydroxylase)、無色花色素還原酶(1leucoanthocyanidin reductase 1)、類黃酮3′-羥化酶(flavonoid 3′-hydroxylase)基因在懷玉2 號(HY2組)塊根中上調,而查爾酮合酶(chalcone synthase)、黃酮醇合酶(flavonol synthase)、類黃酮3′,5′-甲基轉移酶(flavonoid 3′,5′-methyltransferase)基因在懷玉2 號(HY2 組)塊根中下調,導致懷玉山三葉青懷玉1 號(HY1 組)和懷玉2 號(HY2 組)塊根總黃酮含量的差異。

表 2 HY1 組和HY2 組部分差異表達基因GO 富集結果Table 2 GO enrichment on certain differentially expressed genes in HY1 and HY2
查爾酮合酶和黃酮醇合酶的熒光定量 PCR 分析表明,查爾酮合酶基因在懷玉山三葉青懷玉1 號(HY1組)和懷玉2 號(HY2 組)的RQ 值為1 和0.00051,表達下調;黃酮醇合酶在懷玉山三葉青懷玉1 號(HY1組)和懷玉2 號(HY2 組)的RQ 值為1 和0.450961,表達下調。這個結果與轉錄組的結果是一致的,表明本次轉錄組分析結果是有效的。

表 3 HY1 組和HY2 組差異表達基因KEGG 富集分析(前20)Table 3 KEGG enrichment on top 20 differentially expressed genes in HY1 and HY2
目前利用轉錄組分析來研究植物不同品種差異基因的報道很少。差異基因的KEGG 富集分析有助于更進一步了解差異基因的生物學功能[18]。4 個大豆栽培種多莢與少莢品種的花序轉錄水平差異主要集中在物質代謝、脅迫應答、刺激應答、病害抗性等方面,與脫落直接相關的基因表達不相關[19]。2 個紫花苜蓿品種(WL319HQ 和準格爾)轉錄組富集的KEGG 途徑主要有核糖體、植物激素信號轉導等,其中核糖體途徑注釋的DEGs 最多[20]。3 個不同品種百香果(黃果、滿天星和紫果)果皮和果肉的KEGG富集分析表明,黃果與滿天星的差異在于細胞胞吞作用,黃果與紫果的差異在于玉米素的生物合成和糖酵解途徑,滿天星與紫果的差異在于纈氨酸、亮氨酸和異亮氨酸的生物合成[21]。在本實驗中,懷玉山三葉青懷玉1 號(HY1 組)和懷玉2 號(HY2組)塊根差異表達基因富集的KEGG 通路主要有核糖體、植物激素信號轉導、苯丙酸生物合成、丙酮酸代謝、乙醛酸和二元酸代謝、半胱氨酸與蛋氨酸代謝、光合生物的固碳作用等,這可能是懷玉山三葉青懷玉1 號和懷玉2 號兩個栽培種的內在分子差異。
黃酮類化合物是植物體內一類重要的保護性物質,可抵御病原菌侵害、防止紫外線傷害、促進色素形成等[22],具有軟化血管、抗癌、清除體內自由基等功能,已成為植物次生代謝物應用的研究熱點[23]。黃酮類化合物主要包括白藜蘆醇、黃酮、異黃酮、黃烷酮、查耳酮、花色素苷、原花色素等[24]。
白藜蘆醇(resveratrol)是一種植保素,可抵御病菌侵染、增強抗病性[25]。研究表明,一些芪類物質還具有抗炎抗氧化[26]、防癌抗癌[27]等藥理活性。許多植物中存在合成白藜蘆醇的底物,但缺乏合成白藜蘆醇必需的酶——芪合酶[28?29]。吳鳳穎等[30]對自然狀態下轉基因植株中白藜蘆醇合成相關基因進行實時定量 PCR 分析,發現過表達芪合酶基因時白藜蘆醇積累量大幅提高。在本實驗中,芪合酶在懷玉山三葉青懷玉1 號(HY1 組)和懷玉2 號(HY2組)上調和下調,導致懷玉山三葉青懷玉1 號(HY1組)白藜蘆醇合成增加,而懷玉2 號(HY2 組)白藜蘆醇合成下降。

表 4 與次生代謝物合成相關差異基因的表達Table 4 Expressions of differentially expressed genes related to secondary metabolites synthesis
無色花色素雙加氧酶是植物花色素苷生物合成途徑中的關鍵酶,屬于雙加氧酶家族,可將無色原花色素催化生成有色花色素,對花色素苷的合成至關重要[31?32]。在山葡萄果實著色過程中,無色花色素雙加氧酶基因在不同時期的果皮中均有表達,在轉色期的葉片、莖、果肉中也均有表達,且表達量相近[31]。在本實驗中,無色花色素雙加氧酶在懷玉山三葉青懷玉1 號(HY1 組)和懷玉2 號(HY2 組)下調和上調,導致懷玉山三葉青懷玉1 號(HY1 組)花色素苷合成下降,而懷玉2 號(HY2 組)花色素苷合成增加。
無色花色素還原酶基因是黃酮類化合物生物合成下游的一個重要基因。Tanner 等[33]通過構建LAR基因的重組載體進行體外表達,發現無色花色素還原酶基因原核表達蛋白具有催化合成兒茶酸、黃烷-3-醇、兒茶素等黃酮類化合物的活性。黃烷酮 3 -羥化酶與花色素合成相關,調控著黃酮與花青素苷產物的合成[34]。前人研究表明,在煙草、擬南芥等模式植物中過量表達外源黃烷酮3-羥化酶基因,能提高轉基因植株的類黃酮含量和抗逆能力。在本實驗中,黃烷酮3-羥化酶和無色花色素還原酶在懷玉山三葉青懷玉1 號(HY1 組)和懷玉2 號(HY2 組)下調和上調,導致懷玉山三葉青懷玉1 號(HY1 組)黃酮類化合物合成下降,而懷玉2 號(HY2 組)黃酮類化合物合成增加。
查爾酮合酶是將苯丙烷類代謝途徑引向黃酮類化合物合成的第1 個關鍵酶,催化3 分子的丙二酰輔酶A 與1 分子的香豆酰CoA 生成查爾酮[35]。查爾酮異構酶(CHI)催化查爾酮異構化,形成生物活性二羥基黃烷酮,是植物黃酮合成途徑的關鍵酶,推動下游黃酮類化合物的合成[36]。在本試驗中,查爾酮合酶在懷玉山三葉青懷玉1 號(HY1 組)和懷玉2 號(HY2 組)上調和下調,而查爾酮合酶2 和查爾酮異構酶(CHI)在懷玉山三葉青懷玉1 號(HY1組)和懷玉2 號(HY2 組)下調和上調,這可能是由于查爾酮合酶與查爾酮合酶2 基因雖屬于同一基因家族但執行不同功能,其具體的功能差異還有待進一步的分析,查爾酮異構酶(CHI)可能促進了懷玉山三葉青懷玉2 號(HY2 組)二羥基黃烷酮的合成。
類黃酮3′-羥化酶為細胞色素 P450 亞家族成員之一,影響著黃酮類化合物活性和穩定性的羥基化模式,被認為是黃酮類化合物生物合成途徑中關鍵的限速酶,其表達水平決定了黃酮類化合物含量,是黃酮類化合物生物合成的重要調控點,常與查爾酮異構酶(CHI)、查爾酮合酶 等共同作用合成各類黃酮類化合物[37]。在本實驗中,類黃酮3′-羥化酶在懷玉山三葉青懷玉1 號(HY1 組)和懷玉2 號(HY2 組)下調和上調,導致懷玉山三葉青懷玉1 號(HY1 組)各類黃酮類化合物合成下降,而懷玉2 號(HY2 組)各類黃酮類化合物合成增加。
類黃酮是次生代謝形成的最主要功能性成分之一。甲基化是類黃酮基本結構形成后由類黃酮3′,5′-甲基轉移酶催化的最主要的修飾反應之一,甲基化與酰基化、糖基化等基本修飾反應導致了類黃酮種類及功能的多樣性,可降低類黃酮活性基團的化學反應活性,增加其脂親和性,擴大其在細胞內的分布范圍,同時提高其抗菌性[38]。在本試驗中,類黃酮3′,5′-甲基轉移酶在懷玉山三葉青懷玉1 號(HY1 組)和懷玉2 號(HY2 組)上調和下調,導致懷玉山三葉青懷玉1 號(HY1 組)類黃酮種類及功能的多樣性提高,而和懷玉2 號(HY2 組)類黃酮種類及功能的多樣性下降。