











摘要:類黃酮3',5'-羥化酶(flavonoid 3',5'-hydroxylase,F3'5'H)是花青素合成途徑中催化形成藍色飛燕草素的關鍵酶。本研究通過RT-PCR方法,從藍紫花、玫紅花、白花黃芩中克隆得到F3'5'H基因的全長序列,分別命名為SbF3'5'H-b、SbF3'5'H-r、SbF3'5'H-w。經序列比對,SbF3'5'H-r基因較SbF3'5'H-b/w缺失7 bp,導致蛋白翻譯提前終止。生物信息學分析顯示,三個SbF3'5'H蛋白均屬于細胞色素P450家族,定位在內質網。SbF3'5'H-B/W蛋白具有典型的CYP450保守序列,包括富含脯氨酸基序“LPPGP”、底物識別位點SRS1-6、折疊鎖定基序“ExxR”、血紅素結合基序“PFGAGRRICAG”及預測的羥化活性位點CR1和CR2。而SbF3'5'H-R蛋白由于序列缺失影響二級、三級結構,并導致CYP450結構域不完整,c端缺少多個維持酶活性的保守基序。基于F3'5'H蛋白序列的系統進化分析結果顯示,黃芩與同為唇形科的丹參、一串紅等親緣關系最近,聚在一個分支,與單子葉植物親緣關系較遠。基因表達分析結果顯示,SbF3'5'H在白花中整體表達最高,其次是藍紫花,玫紅花中整體表達最低;不同花發育階段比較,SbF3'5'H基因均呈現出先升高后降低的趨勢,在中蕾期表達量最高,其次是幼蕾期,盛花期表達量最低,藍紫和白花黃芩不同花發育階段間差異顯著或極顯著。本研究結果可為進一步研究不同花色黃芩中SbF3'5'H基因的功能差異、揭示黃芩花色變異的分子機理奠定理論基礎。
關鍵詞:黃芩;花色;類黃酮3',5'-羥化酶;基因克隆;生物信息學分析:表達分析
中圖分類號:S567.239:Q781 文獻標識號:A 文章編號:1001-4942(2024)10-0001-09
黃芩(Scutellaria baicalensis Ceorgi)為唇形科黃芩屬植物,以其干燥根入藥,是我國大宗常用中藥材,具有清熱解毒、燥濕瀉火、止血安胎之功效。黃芩根提取物中含有豐富的黃酮類、二萜、多糖、氨基酸、揮發油等生物活性成分,黃酮類化合物黃芩苷、漢黃芩苷、黃芩素、漢黃芩素是其主要活性成分。黃芩地上部活性成分主要為芹菜素、野黃芩素、野黃芩苷等,與地下部存在明顯差異。現代藥理學研究表明,黃芩具有廣譜的抗病毒、抗炎、抗氧化、抗腫瘤、護肝及保護神經等作用。由黃芩等多味中藥組成的清肺排毒湯、宣肺敗毒方等在治療新型冠狀病毒感染中的臨床效果顯著。
在長期的栽培過程中,黃芩產生了許多變異類型,包括花色、葉片大小、葉表有無被毛等。花瓣的主要呈色物質為花青素,包括天竺葵素、矢車菊素、飛燕草素等。花青素與黃芩活性成分同屬于黃酮類化合物,以苯丙氨酸為前體,經一系列酶促反應生成共同的代謝中間產物柚皮素,后花青素分支在黃烷酮羥化酶F3H、F3'H、F3'5'H的作用下生成二氫黃酮醇類物質,再后經二氫黃酮醇還原酶DFR和花青素還原酶ANS的催化生成呈色的花青素類物質。其中F3'5'H能夠催化二氫山奈酚在B環3'、5'位點羥基化生成二氫楊梅素,是合成藍色飛燕草素的關鍵酶基因,被稱為“藍色基因”。F3'5'H缺失是大部分植物不能形成藍色花的主要原因。目前,已在菊花、錦繡杜鵑、楊梅、茉莉、胡椒等植物中克隆鑒定到F3'5'H基因。但關于黃芩F3'5'H基因的研究尚未見報道。
黃芩花通常呈現藍紫色,本課題組前期篩選得到玫紅花和白花黃芩變異材料,并通過轉錄組代謝組聯合分析篩選到三種花色黃芩間的差異基因F3'5'H。本研究擬利用RT -PCR技術從藍紫花、玫紅花、白花黃芩中克隆SbF3'5'H基因,對其進行生物信息學分析,并利用qRT-PCR分析SbF3'5'H基因在不同花發育階段的表達模式,以期為進一步研究SbF3'5'H基因功能、揭示黃芩花色變異的分子機理奠定基礎,并為高品質黃芩的精準分子育種提供技術支撐。
1 材料與方法
1.1 植物材料
藍紫花(SB)、玫紅花(SR)、白花(SW)黃芩均種植于山東省中醫藥研究院中藥資源苗圃內,于2023年6月盛花期分別采集各材料3個發育階段的花(圖1),置于50 mL離心管中液氮速凍,-80℃保存備用。
1.2 RNA提取及SbF3'5'H基因克隆
利用RNAprep pure Plant Kit(TIANGEN)及PrimeScriptTM Ⅱ 1st Strand cDNA Synthesis Kit(TaKaRa)分別進行三種顏色黃芩花的RNA提取及反轉錄。根據前期轉錄組數據得到的SbF3'5'H基因序列利用Primer Premier5軟件設計基因擴增引物SbF3'5'H-F/R(表1),以反轉錄得到的cDNA為模板,利用PrimeSTAR@ Max DNA Poly-merase(TaKaRa)進行PCR擴增。PCR反應體系(20μL):cDNA模板1 μL,SbF3'5'H-F/R各1 μL,2×PrimeSTAR MAX 10 μL,ddH20 7 μL。PCR擴增條件:95℃預變性5min;95℃30 s,58℃30 s,72℃1.5 min,35個循環;72℃延伸7 min。
將PCR產物進行瓊脂糖凝膠電泳,采用TIANgel Midi Purification Kit(TIANCEN)回收目的片段,連接pMD18 -T載體(TaKaRa),轉化DH5α大腸桿菌,挑取單克隆利用T載體通用引物委托北京擎科生物科技股份有限公司青島分公司測序。
1.3 SbF3'5'H基因生物信息學分析
利用DNAStar軟件中的EditSeq工具分別預測SbF3'5'H-b、SbF3'5'H-r、SbF3'5'H-w基因編碼序列:利用NCBI的BLASTN下具對三個基因與同源基因的序列一致性進行比對:利用在線分析軟件ExPASy的ProtParam、ProtScale工具進行三種SbF3'5'H蛋白的理化性質分析。
利用NCBI CD - search(https://www.ncbi.nlm.nih.gov/cdd)預測SbF3'5'H蛋白保守結構域:采用SOPMA工具預測SbF3'5'H蛋白的二級結構;利用TMHMM和SignalP 5.0預測蛋白跨膜結構域和信號肽:用Plant-mPLoc進行蛋白的亞細胞定位:利用NetPhos 3.1預測蛋白的磷酸化位點;利用NetOGlyc 4.0和NetNGlyc 1.0分別預測蛋白的O型和N型糖基化位點:利用Swiss-Model進行三維結構預測。
從國家基因組科學數據中心網站(https://ngdc.cncb.ac.cn/gwh/Assembly/10411/show)下載黃芩基因組序列,利用TBtools工具提取SbF3'5'H基因上游2 000 bp啟動子區域,采用PlantCARE預測啟動子中可能的順式作用元件。在NCBI網站用SbF3'5' H-B/W蛋白序列進行BLASTP檢索,下載相近物種及模式植物同源蛋白序列,利用DNAMAN軟件進行多重序列比對,利用MECA11的鄰接法(neighbor-joining,NJ)構建系統進化樹,Bootstrap值設為1 000。
1.4 SbF3'5'H基因表達分析
提取三種花色黃芩不同發育階段花的RNA,反轉錄為cDNA。利用PerlPrimer軟件設計熒光定量檢測引物(表1),并通過TBtools軟件檢測引物特異性。利用SYBR@ Premix Ex TaqTMⅡ試劑盒(TaKaRa)進行基因表達分析,反應體系及程序參照試劑盒說明書,試驗均設3次重復。以黃芩18S rRNA為內參基因,基因相對表達量用2-ΔΔCt方法計算,用CraphPad Prism 9.0軟件進行差異顯著性分析和作圖。
2 結果與分析
2.1 SbF3'5'H基因的克隆
以藍紫花(SB)、玫紅花(SR)、白花(SW)黃芩盛花期花的cDNA為模板進行PCR擴增,瓊脂糖凝膠電泳結果如圖2所示。經單克隆測序,SB、SR、SW的SbF3'5'H基因cDNA全長分別是1 527、1 520、1 527 bp(圖3)。三個基因與丹參(Salvia miltiorrhiza)F3'5'H基因(MH447665.1)的序列一致性分別為76.68%、76.40%、76.68%,將其分別命名為SbF3'5'H-b、SbF3'5'H-r、SbF3'5'H-w、其中SbF3'5'H-b和SbF3' 5t H-w序列一致、SbF3%5'H-r在933 - 939位缺失7 bp。
2.2 SbF3'5'H蛋白理化性質分析
利用DNAStar軟件中的EditSeq工具預測到SbF3'5'H-b、SbF3'5'H-r、SbF3'5'H-w基因分勛編碼508、316、508個氨基酸,其中SbF3'5'H-r由于缺失7 bp,導致移碼突變,蛋白質翻譯提前終止。理化性質分析結果(表2)顯示,SbF3'5'H-B、SbF3'5'H-W蛋白分子量為56.86 kDa,理論等電點為7.21; SbF3'5'H-R蛋白分子量為35.10kDa,理論等電點為6.45;三個蛋白均為穩定蛋白。SbF3'5'H-B、SbF3'5'H-W平均親水系數為負值,說明這兩個蛋白為親水性蛋白:SbF3'5'H-R為疏水性蛋白。
2.3 SbF3'5'H蛋白結構分析
保守結構域分析結果(圖4)顯示,SbF3'5'H蛋白屬于細胞色素P450超家族,SbF3 '5' H-B/W的第11 - 506個氨基酸為CYP450結構域,SbF3'5'H-R含有不完整的CYP450結構域(第11- 311個氨基酸)。
二級結構預測顯示SbF3'5' H-B/W由α-螺旋(50.00%)、無規則卷曲(35.24%)、延伸鏈(10.83%)、β-轉角(3.94%)組成;SbF3'5'H-R則分別含有58.23%、29.75%、8.86%和3.16%的α-螺旋、無規則卷曲、延伸鏈和B -轉角。跨膜結構域和信號肽預測結果(圖5a)顯示,SbF3'5'H蛋白在N端含有一個跨膜結構域,第2 - 24個氨基酸為跨膜區域,不含信號肽。亞細胞定位預測顯示三個蛋白均定位在內質網。蛋白磷酸化和糖基化在調節蛋白質的活性和穩定性中起到重要作用。SbF3'5'H蛋白磷酸化預測結果(圖5b)顯示,SbF3'5'H-B/W存在21個絲氨酸(Ser)、16個蘇氨酸(Thr)、3個酪氨酸(Tyr)磷酸化位點;SbF3'5'H-R僅有12個絲氨酸(Ser)、11個蘇氨酸(Thr)、2個酪氨酸(Tyr)磷酸化位點。SbF3'5'H-B/W和SbF3'5'H-R均含有2個N型糖基化位點,不含O型糖基化位點(圖5c)。
根據Swiss -Model三維結構預測結果(圖6),SbF3'5'H-B/W和SbF3'5'H-R的蛋白模型分別是土瓶草(Cephalotus follicularis)的AOAIQ38288.I.A p450domain-containing protein和矮牽牛(Petunia hybrida)的P48419.1.AFlavonoid3',5'- hydroxylase2,序列一致性分別為74.21%和71.66%,模型質量評估(GMQE)值分別為0.94和0.90,模型可信度較高。
2.4 SbF3'5'H蛋白多序列比對及系統發育分析
將SbF3'5'H-B/W、SbF3'5'H-R蛋白與相近物種同源蛋白序列進行多重比對分析,結果(圖7)顯示,SbF3'5'H具有典型的CYP450保守序列,N端的富含脯氨酸基序“LPPCP”形成鉸鏈負責連接蛋白的跨膜區域和胞質中的催化區域,HelixI基序“ACTDTS”可能與底物選擇性及氧結合特性有關,折疊鎖定基序“ExxR”及c端的血紅素結合基序“PFCACRRICAG”是結合血紅素及底物蛋白所必需的,SRS1 -6為底物識別位點,CRI及位于SRS6基序內的CR2是潛在的羥化活性位點,它們是F3'5'H蛋白發揮酶活性所必需的序列。SbF3'5'H-R蛋白由于翻譯提前終止,缺少SRS5 -6、CR2位點、“ExxR”及血紅素結合基序。
基于F3'5'H蛋白序列的系統進化分析結果(圖8)顯示,相同或相近科屬植物的F3'5'H親緣關系較近,黃芩與同為唇形科的丹參、一串紅等親緣關系最近,聚在一個分支;與茄科、豆科、胡桃科等物種親緣關系次之:與單子葉植物水稻、小麥及十字花科擬南芥親緣關系較遠,分別聚為兩大簇。
2.5 SbF3'5'H啟動子分析
對SbF3'5'H基因上游2 000 bp啟動子序列進行順式元件分析(圖9),發現存在逆境響應元件MYC、MYB、W-box,應激響應元件STRE,防御和應激響應元件TC-rich repeats,厭氧誘導元件ARE,低溫響應元件LTR;脫落酸響應元件ABRE、茉莉酸甲酯響應元件CCTCA/TCACG -motif、乙烯響應元件ERE、赤霉素響應元件GARE -motif、生長素響應元件TCA - ele-ment等激素響應元件:以及與分生發育相關的CAT-box元件和光響應元件Box 4、G-Box。
2.6 黃芩花不同發育階段SbF3'5'H基因的表達分析
為了解SbF3'5'H基因在黃芩花發育過程中的表達變化,在三個花發育階段分別進行基因表達分析。以藍紫花F1幼蕾時期的表達量為對照,結果(圖10)顯示,隨著花發育階段的推進,三種黃芩SbF3'5'H基因相對表達量均呈先升高后降低的趨勢,均在F2中蕾期表達量最高,其次是F1幼蕾時期,F3盛花期表達量最低:藍紫花和白花黃芩不同花發育階段間差異顯著或極顯著,玫紅花不同階段間差異不顯著。不同材料間比較,白花中SbF3'5'H基因表達量整體最高,其次是藍紫花,玫紅花中表達量最低。
3 討論與結論
F3'5'H基因是花青素合成途徑中的關鍵酶基因之一,負責形成藍色飛燕草素。本研究在前期轉錄組數據基礎上,通過RT -PCR方法克隆獲得三種花色黃芩F3'5'H基因的全長cDNA序列,分別為1527、1 520、1 527 bp。通過序列比對發現,玫紅花黃芩SbF3'5'H-r基因有7 bp缺失,其造成的移碼突變可能導致蛋白翻譯提前終止。生物信息學分析顯示,三個SbF3'5'H蛋白均屬于細胞色素P450基因家族,定位在內質網,二級結構以α-螺旋為主,N端含有跨膜結構域,不含信號肽,與前人,分析結果一致,符合CYP450發揮催化作用的特點。CYP450蛋白是依賴于血紅素的單加氧酶,血紅素對于其功能發揮必不可少。但SbF3'5'H-R蛋白由于C端缺失部分氨基酸導致CYP450結構域不完整,缺少血紅素結合基序和負責血紅素與底物蛋白穩定結合的“ExxR”基序以及保守的底物識別位點SRS5 -6、潛在的5'羥化位點CR2,這些序列的缺失很有可能導致SbF3'5'H-R羥化酶功能喪失。酶蛋白完整的三維結構是其行使催化功能的前提,三維建模顯示SbF3'5'H-B/W和SbF3'5'H-R蛋白分屬于不同的蛋白模型。綜上,SbF3'5'H-r基因序列缺失導致的移碼突變影響了SbF3'5'H-R蛋白的結構域及二級和三級結構,推測可能因此影響SbF3'5'H-R酶的活性。
基因表達分析顯示,三種黃芩SbF3'5'H基因均是在中蕾期表達量最高,盛花期表達量最低,與基因表達先于蛋白翻譯和代謝物積累的規律相符。不同花色黃芩間,玫紅花SbF3'5'H基因表達量明顯低于藍紫花,白花中表達量最高。
前期代謝組數據顯示,缺少藍色飛燕草素可能是玫紅花黃芩產生花色變異的主要原因,結合本研究結果,推測玫紅花黃芩SbF3'5'H-r基因7 bp的缺失造成的蛋白翻譯缺陷,可能導致SbF3'5'H-R蛋白喪失正常的羥化酶功能,另外玫紅花中SbF3'5'H基因表達量明顯較低,也可能阻礙了飛燕草素的正常合成,但玫紅花色形成是由SbF3'5'H-R酶功能喪失還是基因表達量低導致或者是兩者共同作用的結果,還需要進一步驗證。白色黃芩花中沒有檢測到花青素成分,而SbF3‘5'H-w基因序列與SbF3'5'H-b基因無差異,且白花中SbF3'5'H基因表達量高于藍紫花,推測白花形成可能受花青素合成途徑中其他結構基因或轉錄因子影響,具體原因有待于進一步研究。
基金項目:山東省中醫藥科技發展計劃項目(Q-2022083);山東省中醫藥研究院科研孵化基金項目(2022SACM-4);國家中醫藥管 理局中藥資源保障能力提升工程項目([2023119號);中央本級重大增減支項目(2060302);山東省科技型中小企業創新能力提升工程項目(2022TSGC1059、2023TSGC0444);濟南市農業應用技術創新計劃項目(CX202112)