杜晨陽,李玲莉,劉素君,高宏歡,馮健超,孫 婉,王晨陽,盧紅芳,馬冬云
(河南農業大學 農學院,國家小麥工程技術研究中心, 河南 鄭州 450046)
查爾酮合成酶(Chalcone synthase,CHS)是植物類黃酮生物合成過程中第1個限速酶和關鍵酶,它催化丙二酰輔酶A與香豆酰輔酶A生成四羥基查爾酮[1-3]。CHS基因最初從歐芹中分離到[4],目前,已克隆得到了許多植物的CHS基因。由于CHS基因在植物黃酮代謝途徑中具有重要功能,涉及花色、育性、抵御紫外線和致病因子等諸多植物生理生化過程,該基因得到了廣泛、深入的研究[5-8]。此外,黃酮類物質也具有很強的抗氧化性和自由基清除能力,多項證據表明,黃酮類化合物對人體健康有積極的影響,包括抗腫瘤、抗氧化、抗炎癥等[9-10]。近年來,植物中黃酮類化合物生物合成代謝關鍵酶基因的克隆、表達和功能研究已引起了廣泛的關注,CHS基因日益成為植物遺傳育種、抗逆等領域的研究熱點。
作為三大谷物之一,小麥是世界范圍的主要糧食作物之一,全球1/3以上的人以小麥為主食。隨著氣候的變化,小麥的生存環境面臨著嚴峻的挑戰[11]。通過改良小麥的遺傳背景,提高小麥的品質和抗逆能力是當前研究的重點之一。植物類黃酮不僅參與花色素的合成,還參與抵御逆境的生理活動,同時籽粒中黃酮類物質是重要的抗氧化成分,對人體健康有著重要作用,因此,通過對小麥中類黃酮合成途徑的研究并通過育種和分子生物學手段提高小麥籽粒中類黃酮含量對改善小麥品質有著重要意義。為此,對小麥TaCHS基因進行克隆和序列特征分析,并進一步對黃淮麥區119份小麥品種TaCHS基因的多態性進行分析,以期為進一步深入研究TaCHS基因的功能以及不同等位變異與籽粒抗氧化性之間的關系奠定基礎。
小麥品種周麥98165和揚麥10號于2015-2016年種植于河南農業大學科教園區,小區面積3 m×7 m,在開花期對同日開花的小麥穗進行標記,分別取周麥98165和揚麥10號花后7,14,21,28 d的籽粒樣品;小麥品種許科316于2016-2017年種植于河南農業大學科教園區,取花后15 d的根、莖、葉和籽粒樣品。所取樣品液氮速凍后,保存于-80 ℃冰箱備用。
材料DNA用SLS方法在籽粒中提取。小麥根、莖、葉和籽粒中總RNA的提取使用TransZol Plant試劑盒(全式金),并立即用ReverTra Ace qPCR RT Master Mix with gDNA Remover (ToYoBo)進行反轉錄,合成cDNA第一鏈。
參照NCBI中國春TaCHS(AY286095.1)的基因序列設計1對引物TaCHS-F/TaCHS-R(表1),使用Phanta? Max Super-Fidelity DNA Polymerase(南京諾唯贊)在119份小麥品種中克隆TaCHS基因,并在河南尚亞生物技術有限公司進行測序。

表1 本研究所用引物Tab.1 Primers used in this study
用ExPASy-ProtParam(https://web.ex-pasy.org/protparam/)分析蛋白質的分子質量、等電點、穩定性等理化性質;用WOLF PSORT(https://psort.hgc.jp/)和TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)對TaCHS蛋白的信號肽、亞細胞定位及跨膜區進行預測;用InterProScan(http://www.ebi.ac.uk/interpro/)對蛋白質保守結構域進行預測。用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)預測TaCHS蛋白的二級結構,用Phyre2(http://www.sbg.bio.ic.ac.uk/Phyre2/html/page.cgi?id=index)預測蛋白質的三級結構。以TaCHS編碼蛋白質序列為探針,在Ensembl Plants(http://plants.ensembl.org/index.html)搜索不同物種的編碼序列,利用CDS序列在Mega 5.0中構建基于Neigbor-joining的系統發育樹,預測親緣關系,并在GSDS 2.0(http://gsds.cbi.pku.edu.cn/)中構建不同物種CHS基因的結構圖。
設計引物TaCHS-1F/TaCHS-1R(表1),并使用TB Green Premix Ex Taq Ⅱ(TaKaRa)分析TaCHS基因在小麥不同組織部位的表達情況以及籽粒灌漿過程中表達量的變化趨勢,熒光定量PCR儀為Quantstudio 5 Real-time PCR(Thermo Fisher),以小麥Actin基因為內參。
以NCBI上中國春TaCHS基因(AY286095.1)為參考序列設計引物TaCHS-F/TaCHS-R,擴增小麥品種許科316,獲得其TaCHS基因DNA全長。以TaCHS基因為探針在Ensembl Plants六倍體小麥數據庫(http://plants.ensembl.org/Triticum_aestivum/Info/Index)進行比對,得到3條高度相似分別定位于2A、2B、2D短臂上的序列,其對應的序列號分別為TRIAE_CS42_2AS_TGACv1_112825_AA0345780.1、TRIAE_CS42_2BS_TGACv1_147037_AA0476980.1、TRIAE_CS42_2DS_TGACv1_177302_AA0572700.1,其中克隆的TaCHS基因與位于2A染色體的TaCHS拷貝相似度最高,因此,將克隆的TaCHS基因命名為TaCHS-A1a。
對TaCHS-A1a基因進行生物信息學分析,其DNA全長1 283 bp,由2個外顯子和1個內含子組成,CDS序列全長1 185 bp,編碼394個氨基酸,其蛋白質分子質量為43.15 ku,理論等電點為6.43,分子式為C1907H3048N526O563S25,脂肪族氨基酸指數為87.39,負電荷的氨基酸殘基數(Asp+Glu)為47個;正電荷的氨基酸殘基數(Arg+Lys)為44個。平均親水性值(GRAVY)為-0.088,不穩定系數為39.22,其屬于疏水穩定蛋白。預測的TaCHS蛋白位于細胞質中,沒有分泌通路信號肽,屬于非分泌蛋白。TaCHS氨基酸序列不存在跨膜結構域(圖1-A),由此推測,TaCHS蛋白是在細胞質基質中合成的,不經過跨膜轉運,在細胞質中催化合成類黃酮類物質[12]。TaCHS蛋白在N端和C端都存在1個查爾酮和二苯乙烯合成酶的結構域,屬于同源超家族,為Ⅲ型聚酮合成酶。TaCHS蛋白的二級結構(圖1-B)是由α-螺旋、延伸鏈、β-轉角和無規則卷曲4種結構模式組成。其中,α-螺旋178處,占45.18%;延伸鏈60處,占15.23%;β-轉角23處,占5.84%;無規則卷曲133處,占33.76%。該蛋白質的3D模型(圖1-C)中有388個氨基酸殘基,覆蓋98%的氨基酸序列,結構預測置信度達到100%。

圖1 TaCHS蛋白的跨膜結構域(A)、二級(B)和三級(C)結構預測Fig.1 Transmembrane domain (A), secondary (B) and tertiary (C) structure prediction of the TaCHS protein
以TaCHS編碼蛋白質序列為探針,在Ensembl Plants(http://plants.ensembl.org/index.html)搜索不同物種的編碼序列,得到12個物種的CDS序列(表2)。然后利用這些CDS序列在Mega 5.0中構建基于Neigbor-joining的系統發育樹,結果顯示,12條CDS序列明顯聚類為3類,其中小麥的CHS基因與二穗短柄草的親緣關系最近,屬于第一類,與玉米親緣關系最遠,小麥、水稻、玉米等12個物種的CHS基因均由1個內含子和2個外顯子組成,CDS序列相似度為78.43%,TaCHS與BdCHS相似度最高,達到81.90%(圖2)。

表2 不同物種CHS基因的信息Tab.2 Information on CHS genes in different species

圖2 不同來源的CHS基因進化樹和基因結構Fig.2 CHS genetic tree and genetic structure from different sources
對TaCHS基因的組織表達定量分析結果表明,TaCHS在小麥的根、莖、葉和籽粒中均有所表達,尤其在莖中的表達量最高,顯著高于根、葉和籽粒中的表達量,是根中表達量的3倍、葉片中的11倍、籽粒中的16倍(圖3-A)。
在灌漿期,TaCHS基因的表達水平在揚麥10號和周麥98165的籽粒中均呈現出先升高后下降再升高的特點,在花后14 d達到第一個峰值;且在整個灌漿期,揚麥10號籽粒中TaCHS的表達量均高于周麥98165,這表明揚麥10號籽粒中可能有較高的類黃酮積累(圖3-B)。

不同字母(a, b, c)表示差異顯著(P< 0.05)。Different letters (a, b, c)indicate significant difference(P< 0.05).

M.DL2000 DNA Marker;1-6.周麥98165、揚麥10、許科316、鄭麥366、大白芒、矮抗58 TaCHS基因的PCR擴增。M.DL2000 DNA Marker; 1-6.PCR amplification of TaCHS gene in Zhoumai 98165, Yangmai 10, Xuke 316, Zhengmai 366, Dabaimang, Aikang 58.
對119份小麥品種的DNA樣品進行擴增,經1.5%瓊脂糖凝膠電泳檢測(圖4)后,將有明亮目的條帶的樣品測序。
通過序列比對分析發現,不同小麥品種TaCHS基因在56個位點處存在單核苷酸突變,并在內含子區域存在小片段的Indel,但其編碼的氨基酸序列基本一致,僅在6個位點處存在差異(圖5)。在119份品種中共鑒定到4種TaCHS基因類型,分別命名為TaCHS-A1a(代表品種:中國春)、TaCHS-A1b、TaCHS-A1c、TaCHS-A1d,其分布頻率為85.72%,7.56%,3.36%,3.36%(表3)。4種TaCHS基因類型的DNA序列相似度為97.81%,氨基酸序列相似度為99.43%。TaCHS-A1a與TaCHS-A1b間僅存在1個G/A有義突變,導致1個天冬氨酸(Asp)突變為天冬酰胺(Asn)。TaCHS-A1a與TaCHS-A1c間存在48個SNP, 且在內含子上存在1個5 bp的Indel,其中有4個有義突變C/T、A/G、G/C和G/A,分別位于790,1 159,1 183,1 272 bp處。TaCHS-A1a與TaCHS-A1d間存在51個SNP, 且在內含子區域存在1個4 bp的Indel,其中有4個有義突變G/C、A/G、G/C和G/A,分別位于171,1 159,1 183,1 272 bp處(圖6)。在4種TaCHS基因型中,TaCHS-A1a與TaCHS-A1b的DNA序列相似度最高,為99.92%;TaCHS-A1c與TaCHS-A1d的DNA序列相似度最高,為99.15%。

圖5 不同TaCHS基因等位變異編碼的氨基酸序列比較Fig.5 Comparison of allelic amino acid sequences of TaCHS gene

圖6 TaCHS基因等位變異結構Fig.6 Structure of allele variation in TaCHS gene

表3 TaCHS基因型分布Tab.3 TaCHS genotype distribution
CHS基因參與多種代謝調節活動,其主要功能是影響花色和育性,并在植物逆境脅迫中發揮作用[12-14]。CHS基因在黃酮代謝途徑中調控著黃酮類成分的生物合成與積累,同時CHS的表達受各種外界環境的影響,植物在應激條件下,CHS基因表達量升高,促進黃酮類化合物積累[10]。對小麥TaCHS組織表達定量分析結果表明,TaCHS基因在莖中的表達水平最高,而在葉片中的表達量較低,這與報道的人參、苦蕎和膜莢黃芪中CHS基因在葉片中的表達量高于莖中有一定差異[15-17]。這種差異的原因可能主要來源于不同物種的差異;另外,種植環境也對類黃酮合成酶基因的表達有顯著的影響。前期的研究結果表明,葉片中TaCHS基因的表達量與小麥幼苗的抗旱性有顯著相關性[18],因此,莖鞘中較高的TaCHS表達量是否與植株抗逆性有關還有待進一步的探討。
黃酮類化合物被證實具有預防多種疾病的功能,因此,提高作物籽粒中黃酮類化合物含量對人體健康具有重要的意義[19-21]。灌漿期籽粒中TaCHS基因表達水平在花后14 d達到第一個峰值,花后21 d表達量急劇下降,這與Yang等[22]對CHS基因在藍粒小麥中的定量分析結果基本一致。在灌漿期揚麥10號(紅麥)的TaCHS基因表達量均高于周麥98165(白麥),這可能一定程度上有助于籽粒中積累較高的類黃酮化合物,提高其抗氧化性。研究表明,紅粒小麥相對于白粒小麥具有較高的抗氧化性[23]。不同品種TaCHS基因在籽粒中的表達模式可能與籽粒中類黃酮類物質積累有關,因此,關于TaCHS基因表達量與籽粒類黃酮含量的積累及其抗氧化性的關系有待進一步的探討。
通過對黃淮麥區119份小麥品種TaCHS基因序列分析,共鑒定到4種TaCHS基因類型, 85.71%的小麥品種的TaCHS基因序列與中國春的序列完全一致,表明TaCHS-A1a類型是目前育成品種的主要變異類型。TaCHS的序列較為保守,但依然在少數品種中存在等位變異,不僅在內含子區域存在片段的缺失,同時存在編碼氨基酸差異的有義突變,明確這些變異尤其是位于結構域中的堿基差異與籽粒的類黃酮含量以及抗氧化性的關系,以及若能基于這些位點開發與類黃酮積累量高低相關的功能標記將對育種工作提供重要的參考,有待于下一步的研究。