劉冬梅,婁喜艷,喻 擁,李 瑤,裴冬麗*
(1. 商丘師范學院生物與食品學院植物與微生物互作省級重點實驗室,河南 商丘 476000;2. 商丘工學院土木工程系,河南 商丘 476000)
【研究意義】棉花是重要的經濟作物。 陸地棉是世界上種植最廣泛的棉花種類,占全棉產量的90 %。 異源四倍體物種衍生自作為父本Gossypiumraimondii,提供了D基因,以及作為母本的A基因組物種G.Arboreum。他們在五千至一千萬年前分化,在一百至兩百萬年前重新團聚起來形成陸地棉。
【前人研究進展】轉錄控制是細胞或生物體調節其基因表達的主要機制,轉錄因子(TFs)是通過結合其啟動子區域來調節幾個其他基因的表達,從而導致轉錄的蛋白質。除了正常的基因轉錄控制之外,它們還可以作為對環境信號的響應來調節基因表達[1]。WRKY轉錄因子是目前發現的最大的轉錄因子之一,有研究表明,WRKY蛋白在防御包括細菌,真菌和病毒病原體在內的各種生物脅迫的植物防御中發揮關鍵作用,它們在發育過程中也起著重要的調控作用,如毛狀體啟動,胚胎形態發生,衰老以及植物激素如赤霉酸,脫落酸,或水楊酸。也有越來越多的證據表明WRKY蛋白參與了對各種非生物脅迫的反應。在擬南芥中,微陣列分析顯示,一些WRKY轉錄物在響應各種非生物脅迫如鹽度,干旱和寒冷時受到強烈調控。在水稻中,非生物脅迫(寒冷,干旱和鹽度)或各種植物激素處理下,54個WRKY基因在轉錄本豐度上表現出顯著差異。在大麥中,WRKY基因Hv-WRKY38在受到寒冷和干旱脅迫時表達,而在大豆中至少有9種WRKY基因在非生物脅迫下差異表達[2],值得注意的是,單個WRKY基因可以通過與幾種VQ蛋白(具有VQ連接的基序,包括SIB1和SIB2(西格瑪因子相互作用蛋白))調節多種非生物脅迫來調節多種非生物反應[3]。
自從第1個編碼WRKY蛋白SPF1的cDNA 由 Ishiguro 和 Nakamura在甘薯中克隆出來后,更多的WRKY基因在不同植物中被發現,尤其是在禾本科植物中,包括野生燕麥,水稻,小麥等[4]。近年來,隨著高通量測序工作的實施,許多物種的測序工作都已經完成,棉花WRKY基因家族包含116個基因[5]。WRKY蛋白因含有約60個氨基酸的1個或2個域指定的WRKY結構域而得名。在其N端含有一段保守的氨基酸基序WRKYGQK,在C端含有一個新型的C2H2(C-X4-5-C-X22-23-H-X-H,X可以是任意的非保守氨基酸)或C2HC(C-X7-CX23-H-X-C)鋅指結構[6]。根據其結構域的數量和鋅指結構的類型,WRKY蛋白可分為3類。I類有2個WRKY結構域和C2H2型鋅指結構域,II類有1個WRKY結構域和C2H2型鋅指結構域,根據其結構可以進一步分為5個亞類(II-a、II-b、II-c、II-d和II-e),III類有1個WRKY結構域和 C2HC型鋅指結構[7]。WRKY結構域對于的不同順式作用DNA元件顯示出高結合親和力稱為W盒(T/CTGACC/T)[8]。W盒已經在許多涉及防御和應對環境壓力的基因的啟動子中鑒定出,W盒也存在于WRKY基因啟動子本身中,表明WRKY基因是自我調節的,并且還可以調節應激相關基因的表達[9]。
有研究表明,WRKY70積極參與油菜素類固醇(BR)調節的生長,并且負面地參與干旱反應[10]。鷹嘴豆CaWRKY70通過調控CaHDZ12表達,從而影響植株的抗旱和耐鹽能力[11]。以擬南芥為模型系統,WRKY70通過激活SA信號通路調控由蠟狀芽孢桿菌AR156引發的誘導型全身抗性(ISR)[12]。油菜BnWRKY70基因表達程度與其植株的抗病性呈正相關[13]。擬南芥中的WRKY70同時參與了防御丁香假單胞菌侵染和RPP4調控的抗霜霉病過程,并通過與RCY1抗病蛋白作用來調節擬南芥抗黃瓜花葉病毒[14]。陸地棉WRKY3在根、莖和葉中形成并通過調節各種植物激素(包括水楊酸、脫落酸、茉莉酮酸甲酯、乙烯、赤霉素等)進行表達[15]。對WRKY轉錄因子在二倍體A和D棉花品種中的綜合比較研究中, 總共鑒定了112G.raimondii和109G.arboreumWRKY基因。在2種物種之間沒有發現顯著的基因結構或結構域改變,但許多SNP在外顯子和內含子區域分布不均勻[16]。據已有文獻顯示,WRKY轉錄因子還參與棉花花藥的發育[17]。在野生大豆中。WRKY基因家族成員GsERKY20參與調控植物開花時間[18]。NAC和WRKY的共同表達在調控芝麻MS中起關鍵作用[19]。在擬南芥中,WRKY34轉錄因子已被證明參與其花粉的發育[20],表明該轉錄因子在不同植物體中的功能基本相似,推測GhWRKY70也有上述部分或全部功能。
【本研究切入點】根據前人研究結果,WKY70轉錄因子參與多個生物學過程,其中包括調控開花時間。轉錄組測序結果顯示,WKY70轉錄因子在陸地棉洞A在不育系不育花藥中表達高于可育花藥,推測該基因與棉花雄性不育相關。本文克隆了該基因并對其結構和親緣關系進行了分析,同時通過實驗驗證該基因在雄性不育和可育花藥中的差異表達,為了進一步研究該基因功能奠定基礎。
【擬解決的關鍵問題】該基因的克隆和結構分析為棉花雄性不育基因功能和雄性不育機理的研究提供前提,也為棉花雄性不育材料的創造提供基礎。
1.1.1 植物材料 陸地棉洞A不育系花藥(花蕾d=3~4 mm)。
1.1.2 試劑 DL2000 DNA Marker購自全式金公司, ExTaq聚合酶、rTaq聚合酶、solution1 連接酶、pMD18-T載體,M購自TaKaRa公司,DNA 凝膠回收試劑盒購自東盛公司,Trizol試劑購自上海閃晶分子生物科技有限公司,ReverTra Ace qPCR RT Kit試劑購自東洋紡(上海)生物科技有限公司,大腸桿菌由本實驗室保存。
1.2.1 RNA提取與cDNA的合成 RNA提取參照Trizol(上海閃晶)試劑說明書操作步驟。
cDNA合成參照ReverTra Ace qPCR RT Kit(東洋紡)試劑說明書操作步驟。
1.2.2GhWRKY70轉錄因子的克隆 利用Primer 5設計GhWRKY70轉錄因子全長引物,引物序列Unigene19749-F:NNNNGGATCCATGGGAAGTGTGTCAGCTTGGC;Unigene19749-R:NNNNG TCGACCTA GACCAACTCACTTTCATCAAACTG N(A,T,C或G)。
GhWRKY70轉錄因子全場基因PCR擴增體系為:10×ExTaqbuffer 5 μl;10 mM dNTPs 1 μl;Primer-s 1 μl;Primer-as 1 μl;cDNA 1 μl;0.5 μl;加ddH2O至 50 μl。其PCR擴增程序為:預變性94 ℃,5 min;變性94 ℃,30 s;退火63 ℃,1 min;延伸72 ℃,50 s;終延伸72 ℃,10 min;進行35個循環,4 ℃保存。
1.2.3 PCR產物T載體的連接 將克隆所得片段使用試劑盒進行膠回收,并與pMD18-T連接。T載體連接體系solution1 5 μl;片段 4 μl;載體1 μl,20 ℃過夜連接。
1.2.4 大腸桿菌感受態細胞的制備及載體轉化 方法參照張麗霞,賈海燕(2013)一種簡便高效大腸桿菌感受態細胞制備方法[21]。
1.2.5 轉化后大腸桿菌的克隆及測序 以菌液為模版進行克隆,用Primer 5程序設計菌液PCR檢測引物H-19749-1-F GGTTGGGATTTTGGGGTTGC;H-19749-1-R GACTGGAAGATGCTGGCTCC。菌液檢測PCR體系10×rTaqbuffer 2 μl;10 mM dNTPs 0.2 μl;Primer-s 0.3 μl;Primer-as 0.3 μl;菌液 1 μl;rTaq0.2μl;ddH2O 16 μl。其PCR擴增程序為:預變性94 ℃,5 min;變性94 ℃,30 s;退火60 ℃,40 s;延伸72 ℃,50 s;終延伸72 ℃,10 min;進行35個循環,4 ℃保存。將結果送上海生物工程公司測序,通過多次比對序列,最后得出完整序列。
1.2.6 電泳 ① 瓊脂糖凝膠制備:稱取0.4 g的瓊脂糖,加入40 mL的TBE,放入微波爐中加熱溶解,煮沸3次至完全溶解,待膠涼至60~70 ℃時,倒平板凝固。② 點樣:將RNA提取液(PCR擴增產物或待檢測的菌液)和Loding Buffer按照5∶1的比例混勻點入點樣孔,點2個樣。③ 電泳條件:電壓120 V,電泳15 min。④ 染色:跑完電泳后,膠片在EB中浸泡30 min。⑤ 觀察:紫外光下觀察電泳條帶。
1.2.7 預測與分析 通過NIBI在線軟件ORF Finder(https://www.ncbi.nlm.nih.gov/orffinder/)預測GhWRKY70氨基酸個數以及蛋白質序列。用在線軟件SMAR(http://smart.embl-heidelberg.de/)對蛋白質結構域分析。
利用Expasy數據庫中的在線軟件Prot Param(http://web.expasy.org/protparam/)分析并預測GhWRKY70蛋白的理化性質。
用swiss-model分析軟件(http://swissmodel.expasy.org//SWISS-MODEL.html)進行三級結構預測。
1.2.8 引物設計 通過Primer 5設計引物,轉錄因子GhWRKY 70在不育和可育花藥中的表達進行Q-PCR檢測,以棉花泛素蛋白基因為內參用,差異表達分析引物如下:H-1975-F:GCCTCCAATTGTCCCCTTCA;H-1975-R:TACGCAAACTGTTCACCCGA,片段長度161 bp。根據導出數據計算各指標的平均Ct值、ΔCT值及ΔΔCT值,并計算檢測指標的相對表達水平。
從圖1可以看出,條帶清晰,沒有拖帶現象,RNA無降解,分光光度計測定RNA濃度為175.08 ng/μl,純度(A260/A280)為2.147,可用于基因克隆模板。
從圖2可以看出,其位置處于750~1000 bp中間,片段大小與目的基因相符,條帶清晰。
根據菌液PCR檢測結果(圖3),挑取陽性克隆,送公司測序。

M:DL2000 Marker;1:棉花不育花藥總RNA圖1 RNA提取及反轉錄Fig.1 RNA extraction and reverse transcription

M:DL2000 Marker ;1:PCR所得基因克隆產物圖2 Gh WRKY70基因全長的克隆Fig.2 Full-length gene cloning of Gh WRKY70

M:DL2000 Marker;1~2:PCR所得菌液克隆產物圖3 檢測菌液PCR Fig.3 Detection of bacteria PCR
將獲得的全長基因送上海生物工程公司測序,得到GhWRKY70完整編碼區序列,該基因全長為918 bp,將測序所得到的GhWRKY70完整編碼區序列通過BackIt提交到NCBI,Gene BANK號為MF278614。
2.5.1 Gh WRKY70蛋白質序列GhWRKY70基因編碼305個氨基酸,該蛋白只有1個WRKY結構域,包含61個 aa其位置處于128~191,E值為4.44e-36,在292~301處還有1個組成低復雜性序列區域(圖4)。
2.5.2 Gh WRKY70蛋白質的二級結構預測 Gh WRKY70蛋白二級結構預測結果顯示該蛋白質α螺旋(Hh)為98個,占全部結構的32.13 %,延伸鏈(Ee)37個,占全部結構的12.13 %,13個β轉角(Tt),占全部結構的4.26 %,無規則卷曲有157個(Cc),占全部結構的51.48 %(圖5)。
2.5.3 Gh WRKY70蛋白質三級結構預測 在對Gh WRKY70進行蛋白質三維結構預測的結果中顯示,該蛋白只有1個WRKY結構域,與蛋白質結構域分析的結果一致,說明預測結果準確。將生成的 PDB 結果在 SWISS-pdb Viewer 軟件中觀察蛋白質的結構,結果表明Gh WRKY70三維空間結構主要是由β-折疊和無規則卷曲組成(圖6)。

圖4 蛋白質結構域分析Fig.4 Protein domain analysis

圖5 GhWRKY70蛋白的二級結構預測Fig.5 Secondary structure prediction of GhWRKY70 protein

圖6 Gh WRKY70蛋白質三級結構Fig.6 Gh WRKY70 protein tertiary structure
在Gh WRKY70蛋白理化性質預測分析結果中顯示,該蛋白有305個氨基酸,由19種氨基酸組成,分子量:34648.65,理論等電點:5.97,分子式:C1502H2366N426O490S13。在WRKY70的氨基酸序列中Ser的使用頻率最高,為10.5 %。WRKY70蛋白總的負電荷殘基數為46個,正電荷殘基數為41個,蛋白質的不穩定指數較高,為50.81,指數大于40,表明該蛋白是不穩定的。WRKY70蛋白親水性較強,氨基酸殘基疏水性總和(GRAVY)為-0.838。
運用MEGA5軟件對陸地棉(MF278614GossypiumhirsutumWRKY70)和煙草(KM510344.1NicotianatabacumWRKY70)、擬南芥(AF421157.1ArabidopsisthalianaWRKY70)、小麥(LC068769.1TriticumaestivumWRKY70)、甘藍(KM593152.1Brassicaoleraceavar WRKY70)、蕓苔(KF430076.1BrassicarapaWRKY70)、辣椒(KF484401.1CapsicumannuumWRKY70)、玉米(NM_001154348.1ZeamaysWRKY70)、水稻(BK005073.1OryzasativaWRKY70)、大豆(NM_001315509.1GlycinemaxWRKY70)、粗山羊草亞種(XM_020312323.1Aegilopstauschiisubsp WRKY70)、芭蕉亞種(XM_009417198.2Musaacuminatasubsp WRKY70)、可可(XM_018129667.1TheobromacacaoWRKY70)、亞洲棉(XM_017749682.1GossypiumarboreumWRKY70)、西瓜(GQ453670.1CitrulluslanatusWRKY70)15個序列進行同源性分析, 使用鄰近法(NJ method), bootstrap 設為 1000,構建進化樹,其結果顯示GhWRKY70與亞洲棉的系統進化樹在同一支上,同源性最高,可可在另一個分支上,相比之下同源性次之。水稻和玉米在最遠的分支上,則與其同源性最差(圖7)。
從圖8可以看出,GhWRKY70基因在不育花藥中的表達顯著高于可育花藥,表明該基因可能與洞A雄性不育有關,Q-pCR結果與轉錄組測序的結果一致,驗證了轉錄組測序結果的重要性。

圖7 陸地棉Gh WRKY70基因的同源進化樹分析Fig.7 Analysis of Gh WKY70 gene in upland cotton based on homologue evolutionary tree analysis

圖8 GhWRKY 70基因在不育和可育花藥中的差異表達Fig.8 Differential expression of GhWRKY 70 in sterile and fertile anther
通過本次研究,對GhWRKY70基因有了一個初步的了解。該基因全長918 bp,根據軟件分析,預測編碼305個氨基酸。在GhWRKY70編碼的蛋白中,只有1個WRKY結構域和1個C2-HC(C-X7-C-X23-H-X1-C)型的鋅指結構,屬于第III類,該類轉錄因子只在高等植物中存在[22]。開花植物中的WRKY III基因被認為起源于單子葉植物和真核生物的分歧。擬南芥III組成員的時間表達分析支持這些成員是不同植物防御信號傳導途徑的一部分,包括相容,不相容和非宿主相互作用,表明它們的功能分化。因此,WRKY III基因在植物適應和進化中發揮了關鍵作用。 WRKY III基因被認為是進化方面最先進的,并且在適應性方面最為成功的[23]。該蛋白WRKY結構域中高度保守的WRKYGQK這七個氨基酸序列并不是一成不變的,有些植物的WRKY成員的這七個序列中的W、Q和K會出現變異,而且Q位點突變頻率最高[24]。擬南芥WRKY 結構域中存在的Q突變為K。水稻WRKY結構域中存在Q突變為E。WRKY結構域的突變會改變蛋白質的結構,從而導致蛋白質的某些功能的減弱甚至喪失。下一步工作將基因轉入陸地棉或擬南芥中,驗證該基因功能,為創造棉花雄性不育材料奠定基礎。