王 萍,于月華,白玉翠,郭坤鵬,康嘉楠,倪志勇
(新疆農業大學 農學院,新疆 烏魯木齊 830052)
大豆(Glycinemax(L.) Merr.)是重要的食用蛋白、食用油和飼用蛋白原料,也是我國主要的糧食作物之一。近年來我國大豆的消費增長迅速,主要集中在食用大豆、大豆油、飼用豆粕等方面,且年消費量分別為800,900,3 000多萬t。其中大豆油消費量占植物油總消費量的40%以上,飼用豆粕消費量約占國內飼料工業蛋白原料的60%,是肉、蛋、奶中蛋白質的間接來源[1]。為了培育優質高產的大豆品種來提高大豆的品質及產量,深入了解大豆發育和抗逆的分子機制對于該作物產量和品質的遺傳改良有重要意義。
目前,已知幾種類型的轉錄因子,如NAC、WRKY、AP2/EREBP、C2H2、MYB等[2-4],它們對植物在非生物脅迫中所受的壓力有轉錄調節的作用。NAC蛋白家族是一個大型植物特異性家族,在大多數植物中具有100~170個成員[5],其特征在于在N末端具有保守的NAC結構域和高度不同的轉錄激活因子C末端[6]。Souer等[7]于1996年首次在矮牽牛(Petuniahybrida)中克隆出了NAC轉錄因子基因NAM(NoApicalMeristem)。緊接著Aida等[8]也在擬南芥(Arabidopsisthaliana)中發現了ATAF1/2和CUC2(cup-shapedcotyledon)轉錄因子基因,進一步研究發現該基因與NAM結構相似。近年來,研究者們發現了許多NAC轉錄因子,且該類轉錄因子具有多種多樣的生物功能和植物特異性。目前,已在擬南芥、小麥(Triticumaestivum)、水稻(Oryzasativa)、馬鈴薯(Solanumtuberosum)、玉米(Zeamays)、大麥(Hordeumvulgare)等約20多種植物中發現了NAC基因。因此,NAC家族的轉錄因子是目前在植物基因組中發現的最大的轉錄因子家族之一[9]。
如今,在研究者們對大豆NAC基因家族不斷深入的研究下,克隆并鑒定了許多大豆NAC類轉錄因子基因。該家族中許多成員還參與植物非生物和生物脅迫應答,同時也在植物適應外界不良環境過程中發揮著重要作用,表達譜分析結果表明,約20%~25%的NAC轉錄因子參與了至少一種非生物脅迫應答過程[10],它們在植物生長發育[11-12]、激素調節和抵御逆境[13-14]等方面發揮著重要的作用。例如,Jin等[15]、Quach等[16]研究發現,過表達的GmNAC2基因和過表達的GmNAC004基因分別會導致轉基因煙草對干旱、鹽和低溫敏感并增加擬南芥側根數量和長度,并且轉GmNAC004的擬南芥和野生型擬南芥相比在中度水分脅迫條件下,其側根數和長度都比野生型高。金杭霞[17]發現,過量表達GmNAC5基因使轉基因煙草葉片形態發生改變,可能導致煙草葉片變狹長,GmNAC2基因過量表達使煙草對干旱、高鹽和冷害脅迫表現較敏感,煙草幼苗出現矮小,根長較短等現象。劉曉慶等[18]通過對GmNAC8做Western Blot分析發現,GmNAC8與相應的抗體有良好的結合能力,具有特異性。Souer等[7]研究發現,矮牽牛的NAM基因突變體不能正常形成頂端分生組織,此結果說明NAC基因在分生組織的生長發育中起重要作用。韓巧玲等[19]研究表明,GmNAC2a基因可能作為交叉點,不僅參與非生物脅迫響應途徑,而且可能參與乙烯相關的生物響應途徑。Ni等[20]研究分析了大豆gma-MIR394a基因的功能,發現gma-MIR394a基因在干旱脅迫忍耐中具有正調控功能。劉輝等[21]研究發現,SlNAC80的表達受低溫、干旱、高鹽和ABA誘導,表明SlNAC80可能通過ABA依賴的途徑參與番茄非生物脅迫應答。王國東等[22]發現,PnNAC1響應幾種逆境相關信號分子,并參與三七對茄腐鐮刀菌和人參鏈格孢的防衛反應。這些研究表明,NAC是一類具有多種生物學功能的轉錄因子。
大豆基因組由152個編碼NAC轉錄因子的基因組成[23],目前,已經有許多大豆NAC基因被克隆和分析,同時也鑒定出了一些大豆NAC基因的功能。這些研究對深入探索大豆的生長發育情況及其對逆境脅迫響應的分子機制有著非常重要的意義。本研究從大豆中克隆了1個NAC轉錄因子基因,命名為GmNAC23,并對其進行了系統進化樹、組織特異性表達模式及轉錄激活功能分析,旨在為進一步研究該基因的生物學功能奠定試驗基礎。
大豆栽培品種為Williams 82,由中國農業科學院作物科學研究所作物種質資源中心抗逆研究課題組所提供。將其在溫室中水培25 d后,取葉片組織,液氮速凍,并保存于-80 ℃冰箱備用;DL2000 Marker購自北京天根生化公司;TaqDNA聚合酶、大腸桿菌菌株(E.coli)DH5α感受態細胞購于北京全式金生物有限公司;卡那霉素(Kan)、限制性內切酶SalⅠ、BamH Ⅰ、T4DNA連接酶購于Fermentas公司;引物合成于北京鼎國昌盛生物技術有限責任公司;酵母 YPDA 培養基粉末、酵母單缺培養基粉末SD(Trp-)、酵母三缺培養基粉末SD(Trp-/His-/Ade-)購于北京泛基諾生物有限公司;ONPG購于北京全式金生物有限公司。
1.2.1 大豆葉片RNA的提取與cDNA的合成 將保存于-80 ℃冰箱的大豆葉片經液氮研磨后,使用TRIzol試劑盒(Invitrogen)提取葉片組織總RNA,并用1%瓊脂糖凝膠電泳檢測所提取的RNA,電泳檢測成功后使用反轉錄試劑盒First strand cDNA Synthesis (Thermo Fisher)的說明書,將提取的大豆葉片總RNA反轉錄合成cDNA。
1.2.2GmNAC23基因全長序列的獲得及克隆 本試驗根據數據庫(http:∥www.phytozome.net/soybean.php)中大豆基因組數據的Glyma05g00930.1基因序列,設計了1對引物,nGmNAC23-F: 5′-CAA TAAAGAGTTTTGTTGAAATGGAA-3′和nGmNAC23-R: 5′-ACTTTTAGTAATTCCACAAACCATCA-3′,以合成的大豆葉片cDNA為模板,采用PCR的方法擴增GmNAC23基因的開放閱讀框(ORF)。PCR程序為:94 ℃ 5 min;94℃ 30 s,64℃ 30 s,72 ℃ 1 min( 35個循環);72 ℃ 10 min。將擴增后的PCR產物置1%瓊脂糖凝膠電泳,用紫外凝膠成像儀(Bio-Rad)觀察結果。檢測合格后將純化的PCR產物連接到克隆載體pJET1.2 (Thermo Fisher)中,轉化大腸桿菌挑選陽性克隆送上海美季公司測序。
1.2.3GmNAC23序列的生物信息學分析 利用生物信息學相關軟件對GmNAC23序列進行分析,從GenBank上下載其他物種的氨基酸序列進行同源性分析,用DNAMAN軟件進行多重序列比較,選取其他NAC基因的不同物種,如綠豆、鷹嘴豆、木豆、蒺藜苜蓿、木薯的NAC類基因,用MEGA 4.1軟件構建這些物種的系統發生樹。用Protparam(http://www. expasy.org/tools/protparam)在線工具,分析預測GmNAC23蛋白的分子質量、等電點及其理化性質;利用Predictprotein(https://open.predictprotein.org/)對氨基酸的二級結構進行預測;利用ExPASy(http://web. expasy.org/)對氨基酸的三級結構進行預測;利用 Phytozome V 10.3在線數據庫對GmNAC23基因的組織特異性表達模式進行分析,并發現了GmNAC23基因在染色體上的定位。

圖1 大豆GmNAC23蛋白與其他植物NAC蛋白的同源性比對(A)及其結構域預測(B)Fig.1 Homology comparison of soybean GmNAC23 protein with other plant NAC proteins (A) and its domain prediction (B)
1.2.4GmNAC23酵母表達載體的構建 根據大豆GmNAC23基因序列,設計帶有EcoRⅠ和BamHⅠ酶切位點的引物用PCR方法擴增GmNAC23的ORF序列,引物序列為,23-F: 5′-ATTGAATTCATGGAA AACGTTCCGGCGGTG-3′和23-R: 5′-TTAGGATCCTTAGTAATTCCACAAACCATCAAGATCCAATG-3′,(引物中劃線部分表示酶切位點)。膠回收帶有酶切位點GmNAC23的ORF序列,經過雙酶切,將酶切產物進行純化后,與相同酶切的pGBKT7載體連接,轉化大腸桿菌(E.coli)DH5α感受態細胞,挑選陽性克隆,通過菌液PCR和測序(上海美季)對重組質粒進行檢測。
1.2.5 GmNAC23轉錄激活活性分析 酵母體內轉錄激活試驗參照Yu等[24]方法。利用ONPG方法測定酵母菌株AH109中不同轉化體β-半乳糖苷酶活性,參照李葉云等[25]方法。
本研究以大豆葉片cDNA為模板,利用RT-PCR的方法獲得了一段長為1 077 bp的核苷酸序列,并將其命名為GmNAC23。GmNAC23編碼區長1 053 bp,編碼350個氨基酸,通過軟件預測其分子量為39.483 ku,等電點為7.08。GmNAC23基因組DNA由3個外顯子和2個內含子組成,長度為 1 778 bp。預測氨基酸序列如圖1,發現GmNAC23中含有1個NAM結構域,該結構域位于第16-166個氨基酸,并且在GmNAC23的第188-202個氨基酸存在1個低復雜組成區域,此區域由LGSSALPPLSDSSPS氨基酸組成(圖1)。
將利用NCBI搜索得到的綠豆、鷹嘴豆、木豆、蒺藜苜蓿、木薯的氨基酸序列與GmNAC23的氨基酸序列進行多序列比對并作系統進化樹分析,發現GmNAC23與綠豆VrNAC(Vignaradiata,XP_ 014507026)和木豆CaNAC(Cajanuscajan,XP_020227105)的親緣關系較近,氨基酸一致性分別為88%和84%,且GmNAC23與木豆CaNAC聚在一個分支(圖2)。
利用蛋白質亞細胞定位預測網站 (http://www.psort.org/)對GmNAC23的亞細胞定位進行預測分析, 結果顯示, GmNAC23與其轉錄因子的特征一致定位于細胞核中第5號染色體Chr05:2217936..2219956(reverse)上。利用在線軟件(https://open.predictprotein.org/)預測GmNAC23蛋白質的二級結構(圖3)。通過SWISS-Model(http://swissmodel.expasy.org/)對GmNAC23蛋白質的三級結構進行預測,得到了該蛋白質的三級結構(圖4)。

圖2 GmNAC23蛋白與其他NAC蛋白系統進化樹分析Fig.2 Phylogenetic tree analysis of GmNAC23 protein and other NAC protein systems

圖3 大豆GmNAC23蛋白的二級結構預測Fig.3 Secondary structure prediction of soybean GmNAC23 protein

圖4 大豆GmNAC23蛋白三級結構預測Fig.4 Prediction of the tertiary structure of soybean GmNAC23 protein
本研究為了探索GmNAC23基因的組織特異性表達情況,利用Phytozome V 10.3數據庫搜索獲得了GmNAC23基因在大豆不同組織中的組織特異性表達數據,結果發現,在大豆的不同組織中GmNAC23基因均有表達,并且表達量存在差異。根據數據庫中的FPKM值,發現GmNAC23基因在根中表達量最多,達到67.492。GmNAC23基因在莖頂端分生組織中表達量最小,為0.230(表1)。以上結果表明,在大豆不同組織的發育過程中均有GmNAC23基因的參與,且GmNAC23基因對大豆不同組織的生長發育起到一定的調控作用。
將擴增得到的GmNAC23與pGBKT7連接構建酵母表達載體,轉化酵母菌株AH109,pGBKT7 空載體作為對照同時轉化酵母菌株, 將稀釋過的菌液分別點在單缺和三缺的平板上,30 ℃培養2 d。觀察酵母菌落的生長情況,其結果是轉化體pGBKT7和GmNAC23-pGBKT7在酵母單缺SD(Trp-)營養型缺陷培養基上均能正常生長,說明這2個質粒均已成功轉化到酵母中。而轉化GmNAC23-pGBKT7的酵母轉化體能在三缺SD (Trp-/His-/Ade-)營養型缺陷培養基上正常生長,對照pGBKT7的酵母轉化體不能在三缺SD (Trp-/His-/Ade-)營養型缺陷培養基上正常生長。以上試驗結果說明,GmNAC23具有一定的轉錄激活功能,并且其轉錄激活功能較強(圖5-A)。

表1 大豆GmNAC23基因的組織特異性表達Tab.1 Tissue-specific expression of soybean GmNAC23 gene

A.GmNAC23在酵母中的轉錄激活功能分析; B.GmNAC23轉錄因子β-半乳糖苷酶活性分析。A.Analysis of transcriptional activation function of GmNAC23 in yeast; B.Analysis of β-galactosidase activity of GmNAC23 transcription factor.
對GmNAC23的轉錄激活功能進行了定性分析后,本研究進一步對pGBKT7和GmNAC23-pGBKT7的轉錄激活活性進行了定量分析,分析了酵母菌株AH109中pGBKT7和GmNAC23-pGBKT7轉化體β-半乳糖苷酶的活性,結果發現,GmNAC23-pGBKT7轉化體表現出較高的β-半乳糖苷酶活性,而對照pGBKT7轉化體表現出較低的β-半乳糖苷酶活性。結果進一步說明GmNAC23轉錄因子具有較強的轉錄激活功能(圖5-B)。
NAC轉錄因子是參與植物的許多調控和發育過程以及植物應激反應的一類轉錄因子,構成了一個大的植物特異性家族,由N端保守的DNA結合區域和C端的轉錄激活區域組成的,NAC也是植物特有的一個轉錄因子家族。鄒嘉欣等[26]通過生物信息學分析發現,NAC家族基因分布廣,結構多為個3個外顯子,1個擁有兩端保守基序的NAM結構域位于2個相鄰外顯子上。本研究從大豆中克隆得到了1個命名為GmNAC23的NAC轉錄因子,其具有1個NAM保守結構域,此結構域位于第16-166個氨基酸。經過分析發現,GmNAC23轉錄因子具有3個外顯子和2個內含子,Meng等[27]研究發現,GmNAC1-GmNAC6都含有2個內含子,表明這些GmNAC具有保守的基因組結構。
NAC蛋白構成一個大的家族,其每個家族成員在植物發育中扮演不同的角色,NAC轉錄因子基因屬于編碼植物中重要調節蛋白的大家族基因。李偉等[28]通過聚類分析發現,19個生物學功能已知的NAC轉錄因子在同一分支的具有相似的生物學功能。本研究通過對NCBI搜索得到的綠豆、鷹嘴豆、木豆、蒺藜苜蓿、木薯的氨基酸序列與GmNAC23的氨基酸序列進行多序列比對并作系統進化樹分析,發現綠豆(88%)和木豆(84%)與其進化關系最近,氨基酸一致性達到88%和84%,并且其具有相似的生物學功能。
前人經過研究發現,許多大豆NAC家族成員基因具有轉錄激活的功能。Tran等[29]對31個GmNAC轉錄因子進行酵母單雜實驗,發現其中28個都具有轉錄激活活性。這些研究說明大豆NAC家族蛋白可能具有不同的轉錄調控機制。本研究預測GmNAC23亞細胞定位發現其定位于細胞核中第5號染色體上,并對GmNAC23的轉錄激活功能進行了定性和定量分析,結果發現GmNAC23具有較強的轉錄激活功能。這與NAC蛋白具有轉錄激活活性的傳統認知相符合[30-32]。以上研究結果為下一步分析轉錄激活區的定位提供了依據。
大豆基因組中含有 152 個編碼NAC轉錄因子的基因,這些NAC基因呈現的表達模式各不相同。孟慶長[33]從大豆中克隆了6個編碼NAC同源蛋白的基因序列GmNAC1~GmNAC6,組織表達分析表明GmNAC4和GmNAC6為組成性表達。其他4個基因的表達具有不同的表達模式。本研究利用在線軟件探索GmNAC23基因的組織特異性表達情況,發現在大豆不同組織的發育過程中均有GmNAC23基因的參與,且GmNAC23基因對大豆不同組織的生長發育起到一定的調控作用。
本研究利用RT-PCR的方法從大豆中克隆1個NAC基因GmNAC23。序列分析表明,GmNAC23基因組包含3個外顯子和2個內含子。多序列比對結果表明,GmNAC23蛋白含有1個高度保守的NAM結構域。轉錄活性分析結果表明,GmNAC23具有轉錄激活功能。組織特異性表達模式分析表明,在檢測的所有組織中GmNAC23都有表達,在根中表達量最高,在莖頂端分生組織中表達量最低。本研究為進一步分析大豆GmNAC23的生物學功能提供實驗基礎。