段怡紅,閻媛媛,陳麗婷,李青,張冬梅,孫正文,張艷,馬峙英,王省芬
(河北農業大學農學院, 華北作物改良與調控國家重點實驗室, 河北省棉花產業協同創新中心,河北 保定 071001)
我國人多地少,提高復種指數和土地利用率始終是農業生產的主題之一。短季棉是適合中國一年兩熟和多熟制種植的棉花類型。我國以金字棉為基礎,通過近百年的育種,成功培育了一系列適宜黃河流域和長江流域一年兩熟乃至多熟的短季棉品種,以及適宜內陸棉區耐遲播早熟的短季棉品種。此外,短季棉株型緊湊、植株偏矮、葉量少的特點符合我國目前棉花產業機械化、輕簡化發展的需求,短季棉已成為棉花育種的基本需求之一。然而,我國短季棉種質資源狹窄,制約著短季棉育種的快速發展,利用分子育種的優勢,挖掘棉花開花時間調控基因,有助于短季棉的遺傳改良[1-4]。
MYB轉錄因子是植物中最大轉錄因子家族之一,其結構上都有一段保守的DNA結合區,即MYB結構域。在植物界,人們最早在玉米中發現了與色素合成有關的ZmMYBC1[5]。隨著基因組學和分子生物學的發展,越來越多的MYB家族成員被鑒定。植物中存在大量的MYB轉錄因子,具有多重生物學功能,如維持光周期,調控細胞的形態和模式建成,參與抗逆、抗病等一系列生理生化過程。MYB轉錄因子在調控植物開花過程中也發揮關鍵的作用。研究發現,LHY和CCA1是擬南芥MYB家族中維持和重設生物鐘的負反饋調控因子,生物鐘晝夜節律根據LHY、CAA1和TOC1轉錄和翻譯水平的變化而改變,三者相互作用,從而維持了擬南芥長日照促進開花、短日照抑制開花的典型特征[6-7]。Song等[8]也研究了擬南芥中LHY與ELF3基因之間的相互作用,發現ELF3突變體植株中LHY的轉錄本和蛋白表達減少,開花時間提前。MYR1和MYR2影響赤霉素合成,并在光強減弱時抑制開花[9]。EMF和FE均是在維管束組織特異表達的開花抑制子,通過調控FT響應光照和溫度對開花時間的影響[10-11]。CPL3通過FT調控開花時間[12]。TaMYB72在長日照條件下顯著促進水稻開花[13]。對金盞花花芽分化起始時轉錄組學和蛋白組學的研究也發現了MYB轉錄子[14]。上述研究表明,MYB轉錄因子是MADS基因外又一類重要的植物開花時間調控子。
棉花中已經發現500多個MYB基因[15],GhMYB7和GhMYB9在花及纖維中表達,并且調控纖維發育[16];GaMYB2在纖維中特異性表達,在葉片及纖維生長過程中都起作用[17];GhMYB109在纖維起始時期及伸長的纖維中特異性表達[18];GhMYB25在纖維伸長中也起著重要作用[19];GhMYB52在棉纖維次生壁加厚期優勢表達,參與纖維次生壁加厚過程[20]。重金屬脅迫可短暫抑制GbMYB5基因表達,PEG、脫落酸和赤霉酸誘導均可增強其表達[21];干旱、低溫和高鹽脅迫誘導GhMYB113基因表達[22];干旱脅迫誘導GaMYB2基因上調表達[23];GhRAX3響應干旱脅迫誘導,使棉花耐干旱脅迫能力下降[24]。目前,有關棉花MYB基因調控開花時間的報道甚少。
開花是植物由營養生長向生殖生長轉變的關鍵時期,受溫度、光周期等多種環境因子的調控,并在基因的調節作用下完成[25]。研究棉花開花時間相關基因的功能,探究其作用及調控機制,對于改良棉花生育期、產量、品質等方面具有重要作用[26]。本課題組前期首次完成了來自中國、美國、澳大利亞等主要植棉國419份陸地棉核心種質的基因組重測序?;? 665 030個SNP的全基因組關聯分析,發現位于D03染色體的一個MYB基因與開花時間顯著關聯[27]。本研究對該MYB基因進行了分析,發現棉花基因組中含有兩個序列相似度高的基因序列,分別位于D03和A02染色體,進一步對該基因進行了克隆和功能研究,研究結果將為棉花早熟分子育種提供重要的基因資源和理論依據。
棉花材料TM-1、哥倫比亞型擬南芥、本氏煙草均由本課題組保存。試驗所用pMD18-T載體、大腸桿菌感受態DH5α購自北京天根生化科技有限公司;農桿菌感受態GV3103為自制,植物表達載體35spGreen由本實驗室保存。
植物RNA提取試劑盒購自北京艾德萊生物科技公司,反轉錄試劑盒購自TaKaRa公司,熒光定量試劑盒購自US EVERBRIGHT?INC公司,2×PhantaTMMaster Mix購自南京諾唯贊生物科技公司,限制性內切酶購自賽默飛公司,2×TaqPCR Master Mix、瓊脂糖凝膠回收試劑盒和質粒提取試劑盒均購自天根生物科技有限公司。引物合成與測序均由金唯智公司完成。
棉花種植于河北農業大學農學院溫室,在植株生長到2片真葉(二葉期)時開始取樣,到五葉期結束,每次選取長勢均勻一致的植株最新生長出的一片真葉用于基因的實時定量表達試驗和基因克隆。擬南芥種植于23 ℃植物培養室,16 h光照,8 h黑暗,在苗期進行取樣,用于基因表達分析。所取材料立即投入液氮中冷凍,然后于-80 ℃冰箱保存備用。
從南京農業大學陸地棉基因組數據庫(https://cottonfgd.org/)下載基因序列并設計引物(表1),以cDNA為模板進行擴增,擴增體系20 μL:模板1 μL,前后引物各1 μL,2×PhantaTMMaster Mix 10 μL,ddH2O 7 μL。擴增程序:95 ℃預變性5 min;95 ℃變性30 s,60 ℃退火45 s,72 ℃延伸1 min,32個循環;72 ℃延伸5 min,12 ℃保存。擴增產物于1.2%的瓊脂糖凝膠進行電泳,將得到的目的條帶用膠回收試劑盒回收后,與pMD18-T載體連接,然后轉化大腸桿菌DH5α。挑取菌斑進行PCR檢測,陽性克隆用于測序。保存測序正確的單克隆菌液以供后續試驗使用。
利用Ex PASy網站上的Compute p I/Mw(http://web.expasy.org/compute_pi/)對目的基因編碼蛋白的理化性質進行預測和分析,并用NCBI的CDD數據庫( https://www.ncbi.nlm.nih.gov/Structure/cdd/ cdd.shtml)對其結構域進行預測。用SWISS-MODEL(https://swissmodel.expasy.org/interactive/Vh8qXc/models/)預測蛋白三級結構。從CottonFGD網站(https://cottonfgd.org/)搜索GhMYB44基因的同源序列,利用Mapchart軟件繪制基因在染色體上的分布圖,借助MEGA7.0進行系統進化樹分析。
采用cotton FGD網站(https://cottonfgd.org/)提供的轉錄組數據,分析GhMYB44a和GhMYB44b基因在棉花各組織部位及不同脅迫條件下的表達模式。
以測序正確的陽性克隆質粒為模板,利用引物GhMYB44-F和GhMYB44-R(表1)進行PCR擴增(體系和程序同1.3方法),獲得GhMYB44a和GhMYB44b基因片段,用限制性內切酶EcoRⅤ和BamHⅠ酶切目的基因片段、超表達載體35S pGreen和亞細胞定位載體35S pGreen-GFP,采用T4連接酶16 ℃過夜連接,將連接產物轉化大腸桿菌DH5α,并送公司測序。將測序正確的重組表達載體轉化農桿菌GV3101。

表1 本研究中所用引物序列Table 1 Primer sequences in this study
構建目的基因與GFP的融合表達載體35S:GhMYB44a-GFP和35S:GhMYB44b-GFP,用電擊法將重組質粒轉化農桿菌感受態GV3101,28 ℃震蕩培養,當OD600為1.0~1.2左右時,50 mL菌液收集菌體并重懸于50 mL緩沖液中,緩沖液包括:50 μL 乙酰丁香酮(200 μmol·L-1)、0.101 6 g MgCl2·6H2O、0.097 g 嗎啉乙磺酸、1 mol·L-1NaOH 150 μL,用ddH2O定容至50 mL,室溫放置3 h。本氏煙草種植于23 ℃植物培養室,16 h光照,8 h黑暗,選取長勢良好,葉片肥厚的煙草植株,將靜置的菌體懸浮液用1 mL的一次性注射器吸取出來,從煙草葉片下表皮慢慢注射,讓菌液充滿整個煙草葉片,黑暗避光48 h,撕取表皮細胞制片,在玻片上滴加DAPI染料,使用OLYMPUS激光共聚焦顯微鏡FV10I觀察葉片中綠色熒光蛋白的表達情況。
構建植物超表達載體35S:GhMYB44a和35S:GhMYB44b,用電擊法將重組質粒轉化農桿菌感受態GV3101,并轉化擬南芥[28]。轉基因擬南芥后代種植于營養土,在植株生長至兩片子葉平展后,葉面噴施除草劑Basta篩選陽性苗。待植株葉片稍大時,用CTAB法[29]提取擬南芥葉片基因組DNA,對目的基因進行PCR檢測。待植株開花時,統計植株蓮座葉數目,觀察植株的生長狀態。
按照北京艾德萊RNA試劑盒說明書提取RNA,保證所得RNA的OD260/280為1.8~2.1,OD260/230大于1.8。使用TaKaRa RR047A和RR6110A試劑盒進行反轉錄。熒光定量使用SYBR Green分析法,所用試劑盒為Fast Super EvaGreen qPCR Master Mix,儀器為Applied Biosystems 7500實時定量PCR儀。PCR反應體系包括:2×Super EvaGreen Master Mix 5.0 μL,前后引物各0.5 μL,cDNA 模板1.0 μL,10×ROX reference dye(B) 0.1 μL,ddH2O 2.9 μL。PCR反應條件:95 ℃ 2 min;95 ℃ 5 s,60 ℃ 5 s,72 ℃ 50 s,40個循環。以擬南芥At-TUB2為內參基因。每個樣品進行3次試驗重復,采用2-ΔΔCt法[30]分析試驗數據。利用SPSS11.0軟件處理數據,Graphpad Prism 7.00軟件作圖。
以棉花TM-1葉片的cDNA為模板進行擴增,得到1 000 bp左右的特異性條帶,測序結果顯示為兩條基因序列,長度為987和984 bp,同源性達98%,蛋白序列相似度達95%(圖1A)。兩者的結構域非常保守,蛋白的差異性位于C端,但保守域與C端的相對位置不同,可能導致功能的差異。通過cottonFGD數據庫(https://cottonfgd.org/blast/)比對發現,兩個基因位于D03和A02染色體(圖1C),分別命名為GhMYB44a和GhMYB44b。通過ExPASy網站預測,GhMYB44a編碼蛋白的分子量為37.1 kD,等電點為8.93;GhMYB44b編碼蛋白分子量為37.2 kD,等電點為9.15。進一步分析發現,GhMYB44a和GhMYB44b在A03和D02染色體上沒有相似度很高的同源序列,只與A11和D11染色體上的兩個基因有較高的同源性,說明本研究克隆的兩條序列是不同的基因,且各自在基因組中都是單拷貝(圖2)。

A: 氨基酸序列比對,紅框所示為MYB區域;B: 蛋白三級結構;C: 兩個基因在D03與A02染色體的位置。A: Alignment analysis of amino acid sequences, and red frames show MYB domains; B: 3D structure of protein; C: Chromosome location of the two genes in D03 and A02 chromosomes.圖1 GhMYB44a和GhMYB44b的生物信息學分析Fig.1 Bioinformatic analysis of GhMYB44a and GhMYB44b

圖2 GhMYB44a和GhMYB44b同源基因的系統進化樹分析Fig.2 Phylogenetic analysis of GhMYB44a and GhMYB44b
為確認GhMYB44在細胞中的位置,在煙草表皮細胞中進行瞬時表達,結果顯示GhMYB44a和GhMYB44b蛋白均位于細胞核中,這與轉錄因子定位于核內的特征相一致(圖3)。

圖3 GhMYB44蛋白煙草亞細胞定位Fig.3 Subcellular localization of GhMYB44 protein in tobacco
利用Cotton FGD(https://cottonfgd.org/)中的轉錄組數據對兩個基因進行分析發現,兩個基因在不同組織中的表達呈現出差異,GhMYB44a在陸地棉的根、莖、葉、雌蕊中表達,GhMYB44b在莖、葉、花托、雌蕊中表達,但兩個基因均在葉片中高表達(圖4)。GhMYB44a和GhMYB44b均不響應冷熱脅迫,但受PEG快速誘導,且在PEG處理12 h時表達量仍保持較高水平;在鹽脅迫條件下,GhMYB44a不表達,而GhMYB44b在12 h時受誘導高表達(圖5),由此推斷,GhMYB44a比GhMYB44b對干旱脅迫可能更加敏感,而GhMYB44b參與鹽脅迫反應。

圖4 GhMYB44基因組織特異性表達分析Fig.4 Expression analysis of GhMYB44 in different tissues

圖5 不同脅迫條件下GhMYB44的表達分析Fig.5 Expression difference analysis of GhMYB44 under different stresses
花芽分化的起始標志著植物生殖生長的開始,一般發生于苗期。為了探究GhMYB44是否參與開花時間調控,本研究檢測了棉花從兩葉期到五葉期葉片中GhMYB44的表達變化。結果顯示,GhMYB44在葉片中的表達量一直較高,在四葉期基因的表達量達到高峰,表明該基因可能是開花時間促進子。
通過噴施除草劑Basta初步篩選獲得轉基因擬南芥植株(圖7),進一步對抗除草劑植株進行PCR檢測,獲得了轉基因陽性植株,經后代篩選獲得純合株系。提取純合株系陽性植株葉片RNA進行表達量分析,發現GhMYB44a和GhMYB44b在轉基因株系中高表達,說明兩個基因均被成功轉入到擬南芥基因組中并表達(圖7)。

圖6 GhMYB44在棉花花芽分化不同時期葉片中的表達Fig.6 Relative expression of GhMYB44 in the cotton leaves of of different flower bud differentiation stages

圖7 轉基因擬南芥鑒定及目的基因表達分析Fig.7 Identification and expression analysis of transgenic Arabidopsis thaliana
將轉基因純合株系在23 ℃長日照條件下培養,發現轉基因擬南芥比野生型提前抽薹且轉基因擬南芥蓮座葉數目顯著少于野生型,早花現象顯著。轉GhMYB44a擬南芥抽薹時平均輪作葉片數為10.2,而轉GhMYB44b擬南芥抽薹時平均葉片數為11.4,前者的早花現象更加明顯(圖8、圖9)。且GhMYB44a表達量越高的植株,早花表型越明顯,說明該基因對開花時間的促進作用具有數量特征,而GhMYB44b的表達量與開花時間基本沒有關聯。

注:**表示與野生型之間差異在 P<0.01水平具有統計學意義。Note: ** indicates significant difference compared with WT.圖8 轉GhMYB44a擬南芥表型鑒定Fig.8 Phenotypic identification for over-expressing GhMYB44a Arabidopsis

注:**表示與野生型之間差異在 P<0.01水平具有統計學意義。Note: ** indicates significant difference compared with WT.圖9 轉GhMYB44b擬南芥表型鑒定Fig.9 Phenotyping identification for over-expressing GhMYB44b Arabidopsis
植物葉片感知環境的變化,并在適宜的時候開花、產生后代,開花過程決定著生殖生長的成功與否,是植物發育過程中的重要階段。隨著地球人口的不斷增長,高效利用有限的土地資源是科學家一直努力的方向??s短作物生長周期,是解決土地問題的有效方法之一。克隆參與開花時間調控的基因并研究其功能對于改良作物熟性具有重要意義。MYB轉錄因子在植物中具有多重生物學功能,目前,有關棉花MYB基因的研究主要集中在纖維發育和抗逆過程[16-24],對其調控棉花開花時間的報道甚少。本研究從棉花基因組中克隆了兩個序列高度相似的GhMYB44a和GhMYB44b基因,二者都能促進擬南芥早開花,但GhMYB44a的功能更強,這可能與蛋白結構在C端存在差異有關。絕大部分R2R3 MYB蛋白的C端都具有轉錄激活功能域特征,決定著蛋白的穩定性、與DNA結合的強度以及互作蛋白類型等[31-32]。此外,GhMYB44a和GhMYB44b基因不僅響應PEG脅迫,而且GhMYB44b還受鹽脅迫的誘導,這與前人報道的植物在逆境條件下(如干旱、高鹽、低溫等)會提前開花結實[33]相一致。本研究首次報道MYB基因調控棉花開花時間,豐富了MYB基因的功能,加深了對棉花開花時間調控的認識。棉花基因組較大,含有500多個MYB基因,前人研究表明,MYB常以二聚體或多聚體形式發揮功能,因此挖掘GhMYB44a和GhMYB44b的互作蛋白及其調控的靶基因,對于深入了解MYB基因如何調控開花時間具有重要意義,也是今后研究的重點。