鐘必鳳,鄧家林,李文貴,張全軍*,劉冬梅,曲么日布
(1. 四川省農業科學院園藝研究所, 農業部西南地區園藝作物生物學及種質創制重點實驗室, 四川 成都 610066;2. 江油市農業和畜牧局, 四川 江油 621700;3. 普格縣農牧局 ,四川 普格 615300)
【研究意義】多年生木本植物,尤其是以生殖器官作為主要經濟產出的果樹類植物,成花發生情況直接關系到生產產品的產出和質量。高等植物的成花是由非常復雜的系統決定的,整合了自身遺傳信息的表達信號以及外界條件的影響[1]。這一過程包括了細胞生理和形態分化兩個過程?!厩叭搜芯窟M展】目前的研究表明,至少存在著光周期、春化反應、自主控制途徑、赤霉素途徑等多個不同的途徑控制開花過程[2]。而這些過程可以彼此獨立,也可以相互交錯影響,將植物自身的發育信號與外界環境因子影響進行整合,共同決定營養生長到生殖生長的轉變。SPL(SQUAMOSA promoter-binding protein like)是一類植物特有的轉錄因子,因其具有約80個氨基酸構成的SBP結構域,能結合到SQUAMOSA啟動子上而得名[3]。研究表明,SPL蛋白在調控植物成花中起著重要的調控作用,參與了包括促進植物成年態轉變[4]、調控GA信號轉導[5]、連接光受體信號傳遞[2]、控制花器官形態發育[6]等一系列生理活動。通過整合miR156/157的調控功能,直接或間接影響成花有關蛋白[7]。【本研究切入點】在我國南方地區,梨正?;ㄆ谠?-5月。但因為環境條件不適,如遭遇高溫、干旱等脅迫,可以在當年8-10月再次開花(二次成花)。這一過程中,伴隨著礦質養分、植物激素等多個水平的變化[8-9],同時也涉及到復雜的基因表達變化過程[10]。該現象的發生給成花機理研究提供良好的機會。課題組前期研究表明,在正常條件下,可以通過人工可控的摘葉過程模擬二次成花發生[10]?!緮M解決的關鍵問題】本研究從梨全基因組的角度對SPL編碼基因進行鑒定,同時關注其中在人工誘導二次成花過程中差異表達的成員,為繼續深入研究SPL蛋白在花發育過程中的作用提供前期準備。
白梨基因組序列從梨基因組項目獲得(南京農業大學)。從植物轉錄因子數據庫(plantTFdb)下載已經鑒定的梨SPL蛋白家族成員序列。采用MAFFT軟件(v7.27)進行序列比對,使用HMMER3.1構建隱馬爾科夫模型。最后采用HMMSEARCH對全基因組進行SPL蛋白搜索(E<0.00001)。對搜索獲得的候選SPL蛋白序列,提交NCBI保守結構域(CDD)數據庫進行鑒定后進行人工校對。剔除候選蛋白中不含有SBP結構域的序列,同時也剔除編碼基因中含有N的序列。
對獲得的SPL蛋白序列,采用MAFFT軟件進行序列多重比對。采用IQTREE1.5.5軟件進行系統發育樹重建。其中氨基酸模型替代最優模型采用Modelfinder模塊以貝葉斯信息指數為標準進行選擇。對重建的系統發生樹,采用fastbootstrap自展校驗法評估單個進化分支拓撲結構的穩定性。
因目前沒有完整的梨染色體水平基因組數據,因此選用了公開的scaffold水平白梨基因組[11]為參考,對SPL編碼基因在每個scarfold上的物理排列進行繪圖。
參考課題組前期工作[10],以容易出現二次花的梨品種‘豐水’為材料,在采收果實后人工摘除葉片誘導二次成花。分別于摘葉后7,17,27 d (DF7,DF17, DF27)采集花芽為材料提取總RNA和轉錄組文庫構建和測序(由博奧生物有限公司完成)。同時以未進行成花誘導的相同時間點的芽為對照(C7, C17, C27)同樣進行轉錄組分析。測序獲得的原始數據,剔除含有N大于50 %,質量(Q-value)小于15的reads后,采用soap2軟件()進行基因組回帖。每個編碼基因對應回帖的reads數為基礎,采用TPM算法進行單個基因表達量歸一化。相同時間點的處理和對照組對應基因的表達量進行相對豐富度χ2檢驗。差異表達基因篩選標準為變異倍數大于2,且校正后的P-value小于0.001。
在植物轉錄因子數據庫中,共包含了33個白梨SPL蛋白序列。以這些序列為特征,通過隱馬爾科夫模型搜索,在整個基因組中共鑒定了36個候選SPL因子。人工校對過程中發現,1個候選因子不含有SBP結構域,1個候選因子編碼基因中含有N,均予以剔除。最后全基因組鑒定的SPL蛋白編碼基因如表1所示。這些蛋白分子量變化范圍在11.5~128.1 kDa內。分子量最大的蛋白為Pbr041959.1。SPL蛋白等電點范圍較廣,其中Pbr026854.1達到了10.3,說明該蛋白帶有較多帶正電荷側鏈,預示著其功能的特殊性。
對獲得的SPL蛋白序列,結合擬南芥SPL家族成員序列信息[12],采用IQTREE進行系統發育樹重建。最優氨基酸替換模型JTT+F+R4構建的系統樹如圖1所示。總體上,SPL蛋白根據氨基酸相似序列一致性可以分為3個大的類群。其中類群I和II包含的蛋白最多,分別為16個和14個,而第III類中包含了2個梨SPL蛋白,與擬南芥SPL蛋白At1G02065.1起源于共同祖先基因。若進一步按進行類群劃分,可以將34個梨SPL劃分為8個小的進化支系,與Cai等[13]人對棉屬植物SPL的劃分一致。

表1 梨全基因組SPL編碼基因鑒定及其蛋白特征
對獲得的SPL編碼蛋白序列,進一步進行保守蛋白結構域分析(圖2)發現:絕大部分(29個)SPL蛋白僅含有該家族的特征結構域SBP位點。但少數SPL成員還擁有其他功能蛋白結構域,包括參與MYB-bHLH-WD40復合體的WD40結構域(Pbr011184.3),參與蛋白和蛋白互作的錨蛋白重復序列ANK(Pbr037762.1,Pbr015125.1,Pbr018552.1和Pbr037761.1)。這些典型的結構特征預示著他們可能與其他蛋白互作形成復合體行駛功能。

圖1 基于SPL氨基酸序列的最大似然樹

圖2 SPL蛋白家族成員保守結構域分析
功能相關蛋白通常在染色體上集中排列[14]。以白梨公開的基因組序列為參考,34個鑒定的SPL編碼基因分布在27個scaffold上(圖3)。其中僅有scaffold67上串聯排列了3個SPL編碼基因,平均距離9088 bp。其余成簇排列的SPLs包括位于scaffold1上的Pbr000386.1和Pbr000388.1,scaffold1095上的Pbr002300.1和Pbr002303.1以及scaffold78上的Pbr037761.1和Pbr037762.1。有趣的是,這些成簇排列的SPLs一致性非常高,蛋白結構特征上僅含有少量差異。比如,Pbr03776.1僅比Pbr03762.1多1個ANK結構域。

圖3 SPL編碼基因在梨基因組scaffold上的分布情況
在前期的研究中,已經發現通過人工摘葉處理,‘豐水‘梨可以在當年完成花芽分化,并在9月開花[9]。該結果證明了在摘葉處理后,芽經歷了由營養生長到生殖細胞轉變的生理分化和形態分化的完整過程。為了進一步挖掘可能參與了該過程的SPL轉錄因子,利用RNA-seq數據分析了34個SPL編碼基因在成花誘導和未誘導條件下的差異表達情況。處理組合對照組在同一時間節點的比較發現,34個SPL編碼基因表達模式明顯可以歸為兩類(圖4),21個SPL在整個觀察時間段內表達量較高(TPM>4),其余的SPL基因為一類,在花芽中維持較低的表達水平。摘葉組和正常組基因差異表達分析僅鑒定出兩個差異表達的基因(圖4陰影高亮)。其中Pbr038289.1在摘葉處理27 d后被極顯著誘導,而Pbr002303.1在摘葉處理初期被極顯著抑制。在摘葉誘導成花中,27 d后花芽生理分化結束,形態分化已經非常明顯,因此Pbr038289.1可能參與了花器官的發育過程或者配子育性的調控過程。而在成花誘導前期,Pbr002303.1可能在早期促花信號感應中起作用。
現有的研究表明,SPL蛋白參與了植物胚胎發育、葉片、花和果實的發育,參與了赤霉素信號、光信號傳遞等多個生物性進程[15]。作為植物特有的轉錄因子家族,在不同的植物材料中包含的成員數有很大的差異。擬南芥的基因組中共鑒定出了17個SPL家族成員[12],煙草(Nicotianatabacum)基因組中包含有32個SPL編碼基因[16],森林草莓基因組編碼了14個SPL蛋白[17]。甚至在同屬內,不同種的SPL數目也差異巨大。亞洲棉(Gossypiumarboreum)包含有29個編碼基因,而陸地棉(G.hirsutum)則編碼了59個SPL蛋白[13]。在本研究中,首次揭示了白梨基因組中的34個完整SPL蛋白編碼基因。與擬南芥相比,數目激增。但不同物種中SPL蛋白進化類群數目較為接近,目前多數為8個亞類群[13, 17]。每個類群的擴張程度相較于擬南芥差異較大:如類群I中At5G50570.1所在的亞組中,擬南芥僅有兩個成員,而梨中包含了8個成員。證明在進化過程中,SPL發生了顯著的復制擴增,功能可能發生了分化。
盡管SPL蛋白家族成員氨基酸長度差異明顯,但均包含高度保守的SBP結構域。在其他物種的研究中,除了SBP結構域以外,SPL成員可能還包括其他一至多個其他蛋白結構域。其中最為典型的是ALSLLS結構域,作為miRNA156調控的靶序列存在于SPL的C端[6]。在本研究中的34個成員中,有14個含有該位點(進化類群II的成員)。這些結構域的存在意味著他們在行駛生物性功能時能接受miRNA156的調控。在番茄中,超過半數的SPL基因都是miRNA156的調控靶標,其中CNR直接參與了花器官的發育過程[18]。除此以外,本研究還發現了一個包含WD40結構域的SPL蛋白。WD40蛋白通常情況下作為連接其它轉錄因子蛋白的中間體,蛋白不直接參與下游基因的轉錄激活過程[19],因此Pbr011184.3可能作為特定蛋白復合體中的一員參與了特定生物反應。

圓圈面積大小表示基因表達量高低(log2TPM), 差異表達的基因名用方框標出
Xiong等[17]在草莓SPL基因的組織和時空表達特性分析中發現,SPL基因表達情況差異較大。miRNA156靶向的SPL基因均表現出組織表達特異性,而其他均組成型表達。這表明,差異表達的SPL在特定時間發揮其作用。在本研究中,34個SPL編碼基因在摘葉處理誘導成花過程中絕大部分表達變化不大。僅有2個差異表達的基因被鑒定出來(圖4)。其中表達量較高的Pbr038289.1表達得到明顯上調,進一步分析發現:該蛋白與蘋果的SPL4蛋白一致性達到了97 %。在擬南芥中,SPL3/4/5蛋白能夠整合發育信號,在miRNA156表達量下降的情況下轉錄水平明顯上調,進而直接調控下游成花有關的蛋白如FD, LEAFY和FRUITFULL等編碼基因的表達[20]。在摘葉誘導二次花形成的過程中,SPL基因Pbr038289.1表達量的上調是否受miRNA156的影響目前仍不清楚,有待進一步的研究確認。
本研究基于已有的白梨(PyrusbretschneideriRehd.)基因組數據,從全基因組范圍對SPL轉錄因子編碼基因進行了鑒定,共獲得了34個典型的SPL蛋白家族成員,只有3個成員在目前的梨參考基因組上串聯排列。系統進化分析將34個成員劃歸為8個進化類群,與其他物種SPL分類一致。結合前期二次花誘導過程的轉錄組數據分析發現:34個SPL蛋白編碼基因中僅2個顯著差異表達,其中Pbr038289.1顯著上調表達,而Pbr002303.1表達量顯著下降,這2個蛋白有望成為深入研究梨成花過程調控的重要靶點。