姚慧玲 范海闊 劉蕊 肖勇
(1海南大學 海南海口570228;2中國熱帶農業科學院椰子研究所 海南文昌571339)
蔗糖是絕大部分高等植物葉肉細胞都能夠生產的重要光合產物,是植物中糖運輸最為主要的形式,與植株的多種生理代謝活動存在緊密關聯,并在一定程度上決定了作物產量[1]。如果這種糖類在韌皮部進行長距離運輸,其應用的途徑主要包括兩條,分別為共質體和質外體[2],其中后者在絕大部分植物的蔗糖運輸中具有不可忽視的地位。相關數據顯示,如果選擇質外體途徑,蔗糖轉移至篩管分子-伴胞復合體必須依托于多種蛋白,其中較有代表性的包括SWEET(Sugars will eventually be exported transporters)蛋白、蔗糖轉運蛋白等[3]。
蔗糖轉運蛋白(Sucrose Transporter,SUT)屬于易化子(Major facilitator superfamily,MFS)超家族[4]。菠菜SoSUT是非常具有代表性的植物SUT基因,通常來講,它與單子葉蔗糖轉運蛋白編碼基因存在緊密關聯,擁有該基因的作物較多,其中比較具有典型意義的包括水稻[5]、高粱[6]、玉米[7]等,此外,雙子葉蔗糖轉運蛋白編碼基因對于蔗糖轉運蛋白也非常重要,包含該基因的作物包括擬南芥[8]、陸地棉[9]等。水稻OsSUT分屬于單子葉SUT基因家族,其總共涵蓋5個蔗糖轉運基因。相關數據顯示,OsSUT1在多種植物部位都存在表達的情況[10-11],其中比較主要的包括葉片、葉鞘等,而且它很大程度上決定了籽粒的充實情況[12]。另外,OsSUT3~5在蔗糖供應方面具有不可忽視的作用,它能夠為生長組織所需這趟的生產提供保障[5],所以對植物SUT基因家族展開研究具有重要的價值。
椰子是一類十分具有經濟價值的水果,全球大概有90個國家種植這種作物,當前種植面積大概1 200萬hm2,大概有8 000萬人從事與該作物相關的行業[13]。目前鮮見椰子SUT基因家族的相關報道。本文重點通過生物信息學對椰子SUT基因家族進行鑒定,對其展開綜合性的研究,主要涉及內含子與外顯子結構、系統發育樹等多個方面,為進一步探討椰子CnSUT基因家族在其生長發育階段發揮的生物學功能提供參考。
從(GIGA)nDB(http://gigadb.org/da‐taset/100347)下載椰子轉錄組序列、Ensembl plant(https://plants.ensembl.org/index.html)下載水稻和擬南芥(全基因組序列中Su‐crose Transporter基因家族的蛋白序列信息。另外,本文通過SSH Secure Shell Client將水稻OsSUT基因家族蛋白序列與椰子轉錄組序列信息展開tblastn比對,e值設為1e-10,繼而獲取所需的CDs序列信息。將獲取的序列信息展開后續處理,應用MEGA工具對獲取的CDs序列進行翻譯,從而得到蛋白序列,通過HMMER(https://www.ebi.ac.uk/Tools/hmmer/)配置的功能對CnSUT基因家族中不涵蓋結構域的序列進行預測,進而對CnSUT基因家族的成員進行鑒定。
通 過ExPASy-ProtParam(https://web.ex‐pasy.org/protparam/)對CnSUT基因家族蛋白質的各項理化性質進行運算,其中比較具有代表性的包括氨基酸數、親水指數等,然后在WOLF PSORT(https://wolfpsort.hgc.jp/)對其完成亞細胞定位的預測。
通過NCBI的CDART(https://www.ncbi.nlm.nih.gov/Structure/lexington/lexington.cgi?cmd=rps)和Smart(http://smart.embl.de/)預測氨基酸的保守結構域;TMHMM Server v.2.0在線軟 件 (http://www.cbs.dtu.dk/services/TMHMM/)對SUT蛋白的跨膜結構域展開研究,重點應用GeneDoc對24個CnSUT基因家族成員的蛋白序列進行分析,之后在網上下載保守結構域,進而繪制相應的logo,再利用MEME(https://memesuite.org/meme/tools/meme)對比研究CnSUT家族蛋白的保守基序;除此之外,可通過SOPMA(https://npsa-prabi. ibcp. fr/ cgi-bin/npsa_automat.pl?page=npsa_sopma.html)對目標蛋白質實現二級結構預測
在網上下載椰子CnSUT基因家族成員內含子與外顯子的有關信息,之后利用GSDS(https://www.mybiosoftware.com/gsds-2-0-gene-struc‐ture-display-server.html)預測其整體結構,并結合預測的結果繪制相應的組成圖。在MEGA工具中應用鄰接法構建標準化的系統發育進化樹,并對其進行聚類分析。
通過NCBI獲取椰子葉片(SRR1063404、SRR1063407、SRR1125016、SRR1173229、SRR1273180)與椰子胚(SRR1273070)、胚乳(SRR1265939)及胚愈傷組織(SRR1137438)的轉錄組數據。除此之外,本部分對CnSUT家族成員的RPKM(Reads Per Kilobase per Million mapped reads)展開系統性的分析,然后把全部資料錄入Mev工具(http://mev.tm4.org/),并繪制標準化的圖像。

表1 椰子SUT家族成員基本信息
通過水稻OsSUT基因家族的序列和擬南芥At‐SUT基因家族的序列進行比較,進而獲取5條椰子基因序列,之后將其翻譯為蛋白質序列,并通過HMMER對其進行預測,得到的數據顯示,5條序列都存在結構域,根據其基因ID排序將其名稱設定為CnSUT1~CnSUT5(表1)。其氨基酸數處于446~605個,而對于CnSUT3和CnSUT5,其氨基酸總量最多能夠達到605 aa;基因分子量達到極小值的是CnSUT4,達到極大值的是CnSUT3;等電點主要處于6.3~9.37,CnSUT3和CnSUT5的PI未超過7,屬于典型的酸性蛋白質;余下的PI都超過7,屬于典型的堿性蛋白質。親水性指數主要處于0.334~0.603,為疏水性蛋白。亞細胞定位發現CnSUT基因家族位于質膜。
Smart結果分析顯示,CnSUT基因家族是非常重要的蔗糖/H+共轉運體(圖1)。跨膜結構域研究顯示,椰子CnSUT蛋白總共涵蓋8~11個跨膜結構域,絕大部分CnSUT蛋白都存在10個跨膜結構域,主要涉及CnSUT1、CnSUT5等多種類型,此外,CnSUT4總共含有8個跨膜結構域,而CnSUT3涵蓋了11個跨膜結構域(圖2);CnSUT蛋白都涵蓋于質膜,這個結果與亞細胞定位預測結果一致。

圖1 椰子SUT家族成員蛋白結構域分析
為深入探究椰子CnSUT基因家族蛋白所表現出的各項生物學特性,充分應用MEME工具,將10個保守motif作為主要條件展開統計計算,結果(圖3)表明,全部CnSUT家族成員都涵蓋多個基序,其中比較具有代表性的包括motif 1、motif 7等,它們都是CnSUT最保守的部分,其中有兩個成員涵蓋motif 1、motif 6、motif10等多個基序;進化分析結果(圖4)發現,同一亞族成員的保守基序類型存在非常高的共通性,而且CnSUT3和CnSUT5所對應的保守基序類型不存在任何差異。

圖2 椰子SUT蛋白的跨膜結構分析

圖3 椰子SUT基因家族motif分析
通過SOPMA對CnSUT基因家族蛋白質的二級結構進行預測,結果(表2)顯示,椰子CnSUT基因家族蛋白質存在多樣性的結構,其中比較具有典型意義的包括α-螺旋、無規卷曲等。CnSUT1、CnSUT2的蛋白質二級結構主要特點為α-螺旋>無規卷曲>β-折疊>β-轉角,而CnSUT3、CnSUT4和CnSUT5的蛋白質二級結構主要特點為無規卷曲>α-螺旋>β-折疊>β-轉角。綜上,α-螺旋和無規卷曲是該蛋白最為核心的結構。
GSDS結果(圖5)分析顯示,CnSUT家族成員外顯子的總量為4~14個,其中CnSUT2、CnSUT3、CnSUT5表現出一定的特殊性——都涵蓋14個外顯子。MEGA系統發育進化樹分析結果(圖6)顯示,其主要涉及CnSUT基因家族、AtSUT基因家族等類型。為了深入研究CnSUT家族成員、OsSUT基因家族存在的具體關聯,對多種植物的SUTs建立標準化的系統發育樹,之后對其展開綜合性分析,結果(圖6)顯示,亞組數量為5個,SUT1亞組內全部為AtSUT家族,椰子CnSUT基因家族共涵蓋2個成員。SUT3主要涉及到水稻OsSUT基因家族,相應的成員數量為2,還關聯椰子CnSUT家族,相應的成員數量為1。而SUT5只涵蓋OsSUT基因家族成員。因此,椰子CnSUT基因家族都可以劃分3個亞族,SUT2、SUT3和SUT4。另外,椰子CnSUT基因家族與水稻OsSUT基因家族存在較近的親緣關系,而擬南芥則位列其次。

圖4 椰子SUT家族成員保守基序分布
在對椰子CnSUT基因家族基因號進行有效檢測之后,獲取椰子CnSUT基因家族在多種組織內的FPKM值,之后通過lg函數對FPKM值展開處理,將處理的結果導入TBtools工具內,以此建立完善的基因表達譜(圖7),結果表明,各類CnSUT基因家族成員在胚愈傷組織中均有表達,這表明其基因有較高的概率參與植物生長初期的分化。此外,CnSUT1表達水平相對較低,特別是在葉片內其表達不多,重點在胚、胚愈傷等特定組織內表達,這表明它與幼苗的生長具有緊密關聯,CnSUT3在多個部位表達量都較高,這表明它在椰子生長的整體周期都有作用;而CnSUT2和CnSUT4在所有部位表達量不存在任何差異,這表明其在椰子的生長周期中發揮的作用高度一致。

表2 椰子SUT基因家族的蛋白質二級結構對比分析

圖5 椰子SUT家族成員基因結構分布

圖6 椰子SUT家族成員系統進化樹分析
GPH(Glycoside-Pentoside-Hexuronide/cat‐ion symporter family)家族成員的來源非常復雜,其中比較具有代表性的包括細菌、真核生物等,蛋白結構能夠表現出相對較高的疏水性,序列具有許多保守性較強的氨基酸[14],它的結構模型與MFS結構域非常相近。此外,其功能是將蔗糖轉移至韌皮部,從而實現養分的長途運輸[15]。結合數據庫提供的資料進行分析,GPH家族是非常重要的MFS超家族[16],可以對CnSUTs的功能特性展開深入分析,CnSUTs是糖轉運蛋白中不可或缺的部分,其都屬于GPH/陽離子同向轉運蛋白家族,但不具備MFS結構域。然而各成員通常具有一定區別,比如,各成員涵蓋的跨膜結構總量不一致,主要處于8~11(圖2)。此外,亞細胞定位預測結果表明,各類CnSUTs通常處于質膜,有一定概率屬于膜結合蛋白。結合氨基酸序列建立標準化的系統進化樹,得到的結果表明,其家族成員能夠劃分為5個亞家族,與前人研究結果一致[17]。另外,SUT基因在多種類型的組織中都有分布,他們不但在“源”器官中發揮作用,并且對于“庫”器官的調控也非常重要,缺乏它就無法滿足蔗糖供給[14]。椰子SUTs家族與雙子葉擬南芥不存在緊密關聯,而CnSUT3和OsSUT4表現出較強的同源性,因此推測其作用相差不大。CnSUT3和CnSUT5與OsSUT4大多數情況下劃分至SUT2亞族,它是一類重要的蔗糖轉運蛋白[18]。相關數據顯示,在水稻萌發的胚內OsSUT4的表達情況與另外的OsSUTs具有明顯區別,通過GUS染色法對OsSUT4的啟動子展開研究,可以發現該基因在黏糊層與胚內都存在表達,因此可以推測OsSUT4在蔗糖轉移至萌發胚的環節中發揮了關鍵性作用[19]。由此可見,CnSUT3和OsSUT4參與了胚乳轉化成萌發胚的過程。

圖7 椰子SUT基因家族在不同組織器官中的表達譜分析
CnSUT1和CnSUT4與OsSUT2具有相對較高的同源性,CnSUT1、CnSUT4和OsSUT2都屬于SUT4,其亞族重點在庫器官內表達,其中比較具有典型意義的包括次級葉脈、花和果實等[20]。因此可以推斷,CnSUT1和CnSUT4在初始階段的蔗糖積累中發揮了重要作用。
CnSUT2、OsSUT1和OsSUT3具有相對較強的同源性。對于椰子蔗糖轉運蛋白基因家族而言,CnSUT2主要分布于特定的分支,可以推測,CnSUT2與另外的成員具有比較明顯的功能差異。OsSUT1對葉片中碳水化合物含量不存在明顯影響。除此之外,OsSUT3能夠在多種庫器官內高水平表達,但是它在種子內的表達水平卻非常低[21]。在水稻幼葉中,OsSUT3能夠進行高水平的表達,其重點是為植物提供不可或缺的能量。水稻的穎果發育主要涉及到兩個部分:第一部分為細胞分化;第二部分涉及兩個環節,其分別為籽粒灌漿伸長與穎果增重。根據OsSUTs采用的主要表達模式,可以猜測OsSUT3的高表達能夠在上述2個環節中發揮銜接的作用[22]。所以,可推測CnSUT2能夠在幼葉發育的多個階段中發揮功能。