王艷霞,王璐,楊俊換,張瑤
(山東理工大學 農業工程與食品科學學院,山東 淄博 255049)
早期研究表明,氮源限制是產脂微生物積累脂質的重要營養特征,當培養基中氮源耗盡后,細胞內能荷升高,腺苷一磷酸(adenosine monophosphate,AMP)度降低,三羧酸循環(tricarboxylic acid cycle,TCA cycle)受阻,此時胞內蛋白質、核酸等大分子的合成趨于停止,菌體不再生長,而培養基中大量的碳源(葡萄糖及其他被微生物吸收利用的糖類)持續吸收并轉化為脂質,引起胞內脂質大量積累[1-3]。至今,科學家們對微生物脂質積累過程做了大量的研究工作,對產脂微生物氮源限制引發三羧酸循環調節到脂肪酸合成的生化機制有了較為清楚的認識[3-4]。對真核生物而言,糖酵解的終產物——丙酮酸進入線粒體內,經丙酮酸脫氫酶轉化為重要中間代謝產物——乙酰-CoA。線粒體內乙酰-CoA必須轉運到細胞溶膠,才能用于脂質合成[5-7];因此,轉運乙酰-CoA(檸檬酸為其乙?;d體)的線粒體三羧酸(檸檬酸)轉運體系是連接糖代謝與脂質合成的紐帶,是影響真核生物脂質合成的一個重要因素[5-7]。
三羧酸(檸檬酸)轉運體系中另一個重要轉運蛋白質是蘋果酸(或二羧酸)轉運體(malate transporter,MT)。對大鼠肝臟[8]、胰腺beta細胞[9]線粒體,以及從大鼠肝臟中分離、純化的二羧酸轉運蛋白質[10-11]的研究結果表明,該轉運體通過電荷中性交換原則,在轉入磷酸鹽(或含硫化合物)的同時,將二羧酸(蘋果酸、琥珀酸)轉出線粒體用于糖異生。對釀酒酵母二羧酸轉運體的研究[12-14]顯示,MT有可能通過轉入蘋果酸而增加線粒體內檸檬酸的合成量,從而促進線粒體檸檬酸的轉出。近年來,隨著全基因組測序與全外顯子測序等高通量測序技術的出現和發展[15],大量新的基因序列及氨基酸序列被載入到生物數據庫中,促進了生物信息學的繁榮。研究那些通過實驗難以確定結構的蛋白質,利用生物信息學軟件對其結構進行快速預測和分析,具有重要的理論意義和實用價值。
產脂真菌卷枝毛霉(Mucorcircinelloides)是研究脂質積累機制的模式生物,也是全球首次商業化生產微生物油脂的菌株,其生產的油脂富含ω-6多不飽和脂肪酸γ-亞麻酸[5-6]。目前關于產脂絲狀真菌檸檬酸轉運蛋白的結構和功能報道較少。本研究借助生物信息學分析技術對來源于卷枝毛霉的MT蛋白的理化特性、空間結構及功能位點進行預測,為后續探究該轉運蛋白的三維結構與功能奠定基礎。
根據JGI數據庫公布的卷枝毛霉CBS277.49的基因組信息,通過BLAST工具將基因組中全部基因序列與轉運體系分類數據庫(TCDB)進行比對,找到編碼卷枝毛霉MT蛋白的基因只有一個,通過BLAST工具在CBS277.49的基因數據庫(http://genome.jgi.doe.gov/pages/search-for-genes.jsf?organism=Mucci2)中查找CBS 277.49中的蘋果酸轉運體相關基因,序列如下:

MGEKLERKSLKEMVRHFTPSWFSVIMGTGILSILLHVFPFQFRGLQTIALVVYIMNVVMFCIFLIITIARYAIWPSIIRLVLEHSNQSLFIGTMPMGLTTITNFTILAIREKYAWGLNLAFVLWIIEYVLTILTVLVVPYFVIVHHNHALETMNGTWLLPIVPCVVASASGGLLAQYLDQDRALVVLVISIITMGMGLSLALSVIVIYFYRLIVNKLPPKEVIISSFLPLGPLGQGAYGVIQLGIASKAVLGDRFIVGLGDVAHSVGFLLALFLWGYGVWYLVVATFSVGITTKQGIPFNMGWWALTFPLGVFTAGTLSIGNVLNSMFFWVLGAIFTCLLVLLWLAVMAKTLKGIFTGEMFYAPCLSPVILNS
通過借助在線分析工具Protparam(http://www.expasy.org/tools/protparam.html)對卷枝毛霉MT蛋白的理化性質進行分析;借助ProtScale(http://www.expasy.org/cgi-bin/protscale.pl)對 MT 蛋白的疏水性進行分析。通過借助在線預測工具PredictProtein(http://www.predictprotein.org)和Sopma(https://npsa-prabi.ibcp.fr/cgi-bin/)預測 MT 蛋白的二級結構,借助在線分析網站(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)進一步預測該蛋白的跨膜螺旋結構。借助 SWISS-MODEl工具在線完成 MT 蛋白三級結構模型的構建。
通過借助在線預測工具 SignalP-5.0 Server(http://www.cbs.dtu.dk/services/SignalP/)預測 MT 蛋白的信號肽;借助在線分析工具TMHMMServer v.2.0 (http://www.cbs.dtu.dk/services/TMHMM-2.0/)對MT蛋白的跨膜特征進行分析;借助 NCBI 網站上 Conserved Domains Search (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)工具分析 MT 蛋白的保守結構域;借助在線分析工具NetPhos 3.1 Server(http://www.cbs.dtu.dk/services/NetPhos/)分析 MT 蛋白的磷酸化位點以及借助 Motif Scan(https://myhits.isb-sib.ch/cgi-bin/motif_scan)在線工具對 MT 蛋白翻譯后修飾位點及膜體位置進行分析。
利用卷枝毛霉MT蛋白序列在NCBI網站上借助BLAST工具進行同源性分析,從中挑選出同源性較高的不同代表性物種的蛋白序列進行多重序列比對,并使用MEGA軟件構建系統發育樹。
通過對卷枝毛霉中MT蛋白理化性質的分析,得知該轉運蛋白的分子量約為41 247.79 Da,分子式為C1967H3062N454O475S18,等電點為9.14,不穩定系數(Instability index)為24.01(Ⅱ級),因此將該類蛋白歸類為相對穩定的蛋白。該蛋白的氨基酸總數為373個,含量相對較高的氨基酸主要包括Leu(56個,15.0%)、Val(40個、10.7%)、Ile(38個、10.2%)、Gly(32個、8.6%)、Phe(25個、6.7%)、Ala(24個、6.4%)、Thr(23個、6.2%),不含有Pyr和Sec兩類氨基酸,因此其脂肪族氨基酸指數偏高,約為135.82。該蛋白為膜蛋白,它的親水性總平均值為1.052,一般根據親水性總平均值的正負來判斷其親水性與疏水性(正值為疏水性,負值為親水性),因此我們推斷這是一個疏水性蛋白。通過使用ProtScale工具對該蛋白的疏水性進一步分析,結果表明MT蛋白的疏水性較強,利于它向內部折疊形成二級結構,進一步形成結構域、三級結構等,同時利于形成α螺旋,保證其穩定性,符合其跨膜蛋白的特性(圖1)。

圖1 MT蛋白的疏水性/親水性預測Fig.1 Hydrophobic/hydrophilic prediction of MT protein
對卷枝毛霉MT蛋白的二級結構預測結果(圖2)顯示,該蛋白中二級結構為:α螺旋(藍色線條,193殘基)占比為51.74%、無規則卷曲(紫色線條,101殘基)占比為27.08%、延伸鏈(紅色線條,65殘基)占比為17.43%、β轉角(綠色線條,14殘基)占比為3.75%。α螺旋占比最高,是組成該MT蛋白的主要結構。膜蛋白分子中,鑲嵌在膜內的部分為α螺旋結構。借助Phyre工具進一步對跨膜螺旋結構(圖3)進行分析發現,該蛋白總計有10處跨膜區,分別位于:19-36,48-72,87-107,119-141,156-176,186-221,225-242,263-290,303-321,329-358氨基酸位點處。

圖2 MT蛋白的二級結構Fig.2 Secondary structure of MT protein

圖3 MT蛋白的跨膜螺旋拓撲結構Fig.3 Transmembrane helical topology of MT protein
卷枝毛霉MT蛋白的三級結構預測結果如圖4所示,可知該蛋白在N端以無規則卷曲和延伸的形式存在,中部由10個α螺旋和少量β轉角交替出現,C端以β轉角和無規則卷曲結束。整個模型是通過α螺旋和少量β轉角等二級結構元素在三維空間的上述形式排列形成的一個接近于橢球形的蛋白質分子的三維結構。此蛋白分子由10個跨膜螺旋逆時針形成活性中心鑲嵌于膜內的磷脂雙分子層之間,符合其跨膜蛋白的結構。

圖4 預測的MT蛋白的三級結構Fig.4 Predicted tertiary structures of MT protein
通過使用SignalIP 3.0 Server工具Neural Networks(NN)程序對卷枝毛霉MT蛋白的信號肽進行分析,發現Cleavage site score(C-score)沒有明顯特征、Signal peptide score(S-score)在40殘基處有高的分值;但綜合分析信號肽剪切分值并不高,因此預測該蛋白不存在信號肽屬于非分泌型蛋白(圖5)。通過使用TMHMM工具對卷枝毛霉MT蛋白的跨膜結構進行分析(圖6),發現該蛋白跨膜結構域的位置為:20-42,52-74,87-109,122-144,156-178,188-210,223-245,265-287,299-321,326-348氨基酸位點處,符合其跨膜蛋白的特性。TMHMM工具對卷枝毛霉MT蛋白跨膜結構域的位置預測與上述Phyre工具的位點稍有偏差,但跨膜區域總數相一致。

圖5 MT蛋白的信號肽分析Fig.5 Signal peptide analysis of MT protein

圖6 MT蛋白的跨膜區分析Fig.6 Transmembrane analysis of MT protein
通過使用NCBI網站上的Conserved domains分析可知,卷枝毛霉MT蛋白的保守結構域有一個(圖7),預測結果顯示該蛋白中14-348氨基酸屬于亞硒酸鹽抗性/二羧酸轉運體(TDT)家族。含有門控離子通道中的苯丙氨酸,與亞硫酸鹽敏感蛋白(SSU1)保守結構域一致。

圖7 MT蛋白的保守結構域分析Fig.7 Conservative domain analysis of MT protein
通過對卷枝毛霉MT蛋白理化性質的分析可知,絲氨酸(Ser)及蘇氨酸(Thr)不是其主要組成,含量較低,故此推測該蛋白的磷酸化位點較少。通過借助NetPhos 2.0 Server分析工具進一步預測的結果表明,MT蛋白潛在的Ser磷酸化位點有3個,潛在的Thr磷酸化位點有2個,無潛在的酪氨酸(Tyr)磷酸化位點。
不同的翻譯后修飾類型都可能影響蛋白的基本性質進而影響其功能,借助Motif Scan程序分析卷枝毛霉MT蛋白翻譯后修飾位點及膜體位置見表1。由表1可知:該蛋白存在3個ASN-糖基化位點,分別位于氨基酸86-89、103-106、154-157處;8個豆蔻?;稽c,分別位于氨基酸116-121、171-176、195-200、296-301、311-316、321-326、333-338、354-359處;1個酪蛋白激酶II磷酸化位點,位于氨基酸9-12處;3個蛋白激酶C磷酸化位點,分別位于氨基酸9-11、291-294、351-353處。同時在氨基酸19-316處存在一個C4-二羧酸轉運體/MT蛋白保守結構域,概率值為4.8e-89,與功能域預測的結果一致。
借助網站NCBI中的Blast工具將卷枝毛霉MT蛋白與其他物種中的MT蛋白進行同源性分析隨后生成系統發育樹(圖8)。結果顯示卷枝毛霉CBS277.49與毛霉菌(Mucorambiguous)的同源性最高,其次與卷枝毛霉WJ11也有很高的同源性,因此聚為一類;與栽培大豆(Cultivatedsoybeans)和植物擬南芥(Arabidopsisthaliana)兩個物種親緣關系較遠。
本研究借助生物信息學分析技術對產脂絲狀真菌卷枝毛霉的MT蛋白進行多方面預測。經分析推斷可知,該蛋白疏水性強且性質穩定,不存在明顯的信號肽特征,屬于非分泌型蛋白。α螺旋是組成該MT蛋白占比最高的二級結構,并且膜蛋白分子中α螺旋結構是鑲嵌在膜內的部分[6],符合該蛋白跨膜運輸的特性。MT蛋白由10個跨膜螺旋逆時針排列形成一個接近于橢球形的蛋白質分子的三維結構。對MT蛋白保守結構域分析結果表明,該蛋白存在一個C4-二羧酸轉運體/MT蛋白保守結構域。該轉運蛋白磷酸化位點、翻譯后修飾與結構的特征性序列分析顯示其潛在的Ser磷酸化位點有3個,潛在的Thr磷酸化位點有2個,無潛在的Tyr磷酸化位點;有8個豆蔻?;稽c,3個ASN-糖基化位點和蛋白激酶C磷酸化位點,1個酪蛋白激酶II磷酸化位點。系統發育分析發現卷枝毛霉MT蛋白與毛霉菌(Mucorambiguous)的同源性最高,聚為一類,與植物擬南芥(Arabidopsisthaliana)的親緣關系較遠。本研究將為后續探究MT蛋白的三維結構與功能奠定基礎。

表1 MT蛋白翻譯后修飾位點預測Tab.1 Post-translational modification site prediction of MT protein

圖8 不同種屬的MT蛋白系統進化樹Fig.8 Phylogenetic tree of MT protein system from different species