孟 婕,張明華,楊 晴,張 貝,李可強(qiáng),張傳生,耿立英,李祥龍
(河北科技師范學(xué)院河北省特色動(dòng)物種質(zhì)資源挖掘與創(chuàng)新重點(diǎn)實(shí)驗(yàn)室,河北 秦皇島,066004)
STAT(signal transducers and activators of transcription)是一種潛在的細(xì)胞質(zhì)轉(zhuǎn)錄因子,是細(xì)胞因子和生長因子受體信號傳導(dǎo)的下游效應(yīng)因子[1]。STAT家族在細(xì)胞受體相互作用過程中充當(dāng)載體,保持信號在細(xì)胞內(nèi)傳遞有內(nèi)在特異性,引導(dǎo)一部分細(xì)胞反應(yīng),有控制細(xì)胞生長、分化、增殖免疫調(diào)節(jié)等功能[2~4]。研究發(fā)現(xiàn),STAT含有特定的STAT結(jié)構(gòu)域和SH2結(jié)構(gòu)域,SH2作為最保守的STAT結(jié)構(gòu)域通過結(jié)合特定磷酸酪氨酸基序的能力在信號傳導(dǎo)中起重要作用[5,6]。
大量研究發(fā)現(xiàn),STAT家族基因在細(xì)胞增殖、凋亡、分化和免疫調(diào)節(jié)等生理過程中的作用復(fù)雜且重要,激活后的STAT基因可通過轉(zhuǎn)錄調(diào)控多種原癌基因的表達(dá)來誘導(dǎo)腫瘤的發(fā)生[7]。STAT1被認(rèn)為在生長停滯和凋亡中起重要作用,并作為腫瘤抑制因子,而STAT3和STAT5則參與促進(jìn)細(xì)胞周期進(jìn)展、細(xì)胞轉(zhuǎn)化和防止凋亡[5,8~10]。Cuiping等發(fā)現(xiàn)STAT6在肺癌的間質(zhì)細(xì)胞及免疫細(xì)胞中高表達(dá),STAT6-/-腫瘤小鼠中CD11b+細(xì)胞的動(dòng)員和分化降低,STAT6的缺乏抑制腫瘤增殖[11]。
隨著雞基因組測序的完成,在基因組水平上研究雞STAT家族的信息成為一種可能。筆者采用生物信息學(xué)方法,對STAT基因及其編碼產(chǎn)物的理化性質(zhì)、序列結(jié)構(gòu)特征、染色體定位和二級結(jié)構(gòu)進(jìn)行預(yù)測和分析。同時(shí),對3個(gè)物種進(jìn)行序列比對,構(gòu)建系統(tǒng)進(jìn)化樹,以期為進(jìn)一步研究STAT家族的功能、揭示雞STAT家族抗病分子機(jī)制奠定理論基礎(chǔ)。
在Ensemble數(shù)據(jù)庫(http://asia.ensemble.org/index.htm),下載雞基因組序列信息和基因組基因結(jié)構(gòu)注釋信息文件。從Pfam蛋白家族數(shù)據(jù)(http://pfam.xfam.org/)下載STAT蛋白的隱馬可夫模型(PF02865),并以此作為查詢搜索雞可能STAT蛋白序列,進(jìn)一步在Batch CD-Search (http://www.ncbi.nlm.nih.gov/Structure/bwrpsb.cgi)和SMART (http://smart.emble-heidellerg.de/)對其進(jìn)行驗(yàn)證分析,剔除不含STAT結(jié)構(gòu)域、SH2結(jié)構(gòu)域、其他結(jié)構(gòu)域及注釋不完整的序列,最終獲得雞STAT基因家族成員。利用在線工具ExPASy[12](http://web.expasy.org/protparam/)預(yù)測雞STAT家族成員理化性質(zhì)(等電點(diǎn)、蛋白分子量和氨基酸數(shù)量等屬性)。
從NCBI數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/)下載人和家鼠的STAT蛋白序列,將它與雞STAT蛋白序列整合。通過MEGA-X[13]中的ClustalW將人、家鼠和雞STAT蛋白序列進(jìn)行多序列比對分析。并通過鄰接法(Neighblour-Joining,NJ)構(gòu)建系統(tǒng)進(jìn)化樹,自展值(Bootstrap)設(shè)定為1 000。
使用在線網(wǎng)站 MEME( http://meme-suiteorg/tools/meme) 對STAT蛋白序列的保守基序進(jìn)行預(yù)測分析,搜索motif值設(shè)定為10。STAT的外顯子和內(nèi)含子位置信息參考雞基因組注釋信息gff3文件,利用TBtools[14]軟件對其可視化分析。
利用TBtools軟件從基因組結(jié)構(gòu)注釋文件(gff3)中獲得雞STAT染色體位置信息,并通過其Gene Location Visualize from GTF/GFF功能制作染色體定位圖。
利用在線軟件SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)對雞STAT蛋白序列的二級結(jié)構(gòu)進(jìn)行分析,并對STAT家族各成員的二級結(jié)構(gòu)類型在各成員中的占比和分布進(jìn)行統(tǒng)計(jì)。
用生物信息學(xué)方法并對其進(jìn)行篩選驗(yàn)證,從雞全基因組中得到5條STAT基因序列。將5條雞STAT家族基因序列命名為ChSTAT1,ChSTAT2,ChSTAT3,ChSTAT4,ChSTAT5A。對雞STAT家族進(jìn)行蛋白理化性質(zhì)分析結(jié)果表明,雞STAT家族的氨基酸序列長度最長為905 aa,最短的為749 aa(表1)。家族成員蛋白分子量最大的是99 826.43 ku,最小的是85 695.54 ku。從理論等位點(diǎn)來看,ChSTAT1,ChSTAT2,ChSTAT3,ChSTAT4,ChSTAT5A的等電點(diǎn)均小于7,為酸性蛋白。其中,ChSTAT2等電點(diǎn)最小,為5.39。ChSTAT家族成員不穩(wěn)定系數(shù)大于40,鑒定其為不穩(wěn)定蛋白。ChSTAT1,ChSTAT2,ChSTAT3,ChSTAT4,ChSTAT5A疏水性都小于0,都是親水蛋白。

表1 雞STAT基因家族基本信息
系統(tǒng)進(jìn)化分析結(jié)果表明,雞的5個(gè)STAT基因可分為5組(圖1)。5個(gè)成員與家鼠和人的STAT家族成員分別聚集,說明STAT基因家族各成員相對較保守。STAT1和STAT4聚為一支,說明相較其他成員STAT1和STAT4親緣關(guān)系更近。

注:ChSTAT表示雞,HomoSTAT表示人,MusSTAT表示家鼠。遺傳距離標(biāo)尺在左下角。 節(jié)點(diǎn)上的值為通過Bootstrap檢驗(yàn)次數(shù)的百分?jǐn)?shù)。圖1 雞、家鼠、人STAT家族系統(tǒng)進(jìn)化樹
利用TBtools工具繪制了雞STAT家族成員的結(jié)構(gòu)特征圖。對雞STAT家族的5個(gè)成員進(jìn)行了蛋白保守結(jié)構(gòu)域分析,共獲取了10個(gè)motif元件(圖2)。不同STAT保守基元數(shù)量從4~10不等且分布不同,但同一分支基因所含保守基序個(gè)數(shù)及順序較為一致。其中STAT5A的編碼序列較其他成員簡單。基因成員均含有內(nèi)含子和外顯子。在同一分支的成員,基因結(jié)構(gòu)較相似。
從雞基因組中提取雞染色體長度、STAT基因在染色體上的位置等信息。結(jié)果顯示,ChSTAT定位在3條染色體上(圖3)。ChSTAT1和ChSTAT4定位在7號染色體;ChSTAT3和ChSTAT5A定位在27號染色體;ChSTAT2定位在33號染色體。

圖2 雞STAT家族成員結(jié)構(gòu)特征

圖3 雞STAT基因的染色體分布

表2 雞STAT家族蛋白質(zhì)二級預(yù)測 %
用SOPMA對雞STAT家族成員蛋白序列的二級結(jié)構(gòu)進(jìn)行預(yù)測,結(jié)果表明,雞STAT家族成員全部包含α-螺旋、β-轉(zhuǎn)角、延伸鏈及無規(guī)則卷曲,但各部分所占比例不同(表2)。ChSTAT2主要由無規(guī)則卷曲組成,其余4個(gè)成員主要由α-螺旋組成,β-轉(zhuǎn)角在各成員中所占比例最少。
STAT家族成員歸屬于一個(gè)重要的信號轉(zhuǎn)導(dǎo)家族,在各種動(dòng)物中都存在。STAT家族成員在小鼠及人中被研究較多[15,16]。不同的STAT基因之間通過相互作用共同參與免疫調(diào)節(jié)過程,對于維持機(jī)體免疫系統(tǒng)平衡來說,當(dāng)某個(gè)STAT基因的表達(dá)失調(diào)時(shí)就可能導(dǎo)致疾病發(fā)生。
本次研究通過隱馬可夫模型對雞基因組中STAT家族的搜索分析,鑒定獲得5個(gè)成員。從理論等位點(diǎn)來看,ChSTAT1,ChSTAT2,ChSTAT3,ChSTAT4,ChSTAT5A的等電點(diǎn)均小于7,為酸性蛋白。ChSTAT家族不穩(wěn)定系數(shù)均大于40,鑒定其為不穩(wěn)定蛋白。ChSTAT1,ChSTAT2,ChSTAT3,ChSTAT4,ChSTAT5A疏水性都小于零,都是親水蛋白。以上分析推測雞STAT基因家族成員較易發(fā)生改變。研究發(fā)現(xiàn),STAT2,STAT4和STAT6負(fù)責(zé)調(diào)節(jié)免疫應(yīng)答,而STAT1,STAT3和STAT5(STAT5a和STAT5b)作用不同,它們可以調(diào)控細(xì)胞周期、細(xì)胞存活和血管生成等線管基因的表達(dá),這些基因失調(diào)都會(huì)導(dǎo)致其活性增加,誘導(dǎo)疾病的發(fā)生[17~19]。
基因結(jié)構(gòu)是研究基因進(jìn)化和基因功能的重要依據(jù)。據(jù)STAT家族結(jié)構(gòu)特征分析可知,不同STAT保守基序數(shù)量從4~10不等,并且保守基序分布也是有所不同的,整體來說,亞家族STAT1~4保守基序分布有些許相似。STAT5A的編碼序列相比較其他亞家族簡單。經(jīng)過系統(tǒng)進(jìn)化分析可知,5個(gè)成員與家鼠和人的STAT家族成員分別聚集,表明基因保守性較強(qiáng)。相比之下,家鼠和人屬于同一分支再與雞相同基因聚集,說明物種間的差異較大。染色體定位顯示ChSTAT1和ChSTAT4定位在7號染色體;ChSTAT3和ChSTAT5A定位在27號染色體;ChSTAT2定位在33號染色體。結(jié)合基因結(jié)構(gòu)分析發(fā)現(xiàn),在同一條染色體上的基因結(jié)構(gòu)整體較為相似。
預(yù)測分析蛋白質(zhì)的結(jié)構(gòu)對雞STAT家族的生物學(xué)研究是非常重要的。因?yàn)榈鞍踪|(zhì)只有折疊成特定的空間結(jié)構(gòu)才具有響應(yīng)的活性和生物學(xué)功能[20]。經(jīng)研究發(fā)現(xiàn),變性蛋白質(zhì)在可以重新折疊的實(shí)驗(yàn)條件下可以重新折疊到原來的結(jié)構(gòu)[21]。在生物體內(nèi)蛋白質(zhì)分子的多肽鏈一般都不是松散的線性分子,而是以α-螺旋、β-折疊延伸鏈、β-轉(zhuǎn)角和無規(guī)則卷曲的形態(tài)出現(xiàn)[22]。本次研究發(fā)現(xiàn),雞大多數(shù)STAT基因主要由α-螺旋組成,其次是無規(guī)則卷曲,占比例最少的是β-折疊。
本次研究鑒定得到5個(gè)雞STAT基因家族成員。理化性質(zhì)分析發(fā)現(xiàn),ChSTAT均為酸性蛋白、不穩(wěn)定蛋白且是親水蛋白;根據(jù)進(jìn)化關(guān)系可知同一分支的基因結(jié)構(gòu)以及蛋白保守結(jié)構(gòu)域較為相近;ChSTAT分布在7,27,33等3條染色體上;除ChSTAT2以外其他成員主要由α-螺旋組成。