黃冬麗,丁功濤,王福彬,吳柳芬
(西北民族大學生命科學與工程學院,甘肅 蘭州 730124)
肌肉生長抑制素(Myostatin,MSTN)又稱轉化生長因子(growth differentiation factor8,GDF-8),是轉化生長因子(Transforming growth factorβ,TGF-β)超家族成員之一[1],特異性表達于動物骨骼肌中,屬骨骼肌生長的負調控因子,能抑制肌肉的生長[2]。McPherron AC等[1]首先從小鼠骨骼肌cDNA文庫中克隆得到MSTN基因,并發現該基因缺失的小鼠體重約為正常小鼠的2倍,證明了MSTN基因的表達量與小鼠體重變化呈負相關。自1997年McPherron等[1]首先從鼠的骨骼肌文庫獲得了cDNA全長序列以來,人們相繼克隆了羊、豬、馬、人、魚、雞等20多種脊椎動物的MSTN基因[3],為深入研究MSTN基因的作用機制作出了巨大貢獻。目前,研究大多集中在對于MSTN基因與牛、羊、豬等動物的瘦肉率的關系上,但對編碼蛋白的性質和功能方面的研究卻鮮有報道[4-6]。
杜泊綿羊是來自南非的肉羊品種,具有早熟、生長發育快、采食能力強、肉用特征明顯等特點,MSTN基因在控制綿羊產肉率等方面具有明顯的作用[7-8]。為深入探究杜泊綿羊MSTN基因編碼蛋白的性質和功能,本研究借助生物信息學相關軟件和工具來對杜泊綿羊MSTN基因編碼產物的理化特性和蛋白質結構功能進行預測與分析,以期為以后利用MSTN基因改良羊經濟性狀提供參考。
1.1 杜泊綿羊MSTN基因序列來源杜泊綿羊的MSTN基因的全基因序列由GENEBANK進行查找獲得(GeneBank no:NM-001009428),該DNA血樣取自于綿羊的耳緣靜脈。
1.2 試驗方法 對羊MSTN基因CDS編碼產物的氨基酸序列、其蛋白質特性及功能結構域進行分析與預測所用各種軟件工具及網址見表1。

表1 蛋白質結構預測軟件及相關網址Table 1 The software of prediction about protein structure and function and related web sites
2.1 杜泊綿羊MSTN基因編碼蛋白質理化性質結果闡述 杜泊綿羊的MSTN基因編碼蛋白質理化性質結果表明,羊的MSTN基因編碼375個氨基酸。20種氨基酸所占比例如表2所示,其中占整個氨基酸組成的比重最大的為亮氨酸(Leu),比率為9.9%;比重最小的為色氨酸(Trp),比率為1.6%。負電荷殘基總數(Asp+Glu)及正電荷殘基總數(Arg+Lys)均為48,其分子式為C1912H3018N512O561S21,分子質量為42 827 kDa,基因編碼產物半衰期和不穩定指數分別為30 h和44.87,其中不穩定指數大于40,可判定該基因編碼產物屬于不穩定蛋白[9]。

表2 杜泊綿羊MSTN基因編碼蛋白的氨基酸組成Table 2 The amino acid composition of the protein encoded by the MSTN gene of Dorper Sheep
2.2 杜泊綿羊MSTN基因編碼蛋白質的親疏水性預測結果闡述杜泊綿羊MSTN基因編碼的蛋白質的親疏水性預測結果表明(見圖1),氨基酸的位置和編碼氨基酸疏水性的分值分別作為橫坐標和縱坐標。結果表明,第14位為甲硫氨酸(Met),疏水分值為+2.811,疏水性最強;第28位為谷氨酸(Glu),疏水分值為-3.244,親水性最強。整條氨基酸肽鏈中,親水性氨基酸和疏水性氨基酸分別占65.64%和34.36%,由于整條肽鏈中親水性氨基酸占比較多,總平均親水性分值為-0.490,故可推斷杜泊綿羊MSTN基因編碼的蛋白質是一種水溶性蛋白。

圖1 杜泊綿羊MSTN基因編碼的蛋白質疏水性/親水性預測分析Fig.1 Hydrophobicity prediction results in Dorper Sheep MSTN protein
2.3 杜泊綿羊MSTN基因編碼的蛋白質信號肽預測結果闡述信號肽常指新合成多肽鏈中用于指導蛋白質的跨膜轉移的N-末端的氨基酸序列,它是指導分泌性蛋白質在糙面內質網上合成的決定性因素。杜泊綿羊MSTN基因編碼的蛋白質信號肽進行分析結果表明(見圖2),杜泊綿羊MSTN基因編碼產物的C值、Y值和S值分別為0.427、0.586和0.950。由于29~31位的氨基酸之間其發現切割位點,故可以預測杜泊綿羊MSTN基因信號肽存在于編碼的蛋白質序列中。

圖2 杜泊綿羊MSTN基因編碼蛋白質信號肽分析結果Fig.2 Signal peptide analysis results in Dorper Sheep MSTN protein
2.4 杜泊綿羊MMSSTTNN基因編碼的蛋白質糖基化位點預測結果闡述 蛋白質糖基化是指在蛋白質合成過程中或合成后,在酶的催化下寡糖鏈被連接在肽鏈特定的糖基化位點,形成糖蛋白。杜泊綿羊MSTN基因編碼的蛋白質糖基化位點進行分析結果表明(見圖3),在杜泊綿羊MSTN基因編碼的蛋白質中含有6個潛在的N-糖基化位點,分別為Asn31、Asn96、Asn176、Asn260、Asn330、Asn369。

圖 3 杜泊綿羊MSTN基因編碼蛋白質N-糖基化位點分析Fig.3 N-glycosylation site Prediction results in Dorper Sheep MSTN protein
2.5 杜泊綿羊MMSSTTNN基因編碼的蛋白質功能預測結果闡述 杜泊綿羊MSTN基因編碼的蛋白質功能預測分析結果表明(見表3),該蛋白作為生長因子和荷爾蒙在信號轉導、免疫應答、脅迫應答過程中發揮作用幾率相對較高,分別為1.271%、1.447%和2.534%,可以預測MSTN基因在調節羊的生長、免疫及代謝中發揮著重要的作用。
2.6 杜泊綿羊MMSSTTNN基因編碼的蛋白質結構預測結果闡述
2.6.1 杜泊綿羊MSTN基因編碼蛋白質二級結構分析 如圖4所示,二級結構組分中α-螺旋(Hh)、β-折疊(Ee)、β-轉角(Tt)和無規則卷曲(Cc)分別占21.07%、23.20%、3.20%和52.53%??梢钥闯鯩STN基因編碼的二級結構中無規則卷曲占主導地位,其次是β-折疊。由于二級結構中α-螺旋所占比例小于45%,但無規則卷曲比例大于20%,由此可以推斷該基因編碼的蛋白質為混合型二級結構[10]。
2.6.2 杜泊綿羊MSTN基因編碼蛋白質三級結構分析 如圖5所示,三級結構中主要成分也是β-折疊和無規則卷曲,與二級結構預測的結果相符。

表 3 杜泊綿羊MSTN基因編碼蛋白質功能預測Table 3 Functional prediction and analysis in Dorper Sheep MSTN protein

圖 4 杜泊綿羊MSTN基因編碼蛋白質的二級結構預測Fig.4 Putative result of MSTN protein secondary structure in Dorper Sheep

圖 5 杜泊綿羊MSTN基因編碼蛋白三級結構預測Fig.5 Putative result of MSTN protein tertiary structure in Dorper Sheep
蛋白質是組成人體一切細胞、組織的重要成分,不僅對基因調控有較大的影響,而且參與機體所有重要部分的組成[11-12]。本研究通過生物信息學分析的方法對杜泊綿羊的MSTN基因序列進行分析,發現MSTN基因的CDS區由1 127個堿基對組成,共編碼375個氨基酸,具有6個潛在的糖基化位點。同時具有較長的半衰期和很高的不穩定系數,編碼的產物總體表現為不穩定的水溶性蛋白。賈浩等[13]在研究中發現蛋白質的半衰期越長穩定系數越高,這與研究分析結果不一致,可能是由于MSTN基因編碼產物的理化特性對其生物學功能的發揮影響不大造成的[14]。
氨基酸的親/疏水性影響蛋白質的結構和功能,是氨基酸固有的的特性,總平均分值可以體現氨基酸的親水性,數值越低,氨基酸的親水性越強。研究結果顯示,該基因編碼的產物中親水性氨基酸占比較大,總平均分值為-0.490,總體表現為親水性,因此可以預測MSTN基因編碼產物為可溶性蛋白。
蛋白質的空間結構指蛋白質分子中所有原子在三維空間中的排布,包括二級、三級、四級結構等,空間結構的組成又密切影響著蛋白質功能的發揮。蛋白質二級結構主要指多肽鏈主鏈折疊產生的由主鏈內和主鏈間周期性氫鍵維系的有規則的構象。該基因編碼產物的二級結構中無規則卷曲(Cc)和β-折疊(Ee)比率比較大,分別為23.20%和52.53%;α-螺旋(Hh)占比較小,為21.07%。由于Cc>20%,Hh<45%,故可推斷該基因編碼產物的二級結構為混合型,主要由β-折疊和無規則卷曲構成。由于無規則卷曲易受側鏈的影響而導致蛋白質功能發生變化,因此對其蛋白質功能的研究還需進一步深入。
在分析預測其功能的結果中顯示,該蛋白作為生長因子和荷爾蒙在信號轉導、免疫應答、脅迫應答過程中發揮作用幾率相對較高,因此可以推斷該基因在杜泊綿羊的生長、免疫和代謝的調節中發揮重要作用。王紅娜等[15]在研究MSTN在綿羊成肌細胞中的調控機制時發現,若制備可有效失活MSTN基因的病毒,可通過RNA干擾技術提高綿羊產肉量;閔令江等[16]通過研究山羊的MSTN基因多態性后發現,MSTN基因對山羊的斷奶重、凈肉重、后軀肉重和肝重等指標有重要影響。本試驗對羊MSTN基因的研究將有利于對該基因及其編碼蛋白功能的進一步分析,為利用MSTN基因改良羊經濟性狀提供參考。