陳建興,王銀朝,張慶蛟,陳海偉,趙 冰
(1.赤峰學院 生命科學學院,內蒙古 赤峰 024000;2.山東東阿阿膠股份有限公司,山東 聊城 252201)
驢朊蛋白基因序列分析
陳建興1,王銀朝2,張慶蛟2,陳海偉1,趙 冰1
(1.赤峰學院 生命科學學院,內蒙古 赤峰 024000;2.山東東阿阿膠股份有限公司,山東 聊城 252201)
在我國,家驢及驢產品具有很大的市場開發潛力和價值.本研究通過生物信息學技術分析了家驢朊蛋白基因PRNP的序列特征,為家驢向肉用方向進行抗病選育提供一定的分子依據.經分析研究發現家驢PRNP基因CDS區翻譯出255個氨基酸構成的多肽.家驢的朊蛋白中的氨基酸以甘氨酸所占的比例最高(18.43%),其次為纈氨酸(8.63%),最低的為半胱氨酸(1.18%).對15條家驢PRNP基因的CDS區序列進行比對時只發現了C153T、T237C和G354C三個突變,并且這三個突變均為沉默突變.家驢朊蛋白的編碼存在明顯的密碼子使用偏好現象.另外,我們重新界定了家驢朊蛋白各區塊的具體大小和位置.
驢;朊蛋白;PRNP;序列分析
驢(Equusasinus)馴化成功后,在許多文化體系中,一直作為主要的馱運家畜為人類文明的發展做出了巨大貢獻[1].時至今日,在內蒙古的許多地區,如呼和浩特、赤峰等地,仍能見到驢或騾子拉的車作為交通工具拉運重物(如建筑工地使用的鋼管)和水果(進行販賣)等.另外,驢肉因味道鮮美、營養豐富,一直受到廣大消費者的厚愛.驢乳因功能獨特,也逐漸為人們所認識和接納[2].驢皮熬制的阿膠,數百年來一直作為補品,深受人們喜愛.我國家驢的養殖數量在全世界范圍內一直處于領先地位,驢產品具有很大的市場開發潛力和價值[3,4].
傳染性海綿樣腦軟化病(transmissiblespongiform encephalopathies,TSE)是在人類和哺乳動物中發現的一類中樞神經系統慢性退化性致死性疾病,又稱朊病毒(prion)病.朊蛋白基因(PrionProteingene,PRNP)在正常情況下編碼一種細胞表面的糖蛋白,通常稱其為細胞型朊蛋白(PrPc,thecellularform ofprionprotein),通過構象轉變,PrPc可轉變為致病性的PrPsc(thescrapieformofprionprotein),而PrPsc在體內(一般是腦部)蓄積可引發朊病毒病[5].朊病毒病在幾種草食動物(綿羊、山羊、牛、馬鹿、麂、大角羚)和雜食動物(人、貓、水貂)中有過報道,但在馬屬動物中未見有感染此病的報道,估計一般情況下,該病毒在各物種間的種屬屏障和潛伏期會有很大不同.朊蛋白的RNA并非由一個外顯子構成,但整個開放閱讀框(ORF)包含在一個單一的外顯子中[5].張太翔和趙德明對德州驢與其余7種動物朊病毒基因核苷酸和氨基酸序列進行比較,發現有三個區域變異較大,認為與種屬屏障和朊病毒的潛伏期有關[6].Zhang等[7]克隆測序并分析了西吉驢的PRNP基因,并將西吉驢該序列與其余物種進行了比對分析.
對于家驢朊蛋白基因的研究,只有趙德明進行了一些研究[6~8].為此,本研究通過生物信息學技術初步分析家驢朊蛋白基因的序列特征,可以更好地了解朊病毒病的發病機理,朊病毒病的傳遞機制和種間屏障等,可為家驢的抗病育種提供分子依據,也可為朊病毒病制定相關預防控制措施提供一些理論依據.
1.1 數據來源
所使用的家驢和倉鼠朊蛋白基因序列,全部來自GenBank,其GenBank登錄號分別為:EF127815、KC845010-KC845023和K02234.
1.2 分析方法
多重序列比對采用DNAMAN7.0軟件進行,家驢PRNP基因的密碼子使用情況分析也采用DNAMAN7.0來完成.家驢朊蛋白氨基酸組成分析通過MEGA6.0來完成.
2.1 家驢朊蛋白基因的比對分析
家驢朊蛋白基因的比對結果,見圖1.從圖中可見,家驢朊蛋白基因間共發現三處核苷酸的改變,分別為C153T、T237C和G354C.由此三處核苷酸的改變,可將家驢朊蛋白基因分為CTG(6個)、TCC(4個)和TTG(5個)三種單倍型.這三個突變中,前二者為嘧啶之間的替換,只有354處為鳥嘌呤和胞嘧啶之間的顛換.對這些基因序列對應的氨基酸序列進行比對發現,這三個突變均為沉默突變,亦即突變未引起氨基酸的改變.

圖1 家驢朊蛋白基因比對結果圖
2.2 家驢朊蛋白基因PRNP的密碼子使用情況分析
通過對家驢的朊蛋白基因PRNP進行密碼子使用情況分析發現,家驢PRNP基因CDS區共翻譯出255個氨基酸構成多肽,見圖2(圖中顯示256個密碼子,包含一個終止密碼子).家驢的朊蛋白中的氨基酸以甘氨酸所占的比例最高(18.43%,共出現47次),其次為纈氨酸(8.63%,共出現22次),最低的為半胱氨酸(1.18%,共出現3次).
從圖2還可以看出,除了UAA、UAG兩個終止密碼子未被使用外,亮氨酸的四個密碼子(UUA、UUG、CUU和CUA)、絲氨酸的兩個密碼子(UCA和UCG)、半胱氨酸的一個密碼子(UGU)、精氨酸的一個密碼子(CGG)、天冬氨酸的一個密碼子(GAU)也未被使用.而這幾種氨基酸都由其它密碼子進行編碼,說明家驢朊蛋白的編碼存在明顯的密碼子使用偏好.除這幾種明顯的密碼子使用偏好外,其余氨基酸的編碼也存在著較明顯的偏好,見圖2.
另外,圖2中也可看出,密碼子三個位置各個核苷酸所占的比例差異較大,密碼子第一位以G所占比例最大,最小為U;密碼子第二位以G所占比例最大,最小為C;密碼子第三位以C所占比例最大,最小為A.
框左邊和右邊分別表示密碼子第一位和第三位的四種核苷酸,框內表示的該密碼子翻譯的氨基酸.第一個數字表示該密碼子出現的次數,第二個數字表示該密碼子出現次數占總256個密碼子的千分率,第三個數字表示該密碼子占同類氨基酸密碼子的百分率.框下面顯示的是密碼子三個位置上各核苷酸所占的比例.
2.3 家驢朊蛋白的基本結構

圖2 家驢朊蛋白基因的密碼子使用情況分析

圖3 家驢朊蛋白的結構示意圖
圖的上方為密碼子數列.SP為信號肽序列;G-PREPEATS是富含Gly-Pro的重復序列區;STE是控制朊蛋白拓補結構的區域;TM是一段跨膜的α螺旋;AH編碼一個兩性螺旋;SS編碼一個疏水信號序列.
通過將家驢朊蛋白與金倉鼠的相應氨基酸序列進行比對,界定好各區域的大體位置,并通過DNANMAN7.0內置的部分功能預測了信號肽和跨膜區的區域,綜合起來做出了家驢朊蛋白的基本結構,結果見圖3.圖3中,上方數列為密碼子的大體位置,SP為N端含24個氨基酸殘基組成的信號肽序列;G-PREPEATS是富含Gly-Pro的重復序列區,53-61氨基酸殘基位置處為1個PQGGGGWGQ的九肽區,62-85氨基酸殘基位置處為3個PHGGGWGQ的八肽區,86-94氨基酸殘基位置處為1個PHGGGGWGQ的九肽區;STE是控制朊蛋白拓補結構的區域;TM是一段跨膜的α螺旋;AH編碼一個兩性螺旋;SS編碼一個疏水信號序列.
在人和一些易感朊病毒病的哺乳動物中,尤其是在一些經濟地位比較突出的家畜,對于朊蛋白基因的研究比較多見[9~12].而對于家驢,只是偶見趙德明等對德州驢和西吉驢的朊蛋白基因的CDS區進行了擴增和簡單的序列分析[6~8],并未見到更進一步的研究報道.雖然朊蛋白基因是在哺乳動物體內非常保守的一個基因,但其具體功能還不是很清楚[13].對于家驢來說,該基因編碼蛋白有無變異,變異對朊病毒病的發病有無影響,都還是未知的.可見,未來對此基因的研究具有很大的意義,有可能找到哺乳動物朊病毒病的發病機制和馬屬動物不患朊病毒病的分子機制,對家驢產品的進一步擴大開發利用提供研究基礎.因此,本研究通過生物信息學技術初步分析家驢朊蛋白基因的序列特征,為將來探尋該基因的變異和作用機制打下基礎.
在已研究的哺乳動物中,PRNP是一個高度保守的基因,所有動物的編碼框都編碼一個約250個氨基酸的蛋白,編碼朊蛋白的CDS中的DNA和氨基酸序列的相似性分別達到90%和95%以上[11,14],據此推測該基因在維持動物生理功能和內環境穩定性方面可能具有重要作用.從圖1中也可看出,15條家驢朊蛋白基因比對時只發現了C153T、T237C和G354C三個突變,并且這三個突變均為沉默突變.這一結果說明家驢朊蛋白基因非常保守,當然,這也與所使用的序列較少有關,有待進一步擴大樣本量進行下一步研究.
通過對家驢的朊蛋白基因PRNP進行密碼子使用情況分析發現,家驢朊蛋白的編碼存在明顯的密碼子使用偏好,見圖2.通過家驢PRNP密碼子使用偏好性的研究,可以判定最優密碼子,并針對最優密碼子設計相應的基因工程表達載體,以提高朊蛋白基因的表達量,這對于進一步研究朊蛋白的生物功能和朊蛋白病的發病機制將具有很大的意義.
圖3中,我們通過將家驢朊蛋白與金倉鼠的相應氨基酸序列進行比對,界定了各區域的大體位置,并通過DNANMAN7.0內置的部分功能預測了信號肽和跨膜區的區域,綜合起來才做出了家驢朊蛋白的基本結構.這就與張太翔和趙德明的研究結果[6]有些不相符.其中,我們認為SP為N端含24個氨基酸殘基組成的信號肽序列,而他們認為是前23個氨基酸殘基構成[6],這在比對和信號肽預測時能夠看出的確是24個氨基酸殘基而非23個;G-P REPEATS中62-85氨基酸殘基位置處為3個PHGGGWGQ的八肽區,這通過檢測和計算就可得知,而在他們的研究中認為是4個八肽區[6],推測可能是筆誤;SS編碼一個疏水信號序列,因為SS前面的序列的最后一個氨基酸在下一步多肽鏈成熟修飾時會錨定一個GPI(糖基磷酸肌醇)[5],所以,SS前那段氨基酸序列最后一個氨基酸必須是絲氨酸,這就很好地界定了該處的位置.
〔1〕A.Beja-Pereira,P.R.England,N.Ferrand, etal.Africanoriginsofthedomesticdonkey [J].Science,2004,304(5678):1781.
〔2〕張曉瑩,趙亮,鄭倩,等.新疆疆岳驢乳理化和微生物指標分析[J].食品科學,2008,29(01):303-305.
〔3〕http://dad.fao.org.
〔4〕J.X.Chen,Y.J.Sun,D.Manglai,etal.Maternalgeneticdiversityandpopulationstructure offourChinesedonkeybreeds[J].Livestock Science,2010,131:272-280.
〔5〕李振剛.分子遺傳學(第三版)[M].北京:科學出版社,2008.
〔6〕張太翔,趙德明.德州驢朊病毒基因克隆與序列分析[J].中國獸醫雜志,2007,43(3):3–5.
〔7〕Z.Zhang,R.Wang,L.Xu,etal.Molecular cloningandsequenceanalysisofprionprotein geneinXijidonkeyinChina[J].Gene,2013, 529:345-350.
〔8〕T.Zhang,H.Liu,X.Zhou,etal.Molecular cloningandsequenceanalysisofprionprotein geneofDezhoudonkeyinChina[J].Asian JournalofAnimaland Veterinary Advances, 2006,1(1):23-32.
〔9〕陳芯,賀三剛,劉明軍.新疆地區綿羊品種朊蛋白基因136、154和171位點的多態性 [J].遺傳, 2010,32(11):1159-1165.
〔10〕PrusinerS.PriondiseasesandtheBSEcrisis [J].Science,1997,278:245~251.
〔11〕管峰,潘磊,石國慶,等.綿羊PRNP遺傳多樣性與抗病育種研究進展[J].遺傳,2009,31(2):137-141.
〔12〕楊建民,趙德明,郝永新,等.奶牛朊病毒基因克隆與序列分析 [J].畜牧獸醫學報,2004,35(6): 685-688.
〔13〕DambergerF.F.,ChristenB.,PérezD.R.,et al.Cellularprion protein conformation and function[J].ProcNatlAcadSciUSA,108(42): 17309-17313.
〔14〕LeeIY,WestawayD,SmitAF,etal.Completegenomicsequenceandanalysisofthe prionproteingeneregionfromthreemammalianspecies[J].GenomeRes,1998,8(10): 1022-1037.
S588.9
A
1673-260X(2014)12-0014-03
2013年度內蒙古自治區高等學校科學研究項目(NJZC13306)研究成果