國果 吳沁怡 吳建偉 趙學軍 付萍 張勇
(貴陽醫學院 寄生蟲學教研室,貴陽 550004)
家蠅泛素結合酶基因的生物信息學分析
國果 吳沁怡 吳建偉 趙學軍 付萍 張勇
(貴陽醫學院 寄生蟲學教研室,貴陽 550004)
利用EST測序技術從家蠅幼蟲cDNA文庫中獲得家蠅泛素結合酶基因(MD-E2)cDNA序列,采用NCBI、ExPASY中的相關工具,對該基因及其編碼蛋白的基本理化性質、疏水性、信號肽、二級結構和亞細胞定位等方面進行預測和分析,MEGA軟件構建了進化樹。結果表明,家蠅泛素結合酶基因的cDNA序列具有完整的ORF框,全長480 bp,一共編碼159個氨基酸。其編碼的蛋白質理論分子量為18.117 9 kD,等電點8.64,無信號肽及跨膜區,屬于親水性蛋白,具有泛素結合酶家族的活性位點(FHPNVYPSGTVCLSLL),主要分布于細胞核;二級結構以無規則卷曲為主,β折疊較少。
家蠅 泛素結合酶 生物信息學
泛素-蛋白酶途徑(Ubiquitin-proteasome pathway,UPP)廣泛存在于真核系統中,此途徑在細胞基本進程如DNA修復,細胞周期調控,機體抵御環境脅迫等一系列通路中發揮著重要作用[1]。在一般蛋白質降解的泛素化途徑中,共需要泛素活化酶(UBE1)、泛素結合酶(UBE2)和泛素底物連接酶(UBE3)3種酶的參與[2],泛素結合酶(UBE2)在選擇性降解靶蛋白中起決定性作用。不同的細胞內有多種UBE2基因,目前發現酵母有13種,擬南芥中有17種,而人類至少有30種。但對于昆蟲UBE2研究報道較少,目前尚未見家蠅體內UBE2的相關研究報道。有學者研究顯示,當機體受到病原體如細菌和病毒攻擊時,UBE2的表達水平明顯上升[3-6]。本課題組通過構建家蠅幼蟲熱脅迫的cDNA全長文庫并進行EST測序,從中篩選得到了UBE2的表達序列標簽,并測定了其全長序列。本研究對家蠅UBE2基因的cDNA序列進行結構與功能的信息學分析,以期為進一步揭示該基因在家蠅免疫防御體系中的功能,挖掘新型的家蠅抗菌功能基因等提供一定的理論及試驗依據。
1.1 材料
熱誘導的家蠅三齡幼蟲cDNA質粒文庫由北京華大合作構建(具體誘導條件及文庫構建方法見課題組前期論文報道[7]。
隨機挑選500個克隆測序得到多個EST,Wublastx 方法歸并EST獲得Unigene。對這些Unigene進行BLAST后,從中篩選獲得編碼家蠅UBE2的基因,文庫質粒編碼為004E02b。
1.2 方法
1.2.1 家蠅泛素結合酶基因的識別與同源性比較 通過NCBI網站的BLASTx程序,將編號為004E02b文庫質粒的插入序列與GenBank 中的序列進行比對,判斷該序列是否為全長編碼序列,尋找該序列的同源蛋白序列,將家蠅泛素結合酶基因命名為MD-E2。
1.2.2 MD-E2理化性質分析 用DNASTAR5.0 軟件分析cDNA序列和開放閱讀框;利用瑞士生物信息學研究所的蛋白分析專家系統(Expert Protein Analysis System,ExPASy)提供的生物信息學工具Protparam,分析預測蛋白質的氨基酸殘基性質、分子量及理論等電點、摩爾消光系數、重組產物在細菌、酵母和哺乳動物細胞中的半衰期、在溶液中的穩定性等;ProtScale 分析蛋白質的疏水性質。采用Signal P分析信號肽序列。
1.2.3 結構及功能預測 利用Interpro 和PREDICTPROTEIN 在線分析軟件預測蛋白質中包含的結構域和氨基酸功能位點;利用PSORT Ⅱ在線分析網站分析蛋白質在細胞內的定位。利用PHD sec 在線服務器和SWISS MODEL在線預測網站預測蛋白質的二級結構和三級結構。
1.2.4 系統發育樹 從NCBI數據庫下載9個物種的泛素結合酶基因編碼蛋白序列,包括果蠅、按蚊、金小蜂、擬谷盜屬、水蚤擬穴青蟹、牛蛙、南美白對蝦和人類,利用MEGA4.1軟件構建系統進化樹。
2.1 MD-E2 基因的序列比對
NCBI對MD-E2進行BLASTx分析,結果(圖1)發現MD-E2基因與黑腹果蠅(Drosophila ananassae)、埃及伊蚊(Aedes aegypti)、大紅斑蝶(Danaus plexippus)泛素結合酶基因的相似性分別為99%、97%和94%,從比對的高同源性判斷該基因是家蠅的泛素結合酶基因,也表明泛素結合酶極度保守。ORF全長480 bp,編碼159個氨基酸。
2.2 理化性質預測
利用ProtParam工具預測表明MD -E2編碼蛋白的相對分子量為18.12 kD,理論等電點(pI 值)8.64,含酸性氨基酸(DE)12.58%,堿性氨基酸(KR)14.47%,親水性氨基酸(AILFWV)、極性氨基酸(NCQSTY)和帶電氨基酸(RKHYCDE)的比例分別為32.7%、20.75%和34.6%。可見,該蛋白在酵母和大腸埃希菌中表達的半衰期分別大于20 h和10 h,在溶液中的不穩定指數略高于40,為41.02,提示穩定性稍弱。
2.3 信號肽預測和分析
分泌蛋白及細胞膜蛋白都以前體物質多肽的形式合成,其N末端含有作為通過膜時指導蛋白質跨膜轉移的氨基酸序列即為信號肽。利用在線網站Signal IP 3.0 Server 分析此蛋白,結果顯示MD-E2基因編碼的蛋白沒有信號肽,屬于非分泌型蛋白。
2.4 亞細胞定位
MD-E2基因編碼蛋白的亞細胞定位分析結果顯示,其分布在細胞核、細胞質、線粒體、細胞骨架、和分泌型囊泡的可能性分別為56.5%、17.4%、13%、4.3%和8.7%。推斷MD-E2蛋白可能主要在細胞核中發揮生物學作用。
2.5 結構域分析
ScanProsite 分析顯示,該氨基酸序列含有完整的泛素結合酶家族的特征性活性位點FHPNVYPSGTVCLSLL(82-97aa)。Inter ProScan 分析顯示其具有泛素結合酶家族的氨基酸保守結構域(圖2)。MotifScan(模序)分析顯示,MD-E2含有1個酰胺化位點,1個蛋白激酶磷酸化位點;2個酪蛋白激酶Ⅱ磷酸化位點;1個N-肉豆蔻酰化位點,1個蛋白激酶C磷酸化位點;1個泛素結合酶活性位點,2個泛素結合酶家族的特征性位點。推測MD-E2蛋白功能的發揮可能與激酶磷酸化有關。
2.6 疏水性和親水性的預測與分析
利用Protprotscale在線預測MD-E2氨基酸序列的親疏水性,根據氨基酸分值越低親水性越強和分值越高疏水性越強的規律可知,MD-E2基因編碼的蛋白多肽鏈第15位具有最低的分值-2.933(最強的親水性),第116為具有最高的分值1.867(最強的疏水性)(圖3)。總體而言,除了局部的疏水區域,大部分區域為親水性,因而整個多肽鏈表現為親水性。該結果與ProtParam分析結果一致。
2.7 二級結構和三級結構預測
MD-E2蛋白沒有跨膜區,Sec預測組成MD-E2多肽鏈二級結構的3種類型,α螺旋(H)、β折疊(E)和無規則卷曲(L)的比例是33.33∶16.35∶50.31,以無規則卷曲為主,β折疊較少。利用Swiss-Modeling對MD-E2的氨基酸序列進行蛋白質三維結構的同源建模(圖4),可見結構中含有較多的α螺旋和無規則卷曲,與二級結構預測結果基本吻合。
2.8 系統發育樹
MD-E2基因編碼蛋白與其他物種泛素結合酶基因編碼蛋白具有較高的同源性,均在90%以上。用MP法構建10個物種的系統發育樹,結果表明,家蠅、果蠅和岡比亞按蚊的距離最近,雙翅目昆蟲與甲殼綱昆蟲進化起源于共同祖先。
20個世紀80年代以來,泛素及泛素-蛋白酶體通路一直是生物學領域的研究熱點之一。作為胞內重要的蛋白質降解體系,泛素系統在免疫信號轉導過程中發揮著重要作用[8]。研究表明,泛素蛋白是調節昆蟲適應外界環境的過程中的重要蛋白之一[9],在果蠅體內,泛素-蛋白酶體途徑通過降解免疫缺失的Reli蛋白而促進了果蠅體內抗菌肽基因的激活和表達[10]。研究者把鰻弧菌(Vibrioan guillarum)注入到貝殼的肌肉內發現,泛素結合酶的表達量有所增加,而Boname 和Lehner[11]也證實了當病毒侵入機體時,泛素結合酶基因的表達明顯上調。對植物體內泛素體系的研究結果亦表明,泛素結合酶在植物抗脅迫反應中具有重要的作用,如在熱激和重金屬誘導條件下,番茄中的泛素結合酶表達增強[12],疣粒野生稻中泛素結合酶基因在受百葉枯病病原菌脅迫120 h內隨著時間延長表達逐漸增強[13],因此我們推測,家蠅泛素結合酶可能也參與了家蠅抗病反應的過程,也是家蠅強大的免疫防御系統中重要的活性分子之一。
本研究對MD-E2的分析表明,該蛋白主要定位于細胞核,概率為56.5%,蛋白上具有多個磷酸化位點,是一個功能活躍的蛋白質。同源性比較分析結果顯示,其堿基序列與已經報道的其他9物種的形似性較高,均為90%以上,提示泛素結合酶是一種高度保守的蛋白。本研究采用生物信息學方法分析了MD-E2的理化特性和結構,不僅豐富了泛素結合酶蛋白家族基因信息,同時為進一步研究在外界刺激誘導下,家蠅泛素結合酶的功能與抗病特性之間的關系,進一步開發家蠅體內豐富的抗菌物質奠定了一定的理論基礎。
家蠅MD-E2基因含有完整的開放閱讀框(480 bp),編碼159個氨基酸。編碼的蛋白質理論分子量為18.1 179 kD,等電點8.64,無信號肽及跨膜區,屬于親水性蛋白,具有泛素結合酶家族的活性位點,主要分布于細胞核;二級結構以無規則卷曲為主,β折疊較少。
[1] Pickart CM. Back to the future with ubiquitin review[J]. Cell, 2004, 116(2):181-191.
[2] Dikic I, Robertson M. Ubiquitin ligases and beyond[J]. BMC Biol, 2012(10):22.
[3] Nú?ez-Acu?a G, Aguilar-Espinoza A, Chávez-Mardones J, et al. Ubiquitin-conjugating enzyme E2-like gene associated to pathogen response in Concholepas concholepas:SNP identification and transcription expression[J]. Fish & Shellfish Immunology, 2012, 33(4):1065-1068.
[4] Haas TL, Emmerich CH, Gerlach B, et al. Recruitment of the linear ubiquitin chain assembly complex stabilizes the TNF-R1 signaling complex and is required for TNF-mediated gene induction[J]. Mol Cell, 2009, 36(5):831-844.
[5] Li YP, Lecker SH, Chen Y, et al. TNF-alpha increases ubiquitinconjugating activity in skeletal muscle by up-regulating UbcH2/ E220k[J]. Federation of American Societies for Experimental Biology Journal, 2003, 17(9):1048 -1057.
[6] Nagy V, Dikic I. Ubiquitin ligase complexes:from substrate selectivity to conjugational specificity[J]. Biol Chem, 2010, 391(2-3):163.
[7] 劉紅美, 張潔. 熱脅迫后家蠅幼蟲cDNA文庫構建與隨機EST測序分析[J]. 免疫學雜志, 2010, 26(9):772-775.
[8] 金偉軍, 姚祥春, 呂美巧, 等. 泛素-蛋白酶體系統的結構、作用和調控機制[J]. 科技通報, 2008, 24(1):29-34.
[9] 金豐良, 許小霞, 張文慶, 等.家蠅泛素編碼區cDNA序列的克隆及在原核細胞中的表達[J].昆蟲學報, 2008, 51(5):473-479.
[10] Khush RS, Cornwell WD, Uram JN, et al. A ubiquitin proteasome pathway represses the Drosophilaimmune deficient signaling cascade[J]. Curr Biol, 2002, 12(20):1728-17371.
[11] Boname JM, Lehner PJ. What has the study of the K3 and K5 viral ubiquitin E3 ligases taught us about ubiquitin-mediated receptor regulation?[J]. Viruses, 2011, 3:118-131.
[12] Lau OS, Deng XW. Effect of Arabidopsis COP10 ubiquitin E2 enhancement activity across E2 fa milies and functional conservation among its canonical homologs[J]. Biochem J, 2009, 418:683-690.
[13] 蔣春苗, 黃興奇, 付堅, 等. 疣粒野生稻泛素結合酶基因的全長cDNA 序列克隆與分析[J]. 作物學報, 2012, 38(5):808- 813.
(責任編輯 狄艷紅)
Bioinformatics Analysis of the Gene and Protein of Ubiquitinconjugated Enzyme from Musca domestic
Guo Guo Wu Qinyi Wu Jianwei Zhao Xuejun Fu Ping Zhang Yong
(Department of Parasitology,Guiyan Medical College,Guiyang 550004)
A cDNA sequence of Musca domestic ubiquitin-conjugated enzyme(MD-E2)was obtained by in EST technology. Some characters of the MD-E2 gene and encoded protein sequence were predicted and analyzed by bioinformatics methods in the following aspects, such as general physical and chemical properties, hydrophobicity, signal peptide, secondary structure and localization sites in cells. Results showed that the MD-E2 contains a complete ORF(480bp)encoding 159 amino acid with a predicted molecular weight about 18.117 9 kD and pI 8.64. The protein encoded by MD-E2 gene has no signal peptide, and no transmembrane domains, and it is a hydrophilic protein which is mainly located in cell nucleus. The secondary structures are mainly composed of random coil.
Musca domestic Ubiquitin-conjugated enzyme Bioinformatics
2013-07-19
國家自然科學基金項目(81160204),貴州省科技廳基金[黔科合(2010)3160],高校博士點學科專項科研基金(20105215120001)
國果,女,博士,副教授,研究方向:昆蟲分子免疫學;E-mail:guoguojsc@163.com