郝玉娟,賈克娟,郭玉琪(.許昌市中心醫院婦產科,河南46000;.河南省人民醫院婦產科,鄭州450003)
宮頸癌作為女性最常見的惡性腫瘤之一,近年來發病率不斷上升[1],由于宮頸癌的發病受到多方面的調控,其發病機制尚未明確,且尚未找到有效的治療手段,導致宮頸癌的高病死率。從分子水平研究宮頸癌的發病機制,能夠為宮頸癌的早期診斷提供有效的支持。朱明玥等[2]利用高通量芯片檢測與分析技術,篩選出部分在宮頸癌與正常宮頸中差異表達的基因,其中基因干擾素調節因子7(IRF7)的作用機制尚未明確。由于利用分子生物學試驗研究基因IRF7需要耗費較大的人力與物力,而生物信息學作為一門交叉學科,可以有效地對基因IRF7的相關功能進行預測,為進一步深入研究提供理論指導。因此,本文利用生物信息學手段分析基因IRF7,以期為宮頸癌的預防和治療奠定理論基礎。
1.1 材料 從GenBank數據庫中查詢到基因IRF7的核苷酸序列,編號為GI:98985818。
1.2 方法
1.2.1 基因IRF7及編碼蛋白質的基本理化性質分析利用ORFFinder(http://www.ncbi.nlm.nih.gov/projects/gorf/)查找開放閱讀框。使用ExPaSy提供的在線軟件ProtParam(http://web.expasy.org/protparam/)分析氨基酸的基本理化性質。
1.2.2 IRF7蛋白質的功能與結構分析 使用InterPro-Scan[3](http://www.ebi.ac.uk/interpro/scan.html)預測蛋白質功能域與結構域,使用Motif Scan(http://hits.isb-sib.ch/cgi-bin/motif_scan/)搜索已知功能基序,使用Net-Phos 2.0 Server(http://www.cbs.dtu.dk/services/NetPhos/)進行磷酸化位點分析,使用 PSORTⅡ server(http://www.genscript.com/psort.html)進行亞細胞定位預測,使用 TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)進行跨膜區預測。使用SignalP 4.1[4](http://www.cbs.dtu.dk/services/SignalP/)進行信號肽預測,物種選擇真核生物,其余使用默認參數。使用BLASTP搜索其他物種的相似蛋白質序列,使用MEGA6.0軟件構建系統進化樹,系統進化樹采用鄰接法(NJ),對構建的進化樹進行自檢(bootstrap),重復設為1 000。使用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)分析蛋白質的二級結構。使用 SWISS-MODEL(http://www.swissmodel.expasy.org)預測蛋白的三級結構。
2.1 基因IRF7及編碼蛋白質的基本理化性質分析 基因IRF7的GeneID為3 665,定位在11p15.5,含有9個外顯子,分別位于 1~632、633~843、844~902、903~1 128、1129~1215、1216~1296、1297~1686、1687~1805、1806~2 051,編碼 516個氨基酸的蛋白質(NP_004022),ORF 閱讀框長度為 1 551 bp(411~1 961 bp),使用 ExPaSy分析結果顯示,蛋白質相對分子質量為55.64×103,等電點為6.12,負電荷殘基總數為57個,正電荷殘基總數為52個,分子結構式為C2475H3832N700O727S19,不穩定系數為65.82,說明蛋白質不穩定。通常脂肪系數越大的蛋白質熱穩定性越高,該蛋白質脂肪系數為70.06,說明熱穩定性高。總平均親水性為-0.410,說明為親水蛋白。
2.2 IRF7蛋白質的功能與結構分析 InterProScan預測結果顯示,20~141aa為側翼螺旋-轉角-螺旋DNA結合域,288~514 aa為類SMAD結構域,Motif Scan分析結果表明存在多個cAMP、CK2、PKC磷酸化位點和N端豆蔻酰化位點。磷酸化位點分析結果顯示,以0.5為閾值,存在19個絲氨酸(Ser)磷酸化位點、9個蘇氨酸(Thr)磷酸化位點、4個酪氨酸(Tyr)磷酸化位點(圖 1)。將序列提交到PSORT中利用k-NN法進行預測,有43.5%的可能性位于核中,說明有可能位于細胞核中。跨膜區預測結果顯示不存在跨膜區(圖2),信號肽預測結果顯示不存在信號肽(圖3),親水性分析結果表明,其總親水性應為負值(圖4),為親水蛋白,與ExPaSy分析結果保持一致。使用BLASTP搜索其他物種的相似蛋白質序列,多序列比對及系統發生樹結果見圖5。蛋白質二級結構分析結果表明,α-螺旋為24.61%,延伸鏈為16.47%,β-轉角為5.62%,無規則卷曲為53.29%(圖6)。三級結構分析結果見圖7。

圖1 磷酸化位點分析

圖2 跨膜區預測結果

圖3 信號肽預測結果

圖4 親水性分析結果

圖5 多序列比對及系統發生樹分析結果

圖6 二級結構分析結果

圖7 三級結構分析結果
生物信息學作為一門生物學、計算機科學、數學等多學科交叉的學科,能夠利用軟件程序和公共數據庫信息為分子生物學提供一條新的研究途徑[5]。研究發現,IRF7在肝細胞感染病毒時其具有抵御病毒作用,很好地保護肝細胞[6]。劉路路[7]研究發現,腸道病毒通過3C蛋白酶切割IRF7并抑制IRF7介導的干擾素啟動子激活功能,從而逃逸宿主天然免疫。劉愛美[8]通過對尖銳濕疣體組織分別用免疫組織化學法在蛋白水平及應用實時熒光定量聚合酶鏈反應在基因水平上檢測IRF7的表達,發現IRF7能調節干擾素的表達,參與機體抗人乳頭狀瘤病毒(HPV)的局部免疫反應。而宮頸癌的發生發展也與人乳頭瘤病毒的感染密切相關,因此,推測IRF7在宮頸癌的發病過程中起著重要作用。本文從生物信息學角度對基因IRF7進行分析。IRF7蛋白質屬于親水蛋白,不含有信號肽,不屬于跨膜蛋白,亞細胞定位結果顯示可能位于核中。蛋白質翻譯后修飾對蛋白質的結構和功能起著關鍵作用,IRF7蛋白質有多個磷酸化位點,磷酸化和去磷酸化是細胞內信號傳導的重要方式,推測其應該與信號傳導有關;蛋白質通過磷酸化和去磷酸化而發生構象改變,導致其活性或性質的改變,從而調節細胞中各個生命活動過程[9],推測其是一個有功能的比較活躍的蛋白質,蛋白質二級結構預測顯示,無規則卷曲占有較大的比例。屈宜笑[10]通過對青魚的研究發現,青魚IRF7基因的cDNA全長為1 901 bp,磷酸化的IRF3和IRF7進入細胞核內誘導干擾素的分泌,從而誘發宿主天然免疫抗病毒反應。本文利用生物信息學手段分析了基因IRF7的染色體定位、蛋白質的基本理化性質、結構及功能,為深入研究基因IRF7對宮頸癌的作用機制奠定了理論基礎。
[1]BEKKERS RL,MASSUGER LF,BULTEN J,et al.Epidemiological and clinical aspects of human papillomavirus detection in the prevention of cervical cancer[J].Rev Med Virol,2004,14(2):95–105.
[2]朱明玥,隋霜,瑪依努爾·尼牙孜,等.新疆維吾爾族宮頸癌全基因組表達譜分析及與宮頸癌相關的信號通路的篩選[J].中國婦幼保健,2014,29(32):5233-5238.
[3]BENDTSEN JD,NIELSEN H,VON HEIJNE G,et al.Improved prediction of signal peptides:Signal P 3.0[J].J Mol Biol,2004,340(4):783-795.
[4]YAN Q.Bioinformatics databases and tools in virology research:an overview[J].In Silico Biol,2008,8(2):71-85.
[5]齊月,金清龍,溫曉玉,等.肝細胞中固有干擾素調節因子7的表達及其抗病毒作用[J].吉林大學學報(醫學版),2012,38(2):183-186.
[6]張紅梅.糖尿病新基因SLC30A8的生物信息學分析[J].中國老年學雜志,2010,30(16):2286-2289.
[7]劉路路.腸道病毒屬3C蛋白通過調控IRF7拮抗天然免疫的機制研究[D].北京:北京協和醫學院中國醫學科學院,北京協和醫學院,中國醫學科學院,清華大學醫學部,2016.
[8]劉愛美.TLR9-MyD88信號通路與尖銳濕疣相關性的研究[D].瀘州:西南醫科大學,2016.
[9]王泳,敬曉紅,孫麗巖,等.糖尿病相關基因KCNJ11的生物信息學分析[J].武警后勤學院學報(醫學版),2012,21(8):610-613.
[10]屈宜笑.青魚IRF3及IRF7基因的克隆及功能初探[D].長沙:湖南師范大學,2016.