姚衛鋒,劉原君,李燕,齊蔓莉,田敬群,劉全忠
(天津醫科大學總醫院皮膚科,天津 300052)
沙眼衣原體(Chlamydial trachomatis,C.t)感染所引起的非淋菌性尿道炎(non-gonococcol Urethritis,NGU)在我國以及歐美國家已成為最常見的性傳播疾病(sexually transmitted infection,STI)之一[1],常遷延難愈,相關耐藥報道逐年增多,但迄今為止尚無理想的疫苗問世,已成為臨床治療的棘手問題。噬菌體(bacteriophage;phage)不僅是分子生物學研究的重要工具,作為抗菌劑治療細菌感染的潛能也日益受到重視。其中將噬菌體作為一項有效的治療手段用于一些重要的病原菌如金黃色葡萄球菌和綠膿桿菌等感染的研究已成為國際研究的新熱點。近年來在鸚鵡熱衣原體、肺炎衣原體和家畜衣原體中陸續發現了衣原體噬菌體,它們屬微病毒家族,具有20面對稱衣殼--由衣殼蛋白Vp1、Vp2和Vp3構成[2]。其中Vp1蛋白為分子量最大的蛋白分子,結構保守而特異,是在其它衣原體種——尤其是沙眼衣原體尋找衣原體噬菌體的良好標志物。雖然衣原體噬菌體研究揭示了這些噬菌體的基因、鏡下結構和分子特征,但對它的作用尚不清楚--這也是急待解決的問題。目前只有國外的幾個實驗室保有發現的衣原體噬菌體株,本文旨在通過生物信息學分析,預測Vp1蛋白的二級結構及其優勢表位,為之后的研究奠定基礎。
1.1 衣原體噬菌體Chp3Vp1氨基酸序列Genbank序列號為YP_022479.1。
1.2 GH蛋白二級結構預測應用DNAStar軟件提供的Protean模塊進行,采用Gamier-Robson方法、Chou-Fasman方法和Karplus-Schulz方法預測蛋白二級結構。B細胞表位預測以7個氨基酸殘基為一組,分別按 Kyte-Doolittle、Emini和 Jameson-Wolf方案預測其親水性、表位可能性和抗原性指數。
2.1 衣原體噬菌體Chp3Vp1蛋白序列
“MVRNRRLPSVMSHSFAQVPSARIQRSSFDRSCGLKTTFNAGY LIPIFCDEVLPGDTFSLKEAFLARMATPIFPLMDNLRLDTQYFF VPLRLIWSNFQKFCGEQDNPDDSTDFLTPVLTAPTGGFTEGSI HDYLGLPTKVAGVQCAAFWHRAYNLIWNQYYRDENIQESV EVQMGDTTTDEVKNYELLKRGKRYDYFTSCLPWPQKGPAV TIGVGGKAPIEGLYMNVNSNNPVGKFVLDSQSTPRVLQDLQG NKLSGIAAYNQTGKHVYVNSAWYTVTPQSEPGATLENGNYY TTQKPQIYADLGATSPVTINSLREAFQLQKLYERDARGGTRYI EIIRSHFNVQSPDARLQRAEYLGGSSTPVNISPIPQTSSTDSTSP QGNLAAYGTAIGSKRVFTKSFTEHGV ILGLASVRADLNYQQ GLDRMWSRRTRWDFYWPALSHLGEQAVLNKEIYCQGPSKNS GGEIVDEQVFGYQERFAEYRYKTSKITGKFRSNATSSLDSWH LAQ EFENLPTLSPEFIEENPPMDRVLAVSNEPHFLLDGWFSLR CARPMPVYSVPGFIDHF”。
序列含565個氨基酸,理論分子量為63.628ku,等電點為6.67。
2.2 蛋白二級結構預測 使用不同的預測分析方法,所預測的蛋白二級結構亦不完全相同,其所含有的α螺旋、β折疊和轉角的數目和存在位置表現出一定的差異。Chou-Fasman方案示:α螺旋、β折疊相間、同時其間有轉角結構(該結構與柔性區域重疊)的區段為N端42-95(2個α螺旋、3個β折疊),162-190(2個 α 螺旋、1個 β 折疊),291-356(3個 α螺旋、3個β折疊);358-417含2個β折疊,其間有轉角結構(該結構與柔性區域重疊);441-482含3個α螺旋,其間有轉角結構(該結構與柔性區域重疊)。Gamier-Robson方案示:全序列大間隔分布4個小片段α螺旋,小間隔密集分布β折疊—其間隔區有轉角結構(該結構與柔性區域重疊)。Karplus-Schulz方案預測蛋白的柔性區域,發現該蛋白的柔性區域大體呈散在性分布,于N端160-266區段密集小段分布,較大的柔性區為19-31,101-114,119-128,277-297,357-383,457-471(圖 1)。

圖1 不同方案預測Chp3Vp1二級結構結果
2.3 蛋白B細胞表位可能性預測結果 以Kyte-Doolittle及Hopp-Woods方案分析,蛋白親水性較高的 區 域 為 N 端 第 1-10,20-35,77-82,101-114,149-197,224-232,237-254,259-270,274-300,314-333,342-359,369-385,359-403,415-438,458-469,472-516,518-528 區段。Jameson-Wolf法預測抗原指數顯示,大多數的高抗原指數區域與預測的親水區重合。Emini方案預測氨基酸殘基位于蛋白質的表面可能性,顯示N端第1-10,103-110,156-168,177-197,289-300,320-332,426-436,475-489區段很可能位于蛋白質的表面,這些可能的表面區段都位于蛋白的親水區域。提示位于蛋白質表面的可能性區域都可能是B細胞表位優勢區域(圖2)。

圖2 Chp3Vp1蛋白的抗原表位預測
蛋白質結構預測,是指直接從氨基酸序列推斷某一蛋白質的功能位點或預測其三維結構,包括二級和三級結構預測,是目前分子生物學研究中迫切需要解決的問題,是最重要的課題之一[3]。蛋白質的二級結構是指肽鏈中局部肽段的構象,它們是完整肽鏈構象(三級結構)的結構單元,是蛋白質復雜的空間構象的基礎。各類二級結構的形成幾乎全是由于肽鏈骨架中羰基上的氧原子和亞胺基上的氫原子之間的氫鍵所維系。其他的作用力,例如范德華力等,對維系結構穩定也起一定作用[4]。最早的蛋白質二級結構是Pauling等于1951年提出的α-螺旋、β-折疊和轉角。α-螺旋、β-折疊的化學鍵能較高,結構規則穩定不易形變。轉角可看成是由幾個氨基酸構成的最小的反平行的β片層,最常見的是β轉角。由于轉角中含有相當比例的極性殘基,使得大多數β轉角存在于分子表面,為凸出結構,極少在分子的內部。為此,轉角及其附近比整個分子有更大的親水性,利于與抗體嵌合,而且糖基化以及磷酸化等轉譯后的加工通常發生在β轉角或其附近區域。還發現轉角這種二級結構在進化中保守性比氨基酸序列的保守性強,這提示β轉角對蛋白質的結構、功能和進化都有重要意義[5~7]。Garnier-Robson法和Chou-Fasman法都預測到蛋白的β-折疊比α-螺旋的數量多,可以認為蛋白的二級結構以β-折疊為主;并且預測到Vp1蛋白有頻繁出現的轉角和無規則卷曲區域,提示Vp1蛋白有較為復雜的空間結構,存在眾多的轉角區域可作為候選的B細胞抗原表位。
根據不同的參數,我們預測了蛋白潛在的B細胞抗原表位。二級結構對蛋白質的抗原表位有很大的影響。α-螺旋、β-折疊結構規則,依靠氫鍵維持,不易形變,很難找到與之相應的配體,常位于蛋白質內部,主要起穩定蛋白質分子結構的作用不易形成抗原表位;而轉角及無規則卷曲等二級結構則是比較松散的結構,易于發生扭曲且結構突出,多位于蛋白質分子表面,形成抗原表位的可能性較大,從而構成蛋白質的功能區域[8]。蛋白質分子的親水性也與其抗原表位構成有密切的聯系,在蛋白質分子中疏水性氨基酸殘基一般埋藏在蛋白質分子內部,而親水性氨基酸殘基位于蛋白質分子表面,在表面電荷和極性最大的親水性區域上通常形成蛋白質的抗原表位[9]。但由于親水性部位與抗原表位沒有高度一致的相關性,即高親水性部位不一定都是B細胞抗原表位,抗原表位也不一定都是高親水性部位。因此,針對蛋白質抗原表位中的氨基酸殘基出現頻率研究建立了蛋白質B細胞抗原表位的抗原指數分析方案。通常情況下,Leu/Thr/Pro/Asp/Asn/Glu/His/Lys/Arg等氨基酸殘基出現的頻率越高,其抗原指數就越大,能形成抗原表位的可能性也就越高。抗原指數分析結果表明有24個集中的抗原表位區域且指數值較高,在其中篩選活性較強并能表現其活力的區域還需要綜合分析其結構、親水性及柔韌性等因素。根據預測結果綜合分析,蛋白N端第1-10,101-112,159-166,174-184,189-195,288-299,323-333,419-435,477-490是B細胞的優勢表位。
本課題組已通過原核表達得到大量純化的Chp3Vp1蛋白,希望通過該重組蛋白用于臨床標本中篩查沙眼衣原體噬菌體并探討其對沙眼衣原體的作用。然而為了研究過程更有針對性,還必須深入研究其結構及相應的構效關系。生物信息學技術是通過對生物學實驗數據的獲取、加工、存儲、檢索與分析,達到揭示數據所蘊含生物學意義之目的[10]。重點主要體現在基因組學和蛋白組學兩方面,具體說就是從核酸和蛋白質序列出發,分析序列中蘊含的結構功能信息,是分子生物學研究的有力工具。我們應用相應分析工具分析了Vp1蛋白的序列信息,為進一步研究奠定基礎。
[1]Spiliopoulou A,Lakiotis V.Chlamydia trachomatis:time for screening[J].Clin Microbiol Infect,2005,11(9):687
[2]Cann AJ,Bove JM.Principles of molecular virology[J].Virus Struct,2005,26(3):217
[3]鄭婷婷,毛軍軍.Profile覆蓋算法在蛋白質二級結構預測中的應用[J].計算機技術與發展,2007,17(9):171
[4]Wallner B,Larsson P,Elofsson A.Pcons.net:protein structure prediction metaserver[J].Nucleic Acids Res,2007,35(Web Server issue):W369
[5]孟翔燕,孟軍,葛家麒,等.基于遺傳算法的蛋白質二級結構預測方法研究進展[J].農機化研究,2009,14(5):72
[6]馬棟萍,阮曉鋼.基于改進BP神經網絡預測蛋白質二級結構[J].北京聯合大學學報(自然科學版),2005,19(2):70
[7]張維東,朱宏明,何融,等.決策樹算法在蛋白質二級結構預測問題中的應用研究[J].微型電腦應用,2009,25(2):8
[8]賀東亮,崔曉東,李進,等.過敏蛋白TBb的免疫活性鑒定及其表位預測[J].免疫學雜志,2009,14(2):46
[9]岳麗琴,沈敘莊,張華生,等.B族鏈球菌C5a肽酶蛋白表位的克隆、表達和免疫學分析[J].中華微生物學和免疫學雜志,2006,26(12):311
[10]康白.迎接微生態學細胞通訊新時代的到來[J].中國微生態學雜志,2006,18(1):115