郭玉鳳 張 婷 張 超 薛振偉 孔曉娜 周小林
(中國輻射防護研究院,太原 030006)
肺癌是發病率和病死率都極高的惡性腫瘤,其中小細胞肺癌(small cell lung cancer,SCLC)約占15%~20%[1]。SCLC的特點是瘤體倍增時間短、預后差、分化程度最低、極易轉移,但其對放化療敏感[2],因此SCLC 的早期診斷和治療至關重要。前胃泌素釋放肽(pro-gastrin-releasing peptide,ProGRP)是SCLC的可靠、靈敏、特異性的腫瘤標志物,在血液中相對穩定,已被用于SCLC早期臨床診斷[2]。ProGRP 由信號肽(1~23)、胃泌素釋放肽(gastrinreleasing peptide,GRP)(24~50)、酶切位點(51~53)、恒定區(54~121)以及可變的羧基末端組成[3]。隨著基因工程抗體技術的發展,治療性抗體藥物逐漸占據全球市場,用于對惡性腫瘤和自身免疫病等疾病的診斷和治療[4-5]。抗ProGRP 單克隆抗體及基因工程抗體的研制是SCLC 診治方向之一。本研究應用不同生物信息學方法分析了ProGRP 蛋白理化性質,結構以及抗原決定簇,為抗ProGRP 單克隆抗體的鑒定及SCLC診治奠定基礎。
1.1 資料 通過NCBI 網站獲取ProGRP 蛋白的氨基酸序列。
1.2 方法
1.2.1 ProGRP 序列比對及理化性質分析 通過EBI 提供的在線Clustalw 工具(http://www.ebi.ac.uk/clustalw/)對ProGRP 氨基酸序列進行比對,Blast分析序列相似性。通過在線工具Expasy Protparam(https://web.expasy.org/protparam/)預測ProGRP的理化性質。
1.2.2 ProGRP跨膜區分析 通過在線軟件TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)分析ProGRP的跨膜區。
1.2.3 ProGRP 二級結構及三級結構分析 通過DNAstar Protean 軟件中的Garnier-Robson 和Chou-Fasman 方法綜合分析ProGRP 二級結構。其中Garnier-Robson 是基于氨基酸序列預測蛋白質二級結構,Chou-Fasman 是基于氨基酸序列的晶體結構來預測蛋白質二級結構。將ProGRP蛋白的氨基酸序列分別提交至Swiss Model(https://www.swissmodel.expasy.org/)在線工具,通過同源建模的方法模擬蛋白三級結構。
1.2.4 ProGRP 抗原決定簇預測 應用DNAstar Protean 軟件中的Kyte-Doolittle 和Hopp-Woods 方法綜合分析ProGRP 親水性與疏水性;用Emini 方法分析蛋白表面可及性;用Karplus-Schulz方法分析蛋白的柔韌性;用Jameson-Wolf 分析序列的抗原指數。應用在線工具BepiPred-2.0(http://tools.iedb.org/bcell/)和ABCpred(http://webs.iiitd.edu.in/raghava/abcpred/)預測ProGRP潛在的抗原決定簇。
2.1 ProGRP同型異構體氨基酸序列比對 ProGRP具有3個同型異構體,NP編號分別為NP_002082.2,NP_001012530.1,NP_001012531.1。ProGRP 同 型異構體序列比對(圖1)結果顯示,3 個亞型的第1~121位的氨基酸序列完全一致,NP_002082.2與NP_001012530.1 和NP_001012531.1 的相似性分別為95.27%和99.18%。

圖1 ProGRP同型異構體氨基酸序列比對及分子結構示意圖Fig.1 ProGRP isoform amino acid sequence alignment and molecular structure diagram
2.2 ProGRP 的理化性質分析 通過Protparam 分析ProGRP 3個亞型的理化性質,結果如表1所示。

表1 ProGRP不同亞型的理化性質預測結果Tab.1 Prediction results of physical and chemical properties of ProGRP different subtypes
2.3 ProGRP的跨膜區預測 TMHMM分析ProGRP跨膜區結果表明,ProGRP 無跨膜螺旋區,整個氨基酸序列皆在細胞膜外(圖2)。

圖2 ProGRP跨膜區預測結果Fig.2 Prediction results of transmembrane area in ProGRP
2.4 ProGRP 二級結構及三級結構分析 分析ProGRP 同型異構體氨基酸序列的相同區域,即ProGRP(1~121),發現α 螺旋主要位于第1~18、42~50、61~92、119~121 位氨基酸殘基;β 折疊主要形成在第23~26、31~37、43~46 位氨基酸殘基;β 轉角主要位 于 第1~4、18~22、27~30、38~41、51~52、54~61、63~66、93~96、98~111、114~118位氨基酸殘基;無規則卷曲位于第30~31、42~43、53~60、97~100、103~104、107~109、111~113位氨基酸殘基(圖3A)。

圖3 ProGRP二級結構預測及同源建模Fig.3 Secondary structure prediction and homology modeling of ProGRP
通過Swiss Model 同源建模法對ProGRP 三級結構進行預測,選擇方法為X-ray,2.80?,模板為3kxy.2.C,模板序列與目的蛋白序列相似度為36%,從第45 位丙氨酸(Ala,A)到第105 位甘氨酸(Gly,G),共模擬出61個氨基酸(圖3B)。
2.5 抗原決定簇預測
2.5.1 用DNAstar Protean 軟件預測ProGRP抗原決定簇相關性質 分析ProGRP(54~121)親水性與疏水性、表面可及性、蛋白柔韌性以及抗原指數(圖4),ProGRP(54~121)親水性區域分布廣泛,主要位于第54~82 和89~121 位氨基酸殘基;ProGRP(54~121)呈現的表面可及性大于1 的區域在54~57、64~76、78~81、90~102 和106~121 區域;ProGRP(54~121)柔韌性區域存在于第58~72 和90~118 位氨基酸殘基;抗原指數較高區域位于第54~73、75~82和88~121位氨基酸。

圖4 ProGRP(54~121)的DNAstar Protean預測結果Fig.4 DNAstar Protean prediction results of ProGRP(54~121)
2.5.2 通過BepiPred-2.0 在線預測ProGRP(54~121)抗原結合區域應用BepiPred-2.0 預測ProGRP(54~121)抗原結合區域,設置閾值為0.5,結果顯示ProGRP(54~121)具有兩個可能的抗原結合區域,分別為第58~76 位氨基酸殘基和第89~118 位氨基酸殘基(圖5)。

圖5 ProGRP(54~121)的BepiPred-2.0在線預測結果Fig.5 BepiPred-2.0 prediction results of ProGRP(54~121)
2.5.3 通過ABCpred 在線預測ProGRP(54~121)抗原決定簇 通過ABCpred 預測ProGRP(54~121)抗原決定簇,采用遞歸神經網絡計算方法,設置閾值為0.51。結果如表2所示,共有5個肽段可作為抗原決定簇。

表2 ProGRP(54~121)的ABCpred抗原決定簇預測結果Tab.2 ProGRP(54~121)epitope prediction results by ABCpred
蛋白質是否為親水性蛋白主要取決于蛋白表面的電荷量[6]。ProGRP 具有3 個同型異構體,其親水性平均值為負數,說明該蛋白為親水性蛋白。不穩定指數大于40 表明蛋白可能不穩定[7]。ProGRP穩定性指數明顯大于40,說明該蛋白不穩定。脂肪族指數為脂肪族側鏈(丙氨酸、纈氨酸、異亮氨酸和亮氨酸)占據的相對體積,被認為是增加球蛋白熱穩定性的積極因素[7]。ProGRP 同型異構體脂肪族指數分別為75.14、73.33和87.61,可在一定程度上增加蛋白穩定性。ProGRP 半衰期長達30 h,作為免疫抗原,其可在宿主體內穩定存在較長時間。ProGRP 具有N-端信號肽,有信號肽的蛋白大多被分泌到膜外發揮作用;在線軟件TMHMM 預測結果表明,ProGRP無跨膜區,其氨基酸殘基全部在膜外,說明ProGRP分泌后被運輸到膜外。
ProGRP 含有α 螺旋、β 折疊、β 轉角和無規則卷曲多種二級結構。其中α 螺旋、β 折疊結構規則、形態固定、一般位于蛋白質內部,難以與抗體嵌合;而β 轉角和無規則卷曲多處于蛋白質表面,結構突出,有利于與抗體嵌合,成為抗原表位的可能性大[8]。通過對ProGRP 二級結構的預測以及Swiss Model 同源建模發現,ProGRP 序列中第51~66 位氨基酸以及第93~118 位氨基酸區域主要為β 轉角和無規則卷曲,可能分布有較好的抗原決定簇。天然蛋白質的抗原決定簇一般為6~12 個氨基酸殘基。此外應滿足以下條件:形成β 轉角和無規則卷曲的片段、高親水性、高的表面可及性,避免出現4個以上連續相鄰的疏水氨基酸殘基,且疏水性殘基數不能超過6個[9]。
DNAstar Protean 分析了蛋白的二級結構、親水性、表面可及性、蛋白柔韌性以及抗原指數等多個參數,綜合各項參數篩選出ProGRP 的以下幾段抗原結合位點:第58~73、75~82、90~102 和106~118 位氨基酸殘基。該軟件是在氨基酸一級結構的基礎上預測抗原結合位點,但它忽略了各氨基酸之間的分子作用力,因此對構象依賴抗原表位的預測有一定局限性。BepiPred-2.0 在線工具預測出兩個可能的抗原結合區域:第58~76 和89~118 位氨基酸殘基,該方法基于Random Forest 算法對根據晶體結構確定的表位和非表位氨基酸進行預測,這種方法的性能優于其他基于序列的表位預測工具[10]。ABCpred基于人工神經網絡預測抗原表位,是應用比較廣泛并具有較高準確率的預測方法[11],通過分析預測出以下抗原決定簇:第55~70、74~89、84~99、92~107以及102~117位氨基酸殘基。依據天然蛋白質抗原決定簇的性質,綜合DNAstar Protean,BepiPred-2.0和ABCpred 預測結果,從ProGRP(54~121)肽段中篩選重復性較高的區域,預測出以下5 個抗原決定簇:第58~64、65~74、76~83、91~102、105~118位氨基酸。
1994年MIYAKE等[12]研究發現血清ProGRP(54~121)的測定在SCLC 患者診斷和治療中起著重要作用。1996 年TAKADA 等[13]通過實驗研究發現ProGRP(54~121)作為SCLC 特異性腫瘤標志物的靈敏度比神經元特異性烯醇化酶(NSE)更高。目前,國內外已研制出幾種ProGRP 檢測試劑盒,其中Perkin Elmer推出的時間分辨免疫熒光分析法(TR-IFMA),Roche推出的Elecsys電化學發光法以及蘇州長光華醫推出的吖啶酯標記化學發光ProGRP 定量檢測試劑使用的單抗皆與ProGRP(54~121)肽段中第71~75 位和第80~84 位氨基酸殘基結合[3,14];Abbot 推出的ARCHITECT 化學發光試劑應用的抗體可以結合第94~98 位和第107~111 位氨基酸殘基[15],這些肽段皆與本研究預測的抗原決定簇有一定重復。中國輻射防護研究院以ProGRP(54~121)為抗原研制出了不同ProGRP 單克隆抗體細胞株,并且通過實驗研究發現,其中E12 細胞株表達的單抗與ProGRP(54~121)肽段中第91~105 位氨基酸殘基結合[16-17]。本研究綜合不同生物信息學方法篩選出ProGRP 的多個抗原決定簇,后期可通過ELISA 鑒定單克隆抗體的抗原結合位點以驗證本研究結果,為應用抗ProGRP 抗體進行SCLC診療奠定良好的基礎。