曹 睿 趙 邑 潘薇薇 曹鵬程 梁雅麗 謝海軍
(山西省生物研究所 山西太原 030000)
Autotaxin(ATX)蛋白1992年首次在人的黑色素瘤細胞系A2058中發現[1],是一種自分泌活性因子,是分子量為126-kDa的糖蛋白。能夠以溶血磷脂酰膽堿(1ysophosphatidyIcholine,LPC)為底物催化生成溶血磷脂酸(1ysophosphatidic acid,LPA),表現出磷酸二酯酶活性,被歸為磷酸二酯酶家族(ENPP2 家族)[2]。除了磷酸二酯酶活性外,Autotaxin蛋白還同時具有焦磷酸酶和 ATP酶活性[3]。Autotaxin在腫瘤細胞中對腫瘤的發生和發展,特別是腫瘤的遷移起著重要作用,其抑制劑的開發并被認為可能為治療腫瘤提供方法[4]。在Autotaxin蛋白的催化結構域中一些氨基酸的糖基化至關重要,已有研究表明Asn524的糖基化對于Autotaxin蛋白發揮活性是必需的。例如:在脂肪細胞中,Asn53和Asn410的N端糖基化對于Autotaxin的分泌和活性很重要[4-5]。因此研究Autotaxin蛋白的磷酸化、糖基化等催化位點非常重要,可以采取生物信息學手段完成預測工作,為進一步挖掘其生物學意義提供理論基礎和研究思路。
1.1 材料 人Autotaxin蛋白fasta格式數據來自NCBI蛋白數據庫,全長 915 aa,GenBank號為:AAA64785.1。
1.2 方法 Autotaxin蛋白的磷酸化位點分析分別利用軟件 DISPHOS 1.3[6]、PhosphoSitePlus[7]、KinasePhos[8]、Scansite[9]、NetPhosk[10]、Musite[11]進 行預測,這些軟件是現今比較常用的磷酸化位點預測軟件。
Autotaxin(ATX)蛋白的糖基化位點(N-型、O-型)分別用 NetNGlyc1.0[12]、Uniprot數據庫、NetOGlyc4.0[13]、YinOYang[14]1.2 軟件進行預測。 各數據庫軟件參數如無特別說明均取默認值(表1)。

表1 預測工具軟件簡介
2.1 磷酸化位點分析結果 6款軟件預測的所有磷酸化位點中,有4款軟件同時預測到的位點有 2個,分別是:S-330,T-328;有 3款軟件同時預測到的位點有3個,分別是:S-860,S-861,T-333;有2款軟件同時預測到的位點有12個,分別是:S-58,S-302,S-308,S-326,S-327,S-729,S-741,S-865,T-210,T-288,T-83,T-368(表 2)。
6款預測軟件中,DISPHOS 1.3預測的全部結果均與其他軟件預測結果重合,其次,預測重復率較 高 的 軟 件 有 :Scansite、Musite、PhosphoSitePlus。預測結果最多的為NetPhosk,KinasePhos預測結果中重復預測率較低。NetPhosk是這6款軟件中預測位點最多的,共有Ser修飾位點26個,Thr修飾位點13個,Tyr修飾位點10個。Musite軟件預測的位點最少,Ser修飾位點 3個,Thr修飾位點 1個,Tyr修飾位點1個。

表2 Autotaxin蛋白磷酸化位點預測
通過對預測結果分析可知,絲氨酸(Ser)修飾位點較多,被重復預測到的有11個位點;其次是蘇氨酸(Thr)、酪氨酸(Tyr),被重復預測到的位點均為3個。此外,Scansite還預測到脯氨酸(Pro354、Pro735)及亮氨酸(Leu498)修飾位點。
2.2 糖基化位點分析結果 N型糖基化位點的預測通過Uniprot數據庫查詢及NetNGlyc1.0軟件預測,重復被預測到的位點為N-54。
O型糖基化位點的預測通過NetOGlyc4.0、YinOYang1.2軟件進行,重復被預測到的位點為O-695、O-696、O-712。
蛋白質翻譯后修飾對細胞的調控機制起重要作用,它能影響蛋白的多種屬性,包括蛋白質折疊、活性及最終功能[15]。蛋白質的磷酸化和糖基化的過程為:蛋白質在蛋白激酶催化下將磷酸集團由ATP轉移到目標蛋白質上,將低聚糖轉移到蛋白質骨架上,主要的生物學功能有:信號轉導、酶活性調節、新陳代謝、蛋白質穩定性與溶解度,抗原性、蛋白質靶標、細胞-細胞相互作用等[16]。真核生物磷酸化位點一般有絲氨酸,蘇氨酸,酪氨酸。其中,絲氨酸和蘇氨酸是最常見的磷酸化位點[17],因為其結構末端含有羥基,羥基很活潑,可以與磷酸基團結合。所以說,蛋白質中如果某個絲氨酸很保守的話,很大程度上就是磷酸化位點。
本研究利用生物信息學軟件對Autotaxin蛋白進行磷酸化和糖基化位點預測。大部分生物信息學軟件的設計思路是基于已有數據的匯集,結合數學模型的設計和計算機技術的集成開發而成。已有實驗或文獻數據的提供可使預測結果具有可靠性高、可重復性強、可驗證性高的優勢,缺點是較少提供新的數據集,科學合理的數學模型和訓練集可彌補此缺陷。
本研究磷酸化位點預測中使用到的軟件,大部分利用的是隱馬爾科夫模型(DISPHOS 1.3、KinasePhos)[18-19],NetPhosk 則采用人工神經網絡算法[20],Musite采用機器學習方法。從軟件本身預測結果及被其他軟件重復預測到的比例看,預測準確 率 排 序 為 :DISPHOS 1.3、Scansite、Musite、Net-Phosk、PhosphoSitePlus、KinasePhos。 從重復被預測到的結果看,12個位點中有 5個位點(Y-83、T-210、T-288、S-302、S-308)是文獻中有明確報道為磷酸化位點的。不同的數學模型、算法對于預測結果的影響是較為顯著的。因此,在初步篩選數據集階段,應該嘗試多軟件、換參數等方式,達到數據集盡可能精確、可驗證的目的。為實驗驗證提供重要的依據和基礎。
識別蛋白質修飾的傳統方法中質譜、磷酸鹽標記等實驗手段能檢測的修飾活性位點十分有限,費時費財,產出較慢。本項目采用高效、可靠的生物信息學手段,對Autotaxin蛋白質修飾活性位點預測,為其抑制劑的開發提供潛在靶點。