曹 睿 潘薇薇 趙 邑 謝海軍
(山西省生物研究院有限公司 山西太原 030000)
Autotaxin(ATX)首次在人的黑色素瘤細胞系A2058 中被發現[1],是一種自分泌活性因子,是血液中重要的酶,具有磷酸二酯酶活性,能催化溶血磷酰膽堿LPC 生成溶血磷脂酸(LPA),進一步激活脂類相關的G 蛋白偶聯受體(LAPR),被歸為磷酸二酯酶家族(ENPP1-ENPP7)[2]。Autotaxin 在許多腫瘤中均有異常表達情況,例如在黑色素瘤、甲狀腺癌、乳腺癌、非小細胞肺癌、 肝癌、胰腺癌中均有異常增 高[3-8],由此 可見Autotaxin 在腫 瘤 的 發生和 發 展過程中有重要作用,被認為是腫瘤治療中一個可能的靶點。
Autotaxin 基因位于人類8 號染色體長臂2 區4 帶1 亞帶2 次亞帶 (8q24.12), 編碼29 個外顯子, 目前主流觀點認為該基因選擇性剪切產生3個蛋白亞型:ATX-α、ATX-β、ATX-γ, 也有科學家近期鑒定出其他的亞型:ATX-δ、ATX-ε[9]。 雖然這些亞型在結構上十分相似, 但具體的生理功能卻有很大差異。 ATX-β,畸形癌亞型,即血漿中的lysoPLD,最初是從畸形癌細胞系克隆的,是最短、 也是最主要的ATX 亞型;ATX-α, 黑素瘤亞型;ATX-γ,腦特異的亞型,主要在少突膠質細胞中表達[10]。本文重點比較ATX-α、ATX-β、ATX-γ這3 個蛋白亞型在序列、二級結構、結構域、理化性質、跨膜區域等方面的異同,為進一步挖掘其生物學意義提供理論基礎和研究思路。
1.1 序列來源 人Autotaxin 蛋白3 個亞型的fasta 數據來自NCBI 蛋白數據庫,ATX-α、ATXβ、ATX-γ全長分別為915aa、863aa、888aa,GI 號分別為91823274、91823602、195947389。
1.2 方法
1)蛋白亞型的序列比對及二級結構對比采用ESPript 3.0[11]。 ESPript 軟件能根據序列比對信息和蛋白質二級結構信息,將比對結果圖形化。軟件需要的序列比對結果為.aln 格式數據, 二級結構信息為.pdb 格式的數據。 其中.aln 格式的序列比對結果可通過Alignment By Muscle、ClustalX 等多種比對軟件得出,參考序列的PDB 文件可通過PDB 網 站(http://www.rcsb.org/pdb/home/home.do)進行下載, 也可通過對目標蛋白進行3D 結構的預測獲得。
2)結構域預測采用simple modular architecture research tool(SMART)[12]。 SMART 是蛋白結構預測和功能分析的工具集合。 可預測蛋白的一些二級結構,例如跨膜區(transmembrane segments)、復合螺旋區(coiled coil regions)、信號肽(signal peptides)、蛋白結構域(PFAM domains)等。 運行軟件可直接用各個數據庫蛋白的ID, 例如Uniprot/Ensembl ID/accession number(ACC)或直接使用蛋白質序列,本文使用的是蛋白序列。
3)理化性質分析采用ProtParam tool[13]。 Prot-Param 是一個可根據蛋白的Swiss-Prot/TrEMBL AC 編號、ID 號或序列進行理化性質分析的軟件(本文使用的是蛋白序列), 可分析的理化性質包括相對分子量、理論PI 值、原子組成、半衰期、不穩定系數等。
4)親疏水性分析采用ProtScale[13]。ProtScale 可根據蛋白的UniProtKB/Swiss-Prot 或UniProtKB/TrEMBL 的AC 編號、ID 號或序列進行疏水性區域的預測,本文使用蛋白序列直接進行預測。
5)跨膜結構預測采用TMHMM[14]。TMHMM 綜合了跨膜區疏水性、電荷偏倚、螺旋長度和膜蛋白拓撲學限制等性質, 采用隱馬氏模型(Hidden Markov Models),對跨膜區及膜內外區進行整體的預測。 TMHMM 是目前最好的進行跨膜區預測的軟件, 尤其在區分可溶性蛋白和膜蛋白時準確性高,是判定一個蛋白是否為膜蛋白的首選軟件,本文使用蛋白序列對3 個亞型的跨膜區域分別進行了預測。

表1 預測工具軟件簡介
2.1 序列比對及二級結構對比結果 在進行序列比對時,本文采用ClustalX 多重序列比對軟件,屬于Clustal 系列工具之一,另外一個ClustalW 工具是命令行形式的界面,適合數量較多的批量序列比對,而ClustalX 是圖形化界面,適用于習慣使用windows 操作系統的用戶。 ATX-α、ATX-β、ATX-γ 3 個亞型的序列比對使用ClustalX,以ATX-β 的二級結構作為參考,3 個亞型序列及二級結構比對結果如圖1 所示(本文附圖見封四)。
從圖1 顯示的分析結果看,ATX-α 與ATXβ、ATX-γ 相比,從第323 個堿基開始,有一段52個堿基的插入,其二級結構為η 折疊,這段插入可能與ATX-α 定位到細胞外基質有 關[10],從后續的結構域預測及疏水性分析看, 此插入片段可能造成了ATX-α 與其他2 個亞型在結構域上及疏水性上的差異;ATX-γ 與ATX-α、ATX-β 相比,從第593 個堿基開始,有一段25 個堿基的插入,其結構為α 螺旋,其生物學作用未知,從后續的分析看, 此插入片段沒有造成蛋白質結構域上的改變,但是從第590 個氨基酸開始,蛋白的疏水性與其他亞型產生了差異。
2.2 結構域預對比結果 利用SMART 及蛋白亞型序列文件, 預測出每個亞型的結構域類型及位置,比較結果如圖2 所示。
從圖2 比較結果看,ATX-α 與ATX-β、ATXγ 相比, 有一個300 bp 左右的Phosphodiest 結構域,而ATX-β、ATX-γ 是2 個較短的Phosphodiest結構域相連接, 造成這種差異的原因可能是因為ATX-α 在第323 處有一段52 個氨基酸的插入片段。 與此同時ATX-γ 第593 處開始的25 個氨基酸的插入片段則沒有造成蛋白質結構域上的改變。 Phosphodiest 結構域的生物學作用是使得蛋白具有磷酸二酯酶活性。
3 個蛋白亞型的共同點是: 均具有1 個跨膜區域、2 個SO 結構域及1 個NUC 結構域(圖3)。SO 結構域的生物學作用是使得蛋白具有類生長調節素B(Somatomedin B-like)的功能。 NUC 為非特異性內切酶作用區域。
2.3 理化性質對比結果 根據3 個亞型序列文件, 使用ProtParam 得出分子量、PI 值等理化性質結果,比較數據如表2。

表2 ATX 基因3 個蛋白亞型的理化性質分析結果
從表2 結果看,ATX-α、ATX-β 與ATX-γ 在原子組成、氨基酸數目、分子量等各種理化性質上均有差異, 尤其在具有重要生物學意義的PI 值、不穩定系數、 親水性上均具有較大差異。 總體上ATX-α 與ATX-β 及ATX-γ 的差異較大,ATXβ、ATX-γ 相對比較相似。
3 個蛋白亞型的相同之處主要表現在: 具有相同的半衰期;均具有較高的不穩定系數,均屬于不穩定的蛋白質,從數值的大小看,3 個蛋白亞型的不穩定性ATX-α>ATX-β>ATX-γ;均具有較高的脂肪系數,脂肪系數反應蛋白的熱穩定性,從數值大小看,ATX-β>ATX-γ>ATX-α。
2.4 親疏水性對比結果 根據序列信息, 使用ProtScale 軟件得到每個亞型每個位點的疏水性值,根據每個位點的疏水性值繪制比較結果圖4。
根據圖4 中不同顏色曲線的重疊程度看,藍色代表的ATX-α 與其他2 個亞型差別較大,而ATX-β 與ATX-γ 相似性較高, 這一點從3 個蛋白亞型的平均親水性分值也可以得到佐證, 分別是:-0.575,-0.495,-0.541。 從差異開始的位置看,ATX-α 與其他2 個亞型的差異從第320 個氨基酸開始,ATX-β 與ATX-γ 的差異從第590 個氨基酸開始, 這一點可以從3 個蛋白亞型序列差異上得到佐證:ATX-α 從第323 個氨基酸開始,有一段52 個氨基酸的插入;ATX-γ 從第593 個氨基酸開始,有一段25 個氨基酸的插入。
2.5 跨膜結構對比結果 TMHMM 軟件根據3個蛋白亞型的序列信息得出跨膜位置信息, 具體比較結果如表3。

表3 ATX 基因3 個蛋白亞型的跨膜區域結果
首先,3 個亞型都有跨膜區域,表明3 個蛋白都是跨膜蛋白;其次,從跨膜區域看,3 個蛋白亞型的跨膜位置沒有區別,高度一致,可以推測使得3 個蛋白亞型具有不同功能的區域主要是從3 個蛋白的第32 個氨基酸開始。
人類大約有2~3 萬個基因,但如今研究者已知的人類細胞中不同蛋白質的數量或許遠超于10 萬個。由相同基因編碼產生的不同蛋白亞型在組織和細胞中或許發揮完全不同的生物學功能,然而這些蛋白質亞基在結構上卻非常相似[15]。 通過關注細胞、組織或器官中的癌癥相關的蛋白質亞型,對于開發新型藥物提供了一定的思路。ATX 基因在腫瘤的發生和發展過程中有重要作用,本研究對于ATX基因3 個蛋白亞型的分析,對于深入理解該基因的生物學功能等多方面研究具有一定的幫助。
本研究從序列、二級結構、結構域、理化性質、親疏水性、跨膜結構方面分析了ATX 基因3 個蛋白亞型的異同。 上文已經從橫向各個角度詳細分析了3 個亞型的異同,縱觀各方面的差異,會發現這些異同是有緊密聯系的。例如,在序列上的差異直接導致二級結構、結構域、理化性質、親疏水性方面的差異。具體分析可以看到,ATX-α 從第323處開始的一個長度為52 個氨基酸的插入片段,直接造成從第320 個位置開始親疏水性發生改變,且可能導致2 個較短的Phosphodiest 結構域連接成一個較長的結構域。 ATX-γ 從第593 處開始的一個長度為25 個氨基酸的插入片段,直接造成從第590 個位置開始親疏水性發生改變, 但沒有引起結構域的變化。 與此同時,引起一個猜測,氨基酸序列上的變化是否導致蛋白質從變化位置前3位開始發生親疏水性改變,這一猜測有待驗證。