古麗巴哈爾·卡吾力,馬建寶,卡麗比努爾·艾爾肯,徐志偉,高曉黎
(新疆醫科大學藥學院,烏魯木齊 830000)
肺癌是全球最常見、死亡率最高的惡性腫瘤,據國家癌癥中心統計,肺癌在我國所有腫瘤中發病率和死亡率均居首位,每年約有82.8 萬人發病、65.7 萬人死亡,且呈持續增長趨勢,肺癌防治已成為惡性腫瘤防控中面臨的重點難點[1-3]。目前非小細胞性肺癌(NSCLC)的治療手段包括手術、放療、化療、輔助化療、靶向治療、免疫治療和姑息治療,但因大多數患者在確診時已是IIIB/IV 期,錯過了最佳治療機會,治療效果及患者生活質量均較差,5 年總生存率仍低于20%[4]。探究NSCLC 的進展機制、發現潛在干預靶點和開發新藥或新療法對提高患者生存率和改善預后已迫在眉睫[4-5]。
癌癥生物療法通過啟動宿主的防御機制和使用生物制劑來刺激機體的抗腫瘤生物反應,已在臨床試驗研究中進行研究,并在臨床上應用,其中抗癌多肽類藥物由于其生物相容性好、高效安全、更具耐受性和兼具生物免疫調節劑功能,在抗腫瘤治療中展現出巨大潛力[6-8]。本研究組在前期工作中一直關注乳源性生物活性肽的分離純化及其活性研究,并發現了具有抗氧化和抗肺癌細胞增殖并誘導其凋亡的鮮馬乳源性生物活性肽(VAPFPQPVVPYPQR,相對分子質量為1 594.88 u,純度≥95%)[9],但其抗肺癌的具體作用機制尚不清楚。因此本研究對馬乳源性生物活性肽在NSCLC 治療中的作用及機制進行探索,以期為開發新抗癌多肽藥物提供理論依據和實驗證據,對改善肺癌患者治療效果和提高生存率具有重要的潛在意義。
用https://web.expasy.org 網站ProtParam 工具分析理化性質,用http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=npsa_sopma.html 軟件中的SOPMA 工具對其二級結構預測, 用https://services.healthtech.dtu.dk/service.php? 網站中的Signal5.0 對其進行信號肽預測,用https://services.healthtech.dtu.dk/service.php? 網站中的TMHMM-2.0 軟件對其跨膜區進行預測,用http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/#網站WoLF PSORT軟件進行亞細胞定位[10-14],用https://services.healthtech.dtu.dk/service.php? 網站中NetPhos-3.1 軟件對其進行磷酸化分析,用軟件https://services.healthtech.dtu.dk/service.php?網站NetOGlyc-4.0 對其進行糖基化位點預測,用http://web.expasy.org/protscale/網站的ProtScale 工具分析疏水性,用ToxinPred http: // www. imtech. res. in/ raghava / toxinpred / AlgPred 預測其毒性[15-16]。
通過OMIM 數據庫(https://omim.org/)獲取肺癌疾病相關靶點,并對獲取的靶點進行整理去重,進一步使用Metascape 數據庫(https://metascape.org/gp/index.htm)對疾病靶點進行GO 功能富集分析和KEGG通路富集分析,并從中篩選出與肺癌關聯度較高的通路蛋白[17-18]。
使用PDB 蛋白數據庫(https://www.rcsb.org/)搜索靶蛋白,下載PDB 格式的2D 結構文件。使用PubChem 數據庫(https://pubchem.ncbi.nlm.nih.gov)搜索氨基酸,下載sdf 格式的2D 結構文件[19]。通過ChemDraw 20.0 軟件將氨基酸活性肽段連接成多肽序列并使用Chem3D 20.0 軟件獲得多肽的3D 結構文件,選擇最低能量構象并保存為mol 格式文件。
采用AutoDock 1.5.6 軟件包對靶蛋白及多肽進行加氫、計算電荷、調整電荷等操作,前處理后保存相關格式文件,使用AutoDock vina 進行分子對接,算法中所有參數均為默認值,每組對接選取結合能最小的結果,使用Pymol 軟件繪制分子對接結果圖[20-23]。
2.1.1 馬乳源活性肽的理化性質
馬乳源性活性肽(VAPFPQPVVPYPQR)的分子式為C77H115N19O18,原子數229,有14 個氨基酸殘基,由7 種基本氨基酸組成,其中占比較高的谷氨酸被人體吸收后,易與血氨形成谷氨酰氨,能解除代謝過程中氨的毒害作用,因而能預防和治療肝昏迷,保護肝臟,是肝臟疾病患者的輔助藥物。另一種占比較高的纈氨酸具有氧化供能、促進蛋白合成、抑制蛋白降解、促進糖異生等生理功能,在生物應用中發揮重要作用,當纈氨酸不足時,中樞神經系統功能會發生紊亂,共濟失調、四肢震顫,由于多肽包含關鍵氨基酸,為其今后的研究提供依據。
馬乳源性多肽分子質量較小,大約為1 594.88 u,免疫原性較低,氨基酸組成結果如表1 所示。馬乳源性多肽等電點為8.72,帶負電的殘基(Asp+Glu)數為0個,帶正電荷的殘基(Arg+Lys)數為1 個,在280 nm 處可測其吸光值。其半衰期在哺乳動物細胞(體外)中為100 h,在酵母(體內)中>20 h,在大腸桿菌(體內)中>10 h ,不穩定指數為128.16,脂溶性指數(aliphatic index)為69.29,親水性總平均值(GRAVY)值為-0.257,馬乳源性生物活性肽為帶正電荷的弱堿性小分子肽,且為不穩定的親水性蛋白多肽,這些性質在考察多肽溶解行為、分離純化、靶向給藥提供有力的數據支撐。除此之外,帶正電荷的多肽有利于與帶負電荷的細菌細胞膜通過靜電作用結合在一起,從而產生一定的生物活性。

表1 馬乳源性活性肽氨基酸組成
2.1.2 馬乳源性活性肽二級結構
二級結構在發揮多肽生物活性中起關鍵作用,LV Y 等[24]對豬源抗菌肽PMAP - 36 的結構、抗菌活性及作用機理進行了研究,結果表明PMAP -3 的α-螺旋區為與細菌細胞膜相互作用的區域。研究通過軟件分析 (檢測參數:Window width 為17,Similarity threshold 8,Number of states 為4),馬乳源性活性肽二級結構均為無規則卷曲(14 個氨基酸殘基全部參與),如圖1 所示,使用RPBS Webpo ratl(mobyle.rpbs.univ-paris-diderot.fr/cgi-bin/portal)網站工具與Chem Draw 20.0 軟件預測及繪制的馬乳源性活性肽的3D結構圖,如圖2 所示。

圖1 馬乳源性活性肽二級結構預測

圖2 馬乳源性活性肽3D 結構預測
2.1.3 馬乳源性活性肽跨膜區預測
亞細胞定位即某種蛋白或某個基因表達產物在細胞內的存在部位,有助于蛋白質功能的初步判斷。通過軟件分析發現,馬乳源性活性沒有跨膜區,均在細胞外,因此推斷馬乳源性活性肽可能在細胞外發揮生物學活性,結果如圖3 所示。

圖3 馬乳源性活性肽跨膜區預測
2.1.4 馬乳源性活性肽信號肽預測
信號肽是分泌蛋白上的一段富含疏水性氨基酸的肽段,用于指導蛋白質的跨膜運輸。經過軟件分析,馬乳源性活性肽沒有信號肽,進一步說明這個氨基酸殘基并不是分泌蛋白產生的,它是由游離的核糖體合成,進入胞質溶膠的蛋白質,參與線粒體、細胞核、過氧化物酶體等的化學反應,結果如圖4 所示。

圖4 馬乳源性活性肽信號肽預測結果
2.1.5 馬乳源性活性肽的糖基化和磷酸化位點預測
蛋白質糖基化對其功能具有重要影響, 不僅影響蛋白質的空間構象、活性、運輸和定位,而且在信號轉導、分子識別、免疫等過程中發揮重要作用。經軟件分析,馬乳源性活性肽糖基化位點低于0.5,推測其不存在糖基化位點。
蛋白質磷酸化是生物界最普遍、研究最為深入的一種蛋白翻譯后修飾, 在生物的整個生命活動中發揮著重要的調節作用,通過軟件分析,馬乳源性活性肽沒有磷酸化位點,無法被多種激酶磷酸化。
2.1.6 馬乳源性活性肽毒性和活性預測
相比于小分子藥物,多肽主要通過水解和腎過濾來清除,水解的產物為氨基酸,因此多肽藥物的代謝產物毒性很低;其次多肽類藥物往往以內源性多肽為模板進行特異性設計,通常具有較高的靶標親和力。雖然馬乳源性多肽是外源性多肽,但是經過軟件分析,馬乳源性活性肽無毒性,將氨基酸序列輸入BIOPEP數據庫(https://biochemia.uwm. edu.pl/biopep-uwm/)搜索是否有相匹配的已知功能肽段,結果并未搜索到相匹配的肽段,毒性預測結果如圖5 所示。

圖5 馬乳源性活性肽毒性預測
前期研究發現,馬乳源性活性肽可抑制肺癌A549細胞增殖,使其在G1 期阻滯和增加細胞凋亡,但其具體機制尚不得知。基于上述,本文為了篩選馬乳源性活性肽的抗肺癌潛在靶蛋白,進行了通路富集分析,并篩選出與肺癌高度關聯的通路中的可能靶蛋白,進行了分子對接,為其進一步研究生物學功能提供了理論基礎。
2.2.1 肺癌靶點的GO、KEGG 富集分析
通過對OMIM 數據庫獲取肺癌疾病相關靶點進行整理去重,得到515 個靶點蛋白,利用Metascape 數據庫就行肺癌靶點的GO、KEGG 富集分析,肺癌靶點GO 生物過程(BP) 主要包括DNA 代謝過程(DNA metabolic process)、細胞增殖的負調控(negative regulation of cell population proliferation)、細胞周期相變的調節(regulation of cell cycle phase transition)等,GO 細胞成分(CC) 則包括錯配修復復合體(mismatch repair complex)、染色體區(chromosomal region)、等離子膜筏(plasma membrane raft)等;而GO 分子功能(MF) 包含ATP 依賴性DNA 損傷傳感器活性(ATP-dependent DNA damage sensor activity)、蛋白激酶活性(protein kinase activity)、跨膜受體蛋白激酶活性(transmembrane receptor protein kinase activity)等;KEGG 通路富集分析結果顯示,關鍵通路富集為癌癥的途徑(Pathways in cancer)、DNA 修復疾病(Diseases of DNA repair)、綜合癌癥途徑(Integrated cancer pathway)、細胞增殖的負調控(negative regulation of cell population proliferation)、細胞周期相變的調節(regulation of cell cycle phase transition)等,表明以上過程、通路等是肺癌治療的關鍵,結果如圖6~7 所示。

圖6 肺癌靶點的GO 富集分析

圖7 肺癌靶點的KEGG 富集分析
2.2.2 靶蛋白篩選結果
通過富集結果,進一步篩選出與肺癌關聯度高的通路如肺上皮發育(lung epithelium developmen)、肺葉發育(lung lobe development)、肺葉形態發生(lung lobe morphogenesis)、肺泡發育(lung alveolus development)等通路的靶點蛋白,并篩選出在這些通路中出現頻率大于5 次的靶點蛋白,分別為鈣黏蛋白相關蛋白(cadherinassociated protein beta 1,CTNNB1)、成纖維細胞生長因子受體2(broblast growth factor receptor 2,FGFR2)、叉頭盒轉錄基因F1 (forkhead box-F1,FOXF1)、鼠肉瘤基因(Kirsten rat sarcoma viral oncogene,KRAS) 、甲狀腺轉錄因子-1 (NK2 homeobox 1,NKX2-1)、轉化生長因子Ⅱ型受體(ecombinant Transforming Growth Factor Beta Receptor II ,TGFBR2)等作為對接靶蛋白。
2.2.3 馬乳源活性肽與靶蛋白對接結果
如表2 所示,馬乳源活性肽與6 種靶點蛋白進行分子對接后,結合能均小于-20 kJ/mol,表明此肽段與CTNNB1、FGFR2 、FOXF1 、KRAS、NKX2、TGFBR2等蛋白均能進行有效的結合,通過Pymol 軟件構建馬乳源活性肽與各靶點蛋白的3D 結合模型如圖9~14所示,馬乳源活性肽與CTNNB1 蛋白的(ARG-185、HIS-219、HIS-223、LYS-292)、FGFR2 蛋白的(PRO-486、ACP-300、ARG-579、GLU-604、GLU-574、LEU-753、ILE-548、MET-540)、FOXF1 蛋白的(SER-273、SER-275、SER-72、TYR-75、GLN-90、LYS-93、ARG-97)、KRAS 蛋白的(THR-74、GLN-70、ALA-59、MET-67、GLU-63、ARG-688、ASP-762、ASN-760、VAL-691、ASN-697、MET-698)、NKX2 蛋白的(LYS-163、ARG-165、TRP-371、TYR-367、ASN-211、TRP-208)、TGFBR2 蛋白的(GLU-59、ASP-80、CYS-78、HIS-86、ASP-87、GLU-108、ASN-68、ARG-66)等位點的氨基酸殘基形成氫鍵,從而與各靶點蛋白間產生有效且強的結合力,可能是馬乳源性活性肽抗肺癌的關鍵靶點。這也表明馬乳源活性肽對肺癌的治療中能起到一定的作用,是具有抗肺癌作用的活性成分。

圖9 馬乳源活性肽與靶蛋白CTNNB1 的結合位點

圖10 馬乳源活性肽與靶蛋白FGFR2 的結合位點

圖11 馬乳源活性肽與靶蛋白FOXF1 的結合位點

圖12 馬乳源活性肽與靶蛋白KRAS 的結合位點

圖13 馬乳源活性肽與靶蛋白NKX2 的結合位點

圖14 馬乳源活性肽與靶蛋白TGFBR2 的結合位點

表2 馬乳源活性肽與靶蛋白相互作用結果
通過對鮮馬乳乳源性生物活性肽(VAPFPQPVVPYPQR)的理化性質進行分析,結果顯示,該多肽二級結構均由無規則卷曲構成,為不穩定的親水性蛋白多肽、帶正電荷、沒有跨膜區和信號肽且定位于細胞外的多肽,無糖基化位點和磷酸化位點,且經數據庫查詢分析其不具有毒性。
基于上述,篩選了馬乳源性活性肽的抗肺癌潛在靶蛋白,進行了通路富集分析,并篩選出與肺癌高度關聯的通路中的可能靶蛋白,如鈣黏蛋白相關蛋白(CTNNB1)、成纖維細胞生長因子受體2(FGFR2)、叉頭盒轉錄基因F1(FOXF1)、鼠肉瘤基因(KRAS)、甲狀腺轉錄因子-1(NK2 homeobox 1,NKX2-1)、轉化生長因子Ⅱ型受體(TGFBR2)等。進一步通過分子對接得出此活性肽與肺癌相關蛋白CTNNB1、FGFR2、FOXF1、KRAS、NKX2、TGFBR2 等蛋白均能進行有效的結合,可能是馬乳源性BAP 抗肺癌的下游靶點。
雖然利用生物信息學方法可大大降低多肽的篩選或預測成本,且能得到較為滿意的結果,但仍需進行后續試驗來驗證。本研究為深入研究乳源性活性肽的功能、構效關系及作用機制提供了理論基礎,同時為新型多肽的設計改造提供了思路。