徐維華 李曉龍 張強 宋愛芬 高麗云 李劍英 韓洪利
(1 煙臺市蓬萊人民醫院普外科,山東 煙臺 265600;2 天津市第三中心醫院胸外科)
肺癌是人類目前全球發病率、病死率最高的惡性腫瘤之一[1],非小細胞肺癌(non-small cell lung cancer,NSCLC)是肺癌較常見的組織病理學類型。早期無淋巴結轉移的N0期NSCLC患者是手術治療的最佳受益人群,但是,目前尚缺乏能夠早期診斷NSCLC的特異性腫瘤標志物。因此,尋找靈敏度和特異度高的早期診斷標志物是目前臨床亟待解決的問題。近幾年,研究人員利用差異蛋白質組學研究方法,通過比較分析癌旁正常組織與癌組織細胞內整體蛋白質表達的差異,對差異表達蛋白(DEPs)進行鑒定和定量分析,從而篩選出與腫瘤相關的生物標志物,為臨床進行腫瘤診斷和治療提供數據參考[2-3]。本研究采用的是蛋白質組學質譜分析方法,以N0期NSCLC患者為研究對象,比較癌組織及癌旁正常組織中DEPs,篩選和鑒定N0期NSCLC患者的腫瘤標記物,為NSCLC的早期診斷提供線索和依據。
收集2018年9月—2020年12月于煙臺市蓬萊人民醫院收治的確診為N0期NSCLC并行胸腔鏡下肺癌根治術的30例患者的癌組織及癌旁正常組織(距腫瘤組織≥5 cm)樣本,所有患者術前均未進行放化療或射頻消融等治療,且術后均經病理組織學檢查明確診斷。患者中位年齡64(55,73)歲,術后TMN分期為Ⅰa期~Ⅰb期,腫瘤分型包括鱗癌5例,腺癌25例。
委托上海拜普生物科技有限公司采用TMT標記蛋白質組學完成30例N0期NSCLC患者的癌組織及癌旁正常組織樣本的蛋白質提取、定量、酶解、肽段的TMT標記、High-pH 反相色譜柱分級、液相二級質譜法(LC-MS/MS)分析、數據庫檢索以及質譜數據分析。使用Sequest HT搜索引擎檢索UniProt-Homo sapiens (Human)[9606]-203800-202201.fasta數據庫,后將LC-MS/MS分析獲得的RAW文件導入Proteome Discoverer 軟件當中(版本號 2.4, Thermo Scientific),將格式轉化為肽段/蛋白表達矩陣數據。使用Perseus軟件(1.6.12.0)、R統計計算軟件(4.0.5)以及Excel軟件對上述的數據的結果進行質譜分析,以變化倍數(FC)>1.2或者<1/1.2,并且以Studentt檢驗P<0.05作為篩選DEPs的條件。
分別對篩選出的上調和下調的DEPs從生物過程、分子功能和細胞組分3個方面進行GO功能分析,選擇P值較小的4種生物過程。對上述DEPs進行KEGG通路的注釋與富集,依據Fisher精確檢驗法對注釋結果進行富集分析,以P<0.05為顯著富集,P值越小表示富集越顯著,選擇3種P值較小的通路。同時對各通路的基因重疊率進行比較分析,獲得基因重疊率具有顯著差異的通路。
通過STRING數據庫和Cytoscape 3.6.1軟件對篩選出的DEPs構建PFIN并進行PFIN分析,明確DEPs之間的相互作用關系。
結合GO功能、KEGG通路和PFIN分析結果,篩選出同時參與了上面4種生物過程及3種KEGG通路并且相互作用關系緊密的DEPs,委托上海拜普生物科技有限公司采用PRM技術進行驗證,以FC>1.2或<1/1.2為驗證條件,最終通過驗證的DEPs稱為靶向DEPs。
對30例患者的癌組織和癌旁正常組織樣本進行TMT標記定量蛋白質組學分析,共發現91種DEPs,其中14種(如HSP90B1、SERPINH1、KRT8等)表達上調,77種(如COL6A3、AHNAK、C3等)表達下調。
對91種DEPs進行GO功能分析,選擇P值較小的4種生物過程,結果顯示,14種上調DEPs分別參與了內質網應激反應、細胞氧化還原穩態、蛋白質折疊及對過氧化氫的反應等生物過程;77種下調DEPs分別參與了細胞蛋白質代謝過程、蛋白質結合、細胞外基質及內肽酶活性的負調控等生物過程。
對91種DEPs進行KEGG通路分析結果顯示,14種上調DEPs主要參與了內質網中的蛋白質加工、甲狀腺激素合成、糖酵解/糖異生、低氧誘導因子-1信號通路等KEGG通路;77種下調DEPs主要參與了補體途徑、細胞外基質受體相互作用、黏著斑、蛋白質消化和吸收、維生素的消化和吸收、阿米巴病、人乳頭瘤病毒感染、磷脂酰肌醇3激酶/蛋白激酶B信號通路、脂肪消化和吸收、膽固醇代謝、百日咳、氮代謝、癌癥中的蛋白聚糖、小細胞肺癌、弓形蟲病、酸分泌收集管等KEGG通路。其中,對通路的基因重疊率進行分析比較,結果顯示,細胞外基質受體相互作用、黏著斑、磷脂酰肌醇3激酶/蛋白激酶B信號通路、人乳頭瘤病毒感染4條通路之間基因重疊率具有顯著差異(P<0.01),維生素的消化和吸收、脂肪消化和吸收、膽固醇代謝3條通路之間基因重疊率具有顯著差異(P<0.01),阿米巴病與小細胞肺癌2條通路之間基因重疊率也具有顯著差異(P<0.01)。
對篩選出的91種DEPs通過STRING數據庫構建PFIN,見圖1,圖中各節點為DEPs,節點之間的連線為DEPs之間的相互作用關系,連線越多表示各DEPs間的相互作用越緊密。
結合GO功能、KEGG通路和PFIN分析的結果,從91種DEPs中篩選出30種同時參與了內質網應激反應、細胞氧化還原穩態、細胞蛋白質代謝過程和蛋白質結合(P值較小的4種生物過程)以及參與了細胞外基質受體相互作用、黏著斑以及磷脂酰肌醇3激酶/蛋白激酶B信號通路(P值較小的3種KEGG通路)DEPs,經PRM驗證后最終獲得25種靶向DEPs,其中上調DEPs 4種,具體分別為熱激蛋白90β亞家族成員1(HSP90B1)、熱激蛋白D亞家族成員1(HSPD1)、二硫鍵異構酶家族A成員6(PDIA6)和PDIA4;下調DEPs 21種,分別為α-1-Ⅵ型膠原蛋白(COL6A1)、COL6A2、COL6A3、絲氨酸蛋白酶抑制劑A亞家族成員1(SERPINA1)、SERPINA3、絲氨酸蛋白酶抑制劑C亞家族成員1(SERPINC1)、SERPIND1、SERPING1、α-5-層粘連蛋白亞基(LAMA5)、LAMB2、LAMC1、碳酸酐酶1(CA1)、CA2、含EH結構域的膜轉運調控蛋白1(EHD1)、EHD2、EHD4、富亮氨酸-α-2-糖蛋白(LRG1)、間-α-胰蛋白酶抑制重鏈蛋白4(ITIH4)、觸珠蛋白(HP)、α-2-巨球蛋白(A2M)、膜聯蛋白A3(ANXA3)。

A:上調DEPs,B:下調DEPs圖1 DEPs的PFIN分析圖Fig.1 PFIN Analysis of DEPs
肺癌是我國發病率、死亡率最高的幾種惡性腫瘤之一,早期診斷率低,很多患者在確診時即已出現轉移,因此患者的總體預后較差。腫瘤標志物是與腫瘤細胞相關的分子信號,對腫瘤的診斷、治療及患者的預后及復發具有評估或預測價值。目前臨床通常采用TMT標記蛋白質組學方法篩選腫瘤相關蛋白或腫瘤標志物。本研究通過TMT標記蛋白質組學分析,共篩選出N0期NSCLC患者癌組織和癌旁正常組織DEPs共91種,結合DEPs的GO功能、KEGG通路、PFIN分析結果,再從中篩選出30種DEPs,經PPM驗證最終篩選出25種靶向DEPs,其中上調DEPs 4種,下調DEPs 21種。
研究發現,PDIA4、PDIA6主要參與凝血、損傷反應、T細胞遷移和癌癥轉移等重要生物過程,其中PDIA4通過活化血小板促進腫瘤生長[4-5],PDIA6可調節膀胱癌[6]和NSCLC細胞[7]的細胞增殖和侵襲。另外熱激蛋白(HSP)主要生理功能為維持細胞完整性,參與熱激反應,通過上調其表達量從而保護細胞免受外界侵害[8]。但是有研究發現其可通過參與凋亡、自噬、血管生成和腫瘤免疫等多種細胞過程促進腫瘤的發生和發展[9]。
SERPINA1、SERPINA3、SERPINC1、SERPIND1、SERPING1均屬于絲氨酸蛋白酶抑制劑的家族成員,本研究發現其在N0期NSCLC組織中表達水平顯著下降,對DEPs進行KEGG通路分析發現,這5種DEPs共同參與了補體與凝血系統的代謝通路。C4BP蛋白主要由肝臟分泌,在血液中為中等豐度,可能與機體對腫瘤的應激反應等有關。
COL6A蛋白在多種惡性腫瘤中呈高表達,通過促進病灶黏附與轉移來增強腫瘤細胞的遷移、浸潤以及侵襲[10]。既往研究表明COL6A1在轉移性NSCLC中高表達,并且其表達水平降低能夠抑制NSCLC的轉移[11]。本研究結果顯示COL6A在肺癌組織中的表達水平較癌旁正常組織顯著降低,推測可能與研究對象不同有關,本研究中納入的是無淋巴結轉移的N0期NSCLC患者組織。
CA1與CA2是碳酸酐酶家族成員,可以催化CO2/H2CO3的可逆水合和脫水反應。其中,CA1起維持細胞內環境穩定的作用[12]。研究發現結直腸癌組織中CA1蛋白和基因表達水平均下調,其在結直腸癌組織中高表達提示手術效果及預后好[13]。而CA2作為CA1的同源基因,是肝細胞癌轉移和上皮間質轉化的抑制劑,并且與肝癌患者的總體生存期具有密切的相關性[14]。本研究結果顯示CA1、CA2在N0期NSCLC組織中表達下調。
EHD1、EHD2、EHD4是EHD家族的重要成員。研究表明EHD1高表達與NSCLC進展及預后不良有關[15]。研究發現EHD2在腎癌組織中高表達[16],另有研究發現EHD2能夠激發NSCLC細胞的增殖和糖酵解,但抑制自噬和細胞凋亡,因此提示EHD2可能是NSCLC的潛在治療靶點,且有成為NSCLC的診斷和預后生物標志物的潛能[17]。研究發現EHD2在乳腺癌組織、肝癌組織及NSCLC等癌組織中的表達明顯低于癌旁組織[18-19],本研究結果與此一致,但具體機制尚待深入探討。
LAM具有促進細胞生長、分化、黏附和轉移等多種生物學效應。LAM家族中的LAMA2屬于抑制基因,其高表達能夠抑制非小細胞肺癌的轉移。本研究發現,LAM家族中的LAMA5、LAMB2以及LAMC1在N0期NSCLC癌組織中表達較癌旁正常組織顯著下調。
綜上所述,本研究通過對N0期NSCLC患者癌組織及癌旁正常組織進行蛋白質組學分析,尋找發現了25種DEPs,可為NSCLC的早期診斷提供線索和依據。
利益沖突聲明:所有作者聲明本文章不存在利益沖突。
ConflictsofInterest: All authors disclose no relevant conflicts of interest.
倫理批準和知情同意:本研究涉及的所有試驗均已通過煙臺市蓬萊人民醫院醫學倫理委員會的審核批準。所有試驗過程均遵照《赫爾辛基宣言》的條例進行。受試對象或其親屬已經簽署知情同意書。
EthicsApprovalandPatientConsent: All experimental protocols in this study were reviewed and approved by The Medical Ethics Committee of Yantai Penglai People’s Hospital, and all experimental protocols were carried out by following the guidelines of The Declaration Helsinki. Consent letters have been signed by the research participants or their relatives.
作者貢獻:徐維華、韓洪利參與了研究設計;徐維華、李曉龍、張強、宋愛芬、高麗云、李劍英參與了論文的寫作和修改。所有作者均閱讀并同意發表該論文。
Contributions: The study was designed byXUWeihuaandHANHongli. The manuscript was drafted and revised byXUWeihua,LIXiaolong,ZHANGQiang,SONGAifen,GAOLiyun, andLIJianying. All the authors have read the last version of the paper and consented submission.