阿布都色麥爾·熱依木 戴京京 邢應如 周武碧 (安徽理工大學醫學院,淮南 232001)
肺癌是世界范圍內的惡性腫瘤之一,主要分為 小細胞肺癌和非小細胞肺癌,其發病率和病死率高,嚴重威脅人類健康[1]。隨著醫療技術的發展,肺癌的診治取得進步。盡管如此,肺癌患者的平均生存率仍然很低(20%),五年生存率低于15%,且大多數肺癌患者在中晚期得到確診[2-3]。目前,正在研究基于靶基因的細胞水平個體化治療,有望改善肺癌患者預后[4-5]。因此,充分闡明肺癌的分子機制具有重要意義。
泛素化和去泛素化是最通用的翻譯后修飾,參與多種生物學過程,例如細胞生長,分化,轉錄調控和致癌作用。去泛素化作用由去泛素化酶介導,去泛素化酶已成為與癌癥相關的許多途徑的重要調節劑。它們可以調節關鍵致癌蛋白或依賴泛素的致癌信號傳導級聯的穩定性[6]。泛素C 末端水解酶L1(UCHL1)是去泛素酶UCH 亞組的成員,主要在正常組織的腦,睪丸,卵巢和胎盤中表達,其在包括肺癌在內的多種癌癥中高表達[7-8]。與正常肺組織相比,UCHL1 在肺癌中異常表達。此外,UCHL1 的表達與癌癥的病理階段密切相關[9]。另外,有體內實驗證據表明,UCHL1 轉基因小鼠具有明顯的易發表型,并伴有肺部腫瘤的發展[10]。因此,以上數據表明UCHL1在肺癌的發生發展中具有重要致癌作用。然而,其具體的致癌機制仍然未知。本研究首先采用生物信息方法分析UCHL1基因在肺癌中的表達、相關生物學功能及其與患者生存期的關系,然后采用免疫組織化學法檢測40例肺癌組織樣本,對生物信息分析結果進行驗證。
1.1 通過Oncomine 數據庫檢索目標基因 條件設定:①“分析類型:癌癥vs正常分析”;②“癌癥類型:肺癌”;③“樣品類型:組織標本”;④“數據類型:mRNA”;⑤“設定條件:過度表達”;⑥“臨界值(P<0.05,fold change>2)”。
1.2 UCHL1表達譜數據提取 Oncomine 數據庫數據提取條件為:①“基因:UCHL1”;②“分析類型:癌癥vs正常分析”;③“癌癥類型:肺癌”;④“數據類型:mRNA”;⑤“臨界值(P<0.05,fold change>2)”。
1.3 UCHL1 蛋白互作網絡構建 采用STRING 數據庫構建UCHL1 蛋白互作網絡,UCHL1 蛋白互作網絡的置信水平>0.4,以文本挖掘、實驗、數據庫、共表達、鄰域、基因融合作為蛋白互作來源,聚類法采用Kmeans聚類,集群數量為3。
1.4 UCHL 相關互作蛋白功能富集分析 Cluster-Profiler 是一個支持GO 和KEGG 富集且支持分析結果可視化的R軟件包。本研究使用ClusterProfiler軟件包對UCHL 相關互作蛋白進行GO 和KEGG 路徑富集分析。P<0.05被劃定為顯著富集截止標準。
1.5 Kaplan Meier-Plotter 生存分析 采用Kaplan Meier-Plotter 數據庫對肺癌患者UCHL1 高低表達組與生存預后的相關性進行分析,條件設定:①“基因:UCHL1”;②“癌癥類型:肺癌或肺腺癌或肺鱗癌”;③“分類截點:自動選擇最佳截斷值”;④“生存指標:OS”。
1.6 GEPIA數據庫分析UCHL1在肺癌中的表達GEPIA 數據庫中,以UCHL1 為目標基因,癌癥類型選擇LUAD(肺腺癌)和LUSC(肺鱗癌),匹配TCGA正常組織表達數據進行可視化分析。
1.7 免疫組織化學 采集2016 年至2018 年間來自南京醫科大學淮安市第一人民醫院的肺癌組織標本40 份,癌旁組織標本15 份。病理組織標本連續切片,脫蠟,乙醇水化,抗原在熱檸檬酸緩沖液中修復,4 ℃密封于1∶400稀釋度的抗UCHL1一抗(Cat:#13179,Cell Signaling technology)中過夜,用HRP 標記的二抗(Cat:KGAA35,凱基生物)密封,DAB 染色,蘇木精復染,中性膠密封。
1.8 UCHL1 蛋白表達結果判斷 根據染色強度評分:0 分(無染色),1 分(淺棕色),2 分(棕色)和3 分(深棕色)。根據陽性染色占比評分:0 分(0%~5%陽性率),1 分(6%~25%陽性率),2 分(26%~50%陽性率),3 分(51%~75%陽性率),4 分(76%~100%陽性率)。染色強度評分與染色占比結果乘積:0 分為(-),1~4分為(+),5~8分為(++),9~12分為(+++)。
1.9 分組方法 根據TCGA 數據庫中肺癌患者組織UCHL1表達值中位數,將患者分為高表達組和低表達組。肺癌患者中,≥60 歲為高年齡組,<60 歲為低年齡組。分期依據為國際抗癌聯盟(UICC)第8版TNM分期系統。
1.10 統計學分析 采用SPSS17.0 軟件進行統計分析。采用卡方檢驗分析UCHL1 表達與臨床特征的關系。采用Cox 比例風險回歸模型,對總生存時間進行單因素和多因素分析,P<0.05表示差異具有顯著性。使用ClusterProfiler 軟件包對UCHL1 及相關互作蛋白進行GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)路徑富集分析,P<0.05被劃定為顯著富集截止標準。
2.1 篩選目標基因 靶基因選擇:根據本次篩選條件,在Oncomine 數據庫中篩選出差異表達基因,根據中位秩次排序,剔除已報道過的基因,篩選出UCHL1 基因。UCHL1 基因中位秩次為993.5,P<0.001(圖1)。

圖1 Oncomine 數據庫中篩選出基因UCHL1(中位秩次993.5)Fig.1 UCHL1 was screened from Oncomine database(Median Rank 993.5)
2.2 UCHL1 在常見腫瘤類型及肺癌中的表達結果 圖2A 所示,Oncomine 數據庫中包含359項有關UCHL1 在各種腫瘤和正常組織中表達的相關研究。其中52 項研究顯示UCHL1 在腫瘤組織呈現差異性表達,23 項研究表明UCHL1 高表達于腫瘤組織。7 項研究表明,UCHL1 在肺癌組織中表達與正常組織相比,差異具有統計學意義(P<0.001,圖2B)。432 個樣本及包括小細胞肺癌、肺類癌、鱗狀細胞肺癌和肺腺癌,對癌癥與正常組織的UCHL1表達水平進行了對比分析。其文章發表在“Proc Natl Acad Sci U S A”和“PLoS One”上。

圖2 UCHL1 基因在Oncomine 數據庫腫瘤研究中的表達情況Fig.2 Expression of UCHL1 gene in Oncomine database
2.3 UCHL1 基因PPI 網絡構建與功能富集 利用STRING 數據庫建立了蛋白質互作網絡(PPI),篩選出與UCHL1 蛋白密切相關的10 個蛋白(COPS5、PARK2、TP53、UBC、UCHL3、HSPA8、SNCA、UBB、RPS27A、UBA52),互作關系edge=48,局部聚類系數為0.917,蛋白質互作網絡富集P值為0.013 6,采用Kmeans 聚類分析將PPI 網絡基因分為3 個模塊,見圖3A。UCHL1 互作蛋白相關信號通路主要富集于泛素介導的蛋白質水解通路,見圖3B。UCHL1互作蛋白生物學功能富集顯著,生物學過程(BP)主要富集于蛋白去泛素化、蛋白質小分子修飾,細胞成分(CC)主要富集于宿主細胞成分,分子功能(MF)主要富集于泛素結合、巰基依賴泛素特異性蛋白酶活性,見圖3C。

圖3 UCHL1蛋白互作網絡以及相關通路分析Fig.3 Analysis of UCHL1 protein interaction network and related pathways
2.4 UCHL1 及相關互作蛋白在肺癌和正常肺組織中的表達 在GEPIA 數據庫中對UCHL1 及相關互作蛋白(COPS5、PARK2、TP53、UBC、UCHL3、HSPA8、SNCA、UBB、RPS27A、UBA52)在肺腺癌及肺鱗癌中的表達數據進行分析。其中,UCHL1、UCHL3 和SNCA 在肺癌與正常肺組織中存在差異表達。在肺腺癌(LUAD,n=483)及肺鱗癌(LUSC,n=486)中UCHL1 表達明顯高于正常肺組織(P<0.05),見圖4A。UCHL3在肺鱗癌(LUSC,n=486)中的表達明顯高于正常肺組織(P<0.05),見圖4B。SNCA 在肺腺癌(LUAD,n=483)中的表達明顯低于正常肺組織(P<0.05),見圖4C。

圖4 GEPIA數據庫中UCHL1及相關互作蛋白在不同肺癌與正常肺組織間的表達差異Fig.4 Expressions of UCHL1 and related proteins in different lung cancer tissues and normal lung tissues in GEPIA database
2.5 UCHL1 及相關互作蛋白在肺癌中的表達與預后分析 利用Kaplan Meier-Plotter 數據庫分析了UCHL1 及相關互作基因(UCHL3、SNCA)表達與肺癌患者預后的關系。UCHL1 低表達組肺癌患者的總生存率(圖5A)明顯高于UCHL1 高表達患者(P<0.001)。UCHL3 在肺鱗癌患者中的表達水平對總生存率無影響(P>0.05)。SNCA 高表達肺腺癌患者的總生存率(圖5C)高于SNCA 低表達患者(P=0.05)。

圖5 Kaplan Meier-Plotter 數據庫分析肺癌患者UCHL1及相關互作蛋白的表達與預后的關系Fig.5 Kaplan Meier-Plotter database analysis of correlation between UCHL1 and related gene expression and prognosis in lung cancer patients
2.6 UCHL1在肺癌組織中的表達 為驗證UCHL1蛋白在肺癌組織中的表達,對肺癌(40 例)及癌旁正常肺組織(15 例)進行免疫組化染色分析,發現正常肺組織中UCHL1表達水平極低或不表達,而在肺癌組織中高表達,見圖6。肺癌組織UCHL1 陽性率及強陽性率均高于正常肺組織,差異具有統計學意義(P<0.05),見表1。

表1 UCHL1蛋白在肺癌及正常肺組織中的表達Tab.1 Expression of UCHL1 protein in lung cancer and normal lung tissues

圖6 免疫組織化學方法檢測肺癌組織中UCHL1的表達Fig.6 Immunohistochemical method for detection of UCHL1 expression in lung cancer
2.7 肺癌UCHL1 表達與臨床特征的關系 在TCGA 數據庫整理出肺癌患者數據,χ2檢驗分析UCHL1 表達與肺癌患者性別、年齡、T、N、M 分期以及病理分期等臨床特征的相關性。肺癌患者UCHL1 的表達與性別(P=0.036)和病理分期(P=0.028)具有顯著性差異,男性肺癌患者UCHL1表達較高,但UCHL1 表達與年齡、T、N、M 分期無明顯相關性(P>0.05,表2)。

表2 UCHL1蛋白表達與肺癌患者臨床病理特征的關系Tab.2 Relationship between expression of UCHL1 protein and clinicopathological features of lung cancer
2.8 肺癌患者總生存率的單因素和多因素分析采用Cox 回歸模型分析各病理因素對肺癌患者生存率的影響。單因素分析顯示UCHL1的表達、T、N、M分期以及病理分期是影響肺癌患者總生存率的因素,多因素分析顯示UCHL1 表達和N 分期是肺癌患者總生存率的獨立危險因素,見表3。

表3 TCGA肺癌數據集肺癌患者OS影響因素的Cox回歸模型Tab.3 Cox regression model for influencing factors of OS rate of lung cancer patients in TCGA lung cancer data set
UCHL1 是一種富含223 個氨基酸的神經元蛋白[11]。UCHL1 的功能最為人所知的是其脫氮酶(DUB)活性,它催化泛素(Ub)的C 端酯和酰胺水解生成單體Ub[12]。除了DUB 活性外,UCHL1 還被認為具有二聚依賴的E3 泛素蛋白連接酶活性和/或在體 內 穩 定Ub 單 體 方 面 有 作 用[13]。作 為DUB,UCHL1 促進Ub 循環,因此可以調節可用Ub 的細胞池,賦予UCHL1調節許多依賴泛素的細胞過程的能力[14]。盡管其確切的生理功能尚不清楚,但越來越多的證據表明UCHL1與人類惡性腫瘤的進展有關。目前,UCHL1 在腫瘤發病機制中的具體作用尚不清楚。據報道,UCHL1 在一些腫瘤組織和癌細胞系中表達上調,并被認為在許多癌癥的發展過程中發揮癌基因作用,包括淋巴瘤、結直腸癌和非小細胞肺癌[15-17]。然而,一些研究表明UCHL1 在鼻咽癌和乳腺癌的發病機制中是一種腫瘤抑制因子[18-19]。盡管關于UCHL1在腫瘤發生中的確切作用存在爭議,但以上研究表明UCHL1 是腫瘤形成和發展的重要調節因子。因此,闡明UCHL1在肺癌中的作用可能會幫助人們更好地了解肺癌的分子發病機制,并促進肺癌治療和診斷工具的開發。
盡管有UCHL1 在肺癌細胞系細胞功能上的相關報道,由于其實驗樣本類型和實驗方法上的差別,需要進一步驗證研究的可靠性以及可重復性。然而,關于UCHL1表達水平對肺癌患者預后的影響還沒有強有力的證據。基于本項研究,采用Oncomine 數據庫初步篩選肺癌組織中的差異表達基因,涉及的數據涵蓋了TCGA 數據庫、GEO 數據庫中的基因數據集,為新的腫瘤分子標志物的探索提供數據基礎。在此數據庫中,根據自己的需要設置過濾和挖掘數據的條件。在Oncomine 數據庫分析篩選出的UCHL1基因在常見腫瘤中的表達情況,結果顯示UCHL1 在52 項腫瘤研究中的表達差異具有統計學意義,23項腫瘤研究中發現UCHL1表達上調。在肺癌表達組研究中,與正常肺組織相比,肺癌組織中UCHL1 表達上調。為了消除個體差異引起的抽樣誤差,課題組在GEPIA 數據庫中進行了大量的驗證。在GEPIA 數據庫以及免疫組化實驗中分析發現,UCHL1 在肺癌中均顯高表達,與正常組織相比差異具有統計學意義。這些研究提示UCHL1 可能在肺癌中起癌基因作用,可能與肺癌的臨床特點和生存預后有關。有趣的是,在UCHL1互作蛋白的研究中發現,UCHL3在肺鱗癌中高表達、SNCA 在肺腺癌低表達,而SNCA 高表達肺腺癌患者預后較好,說明SNCA 可能是腫瘤抑制基因。與UCHL1 相關的信號通路大多集中在蛋白去泛素上,表明UCHL1參與了關鍵致癌蛋白或泛素依賴的致癌信號級聯調節,可能成為抑制腫瘤有絲分裂癥狀的重要靶點。
Kaplan-Meier Plotter 在線分析數據庫為影響患者生存的因素與患者的預后提供可靠的相關性分析。結果表明,UCHL1 的表達水平與肺癌患者的預后顯著相關,UCHL1 的高表達導致患者生存時間縮短,即UCHL1 的表達水平與肺癌患者的OS 呈負相關。
在TCGA 數據庫整理出的肺癌患者臨床數據分析表明,UCHL1 的表達與性別(P=0.036)和病理分期(P=0.028)顯著相關,而與年齡、T、N、M 分期無關(P>0.05)。以上結果提示UCHL1 表達與性別和疾病嚴重程度有關,UCHL1 在男性患者中的表達高于女性,提示肺癌患者中UCHL1的表達可能存在性別差異,其高表達患者惡性程度更高。上述研究提示UCHL1 可能在肺癌的發生發展中起重要作用,并影響患者的預后,為探索肺癌的分子機制提供了一定的參考。
總之,本研究結合公共數據庫分析發現,UCHL1 在肺癌中高表達,并預測其高表達為肺癌患者低生存率的危險因子,提示UCHL1基因可能作為肺癌惡性程度的預測指標以及治療干預的靶點。