杜 強,姚義勇,曾 剛
(南京醫科大學附屬蘇州醫院呼吸與危重癥醫學科,江蘇 蘇州 215008)
目前,肺癌的發病率和致死率在惡性腫瘤中位居首位。2018年全球腫瘤統計報告顯示,新發肺癌患者達210 萬,肺癌患者死亡人數為180 萬(約占癌癥死亡人數的1/5),其中東亞地區男性肺癌發病率全球最高,而女性患者發病率最高的是北美及歐洲等西方國家[1]。非小細胞肺癌是最常見的肺癌病理類型,占所有肺癌的85%,其中肺腺癌是最常見的非小細胞肺癌亞型,占比可達40%[2]。近年研究發現,異常紡錘體樣小頭畸形相關基因(abnormal spindle-like microcephalyassociated gene,ASPM)參與神經系統的發育、調節干細胞特性等功能[3]。此外,在神經系統、消化系統、生殖系統等多種惡性腫瘤中,ASPM 表達水平較癌旁組織高,且高表達患者預后較差。但其影響腫瘤預后的分子作用機制不明確,此前報道可能通過調控細胞周期、p53、Wnt 等通路促進腫瘤的發生發展[4],目前ASPM在肺腺癌中的作用研究甚少,缺乏ASPM對肺腺癌患者生存預后影響及潛在機制方面的研究。本研究旨在通過生物信息學方法研究ASPM 在肺腺癌中表達情況、對肺癌預后的影響及可能的作用機制。
從TCGA 數據庫下載肺腺癌患者RNASeq-2GeneNorm 表達譜數據和相關臨床數據共585 例(數據截止更新日期為2016 年01 月28 日),其中肺腺癌515例,剔除資料不全的樣本,具有完整生存隨訪時間的肺腺癌病例共470 例,其中男性病人219 例,女性病人251例,具有配對的癌旁組織共計58例;主要臨床資料包括年齡、吸煙史、TNM分期及生存狀態等。
1.2.1 生存分析將肺腺癌患者按照ASPM 表達水平高低進行排序,以ASPM 表達水平中位數為界,分為低表達組和高表達組,使用SPSS 軟件中以Kaplan-Meier法分析患者的ASPM表達水平與生存期關系,進行log-rank 檢驗;并采用Cox 回歸模型分析影響預后的危險因素,計算風險比及95%置信區間,P<0.05為差異具有統計學意義。
1.2.2 差異基因篩選從TCGA 數據庫下載表達數據,按照ASPM 表達水平的中位數為界,分為低表達組和高表達組,使用R語言中的ballgown及ggplot軟件包進行高低表達組間差異基因篩選[閾值設置:差異基因上調倍數(fold change,FC)≥1.3 或下調倍數≤0.8,P<0.05]。
1.2.3 差異基因GO 分析在DAVID 6.8 在線數據庫中(https://david.ncifcrf.gov/),對差異基因進行GO(gene ontology)分析(物種和背景均為Homo sapiens),主要涉及細胞組分(cellular component,CC)、生物過程(biological process, BP) 和 分 子 功 能(molecular function,MF)。
1.2.4 ASPM 相關的信號通路富集分析按照ASPM表達水平分高表達組和低表達組,使用GSEA4.0.3進行KEGG 信號通路分析,參數設置:Gene sets database:c2.cp.kegg.v7.1.symbols;Number of permutations:1 000 次;以|NES|>1,NOMP-value<0.05,FDRqvalue<0.25作為基因顯著富集的判斷標準。
1.2.5 蛋白交互網絡分析利用在線分析工具STRING(https://string-db.org/)預測差異蛋白間的相互作用,在STRING中輸入183個差異基因并分析,綜合評分≥0.7被認為是有意義的,繪制蛋白質網絡分析圖[5],將STRING 得到的差異基因導入Cytoscape 軟件中,利用Cytohubba 插件基于最大鄰域分量法(maximum neighborhood component,MNC)分析關鍵基因。
癌和癌旁組織表達差異基因采用R 語言分析(ballgown及ggplot軟件包);統計分析使用SPSS 21.0軟件;ASPM mRNA 在癌和癌旁組織表達水平的差異采用GraphPad Prism 7 軟件作圖,采用配對樣本t檢驗;ASPM mRNA 表達與肺腺癌患者臨床病理學特征的關系采用χ2檢驗;生存分析采用Kaplan-Meier 法及log-rank檢驗;并運用Cox比例風險回歸模型分析影響患者預后危險因素,P<0.05為差異有統計學意義。
在TCGA 數據庫中具有完整資料的肺腺癌和匹配的癌旁組織共計58例,對其ASPM mRNA表達水平進行分析顯示癌組織表達水平明顯高于匹配的癌旁組織,且差異有統計學意義(P<0.05),見圖1。

圖1 癌和癌旁組織中ASPM的表達差異
通過篩選TCGA 數據庫中肺腺癌患者RNAseq 2GeneNorm 表達數據和相關臨床數據,得到具有完整資料的腺癌病例470 例。采用卡方檢驗分析ASPM mRNA 表達與臨床相關指標如年齡(≤65 歲,>65 歲)、性別、吸煙史、T 分期、N 分期相關性。結果顯示,ASPM mRNA 表 達 與 年 齡(P=0.034)、性 別(P=0.026)、吸煙史(P=0.016)、T 分期(P=0.003)相關,即ASPM mRNA在≤65歲、男性、有吸煙史及T2~4期的人群中表達量高,與N分期(P=0.327)無明顯相關,見表1。
對470 例肺腺癌病例采用Kaplan-Meier 法及logrank 檢驗分析,結果顯示ASPM mRNA 表達水平高的肺腺癌患者的生存期短(P=0.002),見圖2。對影響因素進行單因素分析顯示年齡、性別、吸煙史與患者的生存期無明顯關系(P>0.05),而T 分期(P=0.004)、N 分期(P<0.01)與患者生存期相關,即T分期、N分期越晚總體生存率越低;進一步Cox 分析結果顯示N 分期[HR=2.313,95%CI(1.696,3.154),P<0.01)]、ASPM表達水平[HR=1.521,95%CI(1.114,2.076),P=0.008]均為影響肺腺癌預后的獨立危險因素。見表2。

表1 ASPM mRNA表達與臨床病理參數相關性

圖2 生存曲線ASPM高低表達組的生存曲線

表2 肺腺癌患者生存期預后影響因素的單因素和多因素分析
將470 例肺腺癌患者按照ASPM mRNA 表達水平分為高表達組和低表達組,使用R 語言中ballgown 及ggplot軟件篩選出差異基因183個,其中上調倍數≥1.3倍的有97 個,下調倍數≤0.8 的有86 個,P<0.01,根據上述數據構建差異基因火山圖(圖3),列出其中表達差異最大的前10個基因(表3)。

圖3 差異基因的火山圖
利用DAVID 6.8軟件對183個差異基因進行GO富 集分析(數目≥4,P<0.05),將差異基因分為BP、CC和MF 3 個亞類(圖4)。在生物過程方面主要富集于蛋白質分解、細胞信號轉導、細胞蛋白質代謝過程、氧化應激反應等,在細胞組分方面,主要富集于細胞外間隙、細胞外區、細胞表面、蛋白質細胞外基質、核小體等,分子功能方面差異基因主要富集于鈣離子結合、絲氨酸型內肽酶活性、激素活性、蛋白質結合橋接、鈣依賴性蛋白結合方面。
按照ASPM mRNA 的表達量分為高表達組和低表達組,進行GSEA 分析發現有18條通路出現有意義富集(表4),|NES|>2 的富集通路有7 條(圖5),主要集中于卵母細胞減數分裂、細胞周期、孕酮介導的卵母細胞成熟、p53 信號通路、同源重組、一碳代謝及DNA復制。

表3 表達差異最明顯的前10個基因

圖4 GO功能富集分析

表4 KEGG信號通路富集分析
通過STRING 在線工具對差異基因進行分析,以綜合評分(high confidence)大于0.7 作為篩選標準構建PPI網絡圖(圖6)。隨后將STRING獲取的節點數據導入Cytoscape 軟件中使用CytoHubba 插件篩選出關鍵基因4 個(圖7),分別為絲酶抑制蛋白家族D1 成員(serpin family D member 1,SERPIND1,MNC=7),纖維蛋白原β鏈(fibrinogen beta chain,FGB,MNC=7),纖維蛋白原α鏈(fibrinogen alpha chain,FGA,MNC=9),纖維蛋白原γ鏈(fibrinogen gamma chain,FGG,MNC=9)。

圖5 GSEA富集KEGG pathway基因集

圖6 差異表達蛋白的相互作用

圖7 蛋白相互作用中的關鍵基因
肺癌是全世界范圍內發生率和死亡率最高的腫瘤,按病理可分為小細胞和非小細胞肺癌兩大類,其中85%以上都是非小細胞肺癌。盡管目前藥物和手術方式上都有了很大進展,但由于缺乏早期癥狀且轉移風險高,多數患者確診時已處于晚期,5 年生存率低于15%[6]。肺腺癌屬于非小細胞肺癌一種,是原發性肺癌中發生率最高的亞型,占到全部肺癌病例的40%且呈現持續上漲的趨勢[7]。多數肺癌患者確診時已進入進展期或者出現遠處轉移,失去了手術機會,放化療等成為主要的治療方式。腫瘤的發生發展是一個復雜的過程,包括原發部位脫落、細胞外基質降解、侵犯周圍組織、進入血液及淋巴系統并最終形成一個新的病灶[8],涉及的機制眾多,常見的包括細胞周期、細胞凋亡、細胞自噬、免疫逃避及細胞信號轉導等[9],而發現新的分子標記物能夠讓腫瘤診斷窗口期前移,增加腫瘤患者手術治療機會,并能更準確評估患者預后。
本研究通過分析TCGA 數據庫中肺腺癌和癌旁組織臨床資料及mRNA 表達譜數據,發現ASPM mRNA在肺腺癌組織中表達顯著上調,其表達水平與年齡、性別、吸煙史、T 分期相關,進一步生存分析發現ASPM mRNA 表達水平、N 分期及T 分期與肺腺癌預后顯著相關,且ASPM mRNA 高表達組患者總體生存率顯著下降。進一步的多因素生存分析顯示ASPM 高表達是肺腺癌預后不良的獨立危險因素,可作為判斷腫瘤預后的標志物。
ASPM基因位于人類染色體1q31,編碼3 477 個氨基酸(蛋白410 kDa),由1個潛在的微管結合結構域氨基末端、2個鈣調蛋白同源結構域、81個異亮氨酸-谷氨酰重復序列和1 個未知功能的羧基末端組成,ASPM 蛋白以剪接異構體的形式存在,包括124、164、218、250 和410 kDa,其中250 和410 kDa 富集于中心體和中間體,提示這兩種形式的剪接異構體是ASPM蛋白的主要功能形式[10]。
最早發現ASPM 是參與神經系統發育和腦體積增大中的關鍵蛋白[11],主要參與紡錘體的調節進而在有絲分裂過程中發揮作用,該基因突變會導致常染色體隱性原發性小頭[12]。隨著研究的深入,發現ASPM是一種干細胞標記物[13],并且在多種腫瘤細胞中高表達,如膠質瘤、胰腺癌、卵巢癌和肝細胞癌組織[14-16]。在膠質瘤中,ASPM 在腫瘤組織中表達升高[17],結果在體外實驗和大鼠成瘤實驗得到進一步驗證,且ASPM 的表達水平與腫瘤的分期和復發率密切相關,其可能機制是影響腫瘤干細胞的擴增。在胰腺導管腺癌中,Xiong等[18]研究者通過RT-PCR方法證實ASPM 在癌組織中高表達,且與腫瘤進展密切相關。在前列腺癌中,Pai 等[19]研究發現ASPM 可能通過激活Wnt 信號通路促進前列腺腫瘤進展。ASPM 首先與通路上游Dvl-3 相互作用增加β-catenin 穩定性并抑制其降解,使細胞內β-catenin 濃度增加,通過Wnt-Frizzled-Dvl3-βcatenin 信號傳導方式促進下游靶基因表達,敲低ASPM 后則相應出現侵襲增殖能力、克隆形成能力以及腫瘤細胞干性和成瘤能力的下降,由此可見ASPM 能夠促進前列腺癌進展。在侵襲性乳腺癌中,Shubbar等[20]研究發現只有ASPM和Cyclin B2與其相關存活率和臨床病理參數有關,兩者共同參與乳腺癌發生、發展,推測參與細胞周期調控有關,但詳細作用機制尚未闡明。
本文通過GO 分析發現ASPM 廣泛分布在細胞表面、胞質內及細胞核中,可能通過橋接作用、絲氨酸磷酸化等機制,參與蛋白質分解、細胞間信號傳導等方面參與腫瘤的發生發展,通過PPI 網絡圖,本研究發現了與ASPM 有密切作用的4 個蛋白(SERPIND1、FGB、FGA、FGG),并分析了KEGG 信號通路,發現ASPM 參與的機制眾多,主要集中于細胞分化的早期階段,如DNA 復制、減數分裂及細胞周期等,提示ASPM 可以通過多個方面的分子機制共同促進腫瘤發展。
綜上所述,本研究利用生物信息學方法分析ASPM mRNA 在肺腺癌組織中高表達且與患者總體生存率呈負相關,是肺腺癌的一項新的獨立預后指標,SERPIND1、FGB、FGA、FGG 4 個蛋白是ASPM 起作用的關鍵分子,通過影響細胞發育的早期階段來促進肺腺癌進展,這些可以作為肺腺癌的潛在診斷和治療靶點。本研究局限性在于僅基于公共數據庫所提供的mRNA 表達水平分析,缺乏足夠的臨床樣本及細胞、動物實驗支持,本課題組后續將通過相關實驗研究進一步探索ASPM 在肺腺癌中的具體機制,為肺癌的診斷和治療提供一個新方向。