孫耀華,王瀚,李雪瑩,楊慧玲,白辰光
根據中國國家癌癥中心于2018年發布的統計數據,結直腸癌(colorectal cancer)在我國的發病率和死亡率分別位居惡性腫瘤的第3位和第5位[1],且表現出城市發病率高于農村、出現低齡化趨勢等特點[2],嚴重威脅人民身體健康。結直腸癌的發生發展是一個多基因參與的多步驟復雜過程,其中抑制癌基因TP53突變是結直腸癌最常見分子事件之一,與腫瘤發生、發展、預后及治療等各個環節均有明顯的相關性[3]。盡管TP53基因突變在結直腸癌致瘤作用已得到廣泛證實,但接近半數腫瘤的TP53基因為野生型,TP53基因突變型和野生型結直腸癌之間的差異意義尚未完全明確。為此,本研究采用cBioPortal數據庫中的癌癥基因組圖譜(the cancer genome atlas)公共數據集,在明確2種亞型臨床病理特征差異的基礎上,進一步分析基因突變譜的差異,為結直腸癌精準分型和靶向治療提供參考。
1.1 數據資料下載 本研究從cBioPortal數據庫(http://www.cbioportal.org/)下載TCGA結直腸癌數據資料(GDAC firehose)。該數據資料包括640例結直腸癌樣本,其中220例有完整的基因突變信息和對應的臨床病理信息。
1.2 TP53基因突變信息和臨床病理特征提取 應用Gene選項分析設置“Mutation”為篩選條件,輸入查詢基因:“TP53”,下載TP53基因突變信息,包括突變類型、外顯子分布、蛋白改變等。根據TP53基因突變狀態將220例具有完整基因突變信息的腫瘤分為TP53突變型和野生型2種亞型。下載2種亞型腫瘤的臨床病理信息,包括年齡、性別、部位、TNM分期、淋巴管侵犯、血管侵犯、腫瘤突變計數(tumor mutation count)和基因組變異片段(fraction genome altered, FGA)等。腫瘤突變計數,即每例腫瘤的突變個數,以192為界值分為高突變負荷和低突變負荷[4]。FGA以5%為界值分為染色體穩定性和染色體不穩定性[5]。
1.3 基因突變譜差異數據提取 應用Gene選項分析設置“Mutation”為篩選條件,輸入查詢基因,篩選條件為突變頻率(該基因在本組所有病例中的突變發生率)≥5%的基因:TP53、APC、KRAS、NRAS、BRAF、LRP1B、FAT4、FBXW7、PIK3CA、SMAD4、ATM、AMER1、RELN、ARID1A、CREBBP、MYH11、ERBB4、GRIN2A、PCLO、LRRK2、LIFR、CHD4、DNMT1、MTOR、MKI67、ROBO1、TRRAP、TET1、EPHA3、POLE、TCF7L2、EP400、ARID2、ACVR1B、ZFHX3、CDH11、ERBB3、LRP6、SMAD2、NOTCH3、PTPRT、RNF213、ALK、EPHA5、FAT1、KMT2A、PIK3CG、PRKD1、PRKDC、ROS1、TPR、KMT2D、SPEN、SETD2、EP300、AFF3、NOTCH2、IRS4、STAG1、MGA、ZNF521、KMT2C、ATR、CTNNA1、CTNNB1、ESR1、FLT1、MYH9、PDGFRA、PTPRC、PTPRD、RANBP2、MAP2K4、VAV1、KAT6A、KMT2B、MED12、GPHN、LARP4B、SETBP1、RNF43、PREX2。病例選擇“samples with mutation and CNA data (220)”。下載TP53突變型和野生型2種亞型結腸癌的基因突變數據。
1.4 差異基因蛋白的相互作用及生物功能及信號通路分析 采用String(https://string-db.org/)在線工具分析差異基因蛋白的相互作用,物種屬性設置為“homo sapiens”,灰色連線代表蛋白相互作用的強度,連線越粗代表相互作用越強。預測信息來自實驗、數據庫、共表達、相鄰基因和共存。聚類分析采用Kmeans clustering分析,將差異基因蛋白分為3個亞簇。采用Funrich軟件進行基因本體(gene ontology,GO)功能注釋以及京都基因和基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析,標注基因數排列在前10位的項目。
1.5 統計學處理 采用Graphd軟件進行統計分析,計數資料以百分比表示,組間比較采用χ2檢驗及Fisher精確檢驗。P<0.05表示差異有統計學意義。
2.1 220例結直腸癌患者的臨床病理和基因突變特征 220例結直腸癌患者年齡為(69.09±11.71)歲,其中男性114例(51.8%),女性106例(48.2%)。77例(35.0%)腫瘤位于右半結腸、76例(34.5%)腫瘤位于左半結腸、65例(29.5%)腫瘤位于直腸,另有2例結腸腫瘤未明確標注具體位置。基因突變分析表明排在前10位的突變基因分別是APC(160/220, 72.7%)、TP53(120/220, 54.5%)、KRAS(96/220, 46.6%)、LRP1B(42/220, 19.1%)、FAT4(39/220, 17.7%)、FBXW7(39/220, 17.7%)、SMAD4(33/220, 15.0%)、PIK3CA(32/220, 14.5%)、ATM(27/220, 12.3%)、AMER1(26/220, 11.8%)。
2.2 結直腸癌TP53基因突變類型及外顯子分布特征 120例結直腸癌存在TP53基因突變,突變率為54.5%。TP53基因突變類型為缺失突變82例(68%),無義突變20例(17%)、移碼缺失突變10例(8%)、移碼插入突變6例(5%)、剪切突變1例(0.8%)、框內缺失1例(0.8%)。除1例未標注外,119例TP53突變型結腸癌的TP53基因突變分布分別位于外顯子3(1/120, 0.8%)、外顯子4(10/120, 8%)、外顯子5(35/120, 29%)、外顯子6(15/120, 12.5%)、外顯子7(21/120, 17.5%)、外顯子8(28/120, 23.3%)、外顯子9(5/120, 4%)、外顯子10(4/120, 3%)。
2.3 TP53突變型和野生型結直腸癌患者的臨床病理特征分析 根據TP53突變狀態,將220例結直腸癌分為TP53突變型(120例)和野生型(100例)2種亞型。2種亞型患者的臨床理特征相關性分析結果顯示,TP53基因突變多發于左半結腸和直腸(P<0.05)。TP53突變型結直腸癌中,FGA≥5%的例數顯著增多(P<0.01),而高突變負荷的腫瘤比例顯著減少(P<0.01)。2組腫瘤在年齡、性別、TNM分期、淋巴管和血管侵犯方面均無統計學差異(P>0.05)。見表1。
2.4 TP53突變型和野生型結直腸癌的基因突變譜分析 進一步比較TP53突變型和野生型結直腸癌的基因突變譜差異,選用突變例數≥10例的基因,共81個,其中突變率≥10%的基因突變瀑布圖和熱圖見圖1。如表2所示,包括APC、KRAS、NRAS、SMAD4在內的56個基因在2種亞型結直腸癌中的突變率無明顯差異。但是,基因LRP1B、FAT4、FBXW7、PIK3CA、ATM、RELN、CREBBP、ROBO1、BRAF、AMER1、MYH11、POLE、ZFHX3、SETD2、TET1、EP400、NOTCH3、RNF43、PTPRC、LARP4B、PDGFRA、MAP2K4、KMT2A、EP300、VAV1在TP53野生型結直腸癌中的突變率明顯增高,與TP53突變型結直腸癌相比,差異有統計學意義(P<0.05)。
2.5 差異基因蛋白的相互作用及生物功能及信號通路分析 采用String在線工具分析差異基因表達蛋白之間的交互作用,并做kmeans聚類分析。差異基因蛋白相互作用網絡中共有25個節點,50條邊,kmeans聚類分析將差異基因蛋白分為3個亞簇。其中21個蛋白之間存在直接或間接作用,EP300、KMT2A、CREBBP、NOTCH之間存在緊密連接;另外BRAF、PIK3CA、PDGFRA、VAV1之間存在緊密連接,見圖2。采用Funrich軟件進行GO功能注釋和KEGG通路富集分析差異基因。在TP53野生型結直腸癌中,分子功能富集到17項,主要與DNA結合、轉錄調控、細胞粘附及蛋白激酶和受體活性等相關。細胞位置富集到25項,差異基因主要位于細胞核,其次是細胞漿。參與的生物過程富集到7項,主要與信號轉導、細胞交流、調控細胞增生和生長相關。KEGG通路富集到334條通路,排在前位生物過程的主要與PDGFR、EGFR、VEGFR、PI3K信號通路等相關。

圖2 結直腸癌突變率差異基因表達蛋白之間的交互作用及聚類分析
結直腸癌的發生發展是一個多基因參與的多階段復雜過程,包括抑癌基因的失活、癌基因的激活以及各種信號轉導通路的異常等。在本組數據中,220例結直腸癌就存在上百個基因發生突變。野生型TP53是重要的抑癌基因,其能通過多種機制抑制細胞分裂和增殖、促進細胞衰老和凋亡等,從而發揮著腫瘤抑制作用[6]。經過多年的研究,TP53基因在惡性腫瘤中的作用受到越來越多的重視,現已證實在所有惡性腫瘤中,50%以上會出現該基因的突變[7]。在本組數據中,TP53的突變率為54.5%,突變位點主要位于外顯子5和8,與文獻報導一致[8]。
通過比對TP53突變型和野生型結直腸癌患者的臨床病理特征,本研究數據提示TP53突變型結直腸癌好發于左半結腸及直腸,而TP53野生型結直腸癌則好發于右半結腸。有研究表明左半結腸和右半結腸的胚胎起源不同,解剖生理各異,這提示盡管臨床病理表現一致,來自左半結腸和右半結腸的結直腸癌發病的分子機制有所不同[9-10]。目前研究顯示,左半結腸癌與抑癌基因(例如APC、TP53、SMAD4等)的失活,KRAS基因突變以及CpG島甲基化表型相關;而右半結腸癌則與癌基因的激活、BRAF基因突變、MLH1基因的甲基化失活、腫瘤微衛星不穩定相關。本研究也提示,發生于左半結腸和直腸的腸癌病例抑癌基因TP53 突變率明顯高于發生于右半結腸的病例。
本研究發現TP53突變型結直腸癌中FGA≥5%的腫瘤例數顯著增高,這表明TP53突變型結直腸癌更容易產生染色體不穩定性。染色體不穩定性是癌癥的標志之一,它是由于有絲分裂過程中染色體分離持續出現錯誤而所致。當前,越來越多的數據表明TP53突變與染色體不穩定性密切相關[11],攜帶TP53基因突變的腫瘤細胞多為非整倍體(aneuploid)。其中重要的機制就是,野生型p53蛋白可誘導出現異常有絲分裂細胞凋亡壞死,進而限制染色體不穩定性的產生;而TP53基因突變所導致的p53蛋白功能喪失,則增加染色體不穩定性[12-13]。
此外,分析數據表明TP53野生型結直腸癌中高突變負荷腫瘤數目顯著高于TP53突變型結直腸癌,與Cai等[14]在胃癌中的研究結果相一致。近年來,越來越多的研究表明突變負荷會影響腫瘤免疫原性。高突變負荷腫瘤中含有大量記憶CD4+T細胞、活化的CD4+和CD8+T細胞等免疫細胞,因而其對免疫檢查點抑制劑治療(如PD-1/PD-L1、CTLA-4等)更為有效[15]。2017年,Colli等[4]學者的研究進一步提示,以腫瘤突變個數192為界值,可以更好地篩選免疫檢查點抑制劑受益患者。以上結果在另一方面也提示,TP53野生型結直腸癌患者中免疫檢查點抑制劑受益患者要多于TP53突變型結直腸癌患者。
筆者進一步比對TP53突變型和野生型結直腸癌患者的基因突變譜差異,共篩選出25個基因更好發于TP53野生型結直腸癌。基于String分析構建差異基因蛋白間的相互作用網絡發現有21個差異基因蛋白之間存在直接或間接作用。GO注釋和KEGG分析表明篩選出的25個差異基因主要發揮著DNA結合、轉錄調控等分子功能,并主要富集在PDGFR、EGFR、VEGFR、PI3K等信號通路,提示TP53野生型結直腸癌通過新的基因突變、激活以上通路促進腫瘤生長和進展。
綜上所述,雖然除發生部位外,TP53突變型和野生型結直腸癌存在相似的臨床病理形態學特征,但是2種亞型腫瘤的基因突變譜不同。TP53突變型結直腸癌更容易發生染色體不穩定性;而TP53野生型結直腸癌突變負荷增高,其可通過產生新的基因突變,激活非p53信號通路促進腫瘤生長。