李 強,王 喻,黃東紅,余 剛,陳桂芳
(1.中山火炬開發區醫院泌尿外科,廣東 中山 538437; 2.中山大學附屬第三醫院泌尿外科,廣州 510630)
前列腺癌已成為全球癌癥死亡的主要原因之一[1-3],隨著人口老齡化及前列腺癌篩查的開展,前列腺癌的發病率將進一步升高。目前對于前列腺癌的篩查主要依靠前列腺特異性抗原(prostate-specific antigen,PSA),但其特異性不高且無法早期預測腫瘤轉移[4]。另有研究表明PSA的篩查并不能明顯降低前列腺癌死亡率[5-6],因此急需探索一種新型的前列腺癌早期診斷及轉移預測標志物,以給予早期、精準的治療。
腫瘤的發生、發展常伴隨著成千上萬個信號通路的改變,基礎實驗只能對其中有限的通路進行研究,無法整體、全面揭示腫瘤的生物學行為,而生物信息學分析結合了分子生物學與信息技術的優點,對測序數據進行全面、系統的分析,更好地詮釋了腫瘤發生、發展的分子機制。特別是在二代測序技術的支持下,生物信息學分析現已飛速發展[7]。基于以上優點,本研究利用生物信息學分析對癌癥基因組圖譜數據庫(The Cancer Genome Atlas,TCGA)和基因芯片公共數據庫(Gene Expression Omnibus,GEO)進行分析,期望發現與前列腺癌轉移相關的基因,為前列腺癌轉移的早期診斷及治療提供新的治療靶點。
1.1測序數據及一般資料
1.1.1測序數據 前列腺癌轉移相關基因數據主要從GEO(www.ncbi.nlm.nih.gov/)數據庫中收錄的相關芯片數據中挖掘。經過文獻復習后最終選擇GSE6919數據集作為前列腺癌轉移基因數據集進行分析,該數據集包含GPL8300芯片平臺采集的65個原發性腫瘤樣本和25個轉移樣本。而前列腺癌差異分析數據則從TCGA(https://cancergenome.nih.gov/)中獲取,包含52個正常樣本和498個腫瘤樣本。
1.1.2一般資料 選擇2015年1月至2018年12月于中山火炬開發區醫院及中山大學附屬第三醫院手術的前列腺增生及前列腺癌患者組織標本。前列腺增生癥患者均接受了經尿道前列腺切除術,前列腺癌患者均接受了前列腺癌根治術或姑息性經尿道前列腺切除術,手術標本均經過病理學確診。所有患者術前均未行內分泌治療、化療或放療。
1.2方法
1.2.1數據預處理及差異表達 首先刪除存在數據注釋的樣本及基因表達平均值低于1的基因數據,處理后的數據進行基因篩選。從TCGA和GEO數據庫中獲取前列腺癌測序數據,利用R 3.5.1軟件及DESeq、heatmap2、ggplot2、clusterProfiler等R軟件包進行分析。根據數據庫信息將測序數據分為對照組(正常前列腺組織和前列腺增生組織),局限性前列腺癌組和轉移性前列腺癌組,對數據進行過濾和標準化后進行差異性分析,其中差異基因的篩選條件為P<0.05,且log2FC≥2。
1.2.2基因模塊的構建與篩選 將TCGA數據集中的差異基因和GSE6919中的差異基因取交集,得到的結果放回兩個數據集中,分別使用corrplot軟件包進行相關性分析,得出交集基因在兩個數據集中的基因共表達模塊,再將兩個數據中最大模塊的基因取交集,得出共表達系數最高的目的基因。
1.2.3差異表達基因的功能富集分析 利用R 3.5.1軟件中Cluster Profiler軟件包作基因本體論(Gene Ontology,GO)和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析。本研究主要針對GO富集分析中的分子功能、生物過程和細胞組分3個模塊以及KEGG通路進行分析。
1.2.4蛋白互作網絡及關鍵基因篩選 使用String(https://string-db.org/)對目的基因進行蛋白互作網絡分析,然后利用Cytoscape(http://www.cytoscape.org/)計算出關鍵基因并將其可視化。計算方法:使用MCC、MNC、Degree等進行計算,在所有算法中得分位于前3的基因視為關鍵基因。
1.2.5ACTA2的免疫組織化學檢測 本研究收集前列腺增生患者30例,前列腺癌87例(局限性前列腺癌40例,轉移性前列腺癌47例)的組織樣本,使用免疫組織化學染色以明確ACTA2的表達情況。免疫組織化學操作參考說明書,首先使用ACTA2單抗(1∶1 000,Abcam lnc.,MA,ab220179)對切片進行4 ℃ 孵育過夜,接著二抗37 ℃孵育30 min后顯色(Dako Diagnostics,Zug,Switzerland)。結果使用免疫組織化學染色評分(immunoreactive score,IRS)進行評估,IRS評分=染色程度×著色細胞百分比。染色程度:陰性0分,輕度1分,中度2分,重度3分;著色細胞百分比:0% 0分,<10% 1分,11%~50% 2分,51%~80% 3分,>80% 4分。IRS≥6分為高表達,<6分為低表達[8]。

2.1數據預處理及差異表達 TCGA包含52個正常樣本,498個腫瘤樣本,去除有注釋樣本,剩余44個正常樣本,473個腫瘤樣本;去除表達值低的基因后對剩余的31 314個基因進行分析。GSE6919用于分析的樣本數為65個原發性腫瘤樣本,25個轉移樣本,9 198個基因。對前列腺癌數據集進行差異性分析,獲得前列腺癌中在轉移和原發癌中差異表達的基因。其中GSE6919中轉移和非轉移差異表達基因共758個(上調370個,下調388個)。而TCGA數據集中差異表達基因共3 336個(上調1 161個,下調2 175個)。
2.2基因模塊的構建與篩選 將兩個數據集所獲得的差異表達基因進行venny分析,結果顯示前列腺癌轉移的兩個不同的數據集中,包含206個共同差異基因,GSE6919獨有的基因552個,TCGA獨有的基因3 130個,見圖1。采用R 3.5.1軟件中corrplot 軟件包對上述206個基因進行相關性分析,結果顯示在TCGA(圖2A)和GSE6919(圖2B)數據集中206個基因均主要構成3個模塊,而TCGA最大模塊與GSE6919最大模塊存在14個共有基因,見表1。

圖1 TCGA與GSE6919交集基因韋恩圖

基因差異倍數-TCGAP值-TCGA差異倍數-GEOP值-GEOMYLK0.240<0.0010.140<0.001ACTA20.390<0.0010.190<0.001MYH110.290<0.0010.080<0.001TPM10.360<0.0010.260<0.001LMOD10.320<0.0010.220<0.001CALD10.400<0.0010.360<0.001FLNA0.360<0.0010.240<0.001RND30.390<0.0010.340<0.001PPP1R12B0.400<0.0010.350<0.001KCNMB10.340<0.0010.340<0.001CHRDL10.260<0.0010.160<0.001CSRP10.360<0.0010.130<0.001SPARCL10.460<0.0010.380<0.001SYNM0.280<0.0010.180<0.001

圖2 交集的差異基因在TCGA數據集(2A)和
2.3差異表達基因的富集分析 對TCGA和GSE6919數據集中的最大模塊基因進行富集分析,見圖3,然后對14個交集基因進行單獨的富集分析,結果提示這14個基因主要富集到血管平滑肌收縮、局部黏著、Apelin信號通路、催產素信號通路、環鳥苷酸蛋白激酶G信號通路中,見圖4。

3A和3D:分子功能; 3B和3E:生物過程; 3C和3F:細胞組分; 3G和3H:KEGG通路分析

4A:分子功能;4B:生物過程;4C:細胞組分;4D:KEGG通路分析
2.4蛋白互作網絡及關鍵基因篩選 對14個目的基因進行蛋白互作網絡分析,結果顯示其中10個基因可能存在相互聯系:MYLK、ACTA2、MYH11、TPM1、LMOD1、CALD1、FLNA、RND3、PPP1R12B、KCNMB1。然后使用Cytoscape軟件對其進行可視化和關鍵基因的篩選,結果提示MYH11、MYLK和ACTA2是這10個基因的關鍵基因,見表2,調控著大多數的蛋白見圖5。

表2 關鍵基因的計算結果

圖5 蛋白互作網絡分析
2.5免疫組織化學 在前列腺癌組織中,ACTA2的表達較前列腺增生明顯降低,ACTA2的表達隨前列腺癌的進展逐漸下降,見圖6。前列腺增生組、局限性前列腺癌組、轉移性前列腺癌組的IRS分別為(7.43±0.49)分、(4.85±0.22)分、(2.66±0.27)分,各組比較差異有統計學意義(F=223.790,P<0.001),局限性前列腺癌組、轉移性前列腺癌組的IRS評分低于前列腺增生組,轉移性前列腺癌組低于局限性前列腺癌組(P<0.01)。Gleason評分≥7分的患者ACTA2低表達率高于Gleason評分<7分的患者(P<0.05);轉移性前列腺癌患者ACTA2低表達率高于局限性前列腺癌患者(P<0.05);不同年齡、PSA水平和病理分期患者的ACTA2低表達率比較差異無統計學意義(P>0.05)。見表3。

6a:前列腺增生; 6b:局限性前列腺癌; 6c:轉移性前列腺癌

表3 前列腺癌患者各臨床指標ACTA2表達水平比較 [例(%)]
PSA:前列腺特異性抗原
美國國家癌癥研究所公布的研究結果顯示,任何腫瘤的發生、發展都伴隨著一系列基因的高頻突變,并且相互間存在復雜的基因調控網絡[9]。傳統的分子生物學實驗只能研究有限的基因功能及通路,而作為集合了分子生物和信息技術優點的生物信息學分析可研究多基因調控事件在腫瘤發生、發展中的作用。
本研究從公共數據庫獲取前列腺癌相關數據,經過一系列的分析最終發現14個與前列腺癌轉移相關的基因,上述基因主要富集到血管平滑肌收縮、局部黏著、Apelin信號通路、催產素信號通路、環鳥苷酸蛋白激酶G信號通路中,提示上述基因可能通過這些通路促進前列腺癌的發生、發展。使用String對這14個基因進行蛋白互作網絡分析,結果提示其中10個基因存在相互作用,并且MYLK、ACTA2、MYH11可能發揮關鍵調控作用。MYH11廣泛存在于哺乳動物中,對機體的信號轉導、肌肉收縮及細胞器運動起調控作用。Wang等[10]研究發現,MYH11在結腸癌中低表達,且表達水平與腫瘤分期相關。Lu等[11]研究證明MYH11在膀胱癌中表達降低,且表達水平與患者腫瘤侵襲程度呈負相關。MYLK是一種鈣調蛋白依賴性蘇氨酸-絲氨酸激酶,廣泛存在于各種真核細胞及非肌肉性細胞,屬于免疫球蛋白超家族[12]。MYLK主要通過增強肌球蛋白酶活性促進肌球蛋白收縮和應力纖維的形成、黏著,最終導致細胞的遷移和分裂[13-14]。Minamiya等[15]首次報道了在復發轉移的非小細胞肺癌患者中MYLK mRNA的表達水平高于無復發轉移患者。Chen等[16]研究結果顯示MYLK mRNA的表達上調可調控胃癌細胞增殖、凋亡、侵襲與轉移。而Lee等[17]報道在結腸癌中MYLK mRNA相對于正常組織下調,本研究結果與Lee等[17]的研究結果一致。目前MYLK的下調機制仍不清楚,可能與DNA突變、MYLK假基因有關[18]。ACTA2主要分布于肌細胞,是收縮器的主要成分[19]。Jeon等[20]報道表皮生長因子和人類表皮生長因子受體2二聚體可調控ACTA2的表達進而影響乳腺癌的侵襲和轉移。Lee等[21]報道ACTA2可調控c-MET和FAK進而促進肺腺癌的轉移。可見,MYLK、MYH11和ACTA2均與平滑肌細胞功能相關,可能通過影響細胞的黏附、侵襲能力,進而導致前列腺癌的轉移。
為進一步驗證上述結果,本研究納入前列腺增生及前列腺癌患者共117例進行ACTA2免疫組織化學分析,免疫組織化學與上述研究結果一致。隨著前列腺癌的進展,ACTA2的表達也逐漸下降,當患者出現轉移時ACTA2的表達明顯降低。本研究結果顯示,Gleason評分≥7分的患者ACTA2低表達率高于Gleason評分<7分的患者(P<0.05),轉移性前列腺癌患者ACTA2低表達率高于局限性前列腺癌患者(P<0.05),表明ACTA2的下調可導致前列腺癌的進展。
綜上所述,MYLK、MYH11和ACTA2可能是導致前列腺癌轉移的關鍵基因,上述基因參與平滑肌細胞功能的調節,具有調控細胞的黏附、侵襲等功能。另外,本研究還證實ACTA2的下調與前列腺癌進展相關,提示該基因可能成為新的前列腺癌診斷標志物和治療靶點。