劉顯勝,王振國,高溫杰,于曉雙,任貴兵
乳腺癌是全球范圍內女性發病率和死亡率均排首位的惡性腫瘤[1]。據統計,僅2018年新發病例為208.9萬例,死亡62.7萬例[2]。近年來,隨著新一代測序技術和突變基因檢測技術在乳腺癌中的應用與發展[3],不斷有新的癌基因和抑癌基因被發現[4, 5],為乳腺癌精準治療提供了新的方向。然而部分患者因確診時間晚、病理分型差、對治療不敏感等原因,預后仍不甚理想[6],因此亟待進一步深入研究乳腺癌的發病機制及特異性標記物。卷曲螺旋結構域蛋白(coiled-coil domain-containing protein,CCDC)是一種由兩個或兩個以上的卷曲螺旋結構域組成的同寡聚體或寡聚體序列蛋白,可通過基因轉錄、調控細胞周期、介導細胞凋亡、影響細胞侵襲能力等多種途徑參與癌癥的發生發展過程[7]。近年來研究發現,CCDC蛋白在肺癌、甲狀腺癌、胃癌、結腸癌等多種惡性腫瘤中發揮抑癌作用[8-11]。卷曲螺旋結構域蛋白69(coiled-coil domain-containing protein 69,CCDC69)是近年來新發現的CCDC家族成員,定位于5號染色體長臂5q33.1,由296個氨基酸構成。研究發現,CCDC69能夠通過維持紡錘體的正常形態和功能,進而影響細胞分裂的準確性[12]。CCDC69可通過促進細胞周期依賴性激酶抑制蛋白(alternative reading frame,p14ARF)的表達和抑制p53蛋白的降解,增強卵巢癌細胞對化療的敏感性,并誘導細胞凋亡[13]。目前,關于CCDC69與乳腺癌的相關性研究尚不深入。本研究利用癌癥基因組圖集(the cancer genome atlas, TCGA) 數據庫,探討CCDC69在乳腺癌組織中的表達情況及潛在作用,為尋找乳腺癌的新的分子診斷途徑和靶向治療方案提供證據。
1.1 資料數據來源及預處理 從TCGA數據庫(https://www.cancer.gov/)下載了1108例女性乳腺癌組織樣本和112例癌旁組織樣本的mRNA表達譜及相關臨床數據。利用R語言分析包edgeR(http://www.bioconductor.org/packages/release/bioc/html/edgeR.html)對原始mRNA表達數據進行基于加權截尾均值化M值(trimmed mean of M-values,TMM)標準化[14, 15],并進行log2轉換用于后續分析。
1.2 數據篩選及分組 篩選出同一患者的癌組織及癌旁組織基因表達信息的病例111例,用于癌組織及癌旁組織的差異表達分析。篩選出具有完整臨床信息(年齡、TNM分期、腫瘤體積、淋巴結轉移、遠處轉移、雌激素受體、孕激素受體、人類表皮生長因子受體2、生存信息)的病例818例,用于臨床相關分析。根據CCDC69的表達量進行排序,選取中位值將818例患者分為高表達組和低表達組,用于預后相關分析。
1.3 基因集富集分析 使用基因富集分析(Gene Set Enrichment Analysis,GSEA)軟件,選擇“h.all.v6.2.symbols.gmt” 為參照基因集,根據1108例乳腺癌組織CCDC69的表達量建立連續表型,按默認加權富集統計(default weighted enrichment statistic)的方法,設置置換次數為1000次, 計算CCDC69與參照基因集的皮爾森相關系數,并按照相關系數大小進行基因排序,計算富集系數,設置標準化P<0.05, 錯誤發現率(false discovery rates, FDR)<0.25為顯著性富集標準。
1.4 統計學處理 使用 SPSS 25. 0 進行統計分析。癌組織與癌旁組織的差異分析用配對t檢驗。臨床病理參數相關性分析采用獨立樣本t檢驗。生存分析采用 Kaplan-Meier 法和Log-rank 檢驗。單因素和多因素分析采用Cox比例風險回歸模型分析,并計算風險比(HR)及其95%可信區間(Cl),P<0.05為差異有統計學意義。
2.1 CCDC69在癌組織與癌旁組織中的差異表達 CCDC69在同一患者的癌組織中的表達水平(9.922±1.126)低于癌旁組織(12.571±1.388),差異具有統計學意義(P<0.001)。提示在乳腺癌的發生發展過程中,CCDC69的表達可能受到抑制(圖1)。

圖1 CCDC69在乳腺癌組織和癌旁組織的表達量比較
2.2 CCDC69表達水平與乳腺癌患者臨床病理指標的相關性 CCDC69的表達水平與患者的年齡(P=0.020)、腫瘤體積(P=0.027)密切相關,而與TNM分期、淋巴結轉移情況、遠端轉移情況、雌激素受體(ER)表達情況、孕激素受體(PR)表達情況和人類表皮生長因子受體2(Her-2)表達情況等指標無明顯相關性(P>0.05,表1)。


臨床指標例數CCDC69表達量tP年齡(歲) ≤656109.940±1.1212.3240.020 >652089.730±1.136TNM分期 Ⅰ~Ⅱ6269.867±1.123-0.8940.372 Ⅲ~Ⅳ1929.950±1.147腫瘤體積(cm) ≤221710.029±1.0912.2210.027 >26019.835±1.138淋巴結轉移情況 無4029.884±0.058-0.0620.950 有4169.889±1.091遠端轉移情況 無8039.896±1.1231.7480.081 有159.383±1.301ER 陰性2019.834±1.278-0.6270.531 陽性6179.902±1.076PR 陰性2759.821±1.258-1.1190.264 陽性5439.920±1.057Her-2 陰性6959.908±1.1461.1290.259 陽性1599.796±1.051
2.3 CCDC69表達水平與乳腺癌患者預后的相關性 CCDC69的表達水平與乳腺癌患者總體生存期相關(P=0.004),高表達組患者總體生存期明顯長于低表達組患者,提示CCDC69低表達可能是一種不良預后因素(圖2)。在單因素分析中,CCDC69的表達量、患者年齡、TNM分期、腫瘤體積、淋巴結轉移、遠端轉移能影響患者預后(P<0.05)。多因素分析提示CCDC69的表達量、患者年齡、TNM分期、遠端轉移是影響患者預后的獨立危險因素(P<0.05,表2)。

圖2 CCDC69表達水平與乳腺癌患者預后的相關性

表2 影響乳腺癌患者預后的單因素和多因素分析
2.4 CCDC69功能富集分析 GSEA提示, 在乳腺癌樣本中,CCDC69富集到MYC信號通路、E2F信號通路、未折疊蛋白反應、糖酵解基因集,且與上述基因集呈負相關,說明CCDC69可能通過調節以上4條通路發揮抑制乳腺癌作用(表3)。

表3 CCDC69負相關的乳腺癌樣本富集的基因集
乳腺癌是女性最常見的惡性腫瘤,需要根據TNM分期和ER、PR、Her-2的表達情況及其他基因檢測結果,選擇個體化的治療策略,并為患者復發風險和生存質量評估提供指導。隨著對CCDC蛋白家族研究的深入,越來越多的證據表明CCDC蛋白在一些惡性腫瘤中發揮著重要作用,其中CCDC170與雌激素受體1基因融合可增加乳腺癌的侵襲性和復發率[16],CCDC8在乳腺癌組織中的表達量低于良性組織,可能起到抑制乳腺癌發生發展的作用[17]。
本研究基于TCGA數據庫,首次探討了CCDC69與乳腺癌的相關性。通過111例癌組織與癌旁組織配對樣本基因表達數據發現CCDC69在乳腺癌組織中的表達量較正常乳腺組織下降。基于818例具有完整臨床資料的患者樣本基因表達數據,發現CCDC69的表達量與患者年齡和腫瘤體積相關,且CCDC69高表達的患者總體生存期明顯長于低表達患者,Cox回歸分析進一步證實CCDC69 mRNA低表達是影響總生存期的獨立危險因素,說明CCDC69在乳腺癌的發生發展過程中可能起到抑制作用。
此外,本研究通過對1108例乳腺癌樣本中全基因測序數據進行基因富集分析,進一步探討了CCDC69抑制乳腺癌的可能機制。研究表明,MYC基因是乳腺癌中重要的原癌基因,與腫瘤細胞遷移和免疫逃逸密切相關[18]。E2F轉錄因子家族是調控細胞周期的重要蛋白,可通過調節靶基因的轉錄來控制乳腺癌細胞增殖及凋亡[19]。另外,腫瘤細胞生長過程中需消耗大量的營養和氧氣,普遍存在著微環境缺氧、營養匱乏、pH改變等情況,而未折疊反應和糖酵解途徑有利于腫瘤在此環境中生存[20-22]。因此,結合GSEA結果,CCDC69可能通過抑制MYC信號通路、E2F信號通路、未折疊蛋白反應和糖酵解途徑發揮抑制乳腺癌作用。
綜上所述,本研究利用生物信息學方法揭示了CCDC69作為乳腺癌預后標志物的潛在可能性,并對CCDC69在乳腺癌中的作用機制提出假設,為臨床診治乳腺癌提供新的思路。