黃小燕,蘇琪盛,丘程程,朱尚勇
(廣西醫科大學第一附屬醫院超聲科,廣西 南寧 530021)
子宮內膜癌(UCEC)是女性三大婦科惡性腫瘤之一。近10年,UCEC的死亡率年增長率約1.4%,其發病率逐漸上升[1]。子宮及雙側附件切除是UCEC的標準治療手段,對于遠處轉移的患者,輔以放、化療及激素治療,這些治療手段給患者創傷性大。分子靶向治療因其創傷小、療效優的特點,成為有效的UCEC治療策略。因此,鑒別UCEC特異的分子標志物實現分子靶向治療尤顯重要[2]。然而,由于對UCEC的組織病理學分類和異質性認識不足,識別其分子生物標記物仍具挑戰。
腫瘤干細胞(CSCs)是腫瘤中具有自我更新、高增殖和多向分化潛能的一類細胞,具有促腫瘤復發、轉移和耐藥的作用[3]。CSCs的干性與多數癌癥的腫瘤內異質性相關。腫瘤內異質性包含細胞表面標記物及表型異常,而細胞表面標記物以及基因突變類型常被認為是腫瘤病理分類和治療的依據[4]。有研究表明UCEC的發生與CSCs的干性有關[5]。本研究著重于從CSCs干性特征的角度識別與UCEC的組織病理學分類和異質性相關的特征基因。
UCEC患者的納入標準:(1)組織病理學證實為原發性UCEC患者;(2)完整RNA-Seq數據及臨床數據的患者(如年齡,病理分級、生存時間)。排除標準:(1)非原發性UCEC患者;(2)臨床資料不完整。本研究納入23個正常子宮內膜組樣本及552個UCEC樣本。
mRNAsi用于評估腫瘤細胞的去分化程度,mRNAsi值經過1類邏輯回歸機器學算法得到[3],其值的區間為[0,1],值越趨近于1,則表示腫瘤細胞與干細胞的相似程度越大。根據腫瘤樣本的mRNAsi的中位數將患者分為高mRNAsi組與低mRNAsi組,并通過R語言中的“survival”包進行生存分析。Wilcoxon秩和檢驗分析UCEC病理分級與不同年齡間mRNAsi值的差異。最后采用R語言中的“beeswarm”包進行結果可視化處理。
通過Wilcoxon秩和檢驗篩選樣本的差異基因,篩選標準:假陽性率(FDR)<0.05及|log2(FC)|≥1。FC為樣本表達量的差異倍數。
運用R語言中的“WGCNA”包構建具有近似無尺度特性的加權基因共表達網絡(WGCNA),篩選與腫瘤干細胞高度相關的模塊[6]。通過hclust函數對樣本進行聚類分析,使用pickSoftThreshold函數確定軟閾值,設定模塊中最小基因數為30,切割高度的閾值為0.25,采用拓撲重疊(TOM)計算,并運用動態切割法識別共表達基因模塊[7],構建模塊樹狀圖。
選擇與臨床性狀相關性最高的模塊,計算模塊內每個基因的基因顯著性(GS)與模塊隸屬度(MM)的相關性,設定篩選模塊內關鍵基因的閾值為MM>0.8,GS>0.5。
GO和KEGG分析對關鍵基因行功能注釋及通路富集[8],采用“clusterProfiler”包進行富集分析。當FDR<0.05時,認為結果具有統計學意義。通過在線工具STRING(https://www.string-db.org/)[9]進行蛋白網絡互作分析(PPI),并用Cytoscape軟件實現可視化[10]。PPI中關鍵節點的篩選閾值為最低篩選分數≥0.8。以節點數最高的基因作為樞紐基因。
運用R軟件進行數據處理和統計學分析,P<0.05認為差異具有統計學意義
與正常子宮內膜組比較,腫瘤組的mRNAsi表達量與UCEC患者的病理分級及年齡(以65歲為界)成正相關(P<0.001)(圖1A 和 B)。

圖1 mRNAsi與UCEC患者臨床病理分級及年齡的相關性
在TCGA數據庫中得到575個樣本(包括552個UCEC組及23個正常組),篩選出6267個差異表達基因,包括2406個下調基因和3861個上調基因(圖2)。

圖2 差異基因的篩選:紅色基因代表在樣本中上調的基因,綠色表示下調的基因
根據“WGCNA”包對樣本行聚類分析獲得16個關鍵模塊。為了保證無尺度網絡的準確性,其篩選的軟閾值為4(R2=0.95)(圖3A)。通過動態剪切樹算法分割模塊,形成模塊樹狀圖(圖3B),計算16個模塊內的基因與mRNAsi及表觀調控的mRNAsi(EREG-mRNAsi)的相關性,其中藍綠色模塊與mRNAsi呈明顯的正相關且相關系數最高(圖3C,r=0.70,P=4e-80),棕色模塊與mRNAsi呈顯著負相關(r=-0.55,P=2e-42)。因此,我們選擇藍綠色模塊進行分析篩選得到關鍵基因(圖3D)。以 MM>0.8,GS>0.5為篩選標準,共得到 44個與腫瘤干細胞干性相關的基因(P<0.01),這些基因在UCEC組中上調(圖4A,B)。在這44個基因的相關性分析結果中,DEPDC1和CENPI及CENPE 的相關性最高(r=0.87)(圖4C)。
對44個基因構建蛋白互作網絡(PPI),運用Cytoscape軟件進行可視化處理,節點數最多的10個基因為TTK、NCAPH、NCAPG、KIF15、KIF11、CDCA8、CCNB1、CCNA2、BUB1B 和 BUB1(圖5)。GO和KEGG功能富集分析得到關鍵基因主要富集于細胞周期調控,有絲分裂姐妹染色單體分離,同源重組修復等通路(圖6)。
在多種癌癥組織中發現癌細胞可表現出與干細胞特性相似的生物學功能,包括:(1)自我更新調節機制;(2)腫瘤細胞可能來源于正常干細胞[11]。并且有研究表明腫瘤組織中存在小部分具有無限增殖能力的腫瘤干細胞(CSCs)群體[12]。在概念上提出干細胞樣癌細胞的數年后,學者首次在白血病模型中證實CD34+CD38-白血病細胞表現出骨髓造血干細胞特征[13]。同時實體瘤內的CSCs(CD44+CD24-/lowLineage-細胞)已在乳腺癌、腦、結腸、胰腺、肝和肺癌中發現。因此,CD34+,CD44+被認為是在癌癥組織中獨特的CSCs標記物[14]。

圖3 關鍵模塊的篩選

圖4 藍綠色模塊中的差異基因篩選及基因間的相關性分析

圖5 10個樞紐基因的篩選:44個關鍵基因的PPI圖,及10個樞紐基因的PPI圖

圖6 GO和KEGG分析
本研究采用WGCNA篩選出的10個樞紐基因參與了多種腫瘤的發生,其功能主要富集在有絲分裂核分裂、核染色體分離、紡錘體檢查點功能和同源重組修復通路中,這與多位學者的研究結果一致[15]。Mps1(TTK)的表達水平降低導致乳腺癌細胞的有絲分裂異常[16]。CDCA5和CDCA8表達異常影響了細胞核的分裂,主要參與膀胱癌的細胞周期過程[17]。Imai T等人的研究表明,KIF11在食管鱗狀細胞癌(ESCC)和結直腸癌(CRC)組織中的CSCs里發揮著重要作用[18]。HuiCai等人的研究報道CCNB1通過調控細胞周期來影響子宮內膜癌的發病風險[19],此外,在腦癌CSCs中,CCNB1和BUB1B可影響與有絲分裂和紡錘體檢查點功能有關的蛋白分泌,從而調控CSCs的增殖[20]。然而,這10個樞紐基因與UCEC中CSCs的干性特征的關系尚未明確。本次研究發現,這些基因的失調可能與UCEC中CSCs的干性特征有關。
CSCs位于腫瘤細胞層級的頂端,并具有建立和驅動腫瘤發生的獨特能力。我們通過WGCNA分析獲得了與UCEC干性特征相關的樞紐基因(即TTK、NCAPH、NCAPG、KIF15、KIF11、CDCA8、CCNB1、CCNA2、BUB1B 和 BUB1)。而這些基因在調節細胞周期中起著至關重要的作用,可能影響UCEC的干細胞維持。因此,我們的研究有助于深入理解UCEC的分子機制,我們獲得的這10個樞紐基因可能為研究靶向治療UCEC的治療靶點提供參考。