馬小雯,楊巍,郝靚
(1.中國醫科大學法醫學院化學教研室,沈陽 110122;2.遼寧省法醫學生物證據重點實驗室,沈陽 110122;3.中國醫科大學司法鑒定中心,沈陽 110122;4.中國醫科大學臨床二系,沈陽 110122;5.遼寧省健康產業集團本鋼總醫院感染部,遼寧 本溪 117000)
乳腺癌是全球發病率最高的癌癥。2020年公布的全球癌癥數據顯示,乳腺癌新發病例高達226萬例[1]。乳腺癌的早期癥狀多不明顯,進展迅速,晚期可發生遠端轉移,直接威脅患者生命。浸潤型乳腺癌是乳腺腫瘤中高發的類型,其分化程度低,預后差,以浸潤性導管癌最為常見[2]。目前,雖然乳腺癌得到了廣泛研究,但發病機制仍不明確。
FAM110A定位于20號染色體的短臂。2007年,HAUGE在運用酵母雙雜交方法篩選參與細胞周期進程的中心體、微管相關蛋白的實驗中首次發現了FAM110家族蛋白。FAM110家族有3個成員定位于中心體,協助細胞周期的進展并參與微管的組織[3]。FAM110A的表達受到細胞周期的調控,與肝癌和前列腺癌的發生發展相關[4-5]。目前FAM110A在乳腺癌中鮮有研究,其作用機制尚不明確。本研究利用多種數據庫進行數據挖掘,分析FAM110A在乳腺癌中的表達及對預后的影響,為進一步研究FAM110A在乳腺癌發生發展中的作用機制和治療提供線索和依據。
1.1.1 Oncomine數據庫的數據提取和分析:在Oncomine數據庫(https://www.oncomine.org/resource/login.html)中根據本研究的需求設定篩選條件。(1)Gene:FAM110A;(2)Analysis type:cancer vs normal analysis;(3)Cancer type:breast cancer;(4)Data type:All;(5)P< 0.01,fold change >2,gene rank=top10%。
1.1.2 GEPIA數據庫的數據提取及患者預后分析:利用GEPIA數據庫(http://gepia.cancer-pku.cn/detail.php)對FAM110A的表達與分期和預后的關系進行預測。設置分期篩選條件為(1)Gene:FAM110A;(2)Datasets selection:BRCA;(3)Log Scale:yes。設置預后篩選條件為(1)Gene:FAM110A;(2)Methods:Overall Survival;(3)Group cutoff:median;(4)Hazards ratio:yes;(5)95% confidence interval:yes;(6)Axis units:months。
1.1.3 UALCAN數據庫的數據提取和分析:利用UALCAN數據庫(http://ualcan.path.uab.edu/)補充驗證FAM110A在腫瘤不同分期、不同分子分型中的表達差異,并探究FAM110A表達與基因甲基化水平的關系。設置篩選條件為(1)Enter gene symbol:FAM110A;(2)TCGA dataset:Breast invasive carcinoma;(3)Links for analysis:Expression;(4)based on:individual cancer stages/major subclasses。
1.1.4 標本來源:利用人類蛋白圖譜(human protein atlas,HPA)數據庫(https://www.proteinatlas.org/)獲取FAM110A在乳腺癌組織和正常組織中的免疫組織化學染色圖片。
1.1.5 蛋白-蛋白相互作用網絡分析:通過STRING數據庫(https://www.string-db.org/)預測FAM110A相互作用蛋白。
1.1.6 共表達基因聚類分析及分子調控網絡構建:從cBioPortal平臺(http://www.cbioportal.org/)獲 取TCGA數據庫中FAM110A在乳腺癌中的共表達基因,然后運用DAVID數據庫(https://david.ncifcrf.gov/)對相關度較高的基因進行基因本體論(gene ontology,GO)及京都基因和基因組(Kyoto encyclopedia of gene and genomes,KEGG)富集分析。采用STRING數據庫構建共表達分子調控網絡,利用Cytoscape中的Cytohubba插件計算共表達分子網絡中節點連接度,選取連接度最高的10個節點。
采用GraphPad Prism 9軟件行統計學分析,采用t檢驗統計乳腺癌與正常組織之間FAM110A的表達差異。FAM110A不同病理分期間的表達差異比較采用單因素方差分析。采用Kaplan-Meier法進行生存分析,組間生存率采用log-rank檢驗,P< 0.05為差異有統計學意義。
根據設置的篩選條件,Oncomine數據庫共有205項涉及FAM110A在不同腫瘤與正常組織比較的研究結果。其中10項研究有統計學意義。FAM110A在所有腫瘤中8項呈高表達,2項低表達。在乳腺癌中6項呈高表達。在GEPIA數據庫中FAM110A在11種腫瘤組織中呈顯著高表達。見圖1。

圖1 FAM110A在所有腫瘤中的表達Fig.1 Expression of FAM110A in all cancer types
按照篩選條件檢索GEPIA數據庫,結果顯示,乳腺癌組織與正常組織相比,其FAM110A表達顯著上調,差異有統計學意義(P< 0.05),見圖2A。
檢索HPA數據庫,共得到3例FAM110A正常乳腺組織樣本中的免疫組織化學圖片,12例乳腺癌組織樣本中的免疫組織化學圖片(圖2B)。乳腺癌樣本中FAM110A呈高表達。在細胞內,FAM110A高表達于G2、S期,表達水平與細胞周期密切相關(圖2C)。

圖2 FAM110A在乳腺癌中高表達Fig.2 FAM110A is highly expressed in breast cancer
利用UALCAN數據庫針對乳腺癌的分子分型進行在線分析。結果顯示,與正常組織相比,FAM110A在Luminal、HER(2+)、三陰性乳腺癌中的表達量均呈高表達(P均<0.05)。且除去Luminal與HER(2+)之外,各個分型之間FAM110A表達量差異均有統計學意義,見圖3。

圖3 FAM110A在不同分型乳腺癌中表達水平Fig.3 Expression of FAM110A in different types of breast cancer
運用GEPIA分析FAM110A表達水平與乳腺癌患者預后的關系,結果顯示,FAM110A高表達組總生存期(overall survival,OS)劣于低表達組(HR=1.4,P=0.043),見圖4A。在GEPIA數據庫中在線分析FAM110A表達與乳腺癌分期的關系,結果顯示,不同分期之間FAM110A的表達差異有統計學意義(F=2.84,P=0.023 3),見圖4B。利用UALCAN數據庫在線分析得到相似結果。

圖4 FAM110A高表達提示不良預后Fig.4 High level of FAM110A expression is associated with poor prognosis
運用STRING數據庫得到FAM110A蛋白-蛋白相互作用網絡圖,富集P值為0.028 9,與FAM110A存在相互作用的蛋白節點有10個,分別為FAM19A1、SMIM13、CSPP1、GPANK1、IL9、ANKRD9、ZDHHC18、TMEM132D、FAM135B和KCTD3(圖5)。檢索cBioportal數據庫,乳腺癌中FAM110A的共表達基因共有20 033個(P均<0.05)。相關度最高的10個基因為MRPS26、PPDPF、SNRPB、NSFL1C、SLC2A4RG、SCAND1、ITPA、MRPL41、ARRDC1、RBCK1。GO富集分析結果顯示,FAM110A的共表達基因主要參與DNA模板轉錄調控,線粒體平移延伸等生物途徑。KEGG通路富集分析結果顯示,FAM110A的共表達基因主要參與泛素介導的蛋白質水解,癌癥的中心碳代謝等通路。

圖5 FAM110A共表達分子網絡Fig.5 Co-expressed network of FAM110A
乳腺癌是起源于乳腺上皮組織的惡性腫瘤,發病率居全球女性惡性腫瘤的首位。其預后較好,患者生存率相對較高[6]。目前,乳腺癌主要根據臨床病理和分子分型進行治療,但三陰性乳腺癌和難治性多發耐藥乳腺癌仍缺乏有效的治療靶點[7]。因此,尋找乳腺癌的新治療靶點和預后標志物對于乳腺癌的臨床治療極為重要。
FAM110A是FAM110家族成員,作為中心體相關蛋白,參與細胞周期調控[3]。有研究[4]表明,FAM110A的高表達與肝癌的發生和較差預后相關,但其在乳腺癌中的研究較少。本研究利用多種數據庫分析FAM110A在乳腺癌中的表達水平及意義。
對Oncomine數據庫中16項對比FAM110A在乳腺癌和正常組織中表達差異的研究進行分析,結果顯示,FAM110A在乳腺腫瘤中呈高表達,可能誘導乳腺腫瘤的發生。FAM110A在不同分型乳腺癌中表達有統計學差異,可作為乳腺癌分型的標志物。分析HPA數據庫中FAM110A的免疫組化結果,乳腺癌中FAM110A的表達高,定位于核質、胞質及囊泡中,高表達于S期和G2期。這與HAUGE等[3]研究結果一致。
GEPIA數據庫分析結果顯示,FAM110A隨著乳腺癌分期的進展表達量顯著上升,高表達的患者預后更差。甲基化是DNA的一種表觀遺傳修飾,對基因表達有影響。乳腺癌組織中FAM110A基因甲基化水平顯著降低,提示甲基化修飾可能是上調FAM110A在乳腺癌中表達的重要因素。
STRING數據庫分析結果顯示,FAM110A可能與ANKRD9、FAM135B、CSPP1等分子存在相互作用。ANKRD9是一種E3泛素連接酶,通過蛋白酶體途徑發揮抑癌作用[8]。FAM135B是一種細胞周期調控蛋白,可以正調控下游PI3K/Akt/mTOR通路[9]。有絲分裂相關蛋白CSPP1通過對于動點微管動態性的調節介導染色體的運動,保證有絲分裂的準確性[10]。FAM110A可與上述蛋白互作影響腫瘤發生。隨后構建乳腺癌中FAM110A的共表達基因調控網絡,通過研究關鍵節點的功能推斷共表達基因網絡參與的重要生物學途徑。其中MRPL14作為連接度最高的節點,已被證實與乳腺癌相關[11-12]。
本研究對于FAM110A的共表達基因進行功能分析,探究其參與的生物途徑及通路。GO富集分析結果顯示,FAM110A的共表達基因主要參與DNA模板轉錄調控等生物途徑。KEGG通路富集分析結果顯示,FAM110A的共表達基因主要參與泛素介導的蛋白水解等通路。
綜上所述,FAM110A在乳腺癌中呈高表達,且在不同分型乳腺癌中有統計學差異。FAM110A的表達水平與患者預后呈負相關,與分期呈正相關,可作為新的乳腺癌預后標志物。目前對于FAM110A在乳腺癌中作用機制的研究仍較少。本研究初步預測了FAM110A參與的生物途徑及信號通路,為乳腺癌的診治及機制研究提供了思路。