韋 怡,甘 翔,陳江靜,劉美琳,韋麗婷,黃玲玲△
(1.廣西醫科大學第一附屬醫院 南寧,530021;2.桂林醫學院科學實驗中心 桂林,541000;3.廣西疾病蛋白質組學研究重點實驗室 桂林,541000)
卵巢惡性腫瘤是女性生殖器常見的三大惡性腫瘤之一,分為多種類型,其中以上皮細胞來源的上皮性卵巢癌(epithelial ovarian cancer,EOC)最為常見,約占所有卵巢腫瘤的90%[1]。卵巢惡性腫瘤早期常無明顯癥狀,單獨使用糖類抗原125(CA125)、陰道超聲進行篩查時易漏診[2-3]。病變發現時多已至晚期[4],晚期卵巢癌(ovarian cancer,OC)5 年生存率,國際婦產科學聯合會(FIGO)Ⅲ期僅為34%,Ⅳ期僅為15%[5]。因此了解EOC 發生發展的分子機制并制定有效的診療策略極為重要。
近年來,關于微小RNA(microRNA)功能與疾病的關系的研究是一個熱點。microRNA是一類含有約22個核苷酸的小內源性非編碼RNA分子[6],通過與信使RNA(mRNA)分子中的互補序列的堿基配對,在RNA沉默和轉錄后基因表達調控中起著關鍵作用。有研究表明,microRNA 是基因表達和細胞周期調控機制的關鍵因子,對維持OC 細胞的分化狀態起重要作用[7]。本研究主要運用GEO(gene expression omnibus database)多個芯片的數據進行分析以提高樣本量,同時借助GEPIA2(gene expression profiling interactive analysis)在線網站中TCGA(the cancer genome atlas)和GTEx(genotype-tissue expression)的數據對預測mRNA 進行篩選,提高數據可靠性。通過對EOC microRNA-mRNA 的分析及驗證,尋找提示EOC的潛在的生物標志物。
1.1 數據收集及處理 在GEO DataSets(https://www.ncbi.nlm.nih.gov/,2022-02-12)中,以“microRNA and ovarian cancer”為關鍵詞進行搜索,剔除細胞系或EOC 患者血清樣本或以正常輸卵管作為對照組的EOC 數據集,篩選出包含正常卵巢組織和EOC組織樣本的數據集,分為對照組和EOC組。利用sva包進行歸一化處理,limma包進行數據差異分析,滿足|log2FC|>1 且adj.P.Val<0.05 為差異microRNAs。
1.2 差異microRNAs 下游靶基因的預測 使用在線網站miRNet 2.0(https://www.mirnet.ca/,2022-02-14)、TargetScanHuman 8.0(http://www.targetscan.org/vert_80/,2022-02-14)、miRDB(http://mirdb.org/,2022-02-14)進行差異microRNA 下游靶基因的預測。并且使用Venny 2.1(https://bioinfogp.cnb.csic.es/tools/venny/index.html,2022-02-14)取3個網站預測的下游靶基因的交集,以提高數據的可靠性。
1.3 GO 功能富集和KEGG 通路分析 通過WEBbased GEne SeT AnaLysis Toolkit 在線網站(http://www.webgestalt.org/,2022-02-15)對共同靶基因進行KEGG(Kyoto Encyclopedia of Genes and Genomes,2022-02-15)通路和GO(Gene Ontology,2022-02-15)功能富集分析。GO功能富集包括分子功能(MF)、生物過程(BP)和細胞組成(CC)3 個部分。
1.4 蛋白質-蛋白質相互作用(PPI)網絡分析
用String 11.0(https://string-db.org/cgi/input.pl,2022-02-15)在線數據庫建立PPI 網絡分析,以直觀了解它們之間的相互作用。
1.5 篩選差異mRNA 通過GEPIA2(http://gepia2.cancer-pku.cn/#index,2022-02-16)的差異表達分析功能對EOC及正常卵巢的數據進行差異分析,使用ANOVA 的方法進行計算,并下載最終結果。將滿足P<0.01 且|log2FC|>1條件的定義為差異mRNA。將通過3個網站預測得到的下游靶基因與篩選得到的差異mRNA取交集,最終納入與其上游microRNA表達負相關的關鍵靶基因。
1.6 分析關鍵靶基因 利用在線GEPIA2對關鍵靶基因進行生存分析,用Overall Survival的方法,以中位數作為界值分為高表達和低表達,以Logrank P<0.05 認為差異有統計學意義。同時,利用該數據庫中病理分期圖的功能,對關鍵靶基因進行分析,以P<0.05為差異有統計學意義。
1.7 組織標本來源及實時熒光定量聚合酶鏈式反應(RT-qPCR)本研究共包括36 例EOC 患者和24例卵巢正常的患者(對照組)的卵巢組織。60 例卵巢組織皆通過卵巢切除術獲得,其中對照組的卵巢組織取自子宮肌瘤或子宮內膜癌切除術。所有樣本均為2020 年6 月至2022 年1 月自廣西醫科大學第一附屬醫院收取。該項目經廣西醫科大學倫理委員會批準。患者術前未接受治療,術后進行蘇木精-伊紅(HE)染色且病理檢查診斷為EOC或正常卵巢組織。所有樣本均根據FIGO進行分類。
TRIzol 試劑用于從卵巢組織中提取總RNA。根據說明書使用PrimeScript RT reagent Kit with gDNA Eraser(Takara)試劑盒進行互補DNA(cDNA)合成。并使用RT-qPCR 方法檢測關鍵mRNA在EOC和正常組織中的表達。擴增條件如下:程序在95 °C 下啟動10 min,然后通過RT-qPCR 系統進行40 個周期的95 °C 反應15 s 和60 °C 下反應1 min。根據試劑盒All-in-One?RT-qPCR Detection Kit 2.0 的說明書對microRNA進行逆轉錄及RT-qPCR 擴增,擴增條件如下:程序在95°C 下預變性10 min,然后在95 ℃反應15 s,58°C下進行20 s,72 ℃反應40 s條件下反應40個循環。mRNA和microRNA水平使用2?ΔCT[8]進行計算,前者以β-actin作為內參,后者以U6作為內參。
1.8 統計學方法 采用SPSS 17.0 軟件對數據進行統計分析,計量資料以中位數(四分位數間距)[M(P25~P75)]表示,兩組間比較采用秩和檢驗,用GraphPad Prism 8 進行數據可視化分析。曲線下面積(AUC)、靈敏度、特異度、約登指數等用受試者工作特征曲線(ROC 曲線)分析求得,用SPSS 17.0 生成可視化圖像。以P<0.05 為差異有統計學意義。
2.1 microRNAs 數據集篩選 在GEO 數據庫中篩選出GSE119055、GSE83693、GSE53829 3個符合條件的microRNA表達數據集。其中GSE119055包括3例正常卵巢組織,6例EOC組織;GSE83693包括4例正常卵巢組織,16 例EOC 組織;GSE53829 包括14 例正常卵巢組織及6 例卵巢癌交界組織,39 例EOC 組織。并將上述樣本分為EOC 組與對照組進行分析。
2.2 篩選差異microRNAs并獲取其下游靶基因
分別通過sva 包及limma 包對數據進行歸一化分析和差異分析后,篩選得到8 個差異microRNAs(包括2 個上調microRNA、6 個下調microRNA,見表1、圖1)。并用miRNet、miRDB、TargetScanHuman 8.0 這3 個在線網站獲取差異microRNAs 的交集靶基因共226個。

表1 EOC 的3 個芯片通過sva 包及limma 包分析后得到的差異microRNAs

圖1 差異分析做火山圖(紅色為上調microRNA,綠色為下調microRNA)
2.3 GO 功能富集和KEGG 通路分析 使用WEBbased GEne SeT AnaLysis Toolkit 在線網站對226 個共同差異基因進行GO 功能的富集分析,發現富集到的BP 變化主要有:biological regulation 和metabolic process 等。富集到的CC 變化主要有:nucleus、membrane和membrane-enclosed lumen等。富集到的MF 變化主要有:protein binding 和ion binding等(圖2A)。
KEGG 通路分析顯示主要富集于phosphatidylinositol signaling system,neurotrophin signaling pathway,long-term potentiation等生物途徑(圖2B)。
2.4 PPI網絡的構建 從String獲得的PPI網絡,共有226個節點,363條線,其中60個節點是獨立存在的,余166個節點存在相互作用線(圖2C)。

圖2 差異microRNA靶基因的富集分析及PPI網絡構建
2.5 差異表達關鍵mRNA 的鑒定 從GEPIA2 獲得7 638 個差異mRNAs(舍去沒有匹配上Gene Symbol 號的mRNA,最終獲得5 004 個下調,2 611個上調)。將篩選得到的差異mRNAs 與上述預測得到的差異microRNAs的靶基因取交集后,得到28個下調mRNAs,15個上調mRNAs,見表2。

表2 差異表達關鍵基因一覽表
2.6 關鍵基因的分析 利用GEPIA2中424例EOC組織的數據,對43個關鍵基因的總生存期進行生存分析。發現高表達MLLT6、TIAM2的EOC患者較低表達患者的生存率低(Log rank P<0.05),提示高表達MLLT6、TIAM2的EOC 患者的預后較差,見圖3A。
通過對不同病理分期患者的基因表達量進行分 析,發 現MLLT6、MSI1、PKMYT1、PLAGL2、ZNF514、SLC6A9、PIP4K2B、OCRL、MFSD6、GLCCI1、FBXW7與EOC 患者疾病分期相關,其表達量隨疾病進展而降低(均P<0.05),見圖3B。

圖3 基于GEPIA2行差異microRNA靶基因的生存分析及與疾病分期的關系分析
2.7 RT-qPCR驗證EOC組及對照組中MLLT6、hsamiR-450b-5p的表達水平 在進行RT-qPCR驗證之前,先通過HE染色確定標本的病理類型(此過程在廣西醫科大學第一附屬醫院病理科進行),見圖4A。
基于上述生物信息學分析,發現MLLT6在EOC中的生存分析及病理分期均有意義(P<0.05),后續對MLLT6及其上游microRNA進行實驗驗證。
根據RT-qPCR,本課題組發現MLLT6在EOC組織中較正常卵巢組織的表達量[中位數為0.006 997,四分位數間距為(0.002 933~0.011 810)]下調(Z=-2.602,P<0.05),其上游hsa-miR-450b-5p 在EOC 組織中的表達量[中位數為0.000 280,四分位數間距為(0.000 143~0.000 457)]上調(Z=-3.071,P<0.05),見圖4B。根據RT-qPCR 的數據進行ROC 分析發現,MLLT6和hsa-miR-450b-5p 的ROC 分析差異均有統計學意義(P<0.05),圖4C、見表3。

表3 MLLT6、hsa-miR-450b-5p的ROC分析結果

圖4 RT-qPCR檢測36例EOC患者和24例非OC患者的卵巢組織的MLLT6、hsa-miR-450b-5p表達及ROC分析
婦科腫瘤發生于女性生殖系統,與其他實體臟器腫瘤不同的是婦科腫瘤不僅危及患者生命,也涉及子代。因此,研究有助于EOC早期診斷及治療的生物標志物極為重要。研究發現microRNA可以作為EOC 早期檢查工具,可以作為預后的標志物,也可以作為治療靶點[9]。
本研究從GEO數據庫中篩選得到3個數據集,通過分析后獲得2個上調microRNAs和6個下調的microRNAs。這8個差異microRNAs在EOC中的研究仍然缺乏,值得進一步研究。
通過對差異microRNA 的226 個靶基因進行功能富集分析,本課題組發現大部分基因與磷脂酰肌醇信號系統,神經營養因子信號通路,細胞衰老,雌激素信號通路等有關。其中,后兩個信號通路在EOC中的作用已被報道[10-11]。本研究的生物信息學分析結果與之前的研究結果是一致的。通過PPI網絡,發現60 個蛋白獨立存在,其余166 個蛋白存在相互作用線,提示它們可能通過多蛋白復合物在EOC中執行重要的生物功能。
本研究發現TIAM2與EOC 患者的生存相關,MSI1、PKMYT1、PLAGL2、ZNF514、SLC6A9、PIP4K2B、OCRL、MFSD6、GLCCI1、FBXW7與EOC疾病分期相關。其中,與正常卵巢組織相比,MSI1、PKMYT1、PLAGL2、MFSD6、SLC6A9在EOC 組織中表達上調,而其余6 個基因在EOC 組織中表達下調。有研究發現MSI1在包括EOC在內的多種腫瘤組織中高度表達,且過表達MSI1 可促進腫瘤細胞的增殖和侵襲[12]。PKMYT1在EOC組織中的表達上調,高水平的PKMYT1預示EOC 患者的預后較差,且他們認為PKMYT1通過負性調節SIRT3 加速EOC的惡性進展[13]。研究發現PLAGL2在包括EOC在內多種惡性腫瘤中發揮致癌作用[14]。據報道,FBXW7是一種腫瘤抑制基因,可以抑制EOC 細胞的侵襲、遷移和血管生成[15]。上述研究結果與本研究相一致。而關于ZNF514、GLCCI1等基因在EOC中的作用尚未被報道,值得進一步研究。
本研究還發現MLLT6的表達水平不僅與EOC患者的生存相關,隨著疾病進展其表達水平也隨之下降。進一步對MLLT6與其上游hsa-miR-450b-5p進行RT-qPCR 的驗證,發現與預期結果一致,提示hsa-miR-450b-5p可能通過靶向MLLT6促進EOC的發生發展。隨后通過ROC曲線分析,發現hsa-miR-450b-5p和MLLT6可能為提示EOC的標志物。它們在EOC中的研究仍然缺乏,值得進一步研究。
綜上,本課題組認為MLLT6、hsa-miR-450b-5p在EOC中發揮重要作用,hsa-miR-450b-5p可能通過靶向MLLT6影響EOC的發生發展。MLLT6可能與EOC 的預后相關。同時,由于MLLT6的mRNA 表達水平隨著疾病進展而變化,提示MLLT6可能與EOC 疾病的發生發展有關。它們可能為EOC 的診斷相關標志物,兩者聯合診斷效能較佳。但仍需擴大樣本量深入研究。hsa-miR-450b-5p/MLLT6在EOC中的作用尚需進一步研究。