黃秋霞 張錫流 黃克強 張秀玲 王志靜
宮頸癌是世界范圍內第二常見的女性生殖系統惡性腫瘤,也是女性由于癌癥死亡的第四大病因[1-2]。每年,宮頸癌導致約30萬婦女死亡,影響近 60萬婦女,尤其是中年婦女和生活在資源匱乏地區的婦女[3]。據國際癌癥研究機構的統計,2020 年全球約有604 000例新發宮頸癌病例和342 000例死亡病例[2]。高危型人乳頭瘤病毒(HumanPapillomavirus,HPV)的感染(HPV16/18)是宮頸癌發生發展中十分重要的原因;除此之外,性傳播疾病、吸煙、多次分娩和長期使用口服避孕藥等也在一定程度上參與了宮頸癌的發生[4-5]。HPV疫苗的問世,使得宮頸上皮內瘤變和宮頸癌的發病率顯著下降[6]。雖然已有高效的一級預防(HPV疫苗)和二級預防(宮頸細胞學篩查)措施,然而還有一部分與HPV無關的宮頸癌病例難以在早期發現[5]。因此,有必要開展更深入的研究,探究與宮頸癌發生發展相關的分子事件。
長非編碼RNA(long non-coding RNA,lncRNA)是一類不編碼蛋白質且長度大于200 nt的RNA分子。近年來,多項研究表明,lncRNA通過競爭性內源RNA(competing endogenous RNA,ceRNA)機制,調控下游基因的表達,從而影響宮頸癌的發生發展[7-9]。近年來研究表明,MIR210HG是一個與多種惡性腫瘤發生發展相關的lncRNA分子。例如,MIR210HG在胃癌組織中呈顯著的高表達水平,且在體外能顯著促進胃癌細胞的遷移和侵襲[10];在非小細胞肺癌組織中,MIR210HG也呈現顯著的高表達水平,且敲低MIR210HG后可抑制癌細胞的增殖和遷移[11]。在女性生殖系統惡性腫瘤中也有類似的報道,例如在卵巢癌、宮頸癌和子宮內膜癌組織中,MIR210HG的表達均顯著上調[12-14]。但仍缺少大樣本量、多中心的研究來證實MIR210HG在宮頸癌組織中的高表達。因此,有必要開展大樣本量的研究進一步證實MIR210HG在宮頸癌組織中的高表達。
本研究通過檢索GEO、TCGA、SRA、ArrayExpress等高通量數據庫,收集宮頸癌相關的lncRNA數據集,以綜合探究MIR210HG在宮頸癌組織與正常宮頸組織中表達的差異。同時,通過多種方法探究MIR210HG在宮頸癌中相關的ceRNA網絡,進一步挖掘了MIR210HG在宮頸癌中潛在的分子機制。
一、數據收集及處理:
通過檢索ArrayExpress、SRA、GEO等數據庫,收集宮頸癌相關的lncRNA數據集,檢索式如下:“(“cervical cancer” OR “cervical carcinoma”) AND(lncRNA OR lincRNA OR “long non-coding RNA”)”。數據集納入標準:(1)樣本來源于人類宮頸癌組織;(2)數據集中宮頸癌樣本與正常對照均應≥3例;(3)lncRNA表達矩陣可獲取。數據集排除標準:(1)樣本經過放射、藥物或基因敲除等人為干預;(2)缺少相應的注釋文件。同時還下載TCGA-CESC隊列的RNA測序數據,并與GTEx數據庫中正常宮頸組織的測序數據合并、標準化。截至2022年1月20日,共納入4個數據集:TCGA-GTEx(306例宮頸癌,81例正常宮頸)、GSE145372[15-16](4例宮頸癌,4例正常宮頸)、GSE149763[17](3例宮頸癌,3例正常宮頸)和GSE167362[18](3例宮頸癌,3例正常宮頸)。
此外,以相同的方法檢索并整理宮頸癌相關的miRNA和mRNA高通量數據集,將來自同一平臺的數據集合并,并利用R語言(v4.0.4)sva包校正批次效應。利用meta包計算每個miRNA和mRNA的標準化均數差(standard mean difference,SMD),以獲得宮頸癌中差異表達的miRNA和mRNA。計算標準如下:當異質性統計量I2<50%時,提示各隊列之間異質性較小,使用固定效應模型(fixed effects model)合并SMD;反之,使用隨機效應模型(random effects model)合并SMD[19]。當SMD>0且95%CI不包含0時,提示該mRNA(或miRNA)是高表達的;當SMD<0且95%CI不包含0時,提示該mRNA(或miRNA)是低表達的[20]。
二、MIR210HG在宮頸癌與正常對照組織之間的表達差異:
在本研究中,借助GraphPad Prism 8繪制散點圖來探究MIR210HG在宮頸癌與正常對照組織之間的表達差異。同時,還繪制受試者工作特征(receiver operating characteristics,ROC)曲線來評估MIR210HG區分宮頸癌組織和正常宮頸組織的能力。該過程由ROC曲線下面積(area under the curve,AUC)來評估,0.5 為了綜合評估MIR210HG在宮頸癌組織中的表達水平,合并計算4個宮頸癌相關lncRNA數據集中MIR210HG的SMD,合并計算的過程借助Stata v15.1(TX,USA)完成。計算標準及合并SMD的判讀標準同1所述。同時,還利用Stata v15.1繪制綜合受試者工作特征(summary receiver operating characteristics,SROC)曲線來綜合評估MIR210HG區別宮頸癌組織與正常組織的準確性。 三、構建MIR210HG在宮頸癌中相關的ceRNA網絡: 通過在線工具DIANA-LncBase v2,使用結合位點預測模塊預測MIR210HG的靶miRNA,并將預測所得miRNA與計算獲得的低表達miRNA取交集。同時,還利用ENCORI數據庫計算MIR210HG與上述所獲得的靶miRNA的相關性。此外,TargetScan Human v8.0數據庫用于預測上述miRNA的靶基因,并將預測的靶基因與我們計算所得高表達mRNA取交集。Cytoscape v3.7.1軟件用于構建ceRNA網絡。 四、統計分析: 兩組樣本中MIR210HG表達差異的分析由獨立樣本t檢驗完成。Pearson相關系數r用于評估MIR210HG與靶miRNA、miRNA與靶基因之間的相關性。在本研究中,P<0.05提示結果具有統計學意義。 一、MIR210HG在宮頸癌組織與正常對照組織中的表達差異: 在本研究納入的4個宮頸癌相關lncRNA數據集中,TCGA-GTEx、GSE149763檢測到MIR210HG在宮頸癌組織中的表達水平較正常對照組織高,但只有TCGA-GTEx數據集的結果具有統計學意義(P<0.0001,圖1A)。ROC曲線提示MIR210HG區分宮頸癌組織及正常對照組織具有輕度到中度的準確性(AUC=0.6250—0.8889;圖1B)。 A:MIR210HG表達水平的散點圖;P值基于獨立樣本t檢驗。Tumor,腫瘤組;Normal,正常組織組;B:MIR210HG在各個數據集中的ROC曲線; Sensitivity,敏感度;1-Specificity,1-特異度;AUC,曲線下面積A:Scatter plots of MIR210HG expression; P-value is based on Student′s t-test. B:ROC curves of MIR210HG in each dataset.圖1 MIR210HG在宮頸癌及其正常對照組織中的表達水平差異及MIR210HG區分宮頸癌組織的能力Figure 1 Differential expression of MIR210HG in cervical cancer and normal control tissues and the ability of MIR210HG to differentiate cervical cancer tissues 由于MIR210HG在納入的4個數據集中表達水平不一致,我們采用異質性檢驗,結果提示MIR210HG在宮頸癌組織中的表達具有同質性(I2=41.2%,P=0.162,圖2A),固定效應模型得出總SMD=0.57(95%CI [0.33—0.81],P<0.05;圖2A),進一步證實MIR210HG在宮頸癌組織中呈高表達水平。Egger檢驗提示發表偏倚不具有統計學意義(P=0.157;圖2B)。SROC曲線下面積達到0.71,提示MIR210HG具有中度區分宮頸癌組織與正常對照組織的能力(圖2C)。 A:森林圖提示,與正常對照組相比,MIR210HG在宮頸癌組織中表達上調;SMD,標準化均數差。B:Egger檢驗提示結果無發表偏倚。C:SROC曲線提示MIR210HG具有輕度區分宮頸癌組織的能力;SENS(Sensitivity),敏感性;SPEC(Specificity),特異性;AUC,曲線下面積A:Forest plot reveals the upregulation of MIR210HG in cervical cancer tissues; B:Egger′s test identifies no publication bias; C:SROC curves demonstrates the mild discriminatory capacity in cervical cancer圖2 整合計算評估MIR210HG在宮頸癌組織和正常對照組織中的表達水平差異及MIR210HG區分宮頸癌組織的能力Figure 2 Evaluation of MIR210HG expression difference between cervical cancer tissues and normal control tissues by integrated calculation and the ability of MIR210HG to differentiate cervical cancer tissues 二、MIR210HG在宮頸癌中相關的ceRNA網絡: 將預測的靶miRNA與宮頸癌中低表達的miRNA取交集,我們共獲得11個miRNA。我們利用ENCORI數據庫計算了這11個miRNA與MIR210HG在宮頸癌組織中表達相關性(基于TCGA-CESC數據集),其中3個miRNA與MIR210HG呈顯著的負相關關系:hsa-miR-424-5p、hsa-miR-218-5p和hsa-miR-3194-5p(表1)。圖3展示了MIR210HG相關的ceRNA網絡圖。 表1 MIR210HG與預測靶miRNA在宮頸癌組織中表達的相關性Table 1 Expression correlation between MIR210HG and predicted target miRNA in cervical cancer 圖3 宮頸癌中MIR210HG及其相關的ceRNA網絡ceRNA,競爭性內源RNA。Figure 3 MIR210HG and its related ceRNA network in cervical cancer 三、宮頸癌中hsa-miR-424-5p與其靶基因表達的相關性: 選擇與MIR210HG表達相關性最強的hsa-miR-424-5p探討其與靶基因的相關性(圖4A)。在ENCORI數據庫中計算hsa-miR-424-5p與靶基因的相關性,其中MYB與hsa-miR-424-5p的表達相關性最強(表2),呈顯著的負相關(圖4B)。森林圖提示,hsa-miR-424-5p在宮頸癌組織中的表達顯著低于正常宮頸組織(SMD=-0.91,95%CI:-1.35~-0.48,P<0.05;圖4C);而MYB在宮頸癌組織中的表達顯著高于正常宮頸組織(SMD=1.11,95%CI:0.10~2.11,P<0.05;圖4D)。圖4E展示了hsa-miR-424-5p與MIR210HG、MYB的結合序列。 表2 hsa-miR-424-5p與預測靶基因在宮頸癌組織中表達的相關性Table 2 Expression correlation between hsa-miR-424-5p and predicted target gene in cervical cancer 宮頸癌是第四大最常見的癌癥,也是女性癌癥死亡的第四大原因,發病率和死亡率均處于較高水平。除了總所周知的HPV感染,宮頸癌的發生發展仍受到其他因素的影響[1-2,4-5]。雖然HPV疫苗的接種和宮頸細胞學的篩查在一定程度上起到了預防宮頸癌的作用,影響宮頸癌發生發展的分子事件仍需要不斷探索。近年來,許多研究報道lncRNA在宮頸癌的發生發展中起到一定的作用[7-9, 21]。MIR210HG作為一個與腫瘤相關的lncRNA分子,其在多種腫瘤中的表達水平及潛在分子機制已被相繼探討。但仍缺少相關多中心、大樣本的整合分析,以證實MIR210HG在宮頸癌中的表達水平。為此,開展了這項多中心的整合分析。 本研究闡述了MIR210HG在宮頸癌組織中高表達。MIR210HG在多種惡性腫瘤中的低表達水平已被相繼報道,如胰腺癌、胃癌、非小細胞肺癌等[10-11,22]。至于女性生殖系統癌癥,MIR210HG在卵巢癌、子宮內膜癌、宮頸癌中均呈高表達的狀態[12-14]。與這些研究不同之處在于,本研究收集全球范圍與宮頸癌相關的lncRNA高通量數據集,通過大樣本量的整合計算(316例宮頸癌樣本,91例正常宮頸樣本),來確定MIR210HG在宮頸癌組織中的表達。整合計算的結果表明,與正常女性相比,MIR210HG在宮頸癌中的表達是顯著上調的。然而,由于臨床數據的缺失,本研究未能開展相關的亞組分析以確定臨床病理參數是否與MIR210HG的表達水平相關,這也有待我們今后的深入探討。 同時,本研究還探討了MIR210HG在宮頸癌中相關的ceRNA機制。近年的研究表明,ceRNA可能與癌癥的發生發展及患者的預后相關[9, 21, 23]。此前已有研究報道,MIR210HG可能通過ceRNA機制參與多種腫瘤的發生發展,例如子宮內膜癌中的MIR210HG-miR-337-3p/137-HMGA2軸,以及宮頸癌中的MIR210HG/miR-503-5p/TRAF4軸等[12, 14]。本研究中通過結合位點預測以及大樣本量的計算,構建了MIR210HG在宮頸癌中的ceRNA機制,推測MIR210HG可能通過hsa-miR-424-5p/MYB軸參與宮頸癌的發生發展。 此外,還探究了MIR210HG相關靶miRNA hsa-miR-424-5p與MYB在宮頸癌組織中的表達。有研究報道hsa-miR-424-5p在宮頸癌組織中呈現低表達水平,且高表達hsa-miR-424-5p可以抑制宮頸癌細胞的增殖和遷移[24]。在本研究中,利用收集的多中心樣本驗證了hsa-miR-424-5p在宮頸癌組織中的低表達(348例宮頸癌組織,42例正常對照);同時,1018例多中心樣本的整合計算結果也表明,MYB在宮頸癌組織中的表達顯著上調,且同時預測了MYB與hsa-miR-424-5p的8mer結合位點。本研究表明MYB可能是hsa-miR-424-5p的一個潛在靶基因。 綜上所述,本研究首次采用整合多中心樣本計算的方法揭示了lncRNA MIR210HG在宮頸癌組織中的高表達,并構建MIR210HG在宮頸癌中相關的ceRNA,推測MIR210HG/hsa-miR-424-5p/MYB軸可能參與宮頸癌的發生發展。然而,MIR210HG在宮頸癌中的分子機制仍需要進一步的實驗探究。結 果





討 論