王衛忠 何雪倩 馮杜金 陳燕敏 趙釗
乳腺癌是全球范圍內女性最常見的惡性腫瘤之一[1]。其發病率逐年上升,每年全球新發病例達115萬,占全球女性惡性腫瘤的22.7%,死亡病例達41萬,占所有女性惡性腫瘤死亡的14.1%,其死亡率在女性惡性腫瘤中位居第二,嚴重威脅婦女健康[2]。雖然近年來隨著診斷和治療技術的提高,乳腺癌的病死率已大大降低,但由于乳腺癌是一種高度異質性的腫瘤,不同乳腺癌患者的預后存在較大差異。發現新的乳腺癌預后生物標志物,以實現乳腺癌的個體化預后評估具有重要的臨床意義。
研究表明,長鏈非編碼RNA(long non-coding RNA,lncRNA)的表達或功能異常與癌癥、退行性神經疾病在內的多種人類重大疾病的發生密切相關[3-4]。lncRNA的表達具有細胞或組織特異性,其或可成為潛在的癌癥生物標志物[5]。增強子是基因組中順式調節元件的主要類型,通過與靶基因啟動子相互作用從而增強靶基因的轉錄。近年來發現增強子也能轉錄lncRNA,稱為增強子RNA(enhancer RNA,eRNA)。在人類細胞中已經鑒定出數以萬計的eRNA。eRNA可以介導靶基因的激活,從而在基因的轉錄調控中發揮重要作用。在癌癥發生、發展過程中,癌基因或致癌信號通路的激活通常會伴隨著增強子的激活以及eRNA的產生。已有研究表明eRNA在腫瘤發生中存在重要作用,暗示它們可作為臨床治療、預測預后的潛在靶標[6]?;准毎┲屑拥鞍紫嚓P蛋白T1(actin-related protein T1,ACTRT1)相關eRNA的突變可能削弱增強子的活性和ACTRT1的表達,從而導致Hedgehog信號通路的異常激活,促進腫瘤的發展[7]。在乳腺癌中可以檢測到神經上皮細胞轉化基因 1(neuroepithelial cell transforming 1,NET1)相關的eRNA高表達,這是一個位于癌基因NET1下游約90 kb的eRNA,敲低NET1e顯著降低了乳腺癌細胞系MCF-7的增殖,并且NET1e表達水平與藥物反應性相關[8]。但是,之前的研究主要集中在單個或幾個eRNA與乳腺癌之間的關系,目前利用大數據篩選分析與乳腺癌相關的eRNA研究還不多見?;诖?,本研究通過人類癌癥基因組圖譜(the cancer genome atlas,TCGA)數據庫篩選出與乳腺癌預后相關的eRNA及其靶基因,分析其與臨床特征的相關性,并對其在泛癌中的表達進行研究,現報道如下。
1.1 乳腺癌預后相關eRNA的篩選 下載獲得由PreSTIGE算法[9]預測的組織特異性增強子表達的lncRNA及其預測靶標的列表,得到2 695個組織特異性增強子表達的lncRNA轉錄本以及2 303個相關預測靶基因。通過Ensembl基因組序列數據庫將列表中的“Ensembl ID”轉換為“gene symbol”,將 2 695 個 eRNA 轉錄本定位到對應的1 288個基因[10-11]。從UCSC Xena癌癥基因組學數據分析平臺下載TCGA數據庫中33種腫瘤的RNA測序數據以及臨床數據,研究TCGA中相應癌癥數據中eRNA的表達水平及其臨床特征相關性。通過基因共表達分析,以評估eRNA水平與靶基因之間的相關性。關鍵eRNA的篩選標準為與總生存期(P<0.05)以及與其靶基因共表達(r>0.4,P<0.001)明顯相關。
1.2 統計學處理 采用R統計軟件。采用Kruskal-Wallis H檢驗比較不同類型腫瘤之間的基因表達差異。采用非參數Wilcoxon符號秩檢驗比較匹配的腫瘤和非腫瘤樣本間的基因差異。采用Spearman等級相關系數評估兩組變量關系密切程度。采用Kaplan-Meier方法計算不同風險組的總體生存時間,進行log-rank檢驗。P<0.05為差異有統計學意義。
2.1 乳腺癌預后相關eRNA篩選結果 通過分析TCGA數據庫中1 217例乳腺癌患者的RNA測序數據,發現91個eRNA的表達水平與乳腺癌患者的總體生存率顯著相關(P<0.05)。隨后將這91個eRNA的表達水平與其靶基因的表達水平進行相關性分析,得到30個預后相關eRNA的表達水平與其靶基因的表達水平呈顯著相關(Spearman等級相關系數r>0.4,P<0.001)。見表1。

表1 與乳腺癌預后相關的eRNA
2.2 AP003059.2是乳腺癌的關鍵eRNA 由表1可見,AP003059.2是與乳腺癌總體生存率相關性最強的eRNA。與AP003059.2低表達組相比,AP003059.2高表達組顯示出更高的總體生存率(圖1a)。AP003059.2的基因表達與靶基因ME3表達水平呈顯著正相關(圖1b)。通過limma包分析乳腺癌中與AP003059.2共表達相關的基因,主要包括蘋果酸酶3(malic enzyme 3,ME3)、AP001148.1、ZNF540、CBX7、RAD51-AS1、AP000654.1、GTF2IRD2、LINC01359、PRSS23、RBM5、AP003059.1、TRMT9B、CROCCP3等13個基因。

圖1 增強子RNA(eRNA)AP003059.2與乳腺癌患者預后的關系[a:AP003059.2高表達和低表達乳腺癌患者的總生存曲線比較;b:AP003059.2和蘋果酸酶3(ME3)共表達關系分析]
2.3 eRNA AP003059.2與激素表達狀態的相關性分析 與雌激素受體(estrogen receptor,ER)陰性腫瘤相比,ER陽性腫瘤表達更高水平的AP003059.2(P<0.001,圖2a)。而與人表皮生長因子受體 2(human epidermal growth factor receptor 2,HER-2) 陰性腫瘤相比,HER-2陽性腫瘤表達較低水平的AP003059.2(P<0.001,圖 2b)。與孕激素受體(progesterone receptor,PR)陰性腫瘤相比,PR陽性腫瘤表達更高水平的AP003059.2(P<0.001,圖2c)。上述結果表明在不同激素受體表達乳腺癌中,AP003059.2的表達存在差異,可能為乳腺癌個體化治療及預后分析提供新的靶標。

圖2 雌激素受體(ER)、人表皮生長因子受體2(HER-2)、孕激素受體(PR)陽性與陰性乳腺癌中增強子RNA(eRNA)AP003059.2的表達差異(a:ER陽性與陰性乳腺癌比較;b:HER-2陽性與陰性乳腺癌比較;c:PR陽性與陰性乳腺癌比較)
2.4 eRNA AP003059.2在泛癌中的表達 通過對33種腫瘤中AP003059.2的表達與腫瘤總體生存率以及與ME3共表達相關性進行研究,發現僅在乳腺癌中,AP003059.2與腫瘤總體生存率以及ME3共表達存在相關性,表明AP003059.2在乳腺癌組織中特異性表達,具有組織特異性。見表2。

表2 33種腫瘤中AP003059.2表達水平與患者生存預后分析及與蘋果酸酶3(ME3)基因表達相關性分析
eRNA是基因增強子區域內衍生的特定亞類lncRNA,能夠以順式作用影響相應基因的轉錄。為了增進對乳腺癌中eRNA的了解,本研究使用以下方法來鑒定BRCA中與預后相關的eRNA:(1)從已發表文獻得到組織特異性增強子表達的lncRNA及其相關靶基因列表;(2)下載TCGA數據庫中乳腺癌數據,分析eRNA的表達與乳腺癌總體生存率的相關性;(3)通過eRNA與靶基因的相關性分析進一步篩選。該方法篩選得到了影響乳腺癌發生、發展的相關eRNA,也可用于具有足夠RNA測序數據的其他人類疾病eRNA的研究。
本研究結果顯示,目前功能尚未注釋的lncRNA AP003059.2被確定為與乳腺癌預后最相關的eRNA。在TCGA數據庫的33種癌癥中,AP003059.2的表達對乳腺癌總體生存率的影響最大,而與其他31種腫瘤存活率無明顯相關性,具有明顯的組織特異性,這或可使其成為預測乳腺癌預后的關鍵eRNA。AP003059.2位于ME3基因的增強子區域內,與ME3的表達之間存在很強的相關性。ME3是蘋果酸酶家族的關鍵成員,在胰島素釋放和上皮細胞間質化等多個生理和病理過程中發揮重要作用[12]。ME3作為一種氧化性脫羧酶,可催化蘋果酸轉化為丙酮酸,是還原型輔酶Ⅱ再生和活性氧(reactive oxygen species,ROS)穩態所必需的。ROS既可以作為信號分子,又可以作為細胞死亡的介體,從而促進腫瘤細胞增殖或誘導腫瘤細胞死亡。已有研究證明胰腺癌組織中ME3的表達高于正常胰腺組織,ME3表達的增加可能在胰腺癌的發展中起重要作用,并作為胰腺癌發生和進展的生物標志物[13]。研究表明,蘋果酸酶可能是抑制包括肺癌、神經膠質瘤、肝細胞癌、皮膚黑色素瘤和鼻咽癌在內的多種腫瘤生長和侵襲的靶標[14-15]。靶向ME3可能是抑制腫瘤生長的有效方法,高特異性的ME3抑制劑可以為相當一部分癌癥患者提供有效的治療方法[16]。
本研究也發現AP003059.2的表達與乳腺癌組織中的激素受體表達狀態相關。與ER陰性的乳腺癌相比,ER陽性的AP003059.2水平更高;與PR陰性的乳腺癌相比,PR陽性的AP003059.2水平更高;而在HER-2陰性的乳腺癌中,AP003059.2水平更高。這些結果表明乳腺癌作為一種異質性很高的惡性腫瘤,必須綜合考慮各種激素受體的表達情況,才能對不同類型乳腺癌的預后和個體化治療方案作出精確判斷。
由于AP003059.2是功能未注釋的轉錄本,本研究試圖通過鑒定除其預測的靶標ME3外的其他共表達基因來闡明其作用。除ME3外,本研究還發現其他12個與AP003599.2具有顯著表達相關性的基因。但是轉錄本之間的相關性并不一定表示兩者之間具有因果關系,AP003059.2是否具有相應靶基因的增強子活性仍有待通過實驗確定。
總之,AP003059.2是乳腺癌的組織特異性eRNA,與乳腺癌的預后明顯相關,或可作為乳腺癌患者潛在預后生物標志物和治療靶標。