沈 瑞,李杰平,展會恩,彭劍嬌,徐宏向,曾惠奇
急性髓系白血病(acute myeloid leukemia, AML)是成人最常見的急性白血病。近年來,盡管靶向治療及干細胞移植等治療手段極大改善了患者的預后,但是還有近一半的患者不能獲得長期生存,其相關機制及治療靶點仍有待進一步探索[1]。miRNA-155是一種功能廣泛的小核糖核酸(ribonucleic acid,RNA),可參與機體的免疫應答、炎性反應、細胞分化等生物過程,并與肝癌、乳腺癌、淋巴癌等多種癌癥的發生與進展密切相關[2]。有學者發現,miRNA-155在AML中亦呈高表達狀態[3],但既往研究多著重于比較外周血中miRNA-155表達水平高低與臨床指標的相關性,欠缺長期隨訪數據,潛在機制也尚未完全闡明。本研究擬借助公開的臨床數據庫—癌癥基因組圖譜(the cancer genome atlas, TCGA)和生物信息學手段分析miRNA-155表達水平對患者生存率的影響,以及miRNA-155調控AML的潛在分子機制,為AML的預防及治療提供參考。
1.1 一般資料 從包含TCGA數據網站(http://www.linkedomics.org)下載AML數據集TCGA_LAMLmiRNASeq、TCGA_LAMLRNAseq和TCGA_LAML Clinical,篩選出同時包含miRNA-155表達水平測定和完整臨床數據的病例共162例,按照miRNA-155表達水平由高到低排序,將排在前50%的81例設為高表達組,剩余81例設為低表達組,應用GraphPad Prism軟件繪制兩組患者生存曲線。
1.2 方法 利用Omisc軟件,將上述患者的各RNA表達水平逐一與miRNA-155表達水平進行Pearson相關性檢測,根據相關系數分別選取與miRNA-155正相關和負相關的前50個基因。將篩選出的100個相關基因導入String在線數據庫(http://string-db.org/),進行生物學注釋和分類,即完成基因本體(gene ontology, GO)富集分析(分為生物學過程、細胞組分和分子功能三個類型板塊)和京都基因與基因組百科全書(the Kyoto encyclopedia of genes and genomes pathway, KEGG)通路富集分析,同時獲得相關基因所編碼的蛋白質之間的相互作用,從而找出處于網絡核心的關鍵蛋白。
1.3 統計學處理 采用SPSS 17.0 軟件進行數據處理,生存時間的比較使用Gehan-Breslow-Wilcoxon分析,相關基因篩選采用Pearson相關性分析。P<0. 05為差異有統計學意義。
2.1 兩組年齡、性別及種族比較 高表達組與低表達組在年齡[(53.99±17.25)歲vs(53.73±15.25)歲]、性別構成(男性∶女性=42∶39vs37∶44)與種族構成(白人∶黑人∶亞裔=41∶15∶25vs44∶11∶26)方面比較,差異無統計學意義(P>0.05)。
2.2 miRNA-155表達水平差異對生存時間的影響 miRNA-155低表達組患者的中位生存時間長于miRNA-155高表達組,差異有統計學意義(P=0.045,圖1)。

圖1 miRNA-155對兩組急性髓系白血病患者生存率比較
2.3 miRNA-155相關基因篩選結果 在檢測的19,448個基因中,有2347個基因與miRNA-155存在相關性(P<0.05)。其中21號染色體開放閱讀框71(chromosome 21 open reading frame 71, C21orf71)和芳基烴受體核轉位樣蛋白2(aryl hydrocarbon receptor nuclear translocator-like protein 2, ARNTL2)與miRNA-155表達水平的正相關系數最高(分別是r=0.634,P<0.05和r=0.526,P<0.05,圖2A、B);溶質載體家族13成員5(solute carrier family 13 member 5, SLC13A5)和Ski樣蛋白(ski-like protein, SKIL)與miRNA-155表達水平的負相關系數最高(分別是r=-0.50,P<0.05和r=-0.48,P<0.05,圖2C、D)。
2.4 GO富集分析和KEGG通路富集分析 結果可見主要涉及的生物學過程包括DNA復制啟動、DNA鏈延伸與DNA雙鏈展開,主要涉及的分子功能為解旋酶活性、作用于DNA的催化活性和DNA復制起始的結合,主要涉及的細胞組分為微染色體維持復合體、三級顆粒和富含纖維蛋白-1的顆粒膜,主要涉及的信號通路為DNA復制、細胞周期調控和基礎切除修復,見表1。

圖2 與miRNA-155相關基因的表達水平
A、B. 和miRNA-155正相關且相關系數最高的2個基因;C、D. 和miRNA-155負相關且相關系數最高的2個基因

表1 完成基因本體富集分析和KEGG通路富集分析
2.5 蛋白相互作用網絡 相關基因編碼蛋白之間的相互作用網絡見圖3,其中微小染色體維持蛋白(microchromosome maintenance proteins,MCM)基因家族是處于網絡核心的蛋白。
AML是血液系統常見的惡性腫瘤,近年來隨著靶向治療新藥的應用及干細胞移植的開展,極大改善了患者的預后,但治療復發性和難治性病例時,仍然缺少有效方法,大多數患者最終死于耐藥和復發[4]。miRNA是一類內源性非編碼RNA,成熟miRNA可與靶mRNA的3′U TR或5′U TR互補結合,并導致mRNA降解或抑制mRNA翻譯,從而抑制基因表達[5]。越來越多的研究發現,miRNA的失調對腫瘤的形成和進展起著重要作用。其中miRNA-155在多種腫瘤的形成中扮演重要角色,例如在乳腺癌中,其過表達可使端粒重復序列結合蛋白1的表達受到抑制,導致端粒損傷,并影響細胞分裂[6];在甲狀腺乳頭狀瘤中,其可通過激活Wnt/β-連環蛋白信號通路,促進腫瘤生長[7]。亦有學者發現,miRNA-155與AML患者預后不良有關[8],但缺少長期隨訪數據,且相關機制仍未完全闡明,miRNA-155能否作為一種提示AML遠期預后的生物標志物仍有待于進一步探討。

圖3 相關基因編碼蛋白相互作用網絡
TCGA數據庫是美國國家癌癥研究所和國家人類基因組研究所在2005年發起的一個項目,在過去的十余年里,TCGA收錄了加拿大和美國地區11 000多例腫瘤組織以及相匹配的正常組織,和約2.5 PB的高通量基因組測序結果,TCGA創建的基因組數據分析流程,可有效收集、選擇和分析組織基因組改變,并結合收錄患者的診斷和治療信息,為改進癌癥預防、早期檢測和治療提供了強大的研究基礎[9]。本研究通過對TCGA數據庫中162例AML患者的隨訪數據進行分析后發現,miRNA-155過表達會導致遠期生存率降低,但具體機制尚不明確。為此本研究基于TCGA數據庫中的基因檢測結果,篩選出與miRNA-155表達密切相關的基因,并進行富集分析,以求挖掘出潛在機制。結果可見,C21orf71、ARNTL2、SLC13A5和SKIL與miRNA-155表達水平的相關性最為明顯。其中C21orf71位于21號染色體,戴海萍[10]的研究發現,在AML患者中可存在11、21號染色體發生相互易位,這可導致其與伙伴基因一起轉錄新的融合蛋白,干擾造血細胞調控,促使AML病情的進展[11]。ARNTL2又名周期樣因子,在細胞的晝夜節律調解中發揮重要作用,晝夜節律調節失常,可導致心血管疾病,癌癥,代謝綜合征和衰老等一系列疾病的發生[12]。SLC13A5是高親和力的鈉/檸檬酸協同轉運蛋白,介導檸檬酸鹽進入細胞,可以促進循環檸檬酸鹽的利用,以產生能量和合成脂肪酸及膽固醇[13]。SKIL在響應細胞外信號的細胞分裂或分化中具有調節作用,有研究表明SKIL基因突變可引起胰腺腫瘤的形成[14]。這也提示miRNA-155可能通過上述靶基因在AML的進展中發揮作用。
GO富集分析結果與KEGG通路富集分析顯示,miRNA-155的相關靶基因所編碼的蛋白的功能多集中在細胞周期與DNA復制的全過程。蛋白網絡分析可見,MCM蛋白家族處于網絡的核心。MCM又稱為DNA復制許可因子,MCM蛋白的早期分級可產生多種多聚體復合物,其具有不同的生物學意義,例如MCM467復合物顯示具有體外解旋酶活性,其被MCM2亞基抑制。 MCM2-7六聚體在DNA復制起始和延伸中是必不可少的[15]。這也與miRNA-155靶基因的富集分析結果一致。
綜上所述,本研究基于miRNA-155從數據庫挖掘AML的潛在作用機制,發現 miRNA-155過表達與AML患者遠期生存率降低有關,可能與其通過相關靶基因調節DNA的復制有關,這為 miRNA-155的臨床價值提供了生物信息學證據支持。