黃玉娟,鐘芳敏,周莉,黃波,王小中,李靜
(1.南昌大學第一附屬醫(yī)院檢驗科,江西 南昌 330006;2.南昌大學第二附屬醫(yī)院檢驗科 江西省檢驗醫(yī)學重點實驗室,江西 南昌 330006)
急性髓系白血病(AML)是一類以骨髓和外周血中未成熟骨髓干/祖細胞惡性增殖為特征的惡性腫瘤。 目前,該病的發(fā)生機制尚不清楚,表觀遺傳學和分子生物學分析揭示了許多AML 發(fā)生發(fā)展的影響因素[1]。AML 的發(fā)病率隨著年齡的增長而增加,在老年人中最常見[2]。目前,AML 患者治療仍不樂觀,五年生存率低于30%,高度異質性和復雜的突變分型是AML 精準治療中極大的挑戰(zhàn)。 因此,進一步分析AML 患者分子生物學特征, 對AML診斷、治療和預后評估非常重要。
人體系統(tǒng)錯綜復雜且精密, 為應對生理環(huán)境的變化和生理過程的需要, 可變剪接發(fā)揮了巨大作用。 各種類型基因轉錄本和相應蛋白質的產生調控著細胞增殖、分化、發(fā)育[3],使得機體活動有序地進行。 可變剪接通過七種剪接方式對前體mRNA(pre-mRNA)進行加工,各類剪接因子相互配合產生成熟的轉錄本。 但任何生理活動都會存在一定的誤差和障礙,選擇性剪接也不例外。 隨著研究的深入,越來越多的研究表明,異常的選擇性剪接(AS)事件影響著癌癥的發(fā)生發(fā)展。 腫瘤細胞控制著選擇性剪接的調控, 產生相應的轉錄本使自身處于有利的生存狀態(tài), 并抑制機體免疫功能對殺傷活性。 因此,對AML 中AS 事件進行全面分析具有重要的生物學意義[4-7]。
隨著高通量測序技術的成熟與發(fā)展, 人們通過基因組學和轉錄組學的相關測序可以全面、直觀地分析癌癥細胞中的變化[8-9]。 AS 事件作為轉錄組學測序的內容之一,具有極高的研究價值,不同的選擇性剪接類型、轉錄本表達量的異常變化,剪接異構體的形成, 在豐度和結構層面都蘊含著大量的生物學信息[10]。生物信息學分析可以鑒定出癌細胞中特異的剪接因子調控方式和轉錄本變化。
本研究將生物信息學分析方法應用于轉錄組學測序數據中,結合臨床信息,探索AS 事件之間的關聯(lián)及與AML 患者預后、 腫瘤微環(huán)境的關系。剪接因子(SFs)在選擇性剪接中發(fā)揮了重要作用,AS 事件與剪接因子相關性分析能更全面了解AML 中AS 事件發(fā)生的特征,根據關系網絡也有利于發(fā)現(xiàn)隱藏在剪接因子調控下的AML 病理發(fā)生機制。 這些互作關系和預后分析也將為AML 分子機制研究和臨床預后判斷提供參考價值。
1.1 數據獲取 AML 轉錄組測序數據和AS 數據分別下載于TCGA 和TCGA SpliceSeq 數據庫,剪接百分比(PSI)值(0%~100%)記錄每個AS 事件的發(fā)生情況。 為使得數據分析更加嚴謹和準確,我們篩選了PSI 值≥75%的樣本進行后續(xù)分析。 同時,我們從TCGA 數據庫獲得這部分病人的臨床信息,包含了生存相關的隨訪記錄。 我們同樣篩選了其中生存時間≥90 d 的AML 患者,更有利于評估患者的生存及預后。
1.2 生存分析及預后相關 AS 事件基因關系網絡采用單變量Cox 回歸分析篩選與AML 患者預后顯著相關的AS 事件(P<0.05)。 我們將相應的基因輸入到檢索相互作用基因(STRING)數據庫的搜索工具中,構建的蛋白質—蛋白質相互作用(PPI)網絡由cytoscape 軟件調整。
1.3 預后模型構建 我們對單變量Cox 分析中篩選的預后AS 事件進一步通過最小收縮與選擇算子(LASSO)回歸分析開發(fā)最優(yōu)風險評分模型。通過模型AS 事件的PSI 值與LASSO 回歸分析指定的系數相乘,計算患者的風險評分。 根據所有患者風險評分的中值, 將所有患者分為高風險組和低風險組。 然后,使用卡普蘭·邁耶(K-M)曲線對高、低風險組進行生存分析。受試者工作特征曲線(ROC)分析評估預后模型的準確性。 單因素、多因素獨立預后分析判斷模型風險評分的獨立預測能力。
1.4 基于風險評分分組的免疫微環(huán)境、免疫評分分析 單樣本基因集富集分析量化了29 個免疫標記的富集水平, 通過分析相應表征基因的表達水平進一步評估患者的免疫浸潤特點。ESTIMATE 分析風險評分與免疫微環(huán)境的關系。
1.5 SF-AS 調控網絡 在以前的研究中整理得到了404 個SFs。 我們根據SFs 的表達值與預后相關的AS 事件的PSI 值構建SF-AS 調控網絡,條件如下:P<0.001,皮爾遜(Pearson)相關系數的絕對值大于0.6。 然后,我們通過Cytoscape 軟件建立了相關性圖。
2.1 數據獲取及AML 患者預后相關AS 事件鑒定我們對151 名AML 患者的選擇性剪接數據、RNA-seq 數據進行統(tǒng)計和分析,共有8830 個基因參與了34 984 個AS 事件。 七種剪接模式包括外顯子跳躍(es)、互斥外顯子(ME)、保留內含子(RI)、替代啟動子(AP)、替代終止子(AT)、替代供體位點(AD)和替代受體位點(AA),見圖1a。對AS 事件進行cox回歸分析,我們得到了6 504 個基因在內的18 099個預后相關AS 事件, 這些AS 事件根據不同的剪接類型進一步分類。 一個基因可能參與兩個或兩個以上與AML 病患者生存顯著相關的AS 事件,這些AS 事件繪制成upset 圖可以直觀清晰地進行比較,見圖1b。

圖1 AML 患者預后相關AS 事件的鑒定
2.2 預后顯著相關選擇性剪接事件及分子特征火山圖顯示AML 患者預后相關AS 事件的整體分布情況,見圖2a,紅色部分表示與生存顯著相關的AS 事件,綠色部分表示相關性不顯著。泡泡圖顯示七種剪接模式下AML 患者預后最相關的事件,見圖2b—圖2h。

圖2 AML 患者預后相關AS 事件以及每種剪接類型下最顯著相關事件的可視化情況
2.3 AML 患者的預后特征 對單變量Cox 分析所得與患者預后顯著相關的AS 事件進行LASSO 回歸分析,去除冗余基因以防止模型的過度擬合,增加模型構建的穩(wěn)定性,見圖3a—圖3b。進一步通過多因素Cox 比例風險分析,我們構建了一個包含6個預后相關AS 事件風險評分模型。計算所有AML患者風險評分,我們依據評分中位數將AML 患者分為低風險組和高風險組。 K-M 曲線分析顯示高風險組患者預后更差,見圖3c。 風險評分曲線依據評分中位數將AML 患者分為低風險組和高風險組,見圖3d。 生存狀態(tài)圖顯示,隨著風險評分的增加,患者死亡數也相應增加,表明風險評分與生存狀態(tài)有關,見圖3e。 熱圖顯示了高低風險評分患者AS 事件PSI 值的總體情況,見圖3f。 ROC 曲線分析表明模型具有較高的準確性(1年、3年、5年生存期AUC 值分別為0.822、0.852、0.838),與其他臨床指標相比能更準確地預測患者的預后, 見圖3g—圖3h。 單變量和變量獨立預后分析中風險評分P 值均<0.05,風險評分可作為臨床預測AML 患者生存狀況的獨立預后因素,見圖3i—圖3j。

圖3 AML 患者預后模型構建
2.4 免疫微環(huán)境與風險評分密切相關 高風險組免疫細胞浸潤水平和免疫評分比低風險組更高,見圖4a—圖4b。 一般來說, 患者腫瘤惡性程度越高,刺激機體免疫功能的激活,免疫浸潤水平也越高,相應的免疫評分也越高。

圖4 高、低風險評分組免疫微環(huán)境的區(qū)別
2.5 生存相關的SF-AS 網絡AS 事件主要由通過與pre-mRNA 結合并影響外顯子選擇性剪接位點調節(jié)RNA 剪接的SF 進行調控。 因此,在AML 中探索SFs 與AS 關系非常重要。 我們將相應SFs 的表達與生存最顯著相關AS 事件的PSI 值 (P<0.001)進行Pearson 相關性分析,見圖5。 我們觀察到QKI 作為核心分子在網絡中的連接程度最高。

圖5 AML 患者SF-AS 網絡及生存分析
Pre-mRNA 經選擇性剪接修飾生成成熟mRNA 是真核生物轉錄過程中必不可少的一個環(huán)節(jié)[11],在基因表達的源頭上產生了重要的影響, 不同的選擇性剪接方式可以產生不同的基因轉錄本,異常調節(jié)下游靶基因或信號通路的作用, 使得癌細胞的功能產生變化,進而影響疾病的表型。 這一類變化不局限于轉錄本表達量的改變, 更是在于結構水平上的不同, 結構水平能更直觀表現(xiàn)基因作用位點的差異性,具有較強的說服力,因此選擇性剪接事件作為分子標志物具有廣闊的應用前景。在本研究中,我們以AML 為研究對象,綜合利用了多種醫(yī)學統(tǒng)計方法,將AML 患者的選擇性剪接事件發(fā)生情況和相應的臨床信息進行整合, 構建可評估AML 患者預后風險的選擇性剪接事件模型。 此外,從SFs-AS 網絡的角度可進一步了解選擇性剪接推動因素,為AML 發(fā)生發(fā)展的機制提供進一步的見解。 目前研究表明,可變剪接事件有可能作為腫瘤學中新的生物標志物, 并且為藥物的開發(fā)提供大量新靶點[12],這對于改善癌癥患者預后和減少癌癥異質性來說非常有意義。
本研究通過LASSO 回歸分析構建了與AML患者預后相關的AS 事件預后模型, 通過這個模型,我們能有效地預測AML 患者預后。 此外,我們也發(fā)現(xiàn)高低風險組的腫瘤微環(huán)境具有差異。 高風險組免疫細胞浸潤水平和免疫評分更高。 這些內容從理論上為AML 分子生物學研究和臨床預后判斷提供了參考價值。 但這項研究的局限在于完全的生物信息學分析, 缺乏新的AML 患者AS 數據進行驗證。 未來我們將結合臨床病人數據進行驗證, 并針對這一系列AS 事件開展基礎實驗,進一步強化AML 中選擇性剪接調控的研究。
最后,我們將目光聚集到SFs 上,作為剪接調控的工具,這些分子在形成大量AS 事件的過程中發(fā)揮了巨大作用[12]。 強化認識SFs 在AML 異常AS事件中的功能, 是解開AML 以AS 為方向的病理機制的關鍵一步。 越來越多的研究表明,SFs 的變化可以通過多種機制參與AML 的發(fā)生和發(fā)展[13]。我們繪制的AS-SF 網絡圖顯示QKI 位于網絡的中心,QKI 是RNA(STAR)家族信號轉導和激活的成員,也屬于異質核核蛋白K-(hnRNP K-)同源結構域蛋白家族。QKI 在許多腫瘤疾病發(fā)生發(fā)展中都具有調控作用, 如QKI 通過RAS p21 蛋白激活劑1/絲裂原活化蛋白激酶(RASA1/MAPK)信號通路抑制乳腺癌[14],調節(jié)缺氧誘導因子1(HIF-1α)的表達抑制腎透明細胞癌的發(fā)生[15],巨噬細胞中QKI 的丟失通過擴增活性氧(ROS)信號和微生物群的破壞加劇炎癥性腸病[16]。這些表明QKI 在癌癥發(fā)展中起到了重要作用,但在AML 中未見報道,未來可針對該分子進一步研究其與AML 的關系。
本研究揭示了AML 患者中預后相關AS 事件,進一步認識了AML 中的AS 特征,此外,我們通過AS 事件構建的預后模型具有較準確的預后預測能力。 最后,我們也分析了模型高低風險組患者免疫微環(huán)境的特征, 并構建了SFs-AS 網絡, 這一部分內容為我們針對AML 免疫治療和后續(xù)AML 剪接機制研究提供了線索。