帕成周,張貫啟,鄔善敏
可變剪切(alternative splicing,AS)又稱選擇性剪切,在mRAN前體到成熟mRNA的這一過程中,不同的剪切方式使得同一個基因可以產生多個不同的成熟mRNA,最終產生不同的蛋白質[1]。AS包含7種選擇性剪切類型,即可變受體位點(AA)、可變供體位點(AD)、可變啟動子(AP)、可變終止子(AT)、外顯子跳躍(ES)、外顯子互斥(ME)、內含子保留(RI)。
胰腺癌(pancreatic adenocarcinoma,PAAD)常見的首發癥狀為上腹部疼痛及不適,早期缺乏特異的臨床表現,容易忽略,就診率低。據中國國家癌癥中心統計數據顯示[2],2015年我國PAAD發病率位居惡性腫瘤第9位,死亡率位居惡性腫瘤第6位。PAAD現有治療手段有限,目前尚未明確發現PAAD的發生發展機制及其相應靶基因的作用。近年來研究表明[3-4],AS事件常在癌癥中發生,可用于腫瘤靶向治療,且被認為與腫瘤發生發展密切相關?,F分析AS事件在PAAD中的發生情況、臨床生存率及調控網絡,以便為臨床評估及深入研究提供依據,報道如下。
1.1 數據集下載及篩選 自癌癥基因組圖譜(TCGA)(https://portal.gdc.cancer.gov/projects)下載并整理TCGA胰腺癌隊列的RNA-seq數據、臨床數據,獲取PAAD病例的臨床病理參數和預后資料,并提取剪接因子(splicing factor,SF)表達量。采用TCGA SpliceSeq工具(https://bioinformatics.mdanderson.org/TCGASpliceSeq/)進行拼接百分比值(percent-splice-in值,PSI值)數據下載及提取可變剪切事件數據,探索與PAAD相關的AS事件的變化。
1.2 生物信息學及統計學分析 利用UpSetR包定量分析PAAD中7種AS類型之間的交集;對172例總生存期至少90 d的PAAD患者,采用單因素Cox分析篩選出與生存顯著相關的AS事件數據,定量分析PAAD中7種與生存相關的AS類型之間的交集,進行與生存相關AS事件的亞組分析。利用Lasson回歸篩選后構建Cox模型,借助AS事件的PSI值及回歸系數計算PAAD患者風險值并截取中位值,分為高、低風險2組。使用Survival包對納入的80例具有完整臨床資料的PAAD患者,采用Kaplan-Meier法進行生存分析,采用單因素Cox回歸分析選擇可能影響PAAD預后的因素,采用多因素Cox回歸分析驗證風險值與PAAD患者生存時間的相關性。采用Cytoscape(3.7.1版)構建PAAD生存相關AS事件與SF的調控網絡。本研究所有資料均用R(3.5.2版)進行分析,以P<0.05為差異有統計學意義。
2.1 PAAD中AS事件發生數目及與生存相關的AS事件發生數目 在PAAD樣品中,發現1 805個基因只發生ES,1 125個基因只發生AT,757個基因只發生AP,最常見的AS事件前3位分別是ES、AT、AP,ME為最罕見的AS事件,見圖1A。經單因素Cox分析選取與生存相關的AS事件,研究表明與生存相關發生AS事件前3位為ES、AP、AT,ME仍較少見。其中,938個基因只發生ES,597個基因只發生AP,592個基因只發生AT,見圖1B。
2.2 PAAD中與生存相關的各型AS事件分析 在單因素Cox分析選取的數據基礎上進行各類型AS事件的可視化分析,分別顯示了7種類型中與生存相關最重要的20個AS事件,CD44基因中發生的ES事件與生存顯著相關,UBA1、VRK3、SPAG7、ITGB1BP1、SPINT2、DNM2基因中分別對應發生的AP、AT、RI、AA、AD、ME事件與生存顯著相關,并且大多數AP、RI事件是PAAD的危險因素,見圖2。
2.3 PAAD中AS事件的臨床生存分析 通過構建Cox模型,見表1,利用PSI值、回歸系數計算PAAD患者風險值中位值為1.00,并將所有AS事件分為高、低風險2組,比較2組生存差異。通過Kaplan-Meier分析可發現高、低風險2組的生存差異具有統計學意義(χ2=42.10,P<0.01)。高風險組的中位生存期為1.3年,低風險組則為5.6年。值得注意的是,隨訪至第6年時,高風險組無存活患者,低風險組仍有2例存活,見圖3A。ROC曲線的AUC為0.765,表明該模型構建比較準確,見圖3B。單因素Cox回歸分析表明風險值與患者總體生存率密切相關;多因素Cox回歸分析則進一步提示高風險值是影響PAAD患者預后的獨立危險因素(HR 1.050,95%CI1.03~1.07,P=0.000),見表2。
2.4 PAAD中生存相關AS事件與SF的調控網絡 為了探索生存相關AS事件之間的功能關系(|cor|>0.8,P<0.01),使用Cytoscape生成基因相互作用網絡顯示,CELF3、CELF4、MSI1、NOVA1、CIRBP等剪接因子在調控網絡與AS事件密切相關。ELAVL3對高風險的AS事件起負調控作用,PRPF39對低風險的AS事件起正調控作用,而CPSF6對低風險的AS事件起負調控作用。同時可以發現,RALYL存在對高風險AS事件負調控及低風險AS事件正調控的雙重作用,見圖4。

表1 基于AS事件的Cox模型參數

表2 單因素Cox回歸分析PAAD臨床特征、AS事件風險值和總體生存率的相關性
剪切因子(SF)是參與RNA前體剪切過程的蛋白質因子,表達異常會導致基因的AS發生改變,增加了基因組表達mRNA的多樣性,使其編碼的蛋白質改變,進而改變表型。在腫瘤中,SF表達異??赡軙鹛囟ù侔┘羟挟悩嬻w的形成,從而導致癌癥的發生[3]。本研究中,基于AS事件的風險值計算,發現風險值可作為預后特征。SF和生存相關AS事件之間存在調控關系的研究,讓人們對PAAD中SF在AS事件所處的調控中心有了更深入的認識。
在PAAD中與生存相關的AS事件發生情況的研究發現,位列首位為ES。同樣,有研究發現在乳腺癌、前列腺癌中ES也是主要的AS事件[5-6],可能與RNA的保守性及存在順式調控元件相關,目前尚未完全闡明。在亞組AS事件可視化分析中得到的部分基因在PAAD中的作用得到了實驗驗證。研究證實ESRP可以調節CD44 v8-10和v6-10外顯子的剪接[7],且CD44的選擇性剪接調控因子在正常或腫瘤細胞中的下調并不影響CD44的總mRNA水平[8]。在細胞水平及臨床研究中發現[9-10],CD44陽性表達的胰腺癌細胞較CD44陰性亞群相比惡性程度更高,且與T分期、TNM分期、淋巴結轉移、分化程度和腫瘤部位等相關。在腫瘤形成方面,CD44高表達的腫瘤組織在大小和質量上更占優勢。腫瘤中的UBA1、VRK3、SPAG7、ITGB1BP1、SPINT2、DNM2等基因中的AS事件值得關注。
通過ROC曲線,分析了AS事件對PAAD預后的預測能力。結果表明,AS事件與PAAD患者的存活時間相關,高風險值可作為PAAD的不良預后因素。此外,本研究分析也強調了SF在AS事件中潛在的調節網絡。有研究發現[11],通過刪除MSI1/MSI2使得胰腺上皮內瘤變進展為腺癌的速度減慢,MSI1的缺失可引起小鼠MR下的腫瘤體積減少為原來的1/5倍。同樣,有實驗研究證實NOVA1與胰腺β細胞功能有關,如胞吐作用、轉錄、胰島素受體信號傳導、剪接和細胞凋亡[12]。但是,調控網絡中凸顯出的SF功能及作用機制還需要深入探索。調控網絡還顯示出明顯的趨勢,即大多數低風險AS事件與SF的表達呈正相關,而高風險AS事件與SF的表達呈負相關。盡管如此,一些特定SF表達的下調是否會導致低風險AS事件減少和高風險AS事件增加還需要進一步通過實驗驗證。
當前癌癥治療的主要難題是患者對治療藥物產生了耐藥性,導致治療失敗。一項研究表明[13],剪接體突變改變了剪接位點和/或外顯子的識別偏好,這種機制的變化可能會在癌細胞中產生突破點,利用剪接體突變的生化特性、基因組和生物學效應優化腫瘤治療方法和手段。Siegfried等[14]研究發現胰腺導管腺癌細胞中丙酮酸激酶基因(PKM)的AS受到影響,導致促進與癌癥相關的PKM2亞型表達升高,可增強胰腺腫瘤對吉西他濱的耐藥性。此外,通過反義寡核苷酸切換PKM剪接,從而有利于PKM1的替代變體表達,增強氧化磷酸化,使胰腺腫瘤細胞對吉西他濱消除耐藥性,進而成為改善胰腺導管腺癌對化療反應的新潛在治療靶點。
總之,本研究對PAAD中與生存相關的AS事件進行了概述,并建立了有價值的預后模型,可用于疾病預后預測。AS事件與SF之間的調控網絡提出了SF如何潛在調節PAAD中AS事件的新見解。這些與生存相關的AS事件和SF為PAAD患者提供了許多新的治療靶點,值得進一步深入研究。
利益沖突:所有作者聲明無利益沖突
作者貢獻聲明
帕成周:查閱網絡生物信息數據挖掘資源,完成大部分數據分析,論文撰寫;張貫啟:完成部分數據分析,論文指導;鄔善敏:論文審核