陳鶴文,崔萌,高欣,鄭曉缺,關兵,馬曉東
膠質瘤是中樞神經系統最常見且致命的原發性惡性腫瘤,預后較差[1]。膠質瘤可以根據WHO分類分為Ⅰ-Ⅳ四個等級[2]。其中,WHO Ⅳ級膠質母細胞瘤(glioblastoma,GBM)是惡性程度最高的一級,盡管采取放射治療、替莫唑胺為主的化療和手術切除等積極的治療方案,但由于腫瘤的高度可塑性和異質性,GBM仍然表現出非常高的復發率和死亡率[3]。對此,鑒定膠質瘤進展中診療相關基因和潛在機制迫在眉睫。現已闡明,RNA結合蛋白可以通過轉錄后調控改變癌癥驅動基因的表達和功能,調節癌細胞的生物學特性。它們通過結合特定的RNA結構域與RNA靶點相互作用,參與調控癌癥的發生、發展和轉移[4]。
Quaking基因編碼的QKI是屬于RNA信號傳導和激活家族(STAR)家族的一種RNA結合蛋白[5]。QKI在中樞神經系統中高表達,對髓鞘的形成和神經系統的發育有關鍵作用[7-8]。Li等[9]首先報道了QKI在膠質瘤組織中表達缺失的現象。之后多項研究表明,QKI在多種惡性腫瘤(如乳腺癌、胃癌、結直腸癌)中的表達下調對腫瘤發生發展有關鍵的作用。QKI可以通過促進microRNA穩定性、選擇性剪切和細胞周期調控等方式參與調控腫瘤生長,逐漸被認為是多種惡性腫瘤的抑癌因子[10-16]。這些發現證實了QKI在惡性腫瘤中的關鍵作用,但是QKI與膠質瘤的臨床相關性和生物學機制還有待發掘。
本研究使用公共數據庫探討QKI的表達與膠質瘤臨床病理特征及患者生存的關系,然后通過蛋白互作網絡和功能富集探索QKI在膠質瘤中的生物學功能和分子機制。為QKI在膠質瘤中的基礎作用提供新的線索,并將QKI確定為膠質瘤預后相關的分子標志物。現報告如下。
1.1 材料 本研究中,膠質瘤樣本的轉錄組數據及對應的臨床資料來自中國腦膠質瘤基因組圖譜(Chinese Glioma Genome Atlas,CGGA)數據庫(數據集:mRNAseq_325)和癌癥基因組圖譜計劃(The Cancer Genome Atlas,TCGA)。并使用R軟件(V4.0.2)對數據進行批次矯正和標準化處理,去除臨床數據不完整的病例,最終納入CGGA數據庫321例(WHO Ⅱ級:103例;WHO Ⅲ級:79例;WHO Ⅳ級:139例)和TCGA數據庫635例(WHO Ⅱ級:224例;WHO Ⅲ級:243例;WHO Ⅳ級:168例)膠質瘤樣本。
1.2 基因的差異表達分析 探究不同WHO級別膠質瘤患者的QKI表達水平是否存在差異。之后,再根據患者的IDH突變情況、發病年齡、1p19q染色體缺失情況分組對比QKI的表達水平差異情況,得出QKI表達與膠質瘤臨床病理特征之間的相關性。
1.3 膠質瘤患者的生存和預后分析 根據QKI表達中位值將CGGA數據庫中膠質瘤患者分為高表達組(156例)和低表達組(157例),根據患者的生存資料繪制Kaplan-Meier(KM)曲線圖。分析QKI的表達水平與膠質瘤患者生存時間的關系,分析QKI表達對TCGA膠質瘤患者的生存影響對其進行驗證。使用單因素和多因素COX比例風險回歸模型,評估CGGA數據庫中QKI基因表達(高表達;低表達)、年齡(≤41歲;>41歲)、WHO分級(Ⅱ級&Ⅲ級;Ⅳ級)、IDH突變狀態(野生型;突變型)、染色體1p19q共缺失狀態(缺失型;非缺失型)對膠質瘤患者預后的影響。
1.4 蛋白互作網絡和基因富集分析 通過STRING(https://string-db.org/)預測QKI的蛋白互作網絡,相關系數>0.65,P<0.01表明顯著共表達。然后,使用R軟件(V4.0.2)包“cluster Profiler”進行基因本體(Gene Ontology,GO)和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)分析。
1.5 統計學方法 箱式圖和KM生存曲線由R軟件(V4.0.2)進行統計分析和制作。基于方差齊性和正態分布的數據,采用獨立樣本t檢驗。計算皮爾遜相關系數來確定兩個連續變量之間的相關性。以P<0.05認為差異有統計學意義。
2.1 QKI基因與膠質瘤臨床病理特征的表達關系分析 本研究分析了CGGA數據庫(321例)中QKI表達水平和膠質瘤臨床特征(包括WHO級別、年齡、IDH突變和染色體1p19q缺失情況)的關系。與WHO Ⅱ級或WHO Ⅲ級膠質瘤相比,WHO Ⅳ級膠質瘤中QKI的表達水平顯著降低,差異有統計學意義(WHO ⅡvsWHO Ⅳ:P<0.001;WHO ⅢvsWHO Ⅳ:P<0.01)。見圖1。同時,QKI高表達與膠質瘤患者年齡(≤41歲)、IDH突變、染色體1p19q缺失密切相關(P值均<0.001)。然后使用TCGA數據庫對上述結果進行了驗證,結果見圖2,WHO Ⅳ級膠質瘤中QKI mRNA的表達水平顯著下降,差異有統計學意義(WHO ⅡvsWHO Ⅳ:P<0.001;WHO ⅢvsWHO Ⅳ:P<0.001)。QKI在年齡≤41歲、IDH突變型、染色體1p19q缺失型膠質瘤中表達水平較高(P值均<0.001)。

圖1 CGGA數據庫中QKI表達水平與膠質瘤臨床病理特征的關系

圖2 TCGA數據庫中QKI表達水平與膠質瘤臨床病理特征的關系
2.2 QKI基因表達水平對膠質瘤患者生存的影響根據QKI表達量的中位值將CGGA數據庫的膠質瘤患者分為QKI高表達組(CGGA=156例)和QKI低表達組(CGGA=157例),然后對膠質瘤患者的總生存時間(overall survival,OS)進行生存分析并繪制KM生存曲線(圖3)。結果顯示,QKI的表達與膠質瘤患者良好預后正相關(P<0.001)。通過對TCGA膠質瘤患者進行生存分析,結果顯示QKI高表達組患者總生存期顯著高于低表達組(P<0.001)。

圖3 CGGA和TCGA數據庫中QKI表達與膠質瘤患者生存的關系
本研究進一步分析了QKI表達水平對放療與化療患者生存時間的影響(圖4)。將CGGA數據庫中251例放療患者根據QKI表達中位值分為高表達組(125例)和低表達組(126例)并進行KM生存分析,結果顯示QKI高表達組患者的生存時間顯著高于低表達組患者(P=0.001)。同樣,將CGGA數據庫中203例化療患者根據QKI表達中位值分為高表達組(101例)和低表達組(102例)進行生存分析,QKI高表達組患者生存時間高于低表達組患者,結果有統計學意義(P=0.043)。

圖4 CGGA數據庫中QKI表達與放療和化療患者生存的關系
2.3 單因素和多因素COX回歸模型分析 CGGA數據庫的單因素COX回歸分析顯示,QKI表達(HR=0.591,95%CI=0.452~0.773,P<0.001)、年齡(HR=1.579,95%CI=1.308~1.907,P<0.001)、WHO級別(HR=2.734,95%CI=2.390~3.127,P<0.001)、IDH突變狀態(HR=0.387,95%CI=0.269~0.483,P<0.001)、染色體1p19q缺失狀態(HR=0.243,95%CI=0.180~0.328,P<0.001)均是膠質瘤患者預后的顯著性影響因子(表1)。多因素COX回歸分析顯示,年齡>41歲(HR=1.251,95%CI=0.990~1.579,P=0.045)和WHO Ⅳ級(HR=2.686,95%CI=1.945~3.708,P<0.001)是膠質瘤預后的不良預后影響因子,而QKI高表達(HR=0.821,95%CI=0.736~0.916,P=0.038)和染色體1p19q共缺失(HR=0.527,95%CI=0.418~0.664,P<0.001)是膠質瘤良好預后的獨立影響因子。

表1 CGGA數據庫單因素和多因素COX回歸分析
2.4 蛋白互作網絡和富集分析 為了深入了解QKI在腫瘤發生或抗腫瘤治療中的潛在機制,進一步收集了QKI相關蛋白和基因進行后續富集分析。通過STRING數據庫獲得了QKI和ARAF,CAMK2A,CAMK2B,CAMK2D,CAMK2G,FUBP3,JAK2,RAF1,RBFOX2,RBPMS蛋白的相互作用網絡(圖5)。然后進行了功能富集分析,GO富集結果顯示,QKI共表達基因主要參與RNA剪切、細胞質顆粒和蛋白激酶活性等功能。KEGG信號通路富集結果顯示,QKI與膠質瘤密切相關并參與ErbB和GnRH信號通路(圖6)。

圖5 QKI相關蛋白互作網絡

圖6 QKI及其相關基因的GO和KEGG富集分析
2.5 QKI表達與膠質瘤免疫細胞浸潤的關系 使用TIMER(Tumor Immune Estimation Resource)數據庫分析QKI表達與多種膠質瘤免疫細胞的表達關系,在GBM中QKI表達水平與多種免疫細胞相關,包括CD8+T細胞(P=7.74×10-3,相關系數=0.13)、CD4+T細胞(P=6.55×10-4,相關系數=0.166)、巨噬細胞(P=2.58×10-3,相關系數=0.147)和中性粒細胞(P=1.26×10-18,相關系數=0.413);在低級別腦膠質瘤(low grade glioma,LGG)中QKI表達水平與B細胞(P=2.25×10-7,相關系數=0.234)、CD8+T細胞(P=9.93×10-66,相關系數=0.201)、CD4+T細胞(P=2.05×10-2,相關系數=0.106)、巨噬細胞(P=3.52×10-6,相關系數=0.211)和樹突狀細胞(P=1.25×10-2,相關系數=0.114)表達相關。提示QKI與膠質瘤的免疫細胞浸潤有密切的關系。

圖7 QKI表達水平與膠質瘤免疫細胞浸潤相關
QKI是最早在中樞神經系統和外周神經系統中被鑒定的RNA結合蛋白,可以調控靶基因的前mRNA加工、mRNA穩定、亞細胞定位和翻譯[5-6]。人類的QKI基因可以表達3種主要的、交替拼接的轉錄因子,即QKI-5、QKI-6和QKI-7。QKI-5是唯一定位于細胞核的異構體,而QKI-6和QKI-7則分布于細胞質[4]。作為一種RNA結合蛋白,QKI可以通過與反應元件結合的方式,在轉錄后調控靶基因的前體信使RNA加工、mRNA輸出、mRNA穩定性和蛋白質翻譯[6]。近期研究表明,QKI在多種惡性腫瘤中起到關鍵作用,如QKI的表達水平受到miR-155的抑制后可以促進結腸癌的發生與發展[17];QKI還可以調節NUMB選擇性剪接,從而抑制肺癌中Notch信號通路激活和細胞增殖[18];在腫瘤細胞增殖周期方面,QKI高表達可以延長腫瘤細胞的G1期,阻礙卵巢癌和腎癌細胞的發展[19-20];QKI的表達升高可以通過調控上皮質間化,在食管鱗狀癌中發揮抑癌作用[21];此外,QKI在膠質瘤的發生、膠質瘤干細胞微環境的維持和調節、膠質干細胞分化等方面發揮重要作用[22-23]。QKI在多種腫瘤中的作用表明,QKI可能成為重要的分子生物標記物和藥物治療靶點,但是QKI表達水平與膠質瘤病理特征的關系及對生存的影響還尚未報道。
本研究通過使用CGGA和TCGA中大樣本量的RNA-seq信息分析了QKI表達和膠質瘤病理特征之間的關系,發現在WHO Ⅳ級膠質瘤中QKI表達水平顯著降低(P<0.001)。Li等[9]發現,相比較于正常組織,QKI在膠質瘤中表達下調;這與本研究結論相符,提示QKI的下調在膠質瘤的發生發展中發揮了關鍵的作用。此外,本研究分析了QKI表達水平與年齡及膠質瘤分子標志物的關系,結果表明QKI在IDH突變型膠質瘤中的表達水平高于IDH野生型膠質瘤(P<0.001)。IDH突變狀態是膠質瘤診斷和預后的重要分子標記物,與IDH野生型膠質瘤相比,IDH突變型膠質瘤的生存期可以增至2~3倍[24]。染色體1p19q聯合缺失型膠質瘤QKI的表達水平較高(P<0.001)。既往文獻表明,染色體1p19q聯合缺失型膠質瘤生存期明顯高于1p19q非聯合缺失型膠質瘤患者[25],基于此提示QKI表達水平有可能成為膠質瘤患者生存相關的獨立影響因子。對CGGA和TCGA數據庫中膠質瘤患者的OS進行生存分析,結果表明QKI高表達組患者的總生存期顯著高于低表達組(P<0.001)。同時,在CGGA數據庫中,對于接受了放療或化療的膠質瘤患者,QKI高表達組的生存期明顯高于低表達組(放療:P=0.001;化療:P=0.043),提示QKI高表達有可能提高了膠質瘤患者對放化療的敏感性。多因素COX回歸分析證實了QKI高表達是腦膠質瘤良好預后的獨立影響因子(P=0.038)。
為了進一步探究QKI與膠質瘤良好預后相關的生物學機制,使用String數據庫分析了QKI相關蛋白的蛋白互作網絡,結果表明QKI與多種信號激活和轉導蛋白關系密切;其中JAK2/STAT3信號通路的激活可以促進膠質瘤細胞的增殖和分化,同時是膠質瘤炎癥性微環境的關鍵信號通路[26]。提示QKI可能通過調節JAK2表達參與膠質瘤的生物學過程,但是仍需要進一步的實驗研究證實。功能富集分析提示,QKI在生物學上主要有RNA剪切、細胞質顆粒和蛋白激酶活性等功能。KEGG信號通路富集結果顯示,QKI與膠質瘤密切相關并參與ErbB和GnRH信號通路,這為深入探索QKI調控膠質瘤細胞的潛在機制提供了重要的方向。腫瘤浸潤性免疫細胞是腫瘤免疫微環境的重要組成部分,是膠質瘤發生發展的重要調節因子[27]。使用TIMER數據庫的研究結果表明,QKI表達與GBM和LGG中多種免疫細胞浸潤相關(包括巨噬細胞),提示QKI可能通過調節膠質瘤免疫浸潤細胞影響膠質瘤微環境的免疫應答。已有多個研究表明,QKI的缺失會引起巨噬細胞吞噬功能下降。Ren等[8]提出QKI是脫髓鞘過程中小膠質細胞吞噬作用的重要調節因子,QKI降低能夠損傷巨噬細胞的吞噬功能。De等[28]通過對人類單核細胞和巨噬細胞轉錄組的RNA測序和芯片分析,證實了QKI在轉錄后指導巨噬細胞特性和功能方面的核心作用。本研究中,QKI在膠質瘤微環境中與巨噬細胞關系密切,提示QKI可能通過影響巨噬細胞的吞噬功能參與膠質瘤的生物學行為。
綜上,QKI被鑒定為與膠質瘤診斷和預后相關的抑癌基因,與膠質瘤患者的臨床病理特征和生存關系密切。QKI有望成為新的膠質瘤分子標志物和治療靶點,通過提高QKI表達水平使膠質瘤患者得到有效治療。但是,本研究還需要進一步對研究結果進行細胞學和動物實驗的驗證,為QKI在膠質瘤中的生物機制提供證據支持。
利益沖突:所有作者均聲明不存在利益沖突。