趙琳 何章彪 張欣 曹翠萍
(1商丘醫學高等專科學校,河南 商丘 476000;2南陽醫學高等??茖W校)
鼻咽癌(NPC)是鼻咽上皮的惡性腫瘤,在東南亞和中國比較普遍〔1,2〕。在流行區,早期NPC患者的5年生存率達95%,晚期NPC患者的生存率僅為60%,70%的初診NPC患者的病情會進一步發展〔3〕。因此,尋找潛在的識別早期NPC患者的生物標記物對改善患者預后具有重要意義。EB病毒(EBV)DNA檢測目前用于NPC早期患者的篩查,但其對腫瘤篩查的陽性預測值較低(11%)〔4〕。有證據表明,基因和細胞信號通路,可能參與NPC的發生和發展,包括TGF-β信號通路和Notch信號通路〔5〕。NPC進展的分子機制尚不清楚,目前對NPC的早期診斷和治療有限〔6〕。因此,需要進一步研究NPC發生和發展的分子機制。
基因芯片是分析基因表達的高通量平臺,可以鑒定參與各種信號通路、分子功能和生物學過程的數百個差異表達基因(DEGs)〔7〕。本研究從基因表達綜合數據庫〔GEO;www.ncbi.nlm.nih.gov/geo;GPL570(HG-U133_Plus_2)Affymetrix Human Genome U133 Plus 2.0 Array〕上下載了GSE64634數據,以鑒定NPC組織中的DEGs〔8〕。隨后,進行了基因本體論(GO;www.genontology.org)和京都基因與基因組百科全書(KEGG)信號通路富集分析,以確定關鍵基因的生物學功能和通路〔9〕。這項研究的結果為NPC的潛在生物標志物提供了新的見解,并可能有助于對NPC發生和發展的分子機制的理解。
1.1研究工具和對象 基因表達譜GSE64634從GEO數據庫下載。GSE64634是在Affymetrix GPL570平臺〔GPL570(HG-U133_Plus_2)Affymetrix Human Genome U133 Plus 2.0 Array〕的基礎上提出的,由12例NPC標本和4例正常對照(GSM1575894,GSM1575895,GSM1575896,GSM15-75897)組成。應用在線分析工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)對NPC及對應的癌旁組織進行DEGs分析。GEO2R是一個基于R語言程序的數據集分析工具,能夠對相同實驗條件下的兩組樣品進行對比,篩選DEGs。基因表達的差異用差異倍數(FC)表示。本研究設定的篩選標準分別為P<0.05,|logFC|≥1(篩選表達差異大于等于2倍的DEGs;或P<0.05,|logFC| ≥2 (篩選表達差異≥4倍的DEGs)。所篩選的差異顯著性基因見表1。
1.2基因功能和通路富集分析 Metascape (http://metascape.org/)是一種在線分析工具,用于提取與候選基因列表相關的生物信息。它不僅可以提供典型的基因功能富集分析,而且可以實現可視化分析,可查看差異顯著性基因的生物功能、信號通路富集等。對篩選出的DEGs進行了GO分析和KEGG通路分析,并利用Metascape工具對篩選的DEGs進行了GO和KEGG通路分析。以P值<0.01為界值,以富集程度評分〔-log10(P)〕進行顯著性排列。
1.3構建蛋白質相互作用(PPI) 網絡String(http://string-db.org)是一個基于Web的資源,用于檢索基因相互作用的搜索工具,用于預測輸入基因列表的蛋白質綜合信息。本研究使用字符串來獲取DEGs的PPI信息,并選擇組合得分大于0.4的相互作用進行研究。在此基礎上,根據蛋白質之間相互作用的信息,利用Cytoscape軟件(Version3.4.0,http://www.cytoscape.org/)構建了PPI網絡,并對網絡進行了可視化。使用Cytoscape Plug-in Network Analyzer進行了進一步的分析,并計算了PPI網絡的拓撲性質、節點度。
1.4以MCODE方法分析鼻咽癌的Hub基因 MCODE分析是檢測PPI網絡中緊密連接區域的一種方法。本研究使用MCODE分析從構建的PPI網絡中選取最重要的模塊進行進一步分析。參數設置:node score cutoff=0.2,K-Core=2,degree cutoff=2。
2.1NPC差異顯著基因的篩選 從GEO公共數據庫中選取GSE64634的基因芯片數據,上傳到GEO2R網絡工具中,篩選正常鼻咽組織和NPC組織之間的DEGs。圖1顯示了DEGs的火山圖。每個顏色點代表一個上調或下調的基因,其中綠色表示下調的基因,紅色表示上調的基因,黑色表示根據P值<0.05和|logFC|>1的標準,沒有差異表達的基因。從GSE64634中鑒定出1 014個DEGs,包括191個上調基因和823個下調基因。圖2分別描繪了來自GSE64634的上調和下調的前10個重要基因的DEGs表達熱圖,基因表達水平用顏色表示,紅色表示高表達,藍色表示低表達。聚類分析表明,在正常鼻咽和NPC組織中,DEGs的表達存在差異。具體差異顯著性基因以表格的形式呈現(表1)。這193個重疊基因被確認為候選DEGs,并用于進一步的分析。

表1 NPC基因芯片GSE64634中篩選出193個差異表達基因

圖1 GSE64634微陣列中的DEGs火山圖

圖2 GSE64634微陣列中前10個差異表達的DEGs mRNA水平的熱圖
2.2DEGs的功能和途徑富集分析 在Metascape數據庫的基礎上,對篩選的NPC的候選DEGs的GO功能和KEGG通路進行了富集分析。以P值為<0.01、最小重疊基因=3和最小富集因子>1.5作為設置標準。如圖3所示,DEGs富集分析主要集中在纖毛運動、體液免疫應答、抗菌體液反應、藥物代謝-細胞色素P450、花生四烯酸代謝過程、鞭毛的精子能動性、化學致癌性、金屬離子運輸、適應性免疫反應的負調控等方面,這些基因之間的功能彼此緊密地聯系在一起,并聚集成完整的網絡(圖4)。圖4顯示了KEGG途徑的富集分析。每個條帶代表一個豐富項或通路,根據-log 10P值著色,網絡的豐富條件和途徑,節點代表豐富的術語或途徑,節點大小表示所涉及的DEGs的數量。共享同一個集群的節點通常彼此靠近,顯示的邊界越粗,相似度就越高。
2.3PPI網絡構建 將篩選的獲得的差異基因輸入STRING網站,構建PPI網絡(圖5),并進一步應用Cytoscape軟件中的分子復合物檢測(MCODE)分析對PPI網絡中連接最為緊密的基因進行分組,形成多個模塊。結果顯示共有3個模塊評分較高(圖2)。其中評分最高的模塊1中共包含了SNRPG,SNRPE,DDX42,SF3A3,DDX46,BUD31,SF3B6,U2AF2,SF3B5,SF3B3,PHF5A,SNRPD3,SF3A2,SNRPA1,SNRPB2,SF3B1,SF3B4,SNRPD2,PRPF6,SF3A1,PRPF31,SNRPA,SNRPB,SNRPD1,SF3B2等25個基因,共形成了300種相互作用關系,具有較高連接度,為中心(Hub)基因。

1~13:纖毛運動、體液免疫反應、抗菌體液反應、藥物代謝細胞色素P450、花生四烯酸代謝過程、鞭毛精子存活率、化學致癌、輔助因子轉運、金屬離子轉運、營養水平的細胞反應、成肌細胞融合、適應免疫反應的負調控、SLC介導的跨膜轉運;圖4同圖3 DEGs富集分析

圖4 KEGG途徑的富集分析

圖5 DEGs對應的蛋白質相互作用緊密連接度最高的3個模塊
NPC是頭頸部最常見的鱗狀細胞腫瘤之一〔5,10〕。Ⅰ期患者的5年生存率為95%。然而,Ⅳ期患者的5年存活率略高于60%〔11〕。因此,了解NPC進展的病因和分子機制對于診斷和治療至關重要〔12〕。微陣列技術已被廣泛應用于預測癌癥的潛在治療靶點,包括結直腸癌〔13〕。在此之前,Wang等〔14〕分析了GSE12452數據集,發現細胞周期蛋白(cyclin)B1、黏蛋白1、細胞表面相關和乙醛脫氫酶1家族成員A1可能與EBV相關的NPC有關。GSE12452序列分析表明,CXC基序趨化因子配體(CXCL)9、ZIC家族成員2、前列腺素內過氧化物合成酶2、纖維連接蛋白1、CXCL10和 ovo 樣轉錄抑制因子1可能在NPC中發揮作用。在本研究中,通過生物信息學分析篩選了20個上調和173個下調的DEGs。KEGG通路富集分析和GO功能注釋結果顯示,上調表達的DEGs主要富集于依賴DNA的DNA復制、細胞分裂、調節參與炎癥反應的細胞因子的產生、抗原處理和肽抗原通過MHC Ⅱ類遞呈和胚胎骨骼系統發育,而表達下調的DEGs主要參與纖毛運動、微管運動、鞭毛精子活力、纖毛或鞭毛依賴的細胞運動和動脈內皮細胞分化,膠質細胞增殖、趨化因子介導的信號通路、軟骨細胞增殖、肌動蛋白絲聚合、神經遞質分解代謝過程。已有研究表明,NPC細胞的侵襲、轉移、增殖和凋亡可能受特異性基因表達上調或下調的影響。這個結果與癌細胞的侵襲和轉移與異常的細胞黏附和細胞分裂密切相關的事實是一致的〔15〕。此外,癌細胞的增殖和凋亡與依賴DNA的DNA復制的異常密切相關。因此,分析所涉及的信號通路為理解腫瘤增殖提供新的見解。
本研究中構建了一個PPI網絡來識別25個最重要的Hub基因。這25個基因形成300種相互作用關系將其緊密聯系在一起,構成一個相對獨立的網絡,并可能通過拮抗或協同作用起到相似的生物學功能。進一步GO分析發現,DDX42參與調控細胞凋亡的過程,通過與TP53BP2相互作用參與細胞存活,可以抵消TP53BP2的凋亡刺激活性。沒有白細胞介素(IL)-3的誘導會引起細胞凋亡,過表達DDX42可以保護Ba/F3細胞免受這種影響,過表達DDX42通過影響IL-3誘導細胞骨架重排來調節細胞極化〔16〕。U2AF2可以負性調控蛋白泛素化。U2AF2在原發性非小細胞肺癌組織中也顯著上調,并且與腫瘤轉移,晚期腫瘤分期,腫瘤患者不良預后和復發顯著相關〔17〕。而且癌癥相關突變與U2AF2剪接因子的功能密切關聯〔18〕。U2AF2介導的CD44亞型會導致體外黑素瘤遷移,體內黑色素瘤轉移至肺和肝〔19〕。SNRPD3、SNRPB參與蛋白質甲基化作用〔20〕。SNRPB在非小細胞肺癌中的表達異常,并且與非小細胞肺癌不良預后相關。在小鼠前列腺癌移植模型中,SNRPB被鑒定為轉移抑制基因〔21〕。敲除SNRPB改變了與膠質母細胞瘤發展相關的關鍵基因/途徑〔受體酪氨酸激酶(RTK),磷脂酰肌醇3-激酶(PI3K),絲裂原活化蛋白激酶(MAPK),轉化(RAS),絲氨酪/蘇氨酸激酶(AKT),成視網膜細胞瘤(RB),p53〕〔22〕。SNRPA1參與IL-12介導的信號通路。SNPRA1是一種剪接體組分,負責將前mRNA加工成mRNA,對男性生育至關重要。SNRPA1與TCF7L2(Wnt信號通路的轉錄因子)與rs386772267的等位基因結合,增加胰腺癌患病風險。SNRPA1對腎癌和卵巢癌的預后不良〔23〕。SNRPA1影響結直腸癌細胞周期,增殖和遷移。SF3B1積極調控基因表達,參與表觀遺傳作用,SF3B1在鼻竇黑色素瘤中出現7%的突變,是鼻竇黑色素瘤潛在的致癌因子〔24〕。
綜上所述,通過GSE64634基因芯片篩查出的DDX42、U2AF2、SNRPB、SNRPA1,SF3B1等5個基因在多種腫瘤中表達異常,并已明確在某些特定腫瘤的發生發展中扮演著重要的角色。這5個基因位于NPC DEGs構成的表達譜網絡中的關鍵節點位置,可作為NPC發生過程中的關鍵Hub基因,為進一步研究NPC發生發展的分子機制及分子標志物的篩選提供指導。