汪 穎 李 朋 王 博 劉丕楠
原始神經(jīng)外胚層腫瘤(primitive neurotodermal tumor,PNET)為一種罕見的高度惡性的神經(jīng)系統(tǒng)腫瘤,由Hart等[1]于1973年首次報道,分為中樞性和外周性兩大類[2]。其中中樞性PNET多發(fā)于兒童,腫瘤呈浸潤性增長,且侵襲性強、惡性程度高、預(yù)后差[3]。現(xiàn)階段中樞性PNET治療以手術(shù)切除加輔助放化療為主,總體療效較差,且發(fā)病原因不明[4]。
生物學(xué)中的基因芯片技術(shù)可用于腫瘤分子相關(guān)途徑的分類、鑒定和預(yù)測,并可識別與臨床相關(guān)的腫瘤分子標志物及潛在治療靶點,從而可對疾病的臨床診斷及治療起提示作用[5,6]。
本研究通過對GEO數(shù)據(jù)庫中下載的中樞性PNET腫瘤組織基因芯片數(shù)據(jù)集GSE74195進行綜合生物信息學(xué)分析,探討基因表達改變后,中樞性PNET分子生物學(xué)功能的改變及影響該過程的關(guān)鍵蛋白,以期進一步探討中樞PNET疾病發(fā)生、發(fā)展相關(guān)分子機制,為中樞PNET的臨床治療提供新思路。
1.材料:登錄美國基因表達匯編(Gene Expression Omnibus, GEO)數(shù)據(jù)庫,檢索PNET研究相關(guān)的基因表達芯片數(shù)據(jù),獲取芯片分析平臺為GPL570 (HG-U133-Plus-2) Affymetrix 表達譜芯片數(shù)據(jù)集GSE74195。GSE74195包含5例中樞PNET腫瘤標本和5例正常小腦組織對照標本。該研究中所獲得的腫瘤標本為術(shù)后立即至于液氮中,并一直在-80℃保存直至使用,正常組織標本獲得于沒有腦腫瘤疾病史的患者。
2.差異表達基因篩選:使用在線分析工具GEO2R(https://www.ncbi.nlm.nih.gov /geo/geo2r/)對數(shù)據(jù)集GSE74195進行處理,以條件FC>3且P<0.01進行差異基因篩選,獲得PNET腫瘤組織中顯著高表達的差異基因列表。
3.GO富集分析和KEGG通路分析:將上述所獲得的顯著差異表達基因列表導(dǎo)入在線生物信息數(shù)據(jù)庫WebGestalt,進行GO功能分析及KEGG通路分析,以FDR<0.05為篩選條件。
4.可能作用藥物篩選:將上述所獲得的顯著差異表達基因列表導(dǎo)入使用在線生物信息數(shù)據(jù)庫WebGestalt進行作用藥物篩選,以FDR<0.05為篩選條件。
5.蛋白質(zhì)的相互作用網(wǎng)絡(luò)建設(shè):使用String在線分析網(wǎng)站(https://string-db.org/,version 11.0)對上述獲得的顯著差異基因列表進行分析,設(shè)置可信度0.7(confidence:0.7)為差異有統(tǒng)計學(xué)意義,選擇實驗或數(shù)據(jù)庫支持進行篩選條件限制,分析得到相關(guān)蛋白質(zhì)的相互作用網(wǎng)絡(luò)圖,根據(jù)差異基因與其相互作用蛋白的連線數(shù)量進一步確定蛋白質(zhì)相互作用網(wǎng)絡(luò)中的關(guān)鍵蛋白。
1.顯著高表達差異基因的獲得:依據(jù)FC >3且P<0.01的篩選條件對所獲得的差異表達基因進行篩選,結(jié)果獲得340個相對于小腦正常組織,中樞性PNET腫瘤組織中顯著高表達的差異基因。差異基因表達譜宏觀表象見圖1。

圖1 差異基因火山圖
2.差異基因功能通路富集分析:將上述篩選獲得的340個顯著上調(diào)的差異基因映射到GO數(shù)據(jù)庫。GO生物過程分析發(fā)現(xiàn)差異基因主要富集在細胞有絲分裂、細胞周期及細胞增殖等生物學(xué)過程;分子功能包括二磷酸多糖蛋白糖轉(zhuǎn)移酶活性、低聚糖基轉(zhuǎn)移酶活性、rRNA結(jié)合、細胞外基質(zhì)結(jié)構(gòu)成分、核糖體的結(jié)構(gòu)成分等的功能;細胞組成分析顯示這些差異基因集中在低聚糖基轉(zhuǎn)移酶復(fù)合物、濃縮染色體著絲粒區(qū)及染色體區(qū)。GO分析結(jié)果見表1。KEGG通路分析顯示,差異基因富集的信號通路有細胞周期和ECM受體相互作用等,詳見圖2。
3.可能作用藥物篩選:將顯著高表達的差異基因輸入WebGestalt在線數(shù)據(jù)庫,對可能有效的藥物進行篩選,以FDR<0.05為篩選條件。數(shù)據(jù)庫選擇GLAD4U時,按富集程度差異,獲得前10個對PNET可能有效的藥物候選,分別為紫杉烷類(taxanes)、紫杉醇(paclitaxel)、胃蛋白酶(pepsin)、奈替米星(netilmicin)、順鉑(cisplatin)、鉑化合物(platinum compounds)、放線菌素類(actinomycines)、達克汀霉素(dactinomycin)、抗腫瘤藥(antineoplastic agents)及蛋白激酶抑制劑(protein kinase inhibitor),結(jié)果如圖3所示。數(shù)據(jù)庫選擇DrugBank時,青蒿醇(artenimol)為唯一候選藥物(富集比例5.5749)。
4.蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)構(gòu)建:蛋白質(zhì)與蛋白質(zhì)之間相互作用網(wǎng)絡(luò)的構(gòu)建,可進一步明確各差異表達基因或蛋白之間的相互作用關(guān)系。基于此,本研究將上述獲得的340個顯著上調(diào)的差異表達基因上傳到String在線工具,經(jīng)分析獲得差異蛋白互作網(wǎng)絡(luò)圖,其中包括305個圓點(代表差異基因或蛋白),938條線(代表相互作用關(guān)系)。根據(jù)差異基因與其相互作用蛋白的連線數(shù)量,確定了5個關(guān)鍵蛋白分子。
臨床研究表明腫瘤的遺傳學(xué)特征可影響其生物學(xué)行為、治療及預(yù)后,這些研究從分子層面揭示了腫瘤發(fā)生、發(fā)展的可能原因,從而為臨床診斷及治療奠定基礎(chǔ)[7]。而現(xiàn)階段中樞性PNET病因不明且發(fā)病率低,臨床治療難度大[8]。為此,本研究通過生物信息學(xué)技術(shù)挖掘相關(guān)數(shù)據(jù),以期獲得中樞性PNET腫瘤潛在治療靶點,為進一步實驗研究提供理論支持。
本研究共分析獲得340個顯著高表達基因,通過對這些差異基因進行GO分析及KEGG通路篩選,發(fā)現(xiàn)上調(diào)基因主要參與細胞周期過程,利用數(shù)據(jù)庫篩選可能有效的藥物,發(fā)現(xiàn)除作用于細胞周期的紫杉烷類、鉑化合物及常見抗腫瘤藥外,分析結(jié)果提示青蒿醇也可能對中樞性PNET腫瘤有一定效果,而此前未見有報道,可能對今后中樞性PNET腫瘤的治療有一定提示作用。

表1 PNET高表達差異基因GO富集分析結(jié)果

圖2 差異表達基因通路分析

圖3 差異基因可能有效藥物篩選

圖4 差異表達基因/蛋白互作網(wǎng)絡(luò)圖
進一步構(gòu)建的蛋白互作網(wǎng)絡(luò)圖中,本研究獲取了5個關(guān)鍵蛋白分子,分別是泛素核糖體融合蛋白52(UBA52,連線43)、泛素C(UBC,連線35)、周期蛋白依賴性激酶1(CDK1,連線31)、著絲粒蛋白K(CENPK,連線29)、神經(jīng)發(fā)育蛋白1(NDE1,連線19)。這些蛋白可能在中樞性PNET腫瘤的發(fā)生、發(fā)展中發(fā)揮重要作用。蛋白互作網(wǎng)絡(luò)圖見圖4。
研究表明,腫瘤是一種細胞周期性疾病,惡性腫瘤的發(fā)生、發(fā)展與細胞周期調(diào)節(jié)機制的紊亂有密切聯(lián)系[9]。而筆者獲取的5個關(guān)鍵蛋白,都參與了細胞周期的調(diào)控過程,其中CENPK蛋白由269個氨基酸組成,編碼基因位于染色體5q12.3上,是著絲粒蛋白家族成員之一。而報道顯示,著絲粒調(diào)節(jié)失調(diào)或功能紊亂可促進腫瘤的發(fā)生[10]。CENPK主要定位于著絲粒的內(nèi)層,可對CENPA與其他著絲粒組分的有效組裝進行調(diào)控,且在卵巢癌、肝癌等高表達,并與預(yù)后相關(guān),可能扮演著致癌基因的角色[11~13]。提示CENPK在調(diào)控著絲粒的組裝和功能方面起重要作用,進而影響腫瘤的發(fā)生、發(fā)展。但目前關(guān)于CENPK的研究較少,調(diào)控機制尚不清楚。靶向調(diào)控PNET中CENPK的表達可能為PNET治療提供新的策略,但需進一步擴大樣本量進一步驗證CENPK在中樞性PNET組織中的表達,在蛋白水平上探討其與中樞性PNET臨床病理特征及預(yù)后的關(guān)系。
此外,UBA52 是由泛素和核糖體蛋白 L40 組成的融合蛋白,在體內(nèi)可以被泛素羧基端水解酶快速精準的剪切為泛素分子和核糖體蛋白 L40。泛素可形成多聚泛素化鏈對底物修飾,進一步通過泛素蛋白酶體途徑特異性降解細胞周期相關(guān)蛋白,從而阻滯細胞周期。
細胞周期蛋白依賴性激酶1 (cyclin-dependent kinases 1,CDK1)為由CDC2基因編碼,相對分子質(zhì)量為3.4×104的蛋白質(zhì),是絲氨酸/蘇氨酸蛋白激酶家族的成員之一。CDK1可與cyclinB組成復(fù)合物,可促使細胞周期從G2期進入M期,從而影響細胞有絲分裂過程[14]。NDE1蛋白位于中心體,作為調(diào)節(jié)動力蛋白功能的多蛋白復(fù)合物的一部分與其他中心體成分相互作用[15]。文獻報道顯示該蛋白對大腦皮質(zhì)發(fā)育至關(guān)重要,在腦增殖室區(qū)皮質(zhì)神經(jīng)元祖細胞分裂過程中,可通過控制有絲分裂紡錘體的方向來調(diào)節(jié)神經(jīng)元的產(chǎn)生。由此可見,這幾個差異蛋白主要集中在細胞周期及有絲分裂過程,與中樞性PNET發(fā)生、發(fā)展有密切關(guān)系,而這種機制是否參與了PNET的發(fā)病尚待進一步的研究。
本研究采用生物信息學(xué)研究方法篩選出中樞性PNET腫瘤組織相關(guān)的差異表達基因,并對其進行了功能預(yù)測,為尋找與中樞性PNET發(fā)生、發(fā)展及治療相關(guān)靶點的研究提供了新思路。