陳 靖,許 諾,,崔 乙,牟 寧,簡天明,吉 玲
視網膜母細胞瘤是一種嬰幼兒最常見的眼內發育性惡性腫瘤[1-3]。隨著臨床醫生對視網膜母細胞瘤認識的逐漸深入,在不影響生存率的前提下出現了全身靜脈、眼動脈化學治療,局部激光光凝治療、玻璃體腔化療、冷凍治療、鞏膜敷貼外放射治療、經瞳孔溫熱治療等保眼與保視力的治療方式[4]。然而,盡管視網膜母細胞瘤在發達國家的生存率大于95%,但在中低收入國家由于診斷不及時等原因其總體生存率僅為25%~65%[5]。因此深入了解視網膜母細胞瘤發生發展的關鍵分子,尋找患者早期診斷與治療新靶點仍具有重要的基礎與臨床意義。
隨著基因芯片的轉錄組數據與生物信息學分析算法的發展,學者們可以利用全世界范圍內的高通量數據進行整合分析并篩選出差異表達的基因,并能夠提供更敏感和更特異的靶點來預測腫瘤預后并輔助治療。然而目前基于公共數據庫中視網膜母細胞瘤數據進行診斷與治療靶點篩選的研究報道較為稀缺。因此本研究擬通過生物信息學方法對視網膜母細胞瘤患者與正常視網膜的轉錄組芯片數據進行挖掘并篩選出候選關鍵基因,并在視網膜母細胞瘤細胞系中進行表達水平驗證,為進一步明確視網膜母細胞瘤的發病機制提供數據支持。
1.1材料從Gene Expression Omnibus(GEO)(https://www.ncbi.nlm.nih.gov/geo/) 數據庫下載基因芯片GSE97508與GSE110811。數據集GSE97508于2017-04提交并于2018-08更新。該數據集所用實驗平臺為 Affymetrix 公司提供的人類基因表達芯片平臺 GPL15207,總共包含9個樣本,其中3例為正常成年人視網膜組織,6例為視網膜母細胞瘤組織。數據集GSE110811于2018-02提交并于2019-05更新。該數據集所用實驗平臺為Affymetrix公司提供的人類基因轉錄檢測2.0 ST平臺GPL16686,總共包含34個樣本,其中3例為正常成年人視網膜組織,3例為良性視網膜細胞瘤組織,28例為視網膜母細胞瘤組織。
1.2方法
1.2.1數據預處理與差異表達基因的獲取使用R語言中的affy 軟件包讀取基因表達芯片數據(CEL格式數據),處理成表達矩陣,用RMA(robust multi-array average)算法對數據進行歸一化處理,用Sva包ComBat函數校正批次效應,并利用各自平臺注釋文件進行探針注釋,去除未匹配的基因探針信息。進一步使用limma軟件包對GSE97508與GSE110811中視網膜母細胞瘤腫瘤樣本和正常視網膜樣本進行差異表達基因(differentially expressed gene,DEG)分析。選取|Log2 (Fold Change)| >1.5且P<0.05作為篩選DEG的標準。將以上兩個數據集獲取的DEG取交集得到本研究的目標DEG。
1.2.2DEG的功能富集分析使用在線分析工具包括DAVID,KEGG對DEG進行生物學功能與通路的分析并用R進行可視化。DAVID是一個用于功能注釋和集成發現基因所代表的生物學意義的在線數據庫[6]。KEGG是一個整合了基因組、化學和系統功能信息的數據庫,本研究使用KEGG的PATHWAY數據庫整合當前DEG涉及的通路信息[7]。基因本體論(gene ontology,GO)分析包括細胞組分(cellular component,CC),用于描述基因產物在細胞中的位置;分子功能(molecular function,MF),用于描述單個基因產物的功能;生物學過程(biological process,BP),用于描述具有多個步驟的有序的生物過程。以P<0.05且錯誤發現率(false discovery rate,FDR)閾值設置在<0.01。
1.2.3蛋白質-蛋白質相互作用網絡與子網絡模塊分析獲取樞紐基因使用在線分析工具STRING (http://string-db.org)進行蛋白質-蛋白質相互作用(protein-protein interaction,PPI)網絡構建[8]。為進一步獲得PPI中的樞紐基因,使用Cytoscape軟件(http://www.cytoscape.org/)中的CytoHubba與Molecular Complex Detection(MCODE)兩個插件篩選樞紐基因[9]。MCODE模塊用以發現PPI網絡中緊密聯系的基因,參數設置:網絡分數閾值:2;節點分數閾值:0.2;K-score:2;最大深度:100。CytoHubba采用11種拓撲分析方法對PPI網絡數據節點進行排名以推測在基因調控,細胞路徑和信號轉導中的樞紐基因。本研究采用Degree法納入值≥10的基因。
1.2.4驗證樞紐基因及診斷效能評估本研究納入一個獨立的驗證數據集GSE24673對篩選到的樞紐基因進行驗證。數據集GSE24673于2010-10提交并于2019-08更新,所用實驗平臺為 Affymetrix公司提供的人類基因轉錄檢測1.0 ST平臺GPL6244,總共包含11個樣本,其中2例為正常成年人視網膜組織,9例為視網膜母細胞瘤組織。并在GSE110811中采用受試者工作特征(receiver operating characteristic,ROC)曲線從基因表達量與診斷效能方面驗證樞紐基因。采用ROC曲線下的面積(area under ROC curve,AUC)作為判斷診斷效能的評價指標。
1.2.5細胞培養本研究采用視網膜母細胞瘤細胞系Y79、Weri-Rb1與HXO-Rb44,對照細胞系采用人RPE細胞系ARPE-19。Y79、Weri-Rb1與HXO-Rb44細胞系采用90% RPMI-1640+10%FBS條件培養;ARPE-19細胞系采用90%DMEM+10%FBS條件培養。置于37℃、體積分數5%CO2培養箱中,隔天換液。顯微鏡下觀察細胞生長至80%~90%進行細胞傳代。
1.2.6qRT-PCR驗證樞紐基因按照RNA逆轉錄試劑盒步驟將提取的RNA逆轉錄合成cDNA。將獲取的cDNA分別加入各引物的反應體系中進行實時熒光定量PCR。擴增后進行熔解曲線分析,以β-actin為內參照,采用2-ΔΔCt法計算各目的基因mRNA相對表達量。引物序列見表1。

表1 引物序列
統計學分析:應用R v.3.4.3進行上述生物信息學分析可視化。應用GraphPad Prism v.8.01進行樞紐基因在驗證數據集的表達差異驗證。兩組間比較采用獨立樣本t檢驗;多組間比較采用單因素方差分析,進一步兩兩比較采用LSD-t檢驗,以P<0.05認為差異具有統計學意義。
2.1視網膜母細胞瘤的差異表達基因與功能富集分析數據集GSE97508篩選出DEG共715個,包括上調基因192個,下調基因523個。數據集GSE110811篩選出DEG共273個,包括上調基因104個,下調基因169個。兩者取交集共獲得DEG 121個。對DEG的富集分析中KEGG通路富集分析結果發現差異基因主要富集于細胞周期、光傳導通路與p53信號通路上(圖1),GO分析結果發現DEG的生物學過程(GO-BP)主要富集于可見光接收、視紫紅質信號傳導通路、有絲分裂細胞核分裂、染色體分離與視紫紅質信號傳導調節通路上(圖2A);細胞組分(GO-CC)主要富集于凝縮的染色體中心粒、紡錘體微管與極點、光感受器內外節膜與光感受器外節等上(圖2B);分子功能(GO-MF)主要富集于G蛋白偶連光感受器活性、蛋白結合、微管結合、蛋白激酶活性、ATP結合等功能上(圖2C)。

圖1 視網膜母細胞瘤DEG的KEGG分析結果。

圖2 視網膜母細胞瘤DEG的GO分析結果 A:生物學過程;B:細胞組分;C:分子功能。
2.2PPI網絡構建及子網絡模塊分析視網膜母細胞瘤DEG 為進一步了解上述差異基因的蛋白互作網絡,我們通過構建DEG的PPI網絡(圖3A)并利用MCODE插件發現3個子模塊,包括子模塊1包含的35個上調樞紐基因(圖3B);子模塊2包含的8個下調樞紐基因(圖3C);子模塊3包含的3個下調樞紐基因(圖3D)。采用CytoHubba插件共得到39個樞紐基因,采用MCODE插件共富集得到46個樞紐基因,兩者分別與GSE97508與GSE110811數據集中差異最大的30個基因取交集最終得到MCM6、DTL、UBE2T、TOP2A、NUSAP1、CENPK、RRM2、RLBP1、RHO共9個樞紐基因(表2,圖4)。

圖3 PPI網絡構建與子網絡模塊圖 A:PPI網絡圖;B:MCODE子模塊1;C:MCODE子模塊2;D:MCODE子模塊3;紅色:上調基因;綠色:下調基因。

表2 視網膜母細胞瘤樞紐基因

圖4 MCODE和CytoHubba及Top DEG韋恩圖。
2.3驗證數據集與ROC曲線驗證視網膜母細胞瘤的樞紐基因為驗證上述9個樞紐基因是否在視網膜母細胞瘤發生發展中起到作用,我們納入一個獨立數據集GSE24673驗證他們的表達量。結果顯示:9個樞紐基因在GSE24673中的表達趨勢與上述測試數據集的表達結果一致,差異均有統計學意義(P<0.001,圖5)。進一步利用ROC曲線在GSE110811中對上述9個樞紐基因的表達量對視網膜母細胞瘤的診斷價值進行驗證。結果顯示:上調基因中UBE2T、RRM2與下調基因中的RHO共3個基因有統計學意義且曲線下面積(AUC)≥80%(圖6)。

圖5 數據集GSE24673中9個樞紐基因表達量 A:MCM6;B:DTL;C:UBE2T;D:TOP2A;E:NUSAP1;F:CENPK;G:RLBP1;H:RRM2;I:RHO;bP<0.001 vs 正常視網膜組。

圖6 AUC大于80%的樞紐基因ROC曲線 A:UBE2T;B:RRM2;C:RHO。
2.4qRT-PCR驗證視網膜母細胞瘤的樞紐基因利用qRT-PCR驗證上述3個樞紐基因在視網膜母細胞瘤細胞系Y79、Weri-Rb1、HXO-Rb44與視網膜色素上皮細胞系ARPE-19中表達情況。結果確認UBE2T與RRM2在3種視網膜母細胞瘤細胞系中mRNA表達量均顯著高于細胞系ARPE-19,而RHO的mRNA表達量顯著低于細胞系ARPE-19,差異均有統計學意義(P<0.001,表3,圖7)。

圖7 qRT-PCR驗證視網膜母細胞瘤樞紐基因表達水平 A:UBE2T;B:RRM2;C:RHO;bP<0.001 vs ARPE-19。

表3 qRT-PCR驗證視網膜母細胞瘤樞紐基因表達水平
生物信息學已被廣泛運用于各類疾病關鍵致病基因和信號通路的篩選。在視網膜母細胞瘤發病機制的相關研究中,生物信息學方法的使用也越來越多[10-11]。Zhao等[10]利用GEO數據庫對罹患單側與雙側視網膜母細胞瘤的患者進行差異表達基因與功能富集分析,但該研究缺少腫瘤組織與正常視網膜組織的比較。Huang等[11]也利用公共數據庫進行視網膜母細胞瘤關鍵致病基因的篩選,但未進行細胞實驗驗證預測結果的可靠性。本研究通過生物信息學方法篩選并在細胞水平驗證網膜母細胞瘤與正常視網膜的關鍵差異基因,為進一步明確視網膜母細胞瘤的發病機制提供重要信息。
本研究發現視網膜母細胞瘤的DEG除了富集于細胞周期以外,光傳導與p53通路也參與了視網膜母細胞瘤的發病。光傳導通路包括一系列的生化反應,可將光子轉化為視錐與視桿細胞中的神經沖動。本研究結果中光傳導通路涉及的基因均為下調基因,說明視網膜光感受器去分化是視網膜母細胞瘤進展的重要原因之一。既往對視網膜母細胞瘤光傳導通路相關基因的研究提示該腫瘤為視錐細胞來源,且該通路基因與視網膜母細胞瘤的進展相關[12]。p53通路在眾多腫瘤的發病中起到關鍵作用。相關研究已經證實p53基因敲除的小鼠可發展成雙側視網膜母細胞瘤。然而視網膜母細胞瘤基因組中p53基因并未產生突變。文獻報道其可能的激活機制為:Rb1基因失活導致Arf、MDM2與MDMX激活,磷酸化的MDM2或MDMX轉位到細胞核與p53結合,通過增加p53蛋白的降解而影響細胞存活,促進視網膜母細胞瘤的進展[13]。本研究從生物信息學的角度再次證實了p53通路失活在視網膜母細胞瘤發病機制中的作用。
本研究發現UBE2T、RRM2與RHO為視網膜母細胞瘤的關鍵基因。其中RRM2是核糖核苷酸還原酶(ribonucleotide reductase,RNR)的一個亞基。它是細胞周期中維持DNA合成與修復的重要蛋白,并且早有研究發現其存在惡性潛能[14]。Nie等[15]應用RNA-seq技術對比視網膜母細胞瘤與正常視網膜轉錄組差異基因同樣發現了RRM2是視網膜母細胞瘤發生發展中的關鍵基因。既往研究表明RRM2可促進膠質母細胞瘤的增殖、遷移和侵襲,并抑制癌細胞凋亡,靶向抑制RRM2可抑制DNA復制,導致包括胰腺癌、卵巢癌與結腸癌等癌細胞的凋亡[16]。Rahman等[17]也報道利用納米顆粒靶向抑制RRM2可調節Bcl2抑制頭頸部腫瘤與肺癌的生長。RHO編碼視紫紅質,它屬于G蛋白偶聯受體,是視桿細胞的特異性標記物。作為成熟視網膜標記物,RHO在既往視網膜母細胞瘤高通量表達譜芯片數據中均證明為低表達狀態[18]。對視網膜母細胞瘤的組織病理學研究也確定光感受器的低分化與視網膜母細胞瘤的惡性程度呈正相關[19]。有研究同樣利用全基因組表達譜芯片分析發現視網膜母細胞瘤中包括RHO在內的光感受器標志物的喪失可導致視網膜母細胞瘤惡性程度增高[20]。UBE2T編碼的功能蛋白屬于泛素結合酶E2家族。它的功能最早發現于范可尼貧血綜合征中[21]。而近年來UBE2T被認為是促癌基因在不同腫瘤的發生發展中發揮重要作用。已經證明UBE2T在包括乳腺癌、肺癌、胃癌、肝癌、前列腺癌、鼻咽癌與骨肉瘤中表達量均較對照組升高,并且其表達量在其中大多數腫瘤中可作為預測不良預后的獨立危險因素[22-24]。本團隊成員也進一步對UBE2T在視網膜母細胞瘤發生發展中的功能進行深入研究,確認了在蛋白層面UBE2T在視網膜母細胞瘤中高表達,其表達量與視網膜母細胞瘤的惡性程度相關,并通過激活STAT3通路促進腫瘤的形成[25]。
本文也存在一些局限性,如使用的數據集均來源于視網膜母細胞瘤的大體腫瘤,且更新于2019-05,而近年來有學者采用單細胞測序技術對視網膜母細胞瘤的分子亞型進行分類,為其精準治療提供方向[26]。另外,本研究納入的基因均屬于功能基因,而目前認為包括miRNA、lncRNA與circRNA在內的眾多非編碼RNA也參與了視網膜母細胞瘤的發生與發展[27]。因此需要多組學測序技術對其治療新靶點進行探討,為視網膜母細胞瘤的生物信息學分析提供新方向[28]。
綜上,本研究通過生物信息學綜合分析視網膜母細胞瘤數據集篩選出UBE2T、RRM2與RHO這三個關鍵基因未來可能成為視網膜母細胞瘤的潛在治療靶點。