(青島大學附屬醫院,山東 青島 266003 1 普外科; 2 肝膽胰外科)
肝細胞癌(HCC)在我國惡性腫瘤發病率中居第5位,死亡率居第2位[1-2]。HCC起病隱匿,多數患者發現時已是晚期,且術后復發率高,總體預后較差。盡管目前經聯合射頻消融治療、肝動脈栓塞化療、靶向藥物治療等多學科綜合治療,患者生存情況已得到明顯改善,但5年生存率僅約60%[3-4]。目前HCC治療的主要難點在于腫瘤異質性強、多靶點藥物應答率低且易產生耐藥,因此,急需從分子水平深入探索其發病機制,挖掘更有意義的基因靶點,為評估患者預后及靶向治療提供更可靠的依據。
隨著高通量測序技術的發展以及人類基因組計劃研究項目的完成,對腫瘤的分子機制有了更深入的了解[5]。其中,RNA測序技術是目前最常用的篩選癌組織和正常組織差異表達基因的方法[6]。通過對HCC的mRNA表達譜分析,可明確其生物學進程,進而可以開展對HCC更深入和系統的研究。本研究利用生物學信息技術,通過對高通量測序芯片數據的分析,篩選出HCC和正常肝組織差異表達的基因及可用于預測HCC預后的特征性基因,系統地從分子水平揭示HCC的發生發展[7-8],為預測HCC預后及指導靶向治療提供參考。
利用美國國立生物技術信息中心的GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/)選取并下載GSE41804、GSE19665和GSE101685 3個包含黃色人種的HCC基因表達的數據集;利用GEO數據庫中的在線分析工具GEO2R對3個數據集進行處理,為減少假陽性的結果,使用P<0.05和Benjamini-Hochberg進行檢驗;下載GEO2R處理后的3個數據集中的數據,以P<0.05和|logFC|≥2為標準進行基因篩選,并提取3個數據集的交集,篩選出HCC與正常組織差異表達的基因。
使用R語言的clusterprofiler可視化R包對篩選出的HCC與正常組織差異表達的基因進行GO功能富集分析[9]和KEGG通路分析[10],選擇條件為:人源基因以及P<0.05。
通過蛋白-蛋白互作預測網站STRING(http://string-db.org)[11]構建蛋白互作網絡,并使用Cytoscape 3.6.1軟件[12]對篩選出的差異表達蛋白進行可視化分析,再利用其自帶小程序MCODE對蛋白互作網絡進行分析,以標注有“seed”的基因為候選基因。
通過Kaplan-Meier在線生存網站(http://kmplot.com)[13]進行候選基因與HCC患者總生存期(OS)關系的生存分析。然后以HCC患者候選基因表達量的中位數為界限,將患者分為高表達組和低表達組,分別比較兩組之間的生存差異,計算每個候選基因的P值、危險比和95%置信區間,排除沒有生存意義的基因,以有生存意義的基因為關鍵基因,將關鍵基因在HCC患者中的表達情況進行在線預后分析,繪制預后生存曲線圖,并將關鍵基因作為一個聯合特征性基因集用于分析HCC預后。
通過在線的網站GEPIA(http://gepia.cancer-pku.cn/index.html)[14]對得到的關鍵基因在HCC患者中以P<0.01為界限進行可視化分析。
選取青島大學附屬醫院肝膽胰外科30例HCC患者手術過程中留取的HCC組織及癌旁正常肝組織標本,所有標本均經病理組織學驗證為HCC或正常肝組織。在說明書的指導下利用Trizol試劑提取標本組織中總RNA。隨后通過A260/A280比率標準估計總RNA細度,并使用PrimeScriptTMRT試劑盒(日本Takara公司)獲得相應的互補DNA。最后使用Takara TB GreenTMPreMix Ex TaqTMⅡ試劑(Tli RNAseH Plus,日本Takara公司)并在羅氏LightCycler480上進行實時定量聚合酶鏈反應(RT-qPCR)以獲取基因相對表達量。該研究獲我院倫理委員會批準。
對GEO數據庫進行數據統計分析,顯示基因表達數據集GSE41804、GSE19665和GSE101685中分別包含HCC與正常組織差異表達基因數量為393、1 110和515個,對3個數據集取交集后最后得到147個HCC與正常組織差異表達的基因。
對147個HCC組織和正常組織差異表達基因進行GO功能富集分析顯示,這些基因與對無機物的反應、加單氧酶活化、類固醇氫化酶活化等生物進程明顯相關(圖1A),圖中基因功能從上至下是按照P值由小到大進行排序,柱狀長短代表富集于此功能的HCC組織和正常組織差異表達基因的數量。再對147個差異表達基因進行KEGG通路分析,顯示這些差異表達基因主要是通過p53信號通路影響HCC的發生和進展(圖1B),圖中信號通路從上至下是按照P值由小到大進行排序,點的大小代表富集于此功能的HCC組織和正常組織差異表達基因的數量。
使用STRING和Cytoscape構建HCC與正常組織147個差異表達基因間的蛋白-蛋白互作網絡圖(圖2)。圖中藍色圖標中的為147個HCC與正常組織差異表達的蛋白名稱,蛋白與蛋白之間的連線表示蛋白之間相互作用,連線越多表示存在的相互作用越緊密。
用MCODE對蛋白互作網絡圖進行分析,得到6個作用緊密的蛋白表達簇,其中每一簇都包含1個標注“seed”的基因。這6個標注“seed”的基因為FAM83D、CYP2C8、MT1M、SLCO1B3、GYS2以及FCN3,即為候選基因。
通過Kaplan-Meier在線生存網站對關鍵基因與HCC患者預后的相關性進行了分析,結果顯示MT1M基因沒有生存意義,故將之剔除,只對有生存意義的另外5個基因進行分析。其中CYP2C8高表達的患者OS顯著長于CYP2C8低表達的患者,而FAM83D、SLCO1B3、GYS2和FCN3低表達的患者OS顯著長于其對應基因高表達的患者。將5個HCC患者預后相關的基因進行聯合預后分析,在線網站根據風險得分中位數將患者分為高風險組和低風險組,低風險組患者OS顯著長于高風險組。

A:差異表達基因GO功能富集分析結果;B:差異表達基因KEGG通路分析結果
圖1 HCC與正常組織差異表達基因的GO功能富集分析和KEGG通路分析
通過在線網站GEPIA對5個關鍵基因在TCGA數據庫進行HCC組織和正常肝組織表達量的可視化分析,顯示基因CYP2C8、FCN3、GYS2以及SLCO1B3在HCC組織中表達量低于正常肝組織,而基因FAM83D則呈相反的趨勢。對臨床上獲取的實物標本進行RT-qPCR,結果同樣顯示CYP2C8、FCN3、GYS2及SLCO1B3在HCC組織中表達量低于正常肝組織,FAM83D在HCC組織中表達量高于正常肝組織,與TCGA數據庫中分析結果一致。
HCC是臨床常見、致死率高的惡性腫瘤,也是我國高發的,危害極大的惡性腫瘤[15]。由于HCC早期臨床癥狀并不明顯,大多數患者發現時病情較晚,失去最佳手術治療時機,且由于HCC異質性強,靶向治療易出現耐藥性,因此患者預后較差。目前,甲胎蛋白指標是作為HCC早期復發的有效評估指標,但是其陽性率較低,臨床上約30%肝細胞癌患者甲胎蛋白并沒有升高,用于術后HCC早期復發篩查及預后評估存在著一定的局限性。索拉非尼、倫伐替尼是HCC的首選靶向治療藥物,但目前整體治療效果仍不佳,因此篩選新的治療靶點對改善患者的預后具有重要意義。

圖2 差異表達基因間的蛋白-蛋白互作網絡圖
本研究首先針對黃色人種選擇了GSE41804、GSE19665以及GSE101685共3個數據集,其中,GSE41804包含了20例HCC組織和20例正常組織的數據,GSE19665包含了10例HCC組織和10例正常組織的數據,GSE101685包含了24例HCC組織和8例正常組織的數據,對38例正常肝組織和54例HCC患者的樣本數據進行綜合分析,初步篩選出147個HCC與正常組織差異表達基因,然后再利用GO富集分析和KEGG通路分析來檢測3個數據集,探索147個HCC與正常組織差異表達基因之間的相互作用,通過GO功能富集分析顯示這些基因與對無機物的反應、加單氧酶活化、類固醇氫化酶活化等生物進程明顯相關,提示這些基因可能參與了腫瘤細胞的增殖和凋亡過程[16-17];KEGG通路分析顯示,147個差異表達基因主要通過p53信號通路影響HCC的發生。肝臟作為人體的最大的代謝器官,參與營養物質以及藥物等的代謝過程,HCC與正常肝組織的差異表達基因KEGG分析顯示,視黃醇代謝、藥物以及酶代謝的變化與HCC患者患病時的代謝功能紊亂狀態相吻合[18-19]。同時利用在線網站STRING研究蛋白質之間的功能相互作用關系,以發現癌癥的發生或發展潛在機制。利用Cytoscape 3.6.1對蛋白相互作網絡圖進行分析,根據作用程度將蛋白互作網絡分成6個作用緊密的簇,每一簇中有一個基因標注為“seed”,分別為基因FAM83D、CYP2C8、MT1M、SLCO1B3、GYS2、FCN3,即為該簇的候選基因,上述6個候選基因不僅和其他基因有著密切的相互作用,而且可能決定其他基因的功能。通過對候選基因進行Kaplan-Meier預后分析發現,FAM83D、CYP2C8、GYS2、SLCO1B3、FCN3關鍵基因是評估HCC患者預后以及靶向治療的關鍵基因。通過RT-qPCR檢測獲取的實物標本中5個關鍵基因的表達量,并與數據庫中分析獲得的關鍵基因表達量進行了比對,兩者結果一致。
FAM83D是FAM83家族成員之一,參與紡錘體相關蛋白的編碼以及有絲分裂過程,可以調節細胞分裂,可以調節癌細胞的增殖、遷移、侵襲和凋亡等過程[20]。研究發現FAM83D高表達,可能與HCC增殖能力呈正相關[21]。敲降FAM83D可以抑制乳腺癌細胞增殖以及誘導細胞凋亡[22]。在正常肝組織中FCN3是一種模式識別分子,具有激活補體凝集素途徑的功能,研究發現FCN3可以識別卵巢癌細胞參與免疫應答[23]。有研究顯示FCN3在HCC中可作為腫瘤的潛在標志物[24-25]。CYP家族是癌癥形成過程的關鍵酶,介導多種致癌物質的代謝以及活化,在HCC患者中,CYP2C8低表達患者的OS比CYP2C8高表達患者的短[26-27]。此外,CYP2C8的低表達與腫瘤分期、肝內轉移等晚期臨床病理特征有關,分期早及病理結果較好的患者CYP2C8表達量高[28]。GYS2是GYS的一個亞型,GYS是糖原生物合成的關鍵酶,可通過與p53的負反饋機制抑制HBV相關HCC的腫瘤生長,GYS2在HCC組織當中表達下調,可以抑制HCC的生長[29-30]。研究顯示SLCO1B3是在肝臟中表達的功能性轉運蛋白,可轉運多種內源性和外源性化合物,包括激素及其結合物,并且和紫杉烷類等抗癌藥耐藥性的產生有關[31-32]。綜上所述,基因FAM83D、FCN3、CYP2C8、GYS2以及SLCO1B3可能是潛在的預測和指導HCC治療的標志物。
綜上所述,本研究利用生物信息學方法對HCC患者的相關數據進行分析,獲得預測和指導HCC治療的潛在標志物,對更加深入地認識和了解HCC的發生和發展提供了理論依據,為后續的動物實驗和臨床試驗提供了研究方向。