張湘豫,張艷群,盧夢云,胡溢洪,韓語誠,鄒先瓊*
(1. 桂林醫學院附屬口腔醫院,桂林 541004;2. 中南大學湘雅醫院腫瘤科,長沙 410008;3. 桂林醫學院基礎醫學院,桂林 541199)
人類糖脂轉運蛋白(glycolipid thansfer protein,GLTP)是一種能在細胞內膜系統間特異性轉運鞘糖脂及維持細胞內鞘糖脂穩態的可溶性蛋白(24 kD),其基因位于染色體12(12q24.11)[1-2]。與其他脂類轉運蛋白相比,人類GLTP蛋白及其相關同源物主要含有由α螺旋構成的雙層“三明治”狀的獨特空間結構,這種結構被稱為GLTP折疊,GLTP折疊目前被認為是真核生物糖脂轉運蛋白超家族的結構基礎及原型蛋白[3-4]。GLTP蛋白家族成員包括4-磷酸磷脂酰肌醇銜接蛋白2(phosphatidylinositol 4-phosphate adaptor protein-2,FAPP2)、人1-磷酸神經酰胺轉運蛋白(ceramide-1-phosphate transfer protein,CPTP)、人類糖脂轉運結構域2蛋白(glycolipid transfer protein domain containing 2,GLTPD2)、促細胞死亡蛋白11(accelerated cell death 11,ACD11)等[1,5-6]。其中,ACD11是植物神經酰胺水平的中間調節蛋白[8]。
人類GLTPD2的GLTP結構域位于第102~252位氨基酸殘基,第1~36位氨基酸殘基為N端信號肽,第13~32位氨基酸殘基為跨膜區,分子量大小為31.6 kD,等電點為10.19[8]。GLTPD2是一種蛋白質編碼基因,與該基因有關的基因本體論(gene ontology,GO)注釋包括糖脂結合和糖脂轉運蛋白活性,該基因的重要旁系同源物是CPTP[1,9]。有研究發現,GLTPD2mRNA在正常肝臟組織中有特別高的表達[1,8]。同時,研究顯示,GLTPD2也與腸、腎等組織的功能及疾病的發生發展密切相關[1]。
肝細胞癌(liver hepatocellular carcinoma,LIHC)是一種重要的腫瘤,目前是全球癌癥相關死亡的第二大原因,全球每年有超過85萬例新發LIHC患者,且這一數字正在上升[10]。LIHC發展的各種危險因素包括肝硬化(由纖維化引起的慢性肝損傷)、乙型肝炎病毒感染、丙型肝炎病毒感染、酒精濫用和代謝綜合征等[10-12]。盡管近幾十年來在腫瘤的治療和臨床診斷方面取得了一些進展,但是LIHC發生發展的作用機制尚不清楚[13],因此,探究肝臟組織的癌變機制,探索癌癥早期診斷、準確預后和治療靶點的潛在生物標志物具有重要意義。迄今,GLTP蛋白家族成員在腫瘤發生發展中的作用及其機制尚不清楚,因而從多數據庫分析GLTPD2在LIHC中的作用對理解GLTP家族成員的生物學功能具有重要的意義。
采用LinkedOmics網站分析GLTPD2表達水平與LIHC臨床病理因素的相關性。LinkedOmics網站(http://www.linkedomics.org/login.php)包含來自TCGA項目的32種癌癥類型共計11 158名患者的多組學數據和臨床數據[14]。檢索步驟:1)選擇腫瘤類型為“LIHC”; 2)選擇TCGA-LIHC RNAseq數據;3)輸入目的基因“GLTPD2”; 4)選擇數據中聯合分析臨床數據“TCGA-LIHC Clinical”; 5)選擇“Non-Parametric Test”。用UALCAN(http://ualcan.path.uab.edu/)在線工具分析比較肝癌組織與癌旁正常組織的mRNA表達量[15]。
用Kaplan-Meier Plotter數據庫的LIHC數據集分析GLTPD2表達量與LIHC患者預后關系[16]。Kaplan-Meier Plotter數據庫(https://kmplot.com/analysis/)可以對來自多個數據庫的54 000個基因影響21種癌癥類型的生存率進行深度分析[17]。設定條件:1)Cancer。liver hepatocellular carcinoma(n=364)。2)Gene symbol。GLTPD2。3)Survival。Overall survival。4)Split patients by。median,選擇Auto select best cutoff。通過GEPIA數據庫(http://gepia.cancer-pku.cn/?tdsourcetag=s_pcqq_aiomsg)及Oncolnc數據庫(http://www.oncolnc.org)做進一步的驗證[18]。
采用Timer 2.0數據庫分析GLTPD2在LIHC組織中細胞免疫浸潤情況。Timer 2.0數據庫(http://timer.cistrome.org/)是一個綜合性的網絡數據庫,可用于系統分析不同類型癌癥的免疫浸潤,該版本的webserver提供了多種方法估計免疫浸潤豐度,允許用戶動態生成高質量的數據,全面探索腫瘤的免疫學、臨床和基因組特征[19-21]。
在篩選了常見的GLTPD2相關基因后,使用Metascape工具進行了進一步的GO分析和KEGG分析。GO分析包括細胞組分(cellular component,CC)、分子功能(molecular function,MF)、生物過程(biological process,BP)[22]。為了驗證GLTPD2共表達基因的注釋,進一步使用了David(注釋、可視化和集成發現數據庫)在線生物信息學數據庫[23]。David是一種生物數據的分析工具,用于整合和提供生物功能的信息[23-24]。
為了更好地預測LIHC患者的預后,使用“rms”程序包(6.2-0版本)和survival包(3.2-10版本),基于Cox回歸分析結果構建了一個列線圖。列線圖可以將統計預測模型簡化為一個針對單個患者定制的總生存期(overall survival,OS)概率的單一數值評估,因此被廣泛應用于癌癥患者的預后[25-27]。模型納入臨床分期的T stage,N stage,M stage,GLTPD2表達和病理分期4個獨立的預后因素變量的預測模型中。采用多變量Cox回歸分析,選擇所有獨立預后因素的聯合模型構建Nomogram圖,預測肝細胞癌患者1、3、5年OS的概率。隨后,采用了1 000個重樣的一致性指數(C指數)對列線圖進行了鑒別和校準,并通過繪制列線圖預測概率與觀測率的關系,對列線圖的校準曲線進行圖形化評價。
LIHC與臨床病理分期(pathologic stages,stageⅠ、Ⅱ、Ⅲ、Ⅳ)、年齡以及TNM(tumor node metastasis staging system)分期中的T分期、N分期等顯著相關。LIHC的臨床病理分期與患者的臨床預后密切相關。GLTPD2表達在LIHC的不同臨床病理分期(stage Ⅰ、Ⅱ、Ⅲ、Ⅳ期)里差異顯著,stage Ⅰ期顯著高于stage Ⅱ期、stage Ⅲ期(圖1a);隨著患者年齡增大,GLTPD2表達增高(圖1b);T1分期與T4分期的GLTPD2表達顯著高于其他分期組(圖1c);N1分期的GLTPD2表達顯著低于N0分期組(圖1d);M1分期的GLTPD2表達與M0分期的GLTPD2表達差異不顯著(圖1e);UALCAN在線工具分析顯示,LIHC與癌旁組織相比,GLTPD2mRNA在LIHC中低表達,差異有顯著相關性(圖1f)。

圖1 GLTPD2表達與LIHC臨床病理參數的關系Fig. 1 Relationship between GLTPD2 expression and clinical pathological parameters of LIHC
通過Kaplan-Meier Plotter數據庫對364個樣本進行生存預后分析,發現GLTPD2低表達組總生存期更短,預后更差(圖2a)。GEPIA數據庫分析表明,GLTPP2低表達組無病生存期(圖2b)及總生存期(圖2c)更短,預后更差。Oncolnc數據庫[14,17]分析可進一步證實以上生存分析結論,GLTPD2低表達組生存期更短且預后更差(圖2d)。

圖2 GLTPD2表達水平與LICH患者預后的生存曲線Fig. 2 Relationship between GLTPD2 expression and prognosis of LIHC patients
Timer 2.0數據庫分析結果顯示,GLTPD2在LIHC免疫微環境中與腫瘤細胞純度、CD8+T細胞、B細胞、中性粒細胞、樹突狀細胞和血管內皮細胞的表達呈負相關,與CD4+T細胞的表達呈正相關,差異有顯著相關性(圖3)。

圖3 GLTPD2表達水平與免疫細胞浸潤水平的相關性Fig. 3 Correlation between expression level of GLTPD2 and infiltration level of immune cells
為了預測與GLTPD2共表達基因的功能,在Metascape平臺上進行了GO分析和KEGG通路分析。GLTPD2共表達基因顯著參與限速酶催化作用、蛋白結構域的特異性結合、蛋白磷酸化氨基酸結合、黃體酮介導的卵母細胞成熟、甲基轉移酶的活性和泛素樣蛋白的連接(圖4a)。這些基因在胰島素信號通路和呼吸電子傳遞鏈、神經營養因子信號通路和蛋白激酶的信號轉導中顯著富集(圖4b、4c)。
預后模型中每個指標的取值范圍對應一個分數范圍,各個指標的取值通過向上作一垂線可以得出一個具體的分數,所有指標分數相加獲得患者的總分,通過總分向下作一垂線可以得出LIHC患者在1、3和5年時生存的概率[27]。如1例LIHC患者為T2分期、N1分期、M1分期、stage II,則GLTPD2表達為8,則該患者的總分為110,對應的患者在1年時的生存率為55%,3年時生存率為30%,5年時生存率為18%,提示GLTPD2表達的異常會影響LIHC患者在1、3和5年時生存的概率(圖5a)。對列線圖的校準曲線進行圖形化評價,提示模型預測效果比較好(圖5b)。

圖5 GLTPD2在LIHC中預后預測模型Fig. 5 Predicted prognostic model of GLTPD2 in LIHC
據統計,2020年約有905 677例肝癌新發病例,830 180例肝癌死亡[28]。雖然以根治性手術為基礎的外科治療大大改善了患者預后,但肝癌的5年生存率僅為12%[29]。因此,探討LIHC的發病、病理機制,為患者提供早期干預,從而降低肝癌患者的發病率和死亡率具有重大的防治意義[30]。本研究使用了多個在線數據庫和工具,對GLTPD2在LIHC中的表達及其潛在機制進行了分析。通過分析相關基因在臨床上的表達及意義,為尋找相關治療靶點提供了新途徑。
人類GLTPD2是GLTP家族的一個新成員,GLTPD2是一種蛋白質編碼基因,與該基因有關的GO注釋包括糖脂結合和糖脂轉運蛋白活性[8]。有研究闡明,人類GLTPD2與肝、腸、腎等組織的功能及疾病的發生發展密切相關[8]。GLTPD2是新生小鼠壞死性小腸結腸炎中上調程度最高的15個基因之一,也是單聚體而非五聚體c反應蛋白處理內皮祖細胞時上調程度最高的12個基因之一。五聚體c反應蛋白與單體c反應蛋白的分離被認為參與了動脈粥樣硬化斑塊發生部位的局部促炎癥反應[31]。在最近的一項全基因關聯研究中,GLTPD2被確定為35個脂類相關基因位點中與心血管疾病風險相關的10個基因突變體之一[31-32]。然而,關于GLTPD2在LIHC中的作用罕有報道。
本研究中GLTPD2在LIHC組織中高表達并與臨床分期呈負相關,有利于LIHC患者的生存。GLTPD2表達與LIHC患者的臨床病理分期、TNM分期顯著相關,提示了GLTPD2低表達與LIHC患者的不良預后呈顯著相關。數據分析提示了GLTPD2的表達與患者年齡呈顯著相關,隨著患者年齡增大,GLTPD2的表達增高。GLTPD2在LIHC免疫微環境中與腫瘤細胞純度、CD8+T細胞、B細胞、中性粒細胞、樹突狀細胞和血管內皮細胞的表達呈負相關,而與CD4+T細胞的表達呈正相關,提示GLTPD2可能通過調節LIHC組織中腫瘤微環境中的免疫細胞浸潤發揮作用。因此,可以推測,GLTPD2在LIHC的發生過程中激活機體的免疫系統,從而產生某種特定抗腫瘤免疫應答。GLTPD2共表達基因顯著參與限速酶的催化作用、蛋白結構域的特異性結合、蛋白磷酸化氨基酸結合、黃體酮介導的卵母細胞成熟、甲基轉移酶的活性和泛素樣蛋白的連接。這些共表達基因在胰島素信號通路、呼吸鏈電子傳遞、神經營養因子信號通路和蛋白激酶的信號轉導中顯著富集,提示GLTPD2調控細胞內多種信號通路,在維持糖脂代謝穩態、能量代謝等生物學功能中具有重要的作用。
綜上所述,本研究揭示了GLTPD2的低表達與LIHC的不良預后有關,是一個潛在的預后生物標志物。而通過藥物處理特異性誘導GLTPD2的表達,可能成為LIHC的潛在治療方案。本研究使用了多個在線數據庫,對GLTPD2在肝癌中的表達及其潛在機制進行了全面的生物信息學分析。該方法的優點是能夠獲得大量的樣本群體、成本低、能開展大規模的基因組研究和功能分析[24]。然而,生物信息學分析研究不可避免地存在一些局限性。首先,由于收集的樣本量不同,不同數據庫的生物信息學分析結果也可能不同。其次,本研究僅研究了基于幾個不同在線數據庫的生物信息學分析結果。因此,需要進一步的試驗來驗證GLTPD2在LIHC中的作用機制。