任冰潔,楊媛媛,卞徐宇,李 強,2,梁容瑞,陶 敏△
(1.蘇州大學附屬第一醫院腫瘤科,蘇州 215006 ;2.江西省腫瘤醫院淋巴血液腫瘤科,南昌 330029)
肺癌是一種高發惡性腫瘤,其中非小細胞肺癌(NSCLC)占絕大多數。NSCLC 可分為肺腺癌(LUAD)、肺鱗癌(LUSC)和大細胞癌,其中LUAD是最常見的亞型。LUAD早期無明顯癥狀不易被發現,5年生存率不足30%[1]。肺癌的形成是一個多階段和多因素參與的復雜過程。
高遷移率族蛋白B1(HMGB1)是高遷移率族蛋白家族的成員,在哺乳動物細胞中廣泛表達。HMGB1 具有細胞內活性和分泌活性,細胞內的HMGB1 能與DNA 結合,在轉錄過程中起關鍵作用。分泌到細胞外的HMGB1 可與Toll 樣受體(TLRs)和晚期糖基化終產物受體(RAGE)結合,激活下游信號通路參與腫瘤的發生、生長、侵襲和轉移。有研究發現,HMGB1 過表達可促進肺癌細胞的增殖和轉移,并與患者預后不良有關[2]。在肺癌方面,雖然有研究表明HMGB1 與LUAD 的不良預后有關,但HMGB1參與LUAD的發生、發展機制尚未完全闡明。本研究旨在探討可能參與LUAD 發生發展的HMGB1下游關鍵節點。
1.1 HMGB1 相關基因分析 UALCAN(http://ualcan.path.uab.edu/index.html)是一個交互式門戶網站,用于深入分析TCGA 中的基因表達數據[3]。為了獲取LUAD 中與HMGB1 表達相關的基因,本研究從UALCAN數據庫TCGA analysis板塊下的Correlation 中獲取了與HMGB1 表達相關基因的數據。將數據導入Excel 中,設置皮爾遜相關系數(Pearson-CC)≥0.4,篩選相關基因。
1.2 生存分析 利用UALCAN數據庫TCGA analysis 板塊對UALCAN 數據庫篩選出的基因分別做生存分析,篩選具有生存意義的基因[3]。
1.3 蛋白質-蛋白質相互作用分析 STRING(https://string-db.org)數據庫是一個在線搜索已知蛋白,以及預測蛋白質互作關系的數據庫,包括蛋白質之間直接物理相互作用,及間接功能的相關性[4]。將TCGA 篩選出的基因和HMGB1 基因一起輸入STRING 數據庫中,建立蛋白質-蛋白質相互作用網絡圖。
1.4 轉錄因子和結合位點預測 AnimalTFDB3.0(http://bioinfo.life.hust.edu.cn/AnimalTFDB/)是一個提供動物轉錄因子(TFs)及其輔助因子信息資源的數據庫,包含來自97 個動物基因組的125 135 個轉錄因子和80 060 個轉錄輔助因子基因[5]。JASPAR(http://jaspar.genereg.net/)是一個提供轉錄因子與DNA 結合位點以及結合模式的公共數據庫[6]。首先,通過NCBI 的Gene 模塊查找目標基因,計算目標基因啟動子區域,一般認為基因起點上游2 000 bp及下游100 bp為基因潛在啟動子區域。其次,在AnimalTFDB3.0 的Predict TFBS 功能預測欄輸入目標基因的啟動子序列,在預測結果欄可以得到與目標基因結合的轉錄因子。最后,挑選潛在的關鍵轉錄因子,利用JASPAR 數據庫預測轉錄因子在目標基因啟動子區域的結合位點。
1.5 信號通路分析 京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)(https://www.kegg.jp/kegg)是一個綜合性的網站,是最為知名和通用的信號通路數據庫[7]。通過KEGG中的KEGG GENES 功能來分析相關的信號通路及通路下游轉錄因子。
2.1 LUAD 中與HMGB1 相關的基因 UALCAN[3]數據庫分析LUAD 中與HMGB1 表達相關的基因,得到正相關基因528 個,其中皮爾遜相關系數≥0.4的基因有101個,負相關基因2個,其中皮爾遜相關系數≥0.4的基因為0個。篩選出的101個皮爾遜相關系數≥0.4的正相關基因見表1。
2.2 生存分析和蛋白質-蛋白質相互作用 UALCAN數據庫分析顯示,33個基因與LUAD的生存預后有關[3],LUAD 組織中細胞周期蛋白依賴激酶1(CDK1)、H2A 組蛋白家族成員Z(H2AFZ)表達量明顯高于正常肺組織,且CDK1、H2AFZ 低/中表達組患者生存時間明顯長于CDK1 和H2AFZ 高表達組(均P<0.05),見圖1。STRING數據庫分析顯示,CDK1和H2AFZ基因與HMGB1存在相互作用[4],見圖2。

表1 LUAD中與HMGB1相關的基因

圖1 LUAD組織CDK1和H2AFZ的表達及生存曲線

圖2 蛋白質-蛋白質相互作用
2.3 CDK1 的轉錄因子和結合位點預測 首先通過NCBI 數據庫查找CDK1 基因的啟動子序列。然后利用AnimalTFDB3.0數據庫預測CDK1基因的轉錄因子[5],獲得572 個轉錄因子。其中SOX2 和SP1是CDK1 的轉錄因子[8-9]。因此選擇SOX2 和SP1 進行結合位點的預測。最后利用JASPAR數據庫預測SOX2 和SP1 轉錄因子在CDK1 啟動子區域的結合位點[6],見圖3。
2.4 H2AFZ 的轉錄因子和結合位點預測 首先通過NCBI 數據庫查找H2AFZ 基因的啟動子序列。然后利用AnimalTFDB3.0 數據庫預測H2AFZ 基因的轉錄因子[5],獲得598 個轉錄因子。SOX2 和SP1是H2AFZ 的轉錄因子[10-11],因此,選擇SOX2 和SP1進行結合位點的預測。最后利用JASPAR數據庫預測SOX2 和SP1 轉錄因子在H2AFZ 啟動子區域的結合位點[6],見圖4。
2.5 SOX2的上游調節基因 有研究表明,HMGB1可以通過PI3K/Akt 和ERK 信號通路促進癌細胞增殖[12]。為了分析Akt和ERK是否對SOX2有調節作用,本研究利用KEGG 數據庫查找相應的信號通路[7]。如圖5 所示,當Akt 或ERK 被上游信號激活后,轉移到細胞核中來促進SOX2的轉錄。

圖3 SOX2-motif和SP1-motif在CDK1啟動子區域結合位點

圖4 SOX2-motif和SP1-motif在H2AFZ啟動子區域結合位點

圖5 Akt和ERK相關信號通路圖
肺癌是世界上最常見和最致命的癌癥之一。隨著診療水平的不斷提高,肺癌患者的生存期大大延長。然而,肺癌患者的5年復發率卻很高,復發患者的治療選擇有限[13]。肺癌的發生和發展是一個復雜的過程,HMGB1 可能參與了肺癌發展的多個階段。研究表明,HMGB1可能參與了肺癌的發展,且LUAD患者的生存呈負相關關系[14]。
HMGB1 是一種高度保守的蛋白質,與多種惡性腫瘤的進展有關。晚期糖基化終產物受體(RAGE)和Toll樣受體家族(如TLR-2、TLR-4、TLR-9)是HMGB1 的重要受體。越來越多的研究表明,HMGB1與RAGE或TLRs結合導致細胞活化,從而延長炎癥、增殖和凋亡的持續時間[15]。HMGB1 結合RAGE 或TLRs 可以激活細胞內信號通路PI3K/Akt 和絲裂原活化蛋白激酶(MAPK、ERK1/2)來調節NCSLC 的活化和增殖[16]。本研究分析LUAD 中與HMGB1 表達相關的基因,篩選出101 個高度正相關的基因。利用UALCAN 數據庫分析這101 個高度正相關基因的表達與LUAD 之間的生存相關性。結果顯示,33 個基因與LUAD 的生存預后有關。通過STRING數據庫建立HMGB1與這33個基因的蛋白質-蛋白質相互作用網絡圖,發現CDK1和H2AFZ與HMGB1之間存在相互作用。
CDK1 基因編碼的蛋白質是Ser/Thr 蛋白激酶家族的成員。該蛋白是高度保守的蛋白激酶復合物M 期啟動因子(MPF)的催化亞基,在真核細胞周期的G1/S和G2/M中起關鍵作用。在癌癥中經常觀察到CDK1活性的失調。通過整合來自不同數據庫(TCGA 和GEO)的基因表達數據,鑒定了CDK1 在LUAD 中的表達上調。據報道,CDK1 上調與LUAD 的不良預后有關[17]。H2AFZ 是組蛋白H2A的變體,在酵母及哺乳動物細胞具體保守序列。H2AFZ在基因轉錄、DNA復制、細胞周期進程和基因組穩定性維持過程中發揮著重要的作用。有研究表明,H2AFZ 的過表達是肝細胞癌、乳腺癌預后不良的一個指標[18]。本研究通過分析TCGA數據庫中的基因表達數據,發現H2AFZ在LUAD中表達上調,且高表達與LUAD的不良預后有關。
PI3K/Akt 已被證明在細胞周期的調節中發揮作用。PI3K/Akt 可以激活細胞周期蛋白D,抑制CDK 抑制劑p21 活性,從而促進G1/S 期轉變。另外,PI3K/Akt 失活將導致G1 期阻滯[19]。總的來說,PI3K/Akt可以通過抑制P21的活性來促進CDK1的表達,參與細胞周期的調節[20]。另外,ERK 信號通路可以上調CDK1,增加G2/M期細胞比例[21]。有研究表明,Akt 是SOX2 表達的上游調節因子,抑制Akt 通路可以降低食管鱗狀細胞中SOX2 的表達[22]。Chen 等[23]證實,澳洲茄邊堿可以抑制Akt 信號傳導,降低SP1和p65的表達,從而抑制人肺癌細胞的生長。ERK 通路也是HMGB1 的重要下游通路,有研究表明FGFR1可以通過MAPK信號通路調節SOX2 的表達,FGFR1-ERK1/2-SOX2 軸可促進FGFR1擴增肺癌細胞的增殖和轉移[24]。SP1是ERK的下游信號分子已通過實驗驗證[25]。本組利用生物學信息技術預測CDK1和H2AFZ的轉錄因子,預測到的轉錄因子包括SOX2 和SP1。SOX2 和SP1 轉錄因子已被證明可以調節CDK1 和H2AFZ 的轉錄[8-11]。
本研究表明,HMGB1 可能是通過PI3K/Akt 或ERK 信號通路促進SOX2 或SP1 表達進而調節CDK1或H2AFZ基因,參與LUAD的進展。