


【摘要】 目的采用生物信息學方法探討COL1A2在頭頸部鱗癌(HNSC)中的表達及相關功能。 方法利用TIMER2.0數據庫分析COL1A2基因在泛癌中的表達;通過GEPIA數據庫、UALCAN數據庫分析該基因在HNSC與正常組織中的差異表達情況;并利用STRING數據庫構建COL1A2基因蛋白互作網,DAVID數據庫分析與該基因互作蛋白基因的相關功能;最后通過GCBI基因雷達數據庫預測該基因可能參與的調控網絡和轉錄因子。 結果COL1A2在多種腫瘤中高表達,且在頭頸部鱗癌組織與正常組織中有差異表達。COL1A2及相關蛋白基因功能富集分析發現其參與了4個細胞組分、5個分子功能、11個生物學程序、7條信號通路,在基因調控網及轉錄因子預測發現,COL1A2與多種蛋白、轉錄因子、lncRNA、micRNA等相互調控。 結論COL1A2與HNSC的發生、發展可能是通過PI3K-Akt信號通路等多種途徑、多種蛋白、轉錄因子共同調控的結果。
【關鍵詞】COL1A2;生物信息學;頭頸部鱗癌;基因表達
中圖分類號: R739.91文獻標志碼: ADOI: 10.3969/j.issn.1003-1383.2024.02.004
Differential expression and functional prediction of COL1A2 in head and neck squamous cell carcinoma
LI Yuyinga, LIU Jielana, HOU Yuanlina, LU Shilia, HU Tingb, WU Binb, TANG Yuliana
【Abstract】 ObjectiveTo investigate the expression and related functions of COL1A2 in head and neck squamous cell carcinoma (HNSC). MethodsThe expression of COL1A2 gene in generalized carcinoma was analyzed by using TIMER2.0 database. GEPIA database and UALCAN database were used to analyze the differential expression of this gene in HNSC and normal tissues. The protein interaction network of the COL1A2 gene was constructed by the STRING database, and the related functions of the gene interaction protein gene were analyzed by DAVID database. Finally, GCBI gene radar database was used to predict the regulatory network and transcription factors that the gene might be involved in. ResultsCOL1A2 was highly expressed in various tumors, and was differentially expressed in head and neck squamous cell carcinoma and normal tissues. Functional enrichment analysis of COL1A2 and related protein genes showed that COL1A2 was involved in 4 cell components, 5 molecular functions, 11 biological programs and 7 signaling pathways. In gene regulatory network and transcription factor prediction, COL1A2 was considered to be mutually regulated with a variety of proteins, transcription factors, lncRNA, and micRNA, etc. ConclusionThe occurrence and development of COL1A2 with HNSC may be the result of the joint regulation of various pathways, various proteins, and transcription factors through the PI3K-Akt signaling pathway.
【Keywords】COL1A2; bioinformatics; neck squamous cell carcinoma (HNSC); gene expression
頭頸部鱗狀細胞癌(head and neck squamous cell carcinoma,HNSC)是世界上第六大常見的惡性腫瘤,每年因該病死亡人數達數十萬,病死率非常高[1-2]。Ⅰ型膠原蛋白螺旋結構由兩條α1鏈和一條α2鏈組成,其中,Ⅰ型膠原蛋白α2(collagen type Ⅰ alpha 2 chain,COL1A2)編碼Ⅰ型膠原蛋白的前α2鏈。Ⅰ型膠原蛋白是人體內重要的膠原蛋白,是細胞外基質的重要成分,存在于骨骼、角膜和肌腱等大多數結締組織中并參與多種生物學功能。因此,COL1A2間接參與了細胞基質的構建,維持細胞骨架的完整,一定程度上為腫瘤的黏附和生長提供支架和環境。近年研究發現,COL1A2參與胃癌、結腸癌、食管癌等多種癌癥的增殖與發展[3-5],COL1A1和COL1A2的過表達,促進了癌細胞侵襲轉移的重要步驟——上皮-間充質轉化的進程[6]。COL1A2在眾多癌癥的差異表達不僅與癌癥的發展有很大聯系,并且還與患者預后不良有關。但其在HNSC的作用機制尚不明確,本研究探討COL1A2在HNSC的表達并進一步探索其可能參與的調控網絡以及相關功能,為了解HNSC的發病機制,發掘潛在靶向基因提供理論依據。
1 資料與方法
1.1 COL1A2泛癌分析
在TIMER數據庫(https://cistrome.shinyapps.io/timer/)“Diff Expr”選項檢索COL1A2基因。
1.2 COL1A2在HNSC中表達分析
GEPIA數據庫(http://gepia.cancer-pku.cn/)中選擇“Boxplot”檢索COL1A2在HNSC與正常組織中表達,設置條件|log2FC|gt;1;Plt;0.01。UALCAN數據庫(http://ualcan.path.uab.edu/index.html)選擇“TCGA”模塊輸入COL1A2選擇HNSC后進行檢索,可獲得該基因相關表達信息。
1.3 COL1A2蛋白互作網
利用STRING數據庫(https://www.string-db.org/)構建蛋白互作網,在“Homo sapiens”檢索框輸入“COL1A2”,選擇物種類型:“HOMO sapiens”進行構建COL1A2蛋白互作網,在“Settings”框設置條件highest confidence(0.900)。
1.4 COL1A2功能及通路富集分析
將與COL1A2關系密切相關蛋白輸入DAVID數據庫(https://david.ncifcrf.gov/home.jsp)“Start Analysis”檢索框,選定標識以及物種分別為“OFFICIAL-GENE-SYMBOL”和“HOMO sapiens”進行分析。
1.5 COL1A2基因的調控網絡分析及預測轉錄因子
在GCBI數據庫(https://www.gcbi.com.cn/)首頁選擇“基因雷達”模塊對COL1A2基因進行與之相關因子調控網的分析。
1.6 統計學方法
數據的分析采用數據庫默認的統計學分析方法進行。COL1A2基因在HNSC組織與正常組織中的表達水平采用單因素方差進行比較分析。檢驗水準:α=0.05,雙側檢驗。
2 結果
2.1 COL1A2在多種癌組織與正常組織中的表達
TIMER2.0數據庫結果顯示,除了少數癌組織以外,COL1A2高表達于HNSC等多種癌組織。見圖1。
2.2 COL1A2在HNSC與正常組織中的差異表達情況
GEPIA數據庫與UALCAN數據庫均顯示COL1A2在HNSC組織的表達高于正常組織。見圖2。
2.3 構建與COL1A2相互作用的蛋白網絡
STRING數據庫顯示COL1A2與ITGA2、FN1、DCN、SPARC、COL1A1、COL3A1、PCOLCE、LUM、ADAMTS2、COL5A2互作密切相關。見圖3。
2.4 COL1A2基因功能及通路的富集分析
經過對COL1A2及10個緊密聯系的基因功能富集分析發現,COL1A2與ITGA2、FN1、DCN、SPARC、COL1A1、COL3A1、PCOLCE、LUM、ADAMTS2、COL5A2參與4個細胞組分(cell component,CC)、5個分子功能(molecular function,MF)、11個生物學程序(biological process,BP)、7條信號通路(signaling pathways,KG)。見圖4。
2.5 COL1A2的調控關系網
在線實驗室平臺分析結果:COL1A2與多種蛋白、lncRNA、靶向miRNA等多種因子共同調控COL1A2的激活、抑制以及與DNA的結合。見圖5。
2.6 COL1A2轉錄因子預測
根據轉錄因子預測結果顯示,COL1A2可能受到AHR、AP3、BETACATENIN、BRCA、CDX1、CPBP、DAX1、E2F1、EOS、GKLF、IK、IK2、ISL2、KID3等轉錄因子的調控。見圖6。
3 討論
COL1A2位于常染色體7q21.3-q22.1,由52個外顯子和其他非編碼部分構成[7]。其參與編碼的Ⅰ型膠原蛋白是人體內廣泛存在的蛋白質,是細胞外基質結構的重要組成部分[8],尤其是在形成實體腫瘤的間質過程中起到重要作用[9],因此COL1A2一定程度上參與了細胞基質骨架的形成與維持,為腫瘤細胞的依附提供必要的支撐條件。COL1A2被證明參與多種人類腫瘤的發展,COL1A2高表達于胰腺癌組織及細胞,該基因的沉默抑制胰腺癌細胞的增殖、遷移,參與胰腺癌的發展[10]。COL1A2相較于正常組織,其在胃癌組織高表達[11]。BMP1蛋白的缺失會促進COL1A1、COL1A2在結腸癌組織的過表達,從而促進EMT過程導致腫瘤的轉移。這些研究結果提示,COL1A2在腫瘤的發展、遷移過程中不容忽視。在本研究中,結合多個數據庫結果分析發現,COL1A2基因在頭頸部鱗癌組織的表達情況與上述研究有相同之處,即在頭頸部鱗癌組織中高表達于正常組織,且差異有統計學意義。
癌癥的發生、發展、轉移不僅僅由一個基因或蛋白導致,往往是通過多種蛋白、多條通路共同調控的結果。筆者發現,與COL1A2密切相關的10個蛋白分別是ITGA2、FN1、DCN、SPARC、COL1A1、COL3A1、PCOLCE、LUM、ADAMTS2、COL5A2。經過功能富集分析發現這些蛋白參與了骨骼系統的開發、凝血、白細胞的遷移、膠原蛋白代謝過程等生物學過程;還參與了PI3k-Akt信號通路、黏著斑信號通路、ECM受體相互作用、血小板激活等信號通路。PI3k-Akt信號通路被報道與眾多腫瘤的增殖、遷移有關:通過磷酸化Bad途徑、miR-144激活途徑等可以增強鼻咽癌細胞浸潤、轉移的能力[12];被抑制則可引起卵巢癌細胞的凋亡[13];通過激活下游相關蛋白加速結節性甲狀腺腫的惡化[14]。黏著斑信號通路與腫瘤的侵襲緊密相關[15-17]。有研究證明上皮細胞外的黏著斑通過肌動蛋白與細胞外基質作用發揮ECM信號通路共同調控胃癌的發生,且COL1A2及相關蛋白FN1、COL1A1、COL3A1、COL5A2在胃癌上調表達[15]。整合素亞基α2(integrin subunit alpha-2 ,ITGA2)常與ITGB1形成α2β1整合蛋白,參與腫瘤細胞的遷移、侵襲過程,在ITGA2表達水平高的胰腺癌樣本中主要富集的通路包括PI3K/AKT/mTOR信號通路[18];在食管鱗狀上皮細胞癌的惡性發展的研究中也發現了高表達ITGA2可能使FAK/AKT磷酸化并且上調EMT表型以促進該癌癥的發展[19]。這些研究與我們富集分析的通路結果有相同之處;SPARC、PCOLCE等基因同樣被認為是潛在的腫瘤標志物[17,20]。LUM則是彌散性胃癌的核心基因,其增強表達的患者顯示預后不良[21]。由此可見,COL1A2和緊密蛋白互作網與腫瘤有十分密切的關系,COL1A2很可能通過這些與癌癥發展密切相關的蛋白和通路參與了頭頸部鱗癌的發生、發展。
長鏈非編碼RNA通常與人類多種疾病,尤其是癌癥有關,在基因調控中發揮重要作用。在共表達調控網絡分析圖中發現許多長鏈非編碼RNA(lncRNA)與COL1A2參與頭頸部鱗癌的調控,例如lncRNA-GCC2-AS1、lncRNA-WT1-AS、lncRNA-DSCR8、lncRNA-0024、lncRNA-CCDC26、lncRNA-00908、lncRNA-00482、lncRNA-SNHG29、lncRNA-PLAC4以及lncRNA-TINCR。特別是lncRNA-TINCR、lncRNA-DSCR8、lncRNA-SNHG29等已經有報道通過修飾miRNA或黏附miRNA促進癌癥發展[22-23]和血管鈣化[24]。這表明這些相關lncRNA可能也參與頭頸部鱗癌的發生發展。部分lncRNA尚未有研究報道,為頭頸部鱗癌的研究提供了新的研究思路。
轉錄因子是一類能在基因5'端上游特定結合以保證目的基因在特定時間、地點、程度、空間表達的分子。通過對COL1A2特定轉錄因子的分析,我們發現FLi-1、Egr-1、Sp1-isoform1、GATA-4、TCF1、TCF3、THAP1、VMYB、STAT1等轉錄因子可能在調控COL1A2過程中起著不同的作用,為深入研究頭頸部鱗癌調控機制指明方向。
綜上所述,COL1A2在頭頸部鱗癌與正常組織中差異表達,且其通過密切聯系蛋白參與多種生物程序和癌癥常見信號通路,并可能和預測轉錄因子及RNA共同調節頭頸部鱗癌的產生和發展。
參 考 文 獻
[ 1] 張璐,陸靜鈺,陸海軍.頭頸部鱗癌相關生物標志物與免疫治療預后的關系[J].實用腫瘤學雜志,2021,35(1):55-58.
[ 2] 顧佳欣,于海青,樊國梁.頭頸部鱗狀細胞癌差異表達基因分析[J].內蒙古大學學報(自然科學版),2021,52(5):477-486.
[ 3] AO R, GUAN L, WANG Y, et al. Silencing of COL1A2, COL6A3, and THBS2 inhibits gastric cancer cell proliferation,migration,and invasion while promoting apoptosis through the PI3k-Akt signaling pathway[J]. J Cell Biochem, 2018, 119(6): 4420-4434.
[ 4] 劉小軍,韓建軍,高飛,等.結直腸癌組織的COL1A1和COL1A2水平及臨床意義[J].臨床腫瘤學雜志,2020,25(5):430-435.
[ 5] LI G B, JIANG W, KANG Y T, et al. High expression of collagen 1A2 promotes the proliferation and metastasis of esophageal cancer cells[J]. Ann Transl Med, 2020, 8(24): 1672.
[ 6] ZHU X J, LUO X S, JIANG S Y, et al. Bone morphogenetic protein 1 targeting COL1A1 and COL1A2 to regulate the epithelial-mesenchymal transition process of colon cancer SW620 cells[J]. J Nanosci Nanotechnol, 2020, 20(3): 1366-1374.
[ 7] 孟祥寧,薛雅麗,傅松濱,等.COL1A2基因多態性的研究進展[J].國外醫學 遺傳學分冊,2002,25(5):310-313.
[ 8] 胡美.Notch信號通路調控成纖維細胞表達Col1α1及Col1α2從而影響哮喘氣道上皮下纖維化[D].西安:第四軍醫大學,2014.
[ 9] 于一凡.COL1A2對結直腸癌細胞增殖、遷移、侵襲的機制研究[D].沈陽:中國醫科大學,2018.
[10] WU J, LIU J, WEI X Q, et al. A feature-based analysis identifies COL1A2 as a regulator in pancreatic cancer[J]. J Enzyme Inhib Med Chem, 2019, 34(1): 420-428.
[11] RONG L, HUANG W, TIAN S K, et al. COL1A2 is a novel biomarker to improve clinical prediction in human gastric cancer:integrating bioinformatics and meta-analysis[J]. Pathol Oncol Res, 2018, 24(1): 129-134.
[12] 田忠,夏嬙,王新穎.P13K/Akt信號通路及其在鼻咽癌發生發展中的研究進展[J].實用醫學雜志,2016,32(4):678-680.
[13] 王莉.GOLPH3通過PI3K/AKT信號通路調控上皮性卵巢癌細胞增殖與凋亡的研究[D].上海:上海交通大學,2018.
[14] 曾明星.活血消癭方治療結節性甲狀腺腫的臨床經驗及調控PI3K/Akt信號通路的機制研究[D].武漢:湖北中醫藥大學,2017.
[15] 何昕.胃癌基因芯片的差異表達基因研究[D].衡陽:南華大學,2016.
[16] SHEN J, CAO B B, WANG Y T, et al. Hippo component YAP promotes focal adhesion and tumour aggressiveness via transcriptionally activating THBS1/FAK signalling in breast cancer[J]. J Exp Clin Cancer Res, 2018, 37(1): 175.
[17] 王松,李興川,劉兆辰,等.SPARC在胃癌中的表達及預后相關分析[C]//中國抗癌協會腫瘤標志專業委員會,中國抗癌協會青年理事會.2019年中國腫瘤標志物學術大會暨第十三屆腫瘤標志物青年科學家論壇論文集.蘭州大學第一醫院,蘭州大學第二醫院,2019:2.
[18] 任天宇,周新童,黨勝春.基于生物信息學分析ITGA2在胰腺癌組織中的表達及機制[J].現代腫瘤醫學,2020,28(20):3570-3574.
[19] 黃衛.ITGA2過表達通過FAK/AKT通路促進食管鱗狀細胞癌的惡性進展[D].重慶:重慶醫科大學,2021.
[20] 曹媛.lncRNA PCOLCE-AS1在葡萄膜黑色素瘤中的作用及機制研究[D].上海:上海交通大學,2018.
[21] 李戴牟,吳留成,梁榜輝,等.基于轉錄組測序分析彌漫型胃癌特征及其核心基因LUM的表達[J].中國癌癥防治雜志,2022,14(2):160-166.
[22]江國斌,陳曉萍.TINCR靶向microR-544a/FBXW7對人乳腺癌細胞增殖、侵襲的影響[J].中國現代醫學雜志,2021,31(10):41-47.
[23] 吳現磊. lncRNA DSCR8在胃癌中的研究[J].湖北科技學院學報(醫學版),2021,35(1):12-15,封2,封3.
[24]陳艷霞.LncRNA-SNHG29/miR-200b-3p調控Klotho/FGF23軸介導血管鈣化的機制研究[D].南昌:南昌大學,2020.
(收稿日期:2023-04-30 修回日期:2023-07-17)
(編輯:梁明佩)
基金項目: 2022年大學生創新創業訓練計劃自治區級立項項目(S202210599011,S202210599096,S202210599050);2021年大學生創新創業訓練計劃自治區級立項項目(S202110599074);右江民族醫學院2018年度校級科研課題(yy2018ky015)
第一作者簡介: 李鈺穎,女,在讀全日制本科生。E-mail:2541335701@qq.com
通信作者: 唐玉蓮。E-mail:284118382@qq.com
[本文引用格式] 李鈺穎,劉潔蘭,侯沅林,等.COL1A2在頭頸部鱗癌中的差異表達及功能分析[J].右江醫學,2024,52(2):121-126.