丁麗麗, 劉軒綺, 孫曉林, 高雅靜, 武志慧, 王永福
(包頭醫學院第一附屬醫院, 1. 風濕免疫科, 2. 中心實驗室/內蒙古自治區自體免疫學重點實驗室, 內蒙古 包頭, 014010)
轉化生長因子-β(TGF-β)是轉化生長因子超家族中的一員,在調節細胞分化、增殖、遷移、免疫反應和細胞外基質(ECM)沉積中發揮至關重要的作用[1]。TGF-β通常以前體的形式合成,需要進一步激活以觸發其下游的經典或非經典途徑[2-3]。研究[4-6]表明, TGF-β可通過激活經典的Smads通路來促進纖維化相關分子轉錄,包括α-平滑肌肌動蛋白(α-SMA)、Ⅰ型膠原和基質金屬蛋白酶組織抑制劑(TIMP), 其可誘導成纖維細胞活化和ECM沉積,導致組織器官纖維化。TGF-β介導的非經典的Smads信號通路也可以上調促纖維化因子的表達,導致ECM過度產生,參與到纖維化過程中[7]。系統性硬化癥(SSc)是一種局限性或彌漫性皮膚及內臟結締組織纖維化、硬化及萎縮的結締組織疾病,該病較罕見,女性多見。30%的SSc患者可并發間質性肺病(ILD)。ILD是SSc患者最常見的死亡原因, 10年病死率高達40%[8-11]。SSc的發病機制較為復雜,其中TGF-β及相關細胞因子啟動的細胞信號轉導可促進SSc纖維化的形成[12]。TGF-β通路可直接作用于成纖維細胞,促進2型先天淋巴樣細胞向促纖維化表型轉化,導致白細胞介素-10 (IL-10)產生減少,膠原合成增加,促進SSc纖維化[13]。
TGF-β生成增加不僅能誘導成纖維細胞向肌成纖維細胞分化,還可導致細胞內鈣調節失調,上調纖維化標志物α-SMA、纖維連接蛋白和波形蛋白的表達,加重SSc肺纖維化[14]。特發性肺纖維化(IPF)是一種病因不明的慢性、進行性、纖維化性間質性肺病,診斷IPF后,患者的中位生存期為2~4年[15]。目前研究[16]認為肺纖維化是肺泡上皮反復微損傷的結果。肺泡上皮細胞在修復過程中,釋放過多的TGF-β等促纖維化因子[17]。促纖維化介質激活并促進駐留的成纖維細胞分化為肌成纖維細胞,產生過量的ECM[18]。成纖維細胞/肌成纖維細胞的聚集和ECM的沉積,破壞了正常的肺結構,阻礙了氣體交換,進而加重IPF[19]。雖然上述兩種疾病的具體發病機制尚不清楚,但TGF-β信號的異常均可誘發或促進系統性硬化癥間質性肺病(SSc-ILD)和IPF發展。本研究分析SSc-ILD、IPF、TGF-β誘導的肺纖維化模型重疊基因的相關性,探討TGF-β介導的信號通路是否可以作為SSc-ILD和IPF共同的致病途徑,現報告如下。
本研究利用Gene Expression Omnibus (GEO)數據庫 (https://www.ncbi.nlm.nih.gov/geo/)[20]獲取GSE76808、GSE135099基因芯片數據,研究類型均為Expression profiling by array, 2個數據源分別在GPL570和GPL13534平臺上檢測。
1.2.1 數據處理: 通過R軟件“tidyverse”包將GSE76808、GSE135099原始數據中的“ID-REF”轉換為“Gene Symbol”。使用R軟件的“limma”包篩選出差異性表達的基因,篩選標準為adj.Pvalue<0.05和|logFC|>1。利用R軟件將差異基因進行處理并繪制火山圖。
1.2.2 獲取重疊基因: 對差異基因交互制作韋恩圖,利用R軟件對重疊基因進行基因本體(GO)功能注釋、京都基因與基因組百科全書(KEGG)通路富集及可視化。
1.2.3 構建蛋白質互作(PPI)網絡并篩選分析hub基因: 從String數據庫[21]搜索重疊基因間的相互作用關系,將PPI關系導入Cytoscape構建PPI網絡,根據Degree值將重疊基因排序,利用“GO”插件篩選出hub基因。通過在線網站TISIDB(http://cis.hku.hk/TISIDB/)[22]對hub基因功能和通路富集進行分析。
本研究對GEO數據庫收錄的GSE76808、GSE135099數據進行差異分析發現,與健康對照組(NC組)相比, SSc-ILD中有279個基因表達上調,362個基因表達下調; 與NC組相比, IPF中存在820個高表達的基因, 1 350個低表達的基因; 與NC組相比, TGF-β誘導的肺纖維化模型中存在1 562個上調的基因, 2 416個下調的基因。見圖1。

A: 與NC組相比, SSc-ILD中差異性表達的基因; B: 與NC組相比, IPF中差異性表達的基因; C: 與NC組相比, TGF-β誘導的肺纖維化模型中差異性表達的基因。圖1 SSc-ILD、IPF、TGF-β誘導的肺纖維化模型中差異性表達的基因
將上述篩選出的SSc-ILD中279個高表達基因與TGF-β誘導的肺纖維化模型中1 562個高表達基因進行交互分析,得到41個上調的重疊基因; SSc-ILD中362個低表達基因與TGF-β誘導的肺纖維化模型中的2 416個低表達基因交互結果顯示,有67個下調的重疊基因。對上述重疊基因進行GO分析發現,重疊的上調基因可能參與了早期內體的形成; 重疊的下調基因可能在白細胞介素-17(IL-17)信號通路、非酒精性脂肪肝病等方面具有重要的調節功能。見圖2。

A、B: 分別為SSc-ILD與TGF-β誘導的肺纖維化模型中高表達、低表達基因的重疊基因韋恩圖; C、D: 分別為SSc-ILD與TGF-β誘導的肺纖維化模型中高表達、低表達的重疊基因GO分析結果。圖2 SSc-ILD差異性表達的基因與TGF-β誘導的肺纖維化模型差異性表達的基因中的重疊基因
對篩選出的IPF中820個上調的基因與TGF-β誘導的肺纖維化模型中的1 562個上調基因進行交互,獲得391個高表達的重疊基因; IPF中下調的1 350個基因與TGF-β誘導的肺纖維化模型中的2 416個下調基因進行交互,獲得957個低表達的重疊基因。對上述重疊基因進行GO分析發現,重疊的上調基因主要富集在中性粒細胞激活、中性粒細胞脫顆粒、蛋白翻譯后修飾、蛋白在內質網內的加工與運輸等方面; 重疊的下調基因可能在氧化磷酸化、ATP酶活性等方面發揮關鍵的調節作用。見圖3。

A、B: 分別為IPF與TGF-β誘導的肺纖維化模型差異表達基因中的重疊基因韋恩圖; C、D: 分別為IPF與TGF-β誘導的肺纖維化模型中上調和下調的重疊基因GO分析結果。圖3 IPF差異性表達的基因與TGF-β誘導的肺纖維化模型差異性表達的基因中的重疊基因
分別將SSc-ILD&TGF-β重疊基因與IPF&TGF-β重疊基因進行交互,發現在上調基因中存在12個重疊基因,在下調基因中存在34個重疊基因。見圖4。

A: SSc-ILD、IPF、TGF-β誘導的肺纖維化模型之間共同上調基因的韋恩圖; B: SSc-ILD、IPF、TGF-β誘導的肺纖維化模型之間共同下調基因的韋恩圖。圖4 SSc-ILD、IPF、TGF-β誘導的肺纖維化模型之間的重疊基因韋恩圖
對SSc-ILD、IPF、TGF-β誘導的肺纖維化模型之間的重疊基因進行PPI網絡分析發現,上調12個基因在蛋白水平沒有出現相互作用,下調的34個基因中存在PPI并得到hub基因ELAVL1。見圖5、表1。

圖5 重疊基因PPI分析結果

表1 PPI網絡分析中前21個基因
GO分析結果顯示,ELAVL1基因參與RNA剪接、加工、翻譯等多種轉錄后修飾過程見表2、表3; KEGG分析結果顯示,ELAVL1基因僅在腺苷酸活化蛋白激酶(AMPK)信號通路中存在富集。

表2 GO分析ELAVL1基因

表3 GO分析ELAVL1基因
肺纖維化是多種間質性肺病的終末期,會引起不可逆性肺損傷,其特征是正常肺泡結構被破壞, ECM過度沉積導致患者肺部氣體交換受阻,呼吸功能不全,甚至死亡。SSc-ILD和IPF患者在人口學特征和致病因素上有所不同,但這兩種疾病均可導致肺實質纖維化,最終進展為呼吸衰竭,其中持續存在的異常TGF-β信號在肺纖維化中起著關鍵作用[23]。SSc-ILD中,先天免疫系統和獲得性免疫系統的過度激活可導致血管內皮細胞和肺泡上皮細胞損傷。同時, TGF-β信號的異常激活可誘導內皮細胞和上皮細胞間充質轉化,以及成纖維細胞向肌成纖維細胞的轉化,導致ECM過度積聚,促進SSc-ILD[24]。IPF的形成起源于肺泡上皮的慢性損傷和(或)老化,導致異常的傷口愈合反應以及持續產生促炎和促纖維化因子,這最終導致血管周圍和間質內間充質細胞的活化和分化。TGF-β信號升高是IPF的重要標志,其可促進成纖維細胞向肌成纖維細胞轉化,上調膠原蛋白相關基因的表達,導致ECM產生增多[25]。
家族性肺纖維化的存在和罕見的遺傳性疾病中肺纖維化的發生促使研究人員關注到宿主遺傳背景在影響SSC-ILD和IPF患者病程和病情發展中的重要作用[26]。2019年由10 000名歐洲患者組成的全基因組關聯研究(GWAS)確定了23個與SSc相關的獨立基因座,使得已知的SSc風險基因座總數增加到28個,并且這些SSc風險位點相關的大多數基因產物與炎癥和自身免疫有關[27]。此外,與普通人群相比, SSc患者和家庭聚集性強的患者的一級親屬罹患SSc的風險更高,估計風險約為1.6%, 表明SSc具有基因遺傳傾向[28]。在IPF中,端粒相關基因(TERT、TERC、PARN、RTEL1、DKC1、TINF2)、表面活性物質編碼基因(SFTPC、SFTPA1、SFTPA2)的罕見變異和20個獨立基因座的單核苷酸多態性(SNPs)在散發性IPF疾病風險中增高,占25%~30%, 并且在IPF的發病機制中,與這些位點相關的基因在對端粒完整性、細胞黏附、纖維化和宿主防御途徑方面扮演著重要的角色[29-30]。基于TGF-β在纖維化過程、SSc-ILD和IPF中的作用,以及SSC-ILD和IPF發生的基因遺傳背景,本研究利用GEO數據庫獲取SSc-ILD、TGF-β和IPF相關基因數據,通過生物信息學技術對上述數據分析發現, SSc-ILD、IPF分別與TGF-β誘導的纖維化模型存在相同的基因。SSc-ILD與TGF-β誘導的纖維化模型共同上調的基因參與早期內體的形成,而共同下調的基因在調節IL-17信號通路中發揮重要作用。IPF與TGF-β誘導的纖維化模型共同的上調基因參與了中性粒細胞激活、中性粒細胞脫顆粒、蛋白翻譯后修飾、加工與運輸等的調節; 共同的下調基因可能在氧化磷酸化、ATP酶活性等過程中發揮關鍵作用。TGF-β信號可能通過調控基因的上述功能分別參與SSC-ILD和IPF的發病過程。
本研究將SSc-ILD&TGF-β重疊基因與IPF&TGF-β重疊基因進行交互,發現存在12個重疊高表達基因; 在下調基因中存在34個重疊基因。上述重疊基因的PPI分析發現,在重疊的12個高表達基因中不存在蛋白互作,但在34個低表達基因中存在蛋白互作,并獲得hub基因ELAVL1。ELAVL1基因可以編碼胚胎致死性異常視覺(ELAV)家族中的人抗原R(HuR), 即ELAVL1蛋白,其是一種RNA結合蛋白(RBP)。HuR廣泛表達于多種組織中,通過轉錄后機制參與調控細胞內多種分子的表達[31]。在靜息細胞中, HuR主要定位于細胞核,當受到紫外線輻射、營養耗竭或免疫激活等應激條件的刺激時, HuR結合并將靶mRNA運送到細胞質,起到調節靶mRNA的穩定性和(或)翻譯的作用[32]。研究[33]發現, HuR能夠調節促炎細胞因子(腫瘤壞死因子-α、白細胞介素-6、轉化生長因子-β和干擾素-γ)、促炎介質INOS和趨化因子MCP-1mRNA的表達,這些因素大多參與了肝纖維化的發病過程。TGF-β通過影響HuR對mRNA穩定性和翻譯率的調節在肝纖維化發展中的基因表達調控方面起著重要作用。本研究GO功能分析同樣發現,ELAVL1基因參與調節RNA剪接、加工、翻譯等多種轉錄后修飾; 同時,ELAVL1能夠與雙鏈DNA、mRNA結合,發揮至關重要的分子功能,表明ELAVL1基因可能通過編碼ELAVL1蛋白(HuR)參與SSC-ILD和IPF多種纖維化分子mRNA轉錄后調控。
在IPF中,人肺成纖維細胞經TGF-β處理后, HuR由胞核向胞漿轉位明顯增加。在肺纖維化小鼠模型中,肺組織細胞的胞漿HuR顯著高于對照組。HuR可能通過促進肌成纖維細胞的分化以及增加易感個體ECM的產生參與肺纖維化[34]。本研究TGF-β誘導的纖維化模型、IPF和SSc-ILD中均出現差異性表達的ELAVL1基因,表明TGF-β可能通過誘導IPF與SSc-ILD肺成纖維細胞中的HuR從胞核向胞漿移動,調節纖維化相關因子mRNA的表達,導致ECM產生異常,參與兩種疾病的發展。AMPK是多條代謝途徑的中樞調節因子,作為TGF-β/Smads通路的上游信號分子,對成纖維細胞的增殖、分化和ECM的產生的調節是必不可少的[35]。血管緊張素Ⅱ可誘導心肌纖維化并伴有TGF-β過度表達、Smad2/3高磷酸化和Smad4表達上調。黃芩苷可通過激活AMPK, 抑制TGF-β/Smads通路,從而抑制成纖維細胞增殖和ECM積聚,緩解心肌纖維化[36]。本研究KEGG通路分析發現,ELAVL1基因富集在AMPK信號通路中。一項探究HuR是否參與氣道平滑肌增殖的研究[37]指出, HuR是唯一一個在真核細胞中普遍表達的蛋白; HuR的表達或活性可能受到多種上游刺激的影響,如炎癥介質、生長因子、活性氧蔟(ROS)和缺氧。另外,激活AMPK可有效抑制血小板衍生生長因子(PDGF)誘導的HuR胞漿易位,揭示了ELAVL1蛋白與AMPK信號通路之間的潛在聯系。因此,作者推測在SSc-ILD和IPF中, AMPK信號異常可能導致TGF-β產生增多,過度產生的TGF-β可能通過誘導HuR由胞核向胞漿轉位,進而參與肺纖維化的調節。但確切的調節機制尚不清楚,需要進一步開展大樣本的研究,對本研究中的關鍵結論進行驗證,為闡明SSc-ILD和IPF共同的發病機制提供科學依據。