于曉濤,楊忠杰,應(yīng)真真,裴瑗,張永威,王瑞,2?
(1.漯河市中心醫(yī)院,河南 漯河 462000;2.河南省中藥制劑與加工中醫(yī)藥重點(diǎn)實(shí)驗(yàn)室,河南 漯河 462000)
特發(fā)性肺纖維化(idiopathic pulmonary fibrosis,IPF)是一種特殊的慢性、進(jìn)展性纖維性肺炎,表現(xiàn)為普通型間質(zhì)性肺炎的組織學(xué)和胸部高分辨CT特征,多發(fā)人群為老年人[1]。IPF 的特征是呼吸困難和肺功能的進(jìn)行性惡化,且預(yù)后較差,肺纖維化診斷后的中位生存期僅為2~3年[2]。特發(fā)性肺纖維化是由肺泡上皮局部微損傷、遺傳和環(huán)境等多種因素相互作用的結(jié)果[3]。這些肺泡上皮微損傷引發(fā)了異常的上皮-成纖維細(xì)胞交流,誘導(dǎo)基質(zhì)產(chǎn)生肌成纖維細(xì)胞,以及大量細(xì)胞外基質(zhì)積累和肺間質(zhì)重塑[4-5]。肺纖維化進(jìn)展中纖維細(xì)胞活化過程和細(xì)胞外基質(zhì)合成過程是復(fù)雜的病理過程,是由多種信號(hào)通路和細(xì)胞因子共同作用的結(jié)果。因此,明確IPF 進(jìn)展中準(zhǔn)確可靠的基因和生物標(biāo)志物,挖掘潛在的治療中藥,對(duì)特發(fā)性肺纖維化的診斷與治療具有重要意義[6]。
近年來(lái)基因芯片技術(shù)與高通量技術(shù)被廣泛應(yīng)用于疾病致病機(jī)制基因的識(shí)別及藥物治療新靶點(diǎn)的篩選[7-8]。本研究利用GEO 數(shù)據(jù)庫(kù)下載特發(fā)性肺纖維化的基因芯片數(shù)據(jù),確定特發(fā)性肺纖維化組織中的差異基因,并構(gòu)建蛋白互作網(wǎng)絡(luò),利用CytoHubba 插件確定關(guān)鍵基因,對(duì)關(guān)鍵基因進(jìn)行GO 功能、KEGG 通路分析以明確關(guān)鍵基因的生物學(xué)過程。最后采用Coremine Medical 數(shù)據(jù)庫(kù)對(duì)關(guān)鍵基因預(yù)測(cè)可能的治療中藥,為特發(fā)性肺纖維化的分子機(jī)制研究及治療性中藥挖掘提供理論依據(jù)。
查找基因表達(dá)數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)中特發(fā)性肺纖維化組織樣品數(shù)據(jù),下載編號(hào)GSE110147 的基因表達(dá)數(shù)據(jù)[9]。GSE110147 數(shù)據(jù)集中包含22 例特發(fā)性肺纖維化患者和11 例正常人肺組織的基因表達(dá)數(shù)據(jù)。
基于R 語(yǔ)言“l(fā)immar”包對(duì)IPF 和正常組織基因數(shù)據(jù)中的探針進(jìn)行數(shù)據(jù)歸一化,對(duì)數(shù)據(jù)進(jìn)行t檢驗(yàn)和貝葉斯檢驗(yàn),當(dāng)一個(gè)基因?qū)?yīng)多個(gè)探針時(shí)取其平均值,以箱式圖和主成分分析圖檢查樣本標(biāo)準(zhǔn)化的情況和分組間聚類情況。
利用R 語(yǔ)言,通過GPL6244 平臺(tái)對(duì)應(yīng)“hugene10 sttranscriptcluster.db”包對(duì)探針進(jìn)行基因名稱注釋,差異表達(dá)基因(differentially expressed genes,DEGs)以log2(fold change)的絕對(duì)值>2 和P<0.01 為篩選條件,以log2(fold change)的正、負(fù)代表基因的上、下調(diào),最后以差異表達(dá)基因的歸一化表達(dá)情況構(gòu)建火山圖和熱圖。
以medium confidence >0.4 為篩選條件,利用STRING 數(shù)據(jù)庫(kù)[10](https://string-db.org/)對(duì)DEG 進(jìn)行蛋白質(zhì)相互作用(protein-protein interaction,PPI)分析,并將得到的PPI 互作網(wǎng)絡(luò)導(dǎo)入Cytoscape 軟件(Version 3.7.2),利用CytoHubba插件對(duì)差異基因篩選獲得關(guān)鍵基因,CytoHubba 插件具有11 種拓?fù)浞治龇椒ǎ∕CC、DMNC、MNC、Degree、Clustering Coefficient、EPC、BottleNeck、EcCentricity、Closeness、Radiality、Betweenness Stress),以Degree對(duì)節(jié)點(diǎn)進(jìn)行排名,前15名為關(guān)鍵基因(Hub gene)。
將所篩選的關(guān)鍵基因利用DAVID 數(shù)據(jù)庫(kù)進(jìn)行功能富集(GO 基因本體論)。采用Reactome 數(shù)據(jù)庫(kù)(https://reactome.org/)[11]對(duì)Hub gene 進(jìn)行KEGG 的通路富集分析及可視化。以P<0.05作為顯著性富集篩選標(biāo)準(zhǔn)。
將Hub gene 輸入Coremine Medical 數(shù)據(jù)庫(kù)(http://www.coremine.com/)中,下載該基因的相關(guān)中藥信息,以P<0.05為條件確定可能的治療性中藥。
所得箱式圖可見各個(gè)樣本中位數(shù)在一個(gè)水平線上,PCA圖顯示兩組分離顯著,說(shuō)明樣本間的歸一化程度好,IPF和正常組樣本表達(dá)相互獨(dú)立。見圖1。
對(duì)GSE110147 的基因數(shù)據(jù)篩選共得到343 個(gè)差異表達(dá)基因(下調(diào)基因219個(gè),上調(diào)基因124個(gè))。火山圖及熱圖分別見圖2和圖3。
差異基因的PPI網(wǎng)絡(luò)中共包含298個(gè)節(jié)點(diǎn),節(jié)點(diǎn)間共649 個(gè)相互作用關(guān)系。將相互作用關(guān)系導(dǎo)入Cytoscape軟件,利用軟件中的CytoHubba插件中提供的11種拓?fù)浞治鏊惴▽?duì)網(wǎng)絡(luò)中基因節(jié)點(diǎn)進(jìn)行評(píng)分并構(gòu)建重要模塊,并依據(jù)Degree度值評(píng)分排序來(lái)確定差異基因的關(guān)鍵基因。結(jié)果共得到兩個(gè)重要模塊,包含15 個(gè)關(guān)鍵基因,分別為CCL2、SKIV2L2、SPP1、HSP90AA1、POLR2B、TPR、RPS13、COL1A1、VCAN、SMC3、COL3A1、COL1A2、MMP1、ESF1 和NCL。見圖4和表1。

表1 差異表達(dá)基因中Degree排名前15名的基因
對(duì)CCL2、SKIV2L2、SPP1、HSP90AA1、POLR2B、TPR、RPS13、COL1A1、VCAN、SMC3、COL3A1、COL1A2、ESF1、MMP1和NCL共15個(gè)關(guān)鍵基因的GO分析顯示,主要富集的生物過程(BP)為細(xì)胞外基質(zhì)的組織、膠原蛋白分解代謝的過程、骨骼系統(tǒng)發(fā)育、膠原原纖維組織以及對(duì)氨基酸刺激的細(xì)胞反應(yīng);細(xì)胞成分(CC)為細(xì)胞外基質(zhì)、膠原蛋白三聚物、細(xì)胞外區(qū)域、細(xì)胞外空間以及I 型膠原三聚體;分子功能(MF)為細(xì)胞外基質(zhì)結(jié)構(gòu)成分、血小板衍生生長(zhǎng)因子結(jié)合、poly(A)RNA結(jié)合、mRNA結(jié)合以及相同的蛋白結(jié)合。見圖5。
Reactome 富集分析(P<0.05)共篩選出14 條通路,包括糖尿病并發(fā)癥中的AGE/RAGE 信號(hào)通路、松弛素信號(hào)通路、蛋白質(zhì)消化吸收、IL-17 信號(hào)通路、阿米巴病、血小板激活、PI3K/Akt 信號(hào)通路、細(xì)胞外基質(zhì)受體相互作用、類風(fēng)濕性關(guān)節(jié)炎、癌癥通路、流體剪切應(yīng)力與動(dòng)脈粥樣硬化、NOD-like 受體信號(hào)通路、黏著斑和人類乳頭瘤病毒感染路。見圖6。
對(duì)篩選出的15 個(gè)關(guān)鍵基因預(yù)測(cè)相關(guān)中藥,其中12 個(gè)關(guān)鍵基因預(yù)測(cè)得到黃芪、三七、桂枝、黃芩、人參、丹參、黨參、桂丁、黃藥和紫蘇等多味中藥。見表2。

表2 關(guān)鍵基因相關(guān)中藥預(yù)測(cè)表
IPF 的發(fā)病機(jī)制非常復(fù)雜,目前尚不完全清楚。纖維化細(xì)胞的增殖、遷移和活化增加,以及炎癥和氧化應(yīng)激都與IPF 的病因有關(guān),細(xì)胞外基質(zhì)成分的過量產(chǎn)生也會(huì)導(dǎo)致肺纖維化。目前,IPF 的發(fā)病率在全球范圍內(nèi)不斷上升,伴隨著高發(fā)病率、高病死率和不斷增長(zhǎng)的經(jīng)濟(jì)衛(wèi)生負(fù)擔(dān),而臨床可用的治療方法卻十分有限。因此,識(shí)別新的生物標(biāo)志物以發(fā)現(xiàn)IPF 的潛在治療靶點(diǎn)極為重要。
本研究提取芯片GSE110147 信息,通過生物信息學(xué)方法分析,篩選出特發(fā)性肺纖維化的患者和健康人的343 個(gè)差異表達(dá)基因,其中包括219 個(gè)下調(diào)基因和124 個(gè)上調(diào)基因;通過PPI分析篩選出了15 個(gè)與IPF 發(fā)病機(jī)制相關(guān)的關(guān)鍵候選基因,分別為CCL2、SKIV2L2、SPP1、HSP90AA1、POLR2B、TPR、RPS13、COL1A1、VCAN、SMC3、COL3A1、COL1A2、MMP1、ESF1 和NCL。CC 趨化因子配體2(CCL2)在人類IPF 患者中增加,并且與預(yù)后不良、疾病進(jìn)展和加重的纖維化結(jié)果相關(guān)[12]。分泌性磷蛋白1(SPP1)是一種磷酸化的酸性糖蛋白,主要包括破骨細(xì)胞、活化的T 細(xì)胞和活化的巨噬細(xì)胞[13],在IPF 患者肺中增加超過20 倍,是區(qū)分IPF 肺中上調(diào)最多的基因之一[14]?;|(zhì)金屬蛋白酶(MMPs)可以通過降解細(xì)胞外基質(zhì)(ECM)蛋白來(lái)限制肺纖維化。除了ECM 蛋白之外,MMPs 還參與了蛋白質(zhì)活性的調(diào)節(jié),包括潛在生長(zhǎng)因子、炎癥介質(zhì)、細(xì)胞表面分子的分裂、抗纖維化生長(zhǎng)因子和受體[15]。1 型膠原蛋白(COL1A1、COL1A2)是骨骼、皮膚和肌腱等許多人體組織中最豐富的膠原蛋白,其過表達(dá)與組織纖維化疾病呈正相關(guān)[16]。
通過對(duì)關(guān)鍵基因的KEGG 富集分析發(fā)現(xiàn),通路主要涉及IL-17 信號(hào)通路、糖尿病并發(fā)癥中的AGERAGE 信號(hào)通路、松弛素信號(hào)通路、蛋白質(zhì)消化吸收、血小板激活、PI3K-Akt 信號(hào)通路以及細(xì)胞外基質(zhì)受體相互作用等,進(jìn)一步表明特發(fā)性肺纖維化與代謝和炎癥反應(yīng)關(guān)系密切。
研究顯示IL-17B 可直接作用于肺部上皮細(xì)胞,誘導(dǎo)下游基因表達(dá),促進(jìn)中性粒細(xì)胞的招募以及Th17細(xì)胞的分化,進(jìn)而造成肺部嚴(yán)重的炎癥損傷及纖維化發(fā)生,抗生素可能對(duì)治療肺纖維化(如IPF)有效果,并且IL-17B 可以作為潛在抗纖維化靶點(diǎn)[17]。AGE/RAGE 信號(hào)通路激活可刺激多種促纖維化生長(zhǎng)因子的分泌,促進(jìn)膠原沉積增加,導(dǎo)致組織纖維化,以及RAGE 表達(dá)增加[18]。研究顯示纖維化肺呈現(xiàn)AGEs/RAGEs 失衡,這可能與加速衰老過程中的氧化損傷有關(guān)[19]。PI3K/Akt信號(hào)通路主要參與細(xì)胞的生長(zhǎng)、分化、凋亡及血管生成,能使受體酪氨酸激酶(RTK)活化,使細(xì)胞質(zhì)上的PI3K 轉(zhuǎn)移至細(xì)胞膜,調(diào)控下游缺氧誘導(dǎo)因子-1α(HIF-1α)及活性氧類(ROS)系統(tǒng)等參與肺纖維化過程[20-21]。所篩選的15 個(gè)關(guān)鍵基因及其相關(guān)信號(hào)通路可作為特發(fā)性肺纖維化預(yù)防及治療的未來(lái)研究靶點(diǎn)。
目前沒有治療效果確切的藥物用于特發(fā)性肺纖維化,臨床以糖皮質(zhì)激素和免疫抑制劑為主要治療藥物,雖然對(duì)特發(fā)性肺纖維化療效較好,但也常引起較嚴(yán)重的不良反應(yīng)[22]。本文以關(guān)鍵基因篩選治療IPF 的潛在中藥,得到黃芪、三七、丹參、黨參、桂丁、桂枝、黃芩、黃藥、人參和紫蘇等多味中藥。研究發(fā)現(xiàn)三七總皂苷可使肺纖維化小鼠肺組織中PI3K、AKT、mTOR 蛋白磷酸化水平降低,減少細(xì)胞外基質(zhì)以及膠原纖維沉積,以緩解肺纖維化進(jìn)程[23]。黃芪苷可降低波形纖維蛋白和人Ⅰ型膠原蛋白的表達(dá),并且阻斷H2O2對(duì)自噬相關(guān)蛋白如Beclin-1 和LC3A/B 的誘導(dǎo)表達(dá),從而抑制氣道中自噬的形成以緩解ROS 介導(dǎo)的支氣管纖維化[24]。丹芍化纖膠囊由丹參、赤芍、黃芪、銀杏葉等組成,可減輕肺組織的膠原沉積,并調(diào)控TGF-β1/Smads 信號(hào)轉(zhuǎn)導(dǎo)通路以發(fā)揮抗肺纖維化的作用[25-26]。
通過對(duì)GEO 數(shù)據(jù)庫(kù)中特發(fā)性肺纖維化基因數(shù)據(jù)的差異表達(dá)分析,共得到CCL2、SKIV2L2、SPP1、HSP90AA1 和POLR2B 等15 個(gè)特發(fā)性肺纖維化疾病相關(guān)的關(guān)鍵基因,通過對(duì)關(guān)鍵基因富集分析發(fā)現(xiàn)特發(fā)性肺纖維化與代謝和炎癥反應(yīng)關(guān)系密切,預(yù)測(cè)發(fā)現(xiàn)黃芪、三七、丹參、黨參、桂丁、黃芩等多味中藥可作用于相關(guān)的關(guān)鍵基因,可作為特發(fā)性肺纖維化疾病潛在的治療中藥。特發(fā)性肺纖維化所篩選的關(guān)鍵基因及預(yù)測(cè)的相關(guān)中藥可為后續(xù)特發(fā)性肝纖維化機(jī)制研究及藥物治療提供參考,本研究也需要進(jìn)一步實(shí)驗(yàn)來(lái)驗(yàn)證關(guān)鍵基因及相關(guān)中藥的治療作用。