張青 王翔 鞠強 陳穎
(青島大學附屬醫院,山東 青島 266003 1 內分泌與代謝病科; 2 輸血科)
糖尿病腎病(DN)在世界范圍內的患病率逐漸增高[1-3],是終末期腎病(ESRD)的主要原因,約占中國所有ESRD患者的16.4%[4-5]。臨床上,DN患者的特點是蛋白尿和血清肌酐(SCR)水平增高,腎小球濾過率(GFR)降低[6]。病理上,DN的特征可分為腎小球病變和腎小管間質改變[7],其中腎小球病變包括腎小球膜延伸、細胞外基質改變、腎小管間質纖維化及腎小球硬化[8]。腎小球病變與DN的進展密切相關。然而對DN腎小球病變組織的基因表達譜的研究相對較少,臨床上缺乏早期診斷以及防治DN進展的有效方法。因此,明確參與DN進程的關鍵基因對疾病的早期診斷和治療尤為重要。
近年來,生物信息學方法已被廣泛用于芯片數據的分析,以鑒定差異表達基因(DEG)并進行各種分析。但是,單個芯片數據分析的樣本量小并且假陽性率高,難以獲得可靠的結果。GEO數據庫是一個公共基因組學數據庫,存儲了大量高通量基因表
達數據和相關信息[9]。本研究從GEO數據庫下載信使RNA(mRNA)芯片數據集,篩選DN患者的腎小球組織與正常人腎小球組織的DEG。將DEG進行富集分析和蛋白質-蛋白質相互作用(PPI)網絡分析,識別出與DN緊密相關的候選基因,再將這些候選基因的表達水平與患者的臨床指標進行相關性分析,獲得DN前瞻性診斷生物標志物和臨床治療靶點的關鍵基因。
于GEO數據庫的2個數據集(GSE30528和GSE96804)中下載所有與DN腎小球組織與正常人腎小球組織相關的所有基因,通過R軟件包進行log2轉換后,通過Limma軟件包篩選DN腎小球組織與正常人腎小球組織DEG,使用RRA軟件包對DEG進行交叉整合,以P<0.05且|log2FC|≥1作為篩選條件。
通過DAVID在線工具對篩選出的DEG進行GO功能和KEGG通路富集分析。GO功能富集分析包含生物過程(BP)、細胞成分(CC)和分子功能(MF)3個方面;KEGG通路富集分析的篩選條件為基因計數>2和P<0.05。
通過預測蛋白質之間相互作用的在線數據庫STRING 10.5進行DEG的PPI分析,并采用Cytoscape軟件構建可視化PPI網絡[10],通過Cytoscape軟件的插件MCODE識別PPI網絡中的候選基因。
通過Nephroseq v5在線平臺(http://v5.nephroseq.org/)對DN患者的候選基因的表達水平與GFR、SCR、血壓和體質量指數(BMI)等臨床指標進行Pearson相關分析。以P<0.05為差異有統計學意義,將與DN患者臨床指標具有顯著相關性的所有候選基因定義為關鍵基因。
通過Limma軟件包從GEO數據庫GSE30528數據集中篩選出661個DN腎小球組織與正常人腎小球組織DEG,其中上調基因244個,下調基因417個;從GSE96804數據集中篩選出DEG 610個,其中上調基因330個,下調基因280個。經RRA軟件包對兩組結果進行交叉整合以后,共獲得52個DEG,其中上調基因24個,下調基因28個。
GO功能富集分析結果顯示,DEG在BP方面主要富集于細胞外結構組織、炎癥反應的調節、蛋白激酶B信號傳導等過程,CC方面主要富集于細胞外基質、膠原蛋白三聚物和基底膜成分,MF方面主要富集于細胞外基質結構組成成分、具有張力的細胞外基質結構和黏多糖結合作用等功能(圖1)。圖中圓點的大小代表DEG的數量,圓點越大DEG數量越多,圓點的顏色代表調整后的不同P值,從紅色到藍色表示P值從小到大。KEGG通路富集分析顯示,DN腎小球組織與正常人腎小球組織DEG主要富集于補體及凝血級聯反應、蛋白質的消化吸收和局部黏著斑3個通路。

圖1 DEG的GO功能富集分析結果
通過Cytoscape軟件構建了52個DN腎小球組織與正常人腎小球組織DEG的可視化PPI網絡(圖2)。圖中綠色圓點代表下調的DEG,紅色圓點則代表上調的DEG,連線代表蛋白質之間的相互作用。通過MCODE插件總共識別篩選出了14個候選基因,分別為C3、CCL19、COL1A2、COL6A3、COL15A1、LOX、LUM、SERPINF1、TGFBI、THBS2、VCAN、CCL21、CXCR2、SST。

圖2 DN腎小球組織與正常人腎小球組織DEG的PPI網絡
通過Nephroseq v5在線工具對14個候選基因與DN患者臨床指標之間進行Pearson相關性分析顯示,DN腎小球組織當中C3、CCL19、COL1A2、COL6A3、COL15A1、LUM、SERPINF1、TGFBI、THBS2、VCANmRNA表達水平與DN患者的GFR呈負相關,基因LOXmRNA表達水平與DN患者的GFR呈正相關,CCL21、CXCR2、SSTmRNA的表達水平與DN患者的GFR無相關性;DN腎小球組織中CCL19、VCANmRNA表達水平與DN患者的SCR呈正相關,LOXmRNA的表達水平與DN患者的SCR呈負相關;DN腎小球組織中COL15A1 mRNA的表達水平與DN患者的血壓呈正相關;DN腎小球組織中SERPINF1 mRNA的表達水平與DN患者的BMI呈正相關。因此,與DN患者臨床指標顯著相關11個關鍵基因分別為C3、CCL19、COL1A2、COL6A3、COL15A1、LOX、LUM、SERPINF1、TGFBI、THBS2、VCAN。
DN是慢性腎臟病和ESRD的主要病因[11-13]。隨著DN患者數量的增加,DN引起的ESRD的發病率逐年上升[14]。目前,控制血糖、血壓仍然是管理DN的主要方法。由于缺乏早期診斷和有效治療的方法,DN患者預后較差。因此,闡明DN進展的確切分子機制,制定有效的診療方案變得更為緊迫。DN患者早期腎臟改變主要為腎小球特征性增生肥大和腎小球基底膜增厚[15-16],腎小球病變在DN發展中起著關鍵作用[17],然而糖尿病腎小球病變的具體機制并不明確。本研究通過高通量芯片技術和生物信息學分析方法,篩選出DN的關鍵基因,為DN早期診斷和治療提供思路。
本研究通過生物信息學分析方法對2個數據集進行分析,篩選出DN腎小球組織與正常人腎小球組織DEG 52個。通過GO功能和KEGG通路富集分析挖掘DEG之間的相互作用。DEG的GO功能富集分析結果顯示,DEG主要功能富集于細胞外基質的組織、細胞外空間和細胞外基質的結構成分,與KANWAR等[18]的研究結果一致。DN的主要病理特征是彌漫性細胞外基質累積,在DN的進展過程中,腎小球由于腎小球系膜基質的增加而變大,致DN纖維化,這也是目前公認的ESRD的致病機理之一[19-20]。DEG的KEGG通路富集分析結果主要體現在補體及凝血級聯反應、蛋白質的消化吸收和局部黏著斑3個通路,這表明免疫和炎性反應在DN發生發展中發揮重要作用。炎癥已經被認為是DN的關鍵發病機制,越來越多的證據表明活化的補體系統以及促凝血事件可能會導致DN的腎小球損傷[21]。
本研究通過對14個候選基因與DN患者臨床指標之間進行相關性分析,結果顯示11個關鍵基因(C3、CCL19、COL1A2、COL6A3、COL15A1、LOX、LUM、SERPINF1、TGFBI、THBS2、VCAN)與DN患者臨床指標具有顯著相關性。研究發現,部分腎功能受損的糖尿病患者腎組織中C3的轉錄組和蛋白質水平均顯著增加[22],病理學檢查發現腎組織中C3陽性表達與腎組織的損傷程度密切相關[23],阻斷C3信號傳導可有效改善DN模型小鼠的預后[24]。COL1A2是形成Ⅰ型膠原蛋白的主要成分,腎組織中COL1A2基因表達上調提示腎纖維化程度更高[25]。TGFBI在正常腎組織中高表達,敲除TGFBI后小鼠更容易發生鏈脲佐菌素誘導的糖尿病[26],因此,通過對尿液中TGFBI蛋白水平以及白蛋白排泄率的檢測可以預測DN的嚴重程度[27]。THBS2又稱血小板反應蛋白,是存在于細胞外的一種糖蛋白,在體內參與了細胞以及細胞間基質的信號傳導[28],在DN患者的血清中顯著性升高[29],可能是通過凝血酶級聯反應以及黏著斑通路促進DN的進展。
本研究結果當中篩選出的CCL19、COL15A1、COL6A3、LOX、LUM、SERPINF1、VCAN關鍵基因與DN的相關性目前尚未見報道。目前研究發現CCL19與炎癥和免疫反應密切相關[30];COL15A1基因編碼細胞骨架蛋白Restin,該蛋白可穩定微血管和細胞并抑制血管生成[31];COL6A3主要參與信號轉導,是多聚受體復合物的組成部分[32];LOX是分泌型的胺氧化酶,其主要功能是在細胞外基質中催化膠原蛋白形成和參與彈性蛋白的共價交聯[33];LUM可調節纖維蛋白原的形成[34];SERPINF1是一種蛋白酶抑制劑,屬于Serpin家族;SERPINF1基因通過調節胰島素抵抗以及瘦素水平參與了脂代謝[35],同時還編碼色素上皮衍生因子(PEDF),PEDF作為一種分泌蛋白,積聚于細胞外基質中,與Ⅰ型膠原蛋白結合[36],通過調節細胞外基質與膠原蛋白的交聯參與DN進展;VCAN基因編碼細胞外基質中的硫酸軟骨素蛋白聚糖,主要作用是維持細胞外基質的功能,通過與Ⅰ型膠原蛋白相互作用在細胞黏附中發揮重要作用[37]。
綜上所述,本研究通過生物信息學技術分析篩選出與DN密切相關的14個候選基因,并預測了這些候選基因可能參與的生物學途徑及具有的功能,通過與DN患者臨床指標的相關性分析進一步明確了與DN密切相關的11個關鍵基因。對于揭示DN的潛在發病機制具有重要意義,并為DN的治療提供了潛在靶點。本研究也存在一些局限性,如主要是基于mRNA轉錄本的分析,可能與蛋白質水平的轉錄本分析結果有差異;而且僅僅是基于生物信息學分析的理論研究,還應通過分子生物學實驗來進一步驗證所篩選的基因在DN中具體機制和作用。