張 奇 孫 琳 劉美娜
哈爾濱醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室,150081 黑龍江 哈爾濱
過敏性紫癜(Henoch-Sch?nlein purpura, HSP)是一種以小血管炎和IgA免疫復(fù)合物沉積為主要病理特征的全身性疾病,表現(xiàn)為皮膚紫癜、關(guān)節(jié)炎、腹痛和腎受累等[1]。紫癜性腎炎(Henoch-Sch?nlein purpura nephritis, HSPN)是HSP最常見、最嚴(yán)重的并發(fā)癥,高達50%的HSP患兒可在最初發(fā)病的4~6周內(nèi)發(fā)展為HSPN[2]。多數(shù)HSPN患者病情輕微,僅表現(xiàn)為血尿和/或低度蛋白尿,但部分HSPN可導(dǎo)致慢性腎臟疾病和終末期腎功能衰竭,是HSP患者死亡的主要原因[3]。
腎臟損傷的嚴(yán)重程度是決定HSPN遠期預(yù)后的關(guān)鍵因素,因此,正確評估HSPN患兒的腎臟受損程度尤為重要。腎活檢是檢測腎臟損傷程度的金標(biāo)準(zhǔn),但因有創(chuàng)性和潛在的風(fēng)險而在實際應(yīng)用中受限,故探尋安全、無創(chuàng)的腎臟損傷生物標(biāo)志物對HSPN的診斷、治療和預(yù)后具有重要意義。本文收集HSP和HSPN患兒的血樣及臨床信息,檢測RNA-seq數(shù)據(jù),利用權(quán)重基因共表達網(wǎng)絡(luò)分析 (weighted gene co-expression network analysis, WGCNA) 篩選HSPN進展有關(guān)的功能模塊和關(guān)鍵基因,為深入研究HSPN的進展機制和發(fā)掘潛在的生物標(biāo)志物提供線索。
收集某醫(yī)院兒科住院確診的9例HSPN患者和與之年齡、性別相匹配的9例HSP患者為研究對象。HSP的診斷符合歐洲風(fēng)濕病聯(lián)盟和歐洲兒科風(fēng)濕病學(xué)會關(guān)于HSP的診斷標(biāo)準(zhǔn)[4]。在HSP病程的前6個月出現(xiàn)腎病理損害,并伴有血尿和/或蛋白尿者被診斷為HSPN:血尿定義為肉眼血尿,或在高倍鏡視野下血紅細(xì)胞超過5個;蛋白尿定義為1周內(nèi)連續(xù)3次尿蛋白呈陽性,或尿蛋白呈陰性但尿微量白蛋白排泄過多[5-6];腎活檢確定HSPN患者的病理分型,標(biāo)準(zhǔn)參照中華醫(yī)學(xué)會兒科學(xué)分會腎臟學(xué)組指南[7]。排除接受慢性疾病常規(guī)治療的兒童和尿道感染的兒童。所有患者在接受治療前采集血液樣本,患者禁食12 h后用EDTA管收集全血樣本5 mL,4 000×g離心10 min后,取上清液置于-80℃冰箱中保存?zhèn)溆谩?/p>
數(shù)據(jù)包括:研究對象的一般資料和臨床癥狀數(shù)據(jù),如性別、年齡、胃腸道癥狀、關(guān)節(jié)癥狀和腎受累情況;患者的實驗室指標(biāo),如血清IgA, CRP, C3和C4水平;RNA-seq數(shù)據(jù)。
RNA-seq分析的主要步驟包括:①在250 μL血樣中加入750 μL TRIzol LS Reagent,提取totalRNA;②利用NanoDrop ND 1 000 (Thermo Fisher Scientific, USA)檢測totalRNA的純度;③以1~2 μg totalRNA為起始樣本,利用KAPA Stranded RNA-Seq Library Prep Kit (Illumina, San Diego, USA)制備測序文庫,經(jīng)Agilent 2 100 Bioanalyzer檢測合格后,利用qPCR方法對文庫的有效濃度進行準(zhǔn)確定量;④在IlluminaHiSeq 4 000平臺上進行文庫測序,獲得RNA-seq數(shù)據(jù)。使用FPKM (fragments per kilobase per million),即每千個堿基的轉(zhuǎn)錄每百萬映射讀取的片段數(shù)來表示RNA的表達水平。
WGCNA方法根據(jù)基因表達模式的不同,將表達模式相似的基因聚類并定義為模塊。該方法首先利用Pearson相關(guān)系數(shù)構(gòu)建鄰接矩陣;再基于無尺度網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)準(zhǔn)則確定軟閾值β,進行鄰接矩陣的加權(quán)和拓?fù)渚仃嚨霓D(zhuǎn)換;利用拓?fù)渲丿B性指標(biāo)(topological overlap measure , TOM)衡量基因間的相異度并構(gòu)建分層聚類樹;最后通過動態(tài)切割算法識別基因模塊,構(gòu)建共表達網(wǎng)絡(luò)。
利用WGCNA方法獲得網(wǎng)絡(luò)模塊的第一主成分,即模塊特征基因(module eigengene,ME),代表該模塊的基因表達譜;模塊內(nèi)基因與ME的相關(guān)性大小反映的是基因與模塊的關(guān)聯(lián)程度,即模塊隸屬度(module membership, MM)。通過計算ME與表型或性狀的相關(guān)系數(shù),可以衡量模塊與相應(yīng)表型或性狀之間的關(guān)聯(lián);基因顯著性(gene significance, GS)是度量模塊內(nèi)基因與表型或性狀關(guān)聯(lián)程度的指標(biāo),GS的絕對值越大,基因的生物學(xué)意義越顯著[8]。
利用SAS 9.4軟件和R 4.0.2軟件進行統(tǒng)計學(xué)分析;定量資料若服從正態(tài)分布,采用均值±標(biāo)準(zhǔn)差表示,組間比較采用方差分析;若不服從正態(tài)分布,則采用中位數(shù)(四分位數(shù))表示,組間比較采用Kruskal-Wallis秩和檢驗;兩兩比較采用SNK-q檢驗;定性資料和等級資料采用頻數(shù)(百分?jǐn)?shù))表示,組間比較采用χ2檢驗和Kruskal-Wallis秩和檢驗;利用Spearman秩相關(guān)分析HSPN進展與臨床資料的相關(guān)性;檢驗水準(zhǔn)α=0.05。 利用R包“l(fā)imma”進行差異表達分析,差異基因的篩選標(biāo)準(zhǔn)為|log2FC|>1和P<0.05;R包“WGCNA”構(gòu)建共表達網(wǎng)絡(luò),參數(shù)設(shè)置為:軟閾值β=30,每個模塊的最少基因數(shù)=20,模塊合并閾值=0.2;R包“clusterProfiler”進行GO富集分析,顯著性閾值設(shè)置為FDR<0.05。
本文納入18例研究對象,9例HSP患者和9例HSPN患者(type I,type II和type III各3例),年齡范圍5~16歲,男女比例11∶7。HSP、HSPN typeI、HSPN type II和HSPN type III各組一般資料、臨床癥狀和實驗室指標(biāo)的比較結(jié)果見表1。各組之間年齡、性別、關(guān)節(jié)癥狀和胃腸道癥狀之間的差異無統(tǒng)計學(xué)意義(P>0.05);腎受累情況和血清IgA、CRP和C3的差異有統(tǒng)計學(xué)意義(P<0.05),表現(xiàn)為HSPN type II和HSPN type III患者的血尿/蛋白尿水平和血清CRP水平高于HSP和HSPN type I患者、血清IgA水平高于HSPN type I患者,HSPN type III患者的血清C3水平高于HSP患者。

表1 HSP患者和不同病理分級的HSPN患者臨床資料比較
利用Spearman秩相關(guān)分析HSPN進展與臨床資料的相關(guān)性,血尿/蛋白尿水平、血清IgA、CRP和C3水平與HSPN進展呈正相關(guān)關(guān)系(P<0.05)。見表2。
根據(jù)界值|log2FC|>1和P<0.05篩選HSP和HSPN組的差異基因,獲得2 399個差異表達mRNA(differentially expressed genes, DEGs),其中115個上調(diào),2 284個下調(diào)。利用火山圖和熱圖對DEGs的分布和表達模式進行可視化,見圖1。

表2 HSPN進展與臨床資料的相關(guān)性分析

A:火山圖;B:熱圖
WGCNA的參數(shù)設(shè)置β=30,每個模塊的最少基因數(shù)為20,模塊合并閾值為0.2。通過對分層聚類樹的動態(tài)剪接,獲得10個模塊,如圖2所示。模塊ME與臨床資料的相關(guān)性熱圖顯示:與血尿/蛋白尿最相關(guān)的模塊為藍綠色模塊(r=-0.61,P=0.007);與IgA和CRP最相關(guān)的模塊為紫色模塊(IgA:r=0.79,P<0.001;CRP:r=0.79,P<0.001);與C3最相關(guān)的模塊為黃色模塊(r=-0.64,P=0.004)。這3個模塊也同時與HSPN進展相關(guān),相關(guān)系數(shù)分別為-0.53(P=0.02),0.58(P=0.01)和0.47(P=0.05)。見圖3。

圖2 WGCNA模塊聚類圖

圖3 模塊MEs與臨床資料的相關(guān)性熱圖
分別對這幾個模塊中的基因進行GO富集分析,在FDR<0.05的界值下,藍綠色模塊、紫色模塊和黃色模塊的基因分別富集在91條、113條和48條通路中。其中藍綠色模塊前5條顯著富集的通路主要與中性粒細(xì)胞介導(dǎo)的免疫反應(yīng)有關(guān);紫色模塊前5條顯著富集的通路主要與細(xì)胞因子活性和白細(xì)胞遷移有關(guān);黃色模塊前5條顯著富集的通路主要與血小板α顆粒和細(xì)胞粘附有關(guān)。見表3。

表3 模塊基因前5條顯著富集的通路
分別提取這幾個模塊中MM>0.85且|GS|>0.65的基因作為模塊的關(guān)鍵基因,共篩選出45個基因,其中紫色模塊22個,藍綠色模塊13個,黃色模塊10個。見表4。

表4 模塊中的關(guān)鍵基因
利用Kruskal-Wallis秩和檢驗比較上述3個模塊中的關(guān)鍵基因在HSP、HSPN type I、HSPN type II和HSPN type III這4個進展組中的表達情況,基因的表達量用中位數(shù)和四分位數(shù)[M(P25~P75)]表示,其中18個基因的表達在不同組間的差異有統(tǒng)計學(xué)意義(P<0.05)。CALM2-201和MAP1LC3B-201在HSPN type II和type III中低表達;CDKN2D-202在HSPN type I、type II和type III中均低表達,且在type II中的表達低于type I;LDLRAP1-201在HSPN type II中低表達;GPX1-201在HSPN type III中高表達;INHBA-201在HSPN type II和type III中相較于HSP和HSPN type I均呈高表達狀態(tài);PHLDA1-201和VEGFA-205在HSPN type I、type II和type III中均高表達。見表5。因此,可將4個下調(diào)基因(CALM2-201, CDKN2D-202, LDLRAP1-201和MAP1LC3B-201)和4個上調(diào)基因(GPX1-201,INHBA-201, PHLDA1-201和VEGFA-205),共8個基因作為HSPN進展的關(guān)鍵基因。其中,INHBA和VEGFA參與細(xì)胞因子活性(GO:0005125~cytokine activity)和細(xì)胞因子受體結(jié)合通路(GO:0005126~cytokine receptor binding);除此之外,VEGFA還參與白細(xì)胞遷移通路(GO:0050900~leukocyte migration);CDKN2D參與細(xì)胞周期停滯(GO:0007050~cell cycle arrest)和凋亡信號通路的調(diào)控(GO:2001233~regulation of apoptotic signaling pathway);MAP1LC3B參與自噬(GO:0006914~autophagy)和利用自噬機制的過程(GO:0061919~process utilizing autophagic mechanism)。

表5 關(guān)鍵基因在HSP和不同病理分級的HSPN患者中表達情況(FPKM)的比較[M(P25~P75)]
HSPN是HSP出現(xiàn)腎臟損害時的表現(xiàn),為HSP最常見、最嚴(yán)重的并發(fā)癥,預(yù)后主要取決于腎受累的嚴(yán)重程度[9]。因此,探索HSPN進展有關(guān)的功能模塊和關(guān)鍵基因?qū)SPN的診斷、治療和預(yù)后具有重要意義。本文分析了與HSPN進展有關(guān)的臨床指標(biāo),并構(gòu)建了HSPN的差異基因共表達網(wǎng)絡(luò),獲得3個與HSPN進展相關(guān)的功能模塊和8個HSPN進展的關(guān)鍵基因。
通過對HSP和HSPN患者的臨床指標(biāo)進行分析,發(fā)現(xiàn)患者血尿/蛋白尿的水平、血清IgA、CRP和C3水平與HSPN的進展呈正相關(guān)關(guān)系。有研究表明,血清CRP和IgA1的水平高低可有效反映患兒腎臟損傷程度,在HSPN的發(fā)生發(fā)展過程中發(fā)揮重要作用[10-11],與本文的結(jié)論一致。因此,臨床上評估HSPN的疾病進展和腎臟損傷情況時,可將血清IgA、CRP和C3水平作為參考。
利用WGCNA獲得的3個與HSPN進展有關(guān)的功能模塊主要與中性粒細(xì)胞介導(dǎo)的免疫反應(yīng)、細(xì)胞因子活性、白細(xì)胞遷移、血小板α顆粒和細(xì)胞粘附等通路有關(guān)。有學(xué)者在關(guān)于HSPN發(fā)病機制的探討中提到:HSPN患兒的細(xì)胞免疫和體液免疫功能均異常,如B淋巴細(xì)胞多克隆活化和T淋巴細(xì)胞亞群功能紊亂等;免疫復(fù)合物的沉積和補體活化可激起腎小球和間質(zhì)的一系列炎癥反應(yīng),包括單核-巨噬細(xì)胞浸潤和釋放各種細(xì)胞因子等;此外,上述過程也可激活內(nèi)源性和外源性凝血系統(tǒng),引發(fā)凝血反應(yīng)[12-13]。本文從分子通路的角度進一步證實了這些結(jié)論。
通過比較模塊中的關(guān)鍵基因在HSP、HSPN type I、HSPN type II和HSPN type III 4個進展組中的表達情況,獲得了8個HSPN進展的關(guān)鍵基因。其中,GPX1基因多態(tài)性可增加終末期腎臟疾病的發(fā)生風(fēng)險,且能預(yù)測其生存[14];VEGFA在多種腎臟疾病中異常表達,其可變剪接的修飾可作為一種治療慢性腎病的新方法[15];CDKN2D基因編碼的蛋白是細(xì)胞周期蛋白依賴性激酶抑制劑INK4家族成員,該蛋白與CDK4或CDK6形成穩(wěn)定的復(fù)合物,阻止CDK激酶的激活,作為控制細(xì)胞周期G1期進展的細(xì)胞生長調(diào)節(jié)劑,參與細(xì)胞周期的負(fù)調(diào)控[16]。另外,根據(jù)差異表達分析、相關(guān)性分析和功能富集分析結(jié)果可以推斷:CDKN2D和MAP1LC3B基因的下調(diào)導(dǎo)致細(xì)胞周期調(diào)控功能紊亂,并抑制細(xì)胞凋亡和機體的自噬過程,從而引發(fā)一系列炎癥和免疫反應(yīng),導(dǎo)致患者腎臟受損加重,血尿和/或蛋白尿水平升高;INHBA和VEGFA基因的上調(diào)可能通過增強細(xì)胞因子活性和促進白細(xì)胞遷移等方式加重機體的炎癥反應(yīng),進而導(dǎo)致血清IgA和CRP水平升高,促進HSPN的腎臟損傷和疾病進展。
綜上,本文利用WGCNA獲得3個與HSPN進展相關(guān)的功能模塊和8個HSPN進展的關(guān)鍵基因,主要通過調(diào)控炎癥、免疫反應(yīng)、凝血反應(yīng)和細(xì)胞周期等生物學(xué)過程影響疾病相關(guān)的臨床指標(biāo),在HSPN進展中發(fā)揮重要作用。這些結(jié)果為HSPN進展機制的研究奠定了基礎(chǔ),同時也為HSPN潛在治療靶點和生物標(biāo)志物的研究提供了方向。本文僅對這些問題進行了初步探索,關(guān)鍵基因?qū)膊∠嚓P(guān)臨床指標(biāo)的影響,及其在HSPN進展過程中的作用機制需要通過進一步的實驗研究來明確。