覃文濤,胡 陽,蔣銘楊,薄占東
(廣西醫科大學第一附屬醫院,南寧 530021)
激素性股骨頭壞死(steroid-induced avascular necrosis of the femoral head,SANFH)因其發病率和致殘率高,已成為骨科常見且難治的疾病之一。近年來糖皮質等類固醇激素應用逐漸廣泛,進一步的增加了SANFH 的發病率[1]。然而,SANFH 的發病機制一直以來都未有定論,多種治療方法的療效欠佳,因此,探索SANFH 的發病分子機制,已經迫在眉睫。加權基因共表達網絡(weighted gene co-expression network analysis,WGCNA)是一種通過分析基因之間的相關性,將表達模式相似的基因分裝在一個基因模塊中,鑒定基因模塊與表型的關系的一種網絡分析方法[2-3]。可以根據模塊與表型之間的相關性程度來鑒定生物標記物或者關鍵靶點。
本研究通過使用WGCNA 方法來鑒定早期SANFH 發生的潛在生物學標記物,從而提高早期SANFH的診斷治療,降低致殘率。
1.1 數據下載 從GEO(Gene Expression Omnibus,https//www.ncbi.nlm.nih.gov/gds)數據庫中下載SANFH的芯片表達數據及臨床信息(GSE123568),平臺注釋文件是Affymetrix 人基因表達陣列(GPL15207),GSE123568 數據集中包括10 例正常組和30例SANFH組表達數據。
1.2 篩選差異基因(DEGs)用R軟件(版本3.6.3)對芯片數據集進行數據標準化處理和探針注釋,用“limma”包進行樣本差異分析[4-5],將差異倍數(FC)取以2 為底的對數,并以|Log2FC|>1,P<0.05 作為DEGs的篩選條件。
1.3 WGCNA 共表達模塊分析 使用R 的“WGCNA”包構建SANFH相關的加權共表達網絡[6],去掉表達量小于0.5 的樣本,然后計算無尺度分布拓撲矩陣,利用“pickSoftThreshold”函數挑選出最佳軟閾值β,并計算每個基因的皮爾森相關系數,以加權相關系數構建鄰接矩陣,再將鄰接矩陣轉換為拓撲重疊矩陣,以此構建聚類樹,將模塊內基因數目大于50 的進行保留,相似度大于0.25 的模塊進行合并,根據SANFH組和正常組的表達差異,選擇最優模塊。
1.4 功能富集分析 在WGCNA 最優模塊中選擇核心基因(R>0.8,P<0.01),通過與DEGs的交集得到交集基因,利用R 的“clusterProfiler”包對交集基因進行基因本體論(GO)和京都基因和基因組百科全書(KEGG)功能富集[7],取富集結果中P<0.05 和adjustP<0.05的前10個項目進行展示。
1.5 蛋白質互作網絡(PPI)圖構建及關鍵(Hub)基因選擇 在線String 數據庫(https://string-db.org/cgi/input.pl)可以預測蛋白質之間的相互作用關系[8],上傳交集基因到String 數據庫中,相互作用的最低閾值選擇0.40,其他設置默認,導出結果文件。將得到的結果文件導入Cytoscape3.7.2中,按照高表達基因標記為紅色,低表達設為藍色,顏色深度表示差異大小來繪制PPI圖,并使用cytoHubba對網絡進行計算分析[9],尋找Hub基因。在網絡中,分別計算出評價每個節點重要性的3 個指標:節點度(degree)、緊密度(closeness)和中心度(betweenness),篩選出排名前10的節點,它們共同的節點就是Hub基因。
1.6 Hub 基因功能及診斷性能分析R 的“cluster-Profiler”包完成對Hub基因的功能富集,挑選出P<0.05 的富集結果,用“plotROC“包對Hub 基因進行診斷性分析[10],繪制受試者工作特征曲線(ROC 曲線)。為探索Hub基因之間的相互聯系,利用Gene-MANIA(http://genemania.org/)數據庫線上分析[11-12],構建出Hub基因之間的互作網絡圖。
1.7 統計學方法 本研究所有數據采用R 軟件分析,差異分析采用貝葉斯算法,相關性分析采用皮爾森相關性分析,兩組間的數據分析采用雙尾t檢驗,適當的時候用Welcht檢驗,以P<0.05為差異具有統計學意義。
2.1 差異基因 根據GEO 數據庫獲得的40 例樣本,經過差異分析,得到滿足條件的384個DEGs,包括119 個上調基因,265 個下調基因,并以火山圖和熱圖對DEGs進行展示,見圖1?;鹕綀D中綠色表示下調,紅色表示上調,熱圖顯示DEGs 的表達在SANFH組和正常組中有明顯差異。
2.2 WGCNA 和最優模塊選擇 用R 軟件計算分析,確定了軟閾值β=14,經過動態切割法得到分層聚類樹,見圖2A,共得到4個模塊,模塊特征的皮爾森相關性分析矩陣可以看出,turquoise模塊與SANFH 的相關性最高(R=0.72,P<0.001),見圖2B,以R>0.8,P<0.01 選取該模塊的基因(n=375),并與DEGs取交集得到交集基因(n=225)。
2.3 交集基因GO 和KEGG 富集 利用R 的“clusterProfiler”包對225 個交集基因進行GO 和KEGG功能富集分析,見圖3,GO富集結果顯示,交集基因主要富集在紅細胞發育、紅細胞分化、骨髓細胞穩態、骨髓細胞發育和骨髓細胞分化等生物學功能(BP)上,細胞成份(CC)上主要在細胞器外膜、線粒體外膜和皮質細胞骨架有富集,此外還參與了分子功能(MF)的富集,包括泛素樣蛋白轉移酶活性、結合酶活性和細胞骨架的結構成分等。KEGG富集分析與線粒體、泛素介導的蛋白水解和導管酸分泌物等通路有關。
2.4 Hub 基因的PPI 構建 將225 個交集基因導入String 數據庫,得到所有蛋白互作網絡圖,使用Cytoscape3.7.2 軟件的cytoHubba 計算出degree、closeness 和betweenness 3 種節點打分排名前10 的關鍵基因,并找出所包含的共同的基因,這些基因就是Hub 基因,最終找到4 個Hub 基因,即GATA1、SLC4A1、EPB42 和DMTN,并構建了其關鍵基因的PPI圖,見圖4。

圖1 差異基因的火山圖和熱圖

圖2 WGCNA結果

圖3 交集基因的GO和KEGG功能富集分析

圖4 蛋白網絡互作圖
2.5 Hub 基因的分析 每個Hub 基因在SANFH 中都有明顯的差異表達,且表達都低于正常組,功能富集結果顯示,Hub基因主要在凝血、紅細胞和骨髓細胞發育、穩態及分化等分子生物學途徑上有富集,見表1,這與DEGs 的富集結果有一致性。Hub基因的診斷性ROC 曲線顯示,4 個基因在SANFH中具有很好的診斷價值,見圖5A。基因之間的網絡互作圖也顯示Hub基因之間聯系緊密,見圖5B。

表1 Hub基因的GO富集情況

圖5 Hub基因的診斷價值及其基因互作網絡分析
SANFH是一種發病機制復雜,致殘率極高的疾病,對中青年患者影響極大。截止目前,由類固醇激素引起的股骨頭壞死依然是非創傷性股骨頭壞死最常見的病因[13]。近年來,類固醇激素的大量應用導致SANFH 的患者逐年增加,為臨床治療工作帶來極大的負擔[14]。由于其發病機制尚不明確,目前很難找到針對患者早期的預防及治療措施[15]。隨著分子生物的發展,已有一批學者將目光投向基因層面的研究,在SANFH 的發病進程中基因的改變扮演著重要的角色[16-17],因此找到SANFH相關的致病基因,探明其具體的發生機制對臨床SANFH 的早期診斷具有很重要的意義。
本研究通過對GEO 數據庫中的GSE123568 芯片數據進行差異分析,找到正常組與SANFH 組間差異表達的基因,其中滿足條件的差異基因共384個,其中上調的有119 個,下調的有265 個,下調基因明顯多于上調基因,提示SANFH 發生時大部分基因的表達下調。通過WGCNA 挖掘出與SANFH相關性高的基因,將得到的結果與之前的差異基因取交集,得到同時具有差異性和相關性的交集基因。對相關度更高的交集基因進行GO和KEGG功能富集,發現這些基因主要富集在紅細胞和骨髓細胞的發育、分化及穩態上。而有研究報道,骨髓基質細胞的凋亡是SANFH發生的主要特點之一[18],激素可以促進骨髓基質細胞向脂肪細胞細胞轉化,抑制其向成骨細胞的方向的分化,從而導致骨壞死,進而發展為股骨頭壞死[19]。同時有研究發現,促紅細胞生成素可以通過刺激網織紅細胞的增值和分化,促進血管生成來預防類固醇激素引起的股骨頭壞死發生[20]。這些研究與交集基因富集的結果有較好的一致性,提示在交集基因中存在對股骨頭壞死發生和發展起到關鍵作用的基因。
通過Cytoscape3.7.2軟件的相關節點算法分析,最后從交集基因中找到了4 個Hub 基因:GATA1、SLC4A1、EPB42 和DMTN,這可能是SANFH 發生的關鍵基因。4 個Hub 基因在正常組和SANFH 組中的表達差異明顯,在SNAFH 組中均出現低表達。從富集的結果可以看出,Hub 基因的富集結果與384 個差異基因的富集結果具有一致性,進一步證實了這4 個基因的關鍵作用。GATA1 是類紅細胞發育的轉錄激活或者抑制因子,有研究顯示,GATA1 在低氧環境中可以誘導紅系造血[21],而在早期SANFH 中,缺血缺氧是骨壞死中的重要表現[22],使用一定量的糖皮質激素后可以阻礙股骨頭內的血液供應[23],從而形成缺血缺氧的環境。本研究中,GATA1 在SANFH 中表達降低,可能造成股骨頭缺氧加重。SLC4A1、EPB42 和DMTN 3 者具有類似的功能,均在維持紅細胞正常的形態和功能上具有重要的作用[24-26],他們在SANFH中表達含量也明顯下降,可能導致股骨頭內正常紅細胞含量降低,造成股骨頭內缺血缺氧。因此,從4 個Hub 基因的相關性研究中,表明低表達的Hub 基因是SANFH 發展中的危險因素,在SANFH 的早期發病中具有重要的研究價值。對經常需要服用激素的患者,及時檢測血液中4 個Hub 基因的表達,將會一定程度上提高早期SANFH 的診斷率和治療效果,從而降低致殘率。
綜上所述,本研究采用生物信息學分析的方法,發現4個Hub基因在SANFH中的表達具有顯著差異,低表達的Hub基因可能通過參與缺氧信號通路來促進SANFH 的發展,為臨床SANFH 的早期診斷和治療提供了可靠的分子標記,同時也為今后探明SANFH的發病機制提供了一個參考方向。