楊洋 薛建華 虞俊波 顧琪琪 張亞峰 劉佳佳*
1. 南通大學附屬醫院創傷中心,江蘇 南通 226001
2. 南通大學附屬醫院骨科,江蘇 南通 226001
原發性骨質疏松癥(osteoporosis,OP)是一種以骨量減少、骨的微結構退化,骨骼脆性增加和骨折發生風險增加為特征的全身性骨代謝疾病[1]。OP常無明顯的臨床癥狀,一般在骨折發生后才被發現,主要累及脊柱、髖部、腕部和肱骨近端等部位,故OP又被稱為“無聲的浩劫”。因此,及時地預測OP對防治骨質疏松骨折尤為重要[2]。
骨代謝的平衡由成骨細胞的骨形成作用和破骨細胞的骨吸收作用共同維持,兩者之間的動態平衡共同維持骨骼微環境的穩態[3]。既往研究表明,過度激活的破骨細胞以及功能降低的成骨細胞是OP的重要病因。針對Wnt、NF-κB、MAPK等通路設計開發藥物,重塑骨代謝平衡,在OP的治療中具有重要意義[4-5]。然而,現有抗OP藥物如雙膦酸鹽、特立帕肽等,仍具有非典型性骨折、下頜骨壞死、費用昂貴等特點[6]。探究OP發病機制,尋找新的藥物靶點,在OP的臨床治療中具有重要意義[7-8]。
因此,為進一步探索OP的分子機制,本研究擬通過分析基因表達數據庫(gene expression omnibus,GEO)提供的OP相關基因芯片數據,篩選差異表達基因,并對這些基因進行核心基因和信號通路的生物信息學分析,為進一步在分子水平研究OP的發病機制提供理論依據。
研究號 GSE35958 基因表達譜芯片數據來源于美國國立生物技術信息中心的公共基因表達數據庫(gene expression omnibus ,GEO)(https://www.ncbi.nlm.nih.gov/geo/)。該數據集由Benisch 等[9]于2012 年發表,由HGU133 Plus 2.0 ( Affymetrix公司,美國)注釋,芯片平臺為 GPL570。該數據集包含2組來自不同人群的人股骨頭骨髓間充質干細胞(HMSC),共計9例樣本。其中4例樣本的供體為行全髖關節置換術的非OP老年患者,另5例樣本的供體為股骨頸低能量骨折伴有OP的老年患者。
利用R軟件對芯片原始數據進行注釋和過濾,使用Bioconductor (http://www.bioconductor.org)提供的RMA算法對各原始芯片數據進行背景校正及歸一化等預處理,得到標準化的數據。選取校正后的P<0.05且∣logFC∣≥2為閾值,獲得該數據集的差異表達基因(differentially expressed genes,DEGs)。
本研究采用Metascape(http://metascape.org/gp/)在線分析工具進行差異基因富集分析。Metascape整合多個數據庫資源(GO、KEGG、UniProt和DrugBank等),本研究使用的是基因本體( gene ontology,GO)及京都基因和基因組百科全書( kyoto encyclopedia of genes and genomes,KEGG) 兩個數據庫,分別對差異基因進行GO功能富集以分析其參與的生物學進程和KEGG 信號通路富集分析。
通過STRING(search tool for the retrieval of interacting genes /proteins) 11.0在線工具對差異基因進行蛋白質-蛋白質相互作用( protein-protein interaction,PPI) 網絡分析。將STRING的計算結果導入Cytoscape 3.6.1軟件,利用插件MCODE和Cytohubba分別尋找蛋白相互作用網絡中與OP相關的核心基因和核心模塊。
本研究選用基因表達譜芯片GSE35958,通過R軟件采用RMA算法對數據進行預處理后,根據篩選標準篩選出569個差異基因,其中上調7個,下調562個。通過ImageGP(http://www.ehbio.com/ImageGP/)在線工具繪制OP樣本與非OP樣本差異表達基因熱圖。熱圖的顏色反映基因表達量的水平,白色代表升高,藍色代表降低,顏色的亮度代表基因升高及降低的程度,見圖 1。
將篩選出的差異基因導入Metascape后,分別勾選GO中的生物學過程(biological processes)、細胞定位(cellular components)、分子功能(molecular functions)和KEGG中的信號通路(pathway)提交分析。可以看出,差異基因功能主要富集在mRNA前體內含子結合、核體、組蛋白修飾、mRNA 3’端加工和調控結合等(圖2),通路主要富集在葉酸生物合成、粘合連接和致病性大腸桿菌感染等(圖3)。然而,這3條信號通路中并不包含本研究篩選出的核心基因。基于此,本研究繼續對10個核心基因再次進行KEEG通路富集分析,得到一條核心基因顯著富集的信號通路,即泛素介導蛋白水解信號通路(hsa04120)(圖4)。
利用STRING在線工具對569個差異表達基因進行 PPI構建,設定最低相互作用分數為 0.8,得到了由 517個節點、363條連線構成的相互作用關系圖(圖5)。將STRING 的計算結果導入Cytoscape 3.6.1軟件后,采用MCC算法得到前10個核心基因,按值的大小由高到低分別是TCEB1、CUL2、KBTBD6、KBTBD7、ASB8、KLHL42、ASB5、FBXO11、ANAPC10、CDC23,且這10個基因全部為下調的差異表達基因。此外,用MCODE插件對該蛋白相互作用網絡進行分析,得到了由上述10個核心基因構成的核心模塊(圖6)。
骨質疏松癥是一種年齡相關的慢性骨骼代謝疾病,主要以骨量減少、骨微結構改變和骨脆性增加為特點。目前,OP的發病機制尚未完全闡明,但目前已知OP的發生具有一定的遺傳因素,與特定基因的表達有關[10-11]。
本研究分析了2組來自不同人群的人股骨頭骨髓間充質干細胞(HMSC),共計9例樣本,通過GEO數據庫中的基因表達譜芯片GSE35958獲得差異基因,并分析差異基因GO功能富集和KEGG通路富集,發現泛素介導蛋白水解信號通路顯著激活,為OP發病機制的研究提供了理論依據和研究方向。在本研究中,KEGG 最終篩選出的富集通路為泛素介導蛋白水解信號通路,該通路包含CUL2、CDC23、ANAPC10 3個核心基因。而在骨代謝過程中,破骨細胞首先粘附在骨組織,然后通過酸化和蛋白水解完成骨吸收[12],提示該通路可能與OP有關聯。另外,就分析得到的核心基因而言,現有研究主要集中在腫瘤領域,而本研究為這些基因參與OP的發生提供了一定依據,有助于拓展核心基因的功能。
CUL2編碼的蛋白質為Cullin蛋白家族成員,包括Elongin B和C,Rbx1和各種底物識別受體的支架蛋白,形成E3泛素連接酶[13-14]。有學者發現,E3泛素連接酶可以與HIFβ結合,促進HIFα的泛素化和蛋白酶降解[15-16],而HIFα又可與HIF1β結合形成HIF轉錄因子,調節基因表達[17]。HIF下游靶基因中包括血管內皮生長因子A(VEGFA),可促進細胞生長和微血管的增殖[15]。以上結果提示CUL2編碼的蛋白質可能會通過調控HIF表達以影響骨血管再生和成骨細胞活性,從而影響OP的發生發展。
TCEB1編碼的蛋白質Elongin C為轉錄因子B(SIII)復合物的一個亞基,SIII復合物由Elongin A / A2、B和C組成。其中,Elongin B和C是調節亞基,其支架蛋白為CUL2編碼的蛋白質。因此,TCEB1可能與上述的HIF調控下游靶基因VEGFA有關,具體結果有待進一步探討。
CDC23編碼的蛋白質與釀酒酵母Cdc23有很強的相似性,后者為細胞周期G2/M轉換所必需的蛋白質。該蛋白是后期促進因子(APC)的組成部分,APC由8個蛋白亞基組成,在真核細胞中高度保守,可催化細胞周期蛋白的形成。有研究發現,CDC23在甲狀腺癌組織中過度表達,而在正常和增生的甲狀腺組織中缺失,并且CDC23為細胞周期和細胞生長的關鍵調節因子[18]。因此,驗證 CDC23是否參與OP的骨偶聯調控值得深入研究。
ANAPC10編碼的蛋白質為后期促進因子(APC)的一個亞基,由185個氨基酸組成,具有一個保守的核心,是細胞周期調控的泛素蛋白連接酶,在細胞從有絲分裂到G1的進程中起著至關重要的作用[19-20]。由于APC10與SP1蛋白存在功能相關,而SP1蛋白在乳腺癌、甲狀腺癌和胰腺癌等癌組織中與正常組織相比呈現高表達[21-22]。因此,APC10的失調可能與腫瘤的發生有關。但是,ANAPC10與OP是否存在相關性,目前尚無證據支撐,可作為研究的一個方向。
綜上所述,本研究分析得到的10個核心基因和一條信號通路為研究OP 的發生機制和藥物治療提供了新的思路,或為OP藥物研發提供作用靶點。然而,本研究所得到的結論尚需通過基礎實驗來作進一步驗證。