李興艷 楊業靜 黃家志 代萬武 黃祖權 杜勇軍
(廣西醫科大學第三附屬醫院關節外科,南寧市 530031,電子郵箱:448445226@qq.com)
脂肪干細胞(adipose-derived stem cells,ADSCs)是從脂肪組織中分離出的一種具有多向分化潛能的干細胞,主要具有恢復組織細胞、促進細胞再生的作用,可有效改善亞健康、早衰等疾病,抵抗衰老[1]。此外,ADSCs因其具有來源充足、取材容易等優點,已成為骨組織工程研究的熱點。但ADSCs成骨分化的分子生物學機制目前仍未完全闡明[2]。隨著大數據及生物信息學的快速發展,以及ADSCs在臨床醫學領域的應用[3],已有一些學者針對ADSCs成骨分化進行了RNA芯片及測序研究,以進一步探討這些RNA在ADSCs成骨分化過程中所發揮的分子生物學機制。因此,本研究應用生物信息學方法篩選ADSCs成骨分化過程中的差異表達基因及其涉及的信號通路,以探討ADSCs成骨分化過程中潛在的關鍵基因所發揮的分子生物學機制。
1.1 基因表達譜芯片的搜索 利用NCBI平臺下的GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/),檢索與ADSCs成骨分化相關的基因數據集,在檢索結果中選擇GSE63754[4]數據進行挖掘。GSE63754是由國外學者使用Agilent-039494 SurePrint G3 Human GE v2 8x60K Microarray 039381探針測定6個ADSCs成骨分化相關樣本的mRNA表達譜,包括3個ADSCs樣本和3個成骨細胞樣本[5]。
1.2 數據處理及差異表達基因分析 對數據進行整理及優化,如出現同名基因不同表達量時取均值,同時將數據進行對數變換(log2)使得數據服從正態分布。隨后將數據分為成骨細胞組(實驗組)和ADSCs組(對照組),利用R語言的Limma軟件包(版本號:3.12)對數據進行歸一化處理后進行差異表達基因分析。選取adjP值<0.05、|logFC|>2的基因作為候選差異表達基因。
1.3 蛋白質相互作用網絡的構建及其轉錄因子預測 將差異表達基因所對應的蛋白上傳至STRING數據庫(版本號:11.0),選取打分值(基因或者蛋白之間最低互動得分)>0.4的數據,構建蛋白質相互作用(protein-protein interaction,PPI)網絡,并利用Cytoscape軟件(版本號:v3.7.1)將PPI網絡可視化。同時,使用iRegulon軟件(版本號:1.3)對PPI網絡內的基因進行轉錄因子富集預測,將標準化富集分數(normalized enrichment score,NES)排名前5的轉錄因子進行可視化。
1.4 關鍵基因的篩選 為了進一步篩選與ADSCs成骨分化過程相關的潛在關鍵基因,使用cytoHubba插件(版本號:v3.7.1)中的Degree算法對PPI網絡進行重要模塊分析。選擇Degree排名前6的基因作為與ADSCs成骨分化過程相關的潛在關鍵基因。
1.5 關鍵基因的功能和通路富集分析 采用clusterProfiler包(版本號:3.12)對關鍵基因進行基因本體論(Gene Ontology,GO)和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)信號通路富集分析。根據adjP值<0.05進行篩選。
2.1 數據預處理及差異分析 將GSE63754數據預處理后各基因的表達均一化(見圖1A和圖1B),得到32 055個基因的表達矩陣(圖2)。經過差異表達基因分析后,篩選出556個差異表達基因,其中228個基因在成骨細胞組處于上調水平,而另228個基因在ADSCs組處于下調水平。在這些差異表達基因中選取上下調最明顯的100個基因(在ADSCs成骨分化過程中50個上調的基因和50個下調的基因)繪制熱圖(見圖2)。

圖1 數據預處理結果注:A為預處理前的數據表達情況;B為處理后的基因表達情況,可知數據處于同一水平線,代表處理后的數據佳。

圖2 差異表達基因分析結果注:A為火山圖,紅色代表在成骨細胞中上調,藍色代表在成骨細胞中下調;B為熱圖,紅色代表在成骨細胞中上調,綠色代表在成骨細胞中下調。
2.2 PPI網絡及轉錄因子 通過STRING 11.0在線網絡工具對556個差異基因進行PPI網絡分析,排除242個無相互作用的蛋白,最后得到由314個節點、852條連接構成的PPI網絡圖。通過iRegulon插件對這些PPI網絡里的基因進行轉錄因子預測,構建PPI和轉錄因子預測網絡,預測出5個轉錄因子,包括ESRP1、PRKAA2、POU5F1B、ATF4HE和ZSCAN4(見圖3),圖中的蛋白與其他節點連線越多,表明該蛋白在該網絡中越重要。
2.3 關鍵基因的篩選 Degree排名前6的關鍵基因分別是瘦素(leptin, LEP)、白細胞介素1β(interleukin 1β,IL1B)、成纖維細胞生長因子2(fibroblast growth factor 2,FGF2)、鈣黏蛋白1(cadherin 1,CDH1)、血管內皮生長因子A(vascular endothelial growth factor A,VEGFA)和過氧化物酶體增生激活受體γ(peroxisome proliferative activated receptor gamma,PPARG)(見圖3)。

圖3 PPI網絡和轉錄因子預測圖注:圓形代表基因,八邊形代表轉錄因子,線條代表相互關聯
2.4 功能和通路富集分析結果 LEP、IL1B、FGF2、CDH1、VEGFA和PPARG這6個關鍵基因主要富集在p38絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信號通路,并且可能與破骨細胞分化相關。見圖4。


圖4 ADSCs成骨分化過程相關的潛在關鍵基因的富集分析注:A為關鍵基因的GO富集分析圖(前30);B為關鍵基因的KEGG信號通路富集分析圖(前30);C為關鍵基因的GO富集分析結果中排名前10的GO條目;D為關鍵基因的KEGG富集分析結果中排名前10的信號通路。
本研究共篩選出556個差異表達基因。最終發現LEP、IL1B、FGF2、CDH1、VEGFA和PPARG為ADSCs成骨分化過程相關的潛在關鍵基因,并且這些基因和信號通路主要富集在p38 MAPK信號通路上,可能與破骨細胞分化相關。
PPARG為過氧化物酶體增生激活受體γ的編碼基因,其編碼的過氧化物酶體增生激活受體γ可以與類維生素A受體結合形成二聚物,該二聚體可以與多種基因的特異DNA序列——過氧化物酶體增殖反應元件(peroxisome proliferators response element,PPRE)結合,從而激活基因的表達。PPARG主要與癌癥、動脈粥樣硬化、糖尿病和肥胖癥相關[6],但尚未見有關PPARG調控細胞分化的研究。本研究結果表明PPARG可能是ADSCs成骨細胞分化過程中的潛在關鍵分子,但這只是通過生物信息學方法預測的結果,還有待體內外實驗的進一步驗證。
CDH1[7]、VEGFA[8]、FGF2[9]都是癌基因。CDH1基因編碼E-鈣黏蛋白,是一種鈣依賴性細胞黏附蛋白,屬于鈣黏蛋白家族成員,CDH1基因參與調節細胞黏附、遷移和上皮細胞增殖,其功能缺失導致細胞更容易侵襲和轉移,該基因的突變與胃癌、乳腺癌、結直腸癌、甲狀腺癌和卵巢癌密切相關[10]。VEGFA基因是血小板衍生生長因子(platelet-derived growth factor,PDGF)/血管內皮生長因子(vascular endothelial growth factor,VEGF)家族的成員,是糖基化的有絲分裂原,除可特異性地作用于內皮細胞外,還具有多種作用,包括介導增加的血管通透性、誘導血管生成、血管發生和內皮細胞生長、促進細胞遷移和抑制細胞凋亡,其主要與糖尿病及動脈粥樣硬化等微血管病變相關[11]。FGF2基因編碼的蛋白是成纖維細胞生長因子家族的成員,具有廣泛的促有絲分裂和血管生成活性,該蛋白與多種生物學過程有關,如肢體和神經系統發育、傷口愈合和腫瘤生長等。
值得注意的是,IL1B[12]、LEP[13]與炎癥相關。本研究結果顯示,兩者是與ADSCs的成骨分化相關的潛在關鍵分子。因此,IL1B和LEP調控的炎癥反應是否也參與了ADSCs的成骨分化有待進一步研究。
MAPK是一組絲氨酸-蘇氨酸蛋白激酶,其能將信號從細胞外表面傳導到細胞核的內部,能被不同的細胞外因子刺激所激活,如細胞黏附因子、神經遞質因子、生長因子等。MAPK通路是一種較為保守的三級激酶模式,依次通過MAPK激酶激酶、MAPK激酶和MAPK激活下游信號,共同調節著細胞的炎癥反應、對環境的應激適應、分化和生長等多種重要的細胞生理或病理生理過程。在調控細胞炎癥反應方面,p38 MAPK在重癥胰腺炎炎癥反應中扮演重要角色[14];而在調控細胞生長、分化方面,p38 MAPK能夠促進小鼠成骨細胞增殖、分化并抑制成骨細胞的凋亡[15]。本研究結果表明,p38 MAPK信號通路可能在ADSCs成骨分化的分子生物學過程中發揮著重要的作用,這與MAPK信號通路參與細胞生長、分化的作用一致。
綜上所述,本研究通過對GEO 數據庫中關于ADSCs成骨分化的相關數據進行挖掘,發現ADSCs成骨分化過程中潛在的關鍵基因及其涉及的通路。這或可為今后進一步開展實驗研究,探索ADSCs成骨分化的發生、發展及分子生物學機制提供新的思路和依據。