










[摘要]" 目的: 通過生物信息學分析及臨床試驗,研究帕金森病(Parkinson′s disease,PD)發病過程中關鍵的miRNA及mRNA,識別具有診斷和治療潛力的mRNA與miRNA。方法: 使用來自帕金森進展標志物計劃(Parkinson′s progression markers initiative,PPMI)的mRNA和miRNA測序數據,分析兩者的差異表達基因,通過機器學習確定關鍵miRNA,使用多個miRNA-mRNA互作數據庫數據預測靶基因,再將預測的靶基因與差異表達mRNAs進行交叉匹配,獲得miRNA-mRNA調控網絡;然后利用STRING數據庫和Cytoscape軟件構建蛋白質相互作用(PPI)網絡,并篩選出Hub基因;最后通過實時熒光定量PCR(qRT-PCR)在臨床樣本中對識別出的Hub基因和miRNA進行驗證。結果: 通過差異基因表達分析(DEGA)聯合機器學習方法,確定了miR-214和miR-421兩個關鍵miRNA。進一步通過加權基因共表達網絡分析(WGCNA)、miRNA-mRNA互作數據庫以及PPI網絡分析,識別出信號轉導和轉錄激活因子3(STAT3)為Hub基因。通過臨床試驗驗證了miR-214與STAT3之間的相關性,并證明其具有診斷效力。結論: miR-214可能通過下調STAT3的表達,減輕α-突觸核蛋白的異常聚集、炎癥反應和氧化應激。在臨床樣本中,miR-214和STAT3展現出良好的診斷預測效力,并顯示出作為治療靶點的潛力。
[關鍵詞]" 帕金森病;miR-214;信號轉導和轉錄激活因子3;生物信息學;生物標志物
[中圖分類號]" R742" [文獻標志碼]" A" [文章編號]" 1671-7783(2025)02-0171-09
DOI: 10.13312/j.issn.1671-7783.y240081
[引用格式]韓廷燦, 徐宇浩, 朱穎, 等. 基于生物信息學探究帕金森病miRNA-mRNA調控網絡及作用機制[J]. 江蘇大學學報(醫學版), 2025, 35(2): 171-179.
[基金項目]江蘇省衛生健康委2022年度醫學科研重點項目(ZD2022062);江蘇大學醫教協同創新基金重點項目(JDY2023002)
[作者簡介]韓廷燦(1996—),男,碩士研究生;于明(通訊作者),主任醫師,博士生導師,E-mail: yuming7251@163.com
Exploration of the clinical value and identification of Parkinson′s disease biomarkers miR-214 and STAT3 in the miRNA-mRNA regulatory network based on bioinformatics analysis
HAN Tingcan, XU Yuhao, ZHU Ying, YU Ming
(Department of Neurology, Affiliated Hospital of Jiangsu University, Zhenjiang Jiangsu 212001, China)
[Abstract]" Objective: To investigate key microRNAs (miRNAs) and mRNAs involved in the pathogenesis of Parkinson′s disease (PD) through bioinformatics analysis and clinical experiments, and identify mRNAs and miRNAs with diagnostic and therapeutic potential. Methods: mRNA and miRNA sequencing data from the Parkinson′s progression markers initiative (PPMI) were analyzed to identify differentially expressed genes (DEGs). Machine learning algorithms were applied to determine critical miRNAs. Target genes of these miRNAs were predicted using multiple miRNA-mRNA interaction databases. Predicted targets were cross-matched with DEGs to construct an miRNA-mRNA regulatory network. Protein-protein interaction (PPI) networks were built by using the STRING database and Cytoscape software to identify hub genes. Quantitative real-time polymerase chain reaction (qRT-PCR) was performed on clinically collected samples to validate the identified hub genes and miRNAs. Results: Through differential gene expression analysis (DEGA) combined with machine learning, two key miRNAs-miR-214 and miR-421-were identified. Further analysis using weighted gene co-expression network analysis (WGCNA), miRNA-mRNA interaction databases, and PPI network screening revealed STAT3 as the hub gene. Clinical validation confirmed the correlation between miR-214 and STAT3 expression, demonstrating their diagnostic efficacy. Conclusion: MiR-214 may suppress STAT3 expression, thereby alleviating aberrant aggregation of α-synuclein, inflammatory responses, and oxidative stress in PD pathogenesis. Both miR-214/STAT3 demonstrated strong diagnostic predictive efficacy in clinical samples and exhibited potential as therapeutic targets for PD.
[Key words]" Parkinson′s disease; miR-214; signal transduction and transcription activating factor 3 (STAT3); bioinformatics; biomarkers
帕金森?。≒arkinson′s disease,PD)是常見的神經退行性疾病之一,其特征性運動癥狀包括運動遲緩、靜息性震顫、僵硬和步態改變,非運動癥狀則包括感覺減退、便秘和睡眠障礙[1]。PD的發病機制涉及黑質致密部多巴胺能神經元的大量死亡、大腦中α-突觸核蛋白的異常積累、線粒體功能障礙、蛋白質清除受損、神經炎癥以及氧化應激[2-3]。目前,PD的藥物治療主要依賴于多巴胺替代療法,但尚缺乏有效的方法來延緩病情發展[4]。隨著病程進展,患者通常需要增加藥物劑量以及采取多藥物聯合治療,導致藥物不良反應的風險增加,也加重了患者的經濟負擔[5]。因此,需要深入研究PD的遺傳和分子機制,開發新型診斷工具和治療方法。隨著高通量技術在生物醫學研究中的不斷應用,mRNA和miRNA已在多種疾病中展現出作為診斷和治療靶點的潛力[6-8]。本研究旨在探究miRNA及mRNA在PD中的作用和相互調控關系,并結合臨床試驗識別出關鍵的生物標志物。
1" 材料與方法
1.1" miRNA和mRNA測序數據
miRNA和mRNA的高通量測序數據集從帕金森進展標志物計劃(PPMI)的官方網站(www.ppmi-info.org)數據庫下載[9]。這些數據來自同一組受試者的外周血全血,包括發病年齡≥55歲的PD患者和健康對照組樣本,其中PD樣本27個,健康對照組19個。
1.2" 基因差異表達分析
使用R語言中的DESeq2軟件包進行基因差異分析。將診斷作為目標變量,性別以及年齡作為協變量。差異表達基因的統計顯著性標準設定為假陽性發現率(1 discovery rate,FDR)lt;0.05,并且log2(fold change,FC)gt;0.5或lt;-0.5。
1.3" 加權基因共表達網絡分析
加權基因共表達網絡分析(WGCNA)通過計算基因之間的鄰接強度構建拓撲重疊矩陣(TOM),對基因進行聚類,尋找高度相關基因的簇(模塊),然后通過相關性分析找出與診斷密切相關的基因模塊。在PCA分析中對第一主成分貢獻最大的前12 000個RNA納入WGCNA分析。
1.4" 功能富集分析
使用R語言clusterProfiler軟件包進行基因本體論(GO)和京都基因與基因組百科全書(KEGG)富集分析。顯著性閾值均設定為P<0.05。
1.5" 機器學習
采用3種機器學習方法識別關鍵的差異表達miRNA,包括最小絕對收縮和選擇算子(LASSO)、支持向量機(SVM)和神經網絡(NNET)算法。將差異表達的miRNA作為自變量輸入到模型中,以患病與否作為因變量。將46個樣本根據患病與否隨機分為兩組,其中34個樣本用于訓練組,剩下12個樣本構成獨立驗證組,用以評估模型預測效能。
LASSO模型通過R語言的glmnet軟件包構建,采用7折交叉驗證訓練調整超參數λ。模型的準確性通過計算每個λ值對應的受試者工作特征(ROC)曲線來評定。
SVM模型通過R語言的e1071軟件包訓練,并使用遞歸特征消除法(RFE)評估miRNA在PD中的重要性。每次訓練迭代中,通過測試集上的預測準確性評估模型性能并計算特征重要性。
NNET是一個單隱藏層的神經網絡模型。使用R語言的nnet軟件包構建神經網絡,并應用網格搜索方法測試包括懲罰系數、迭代次數和神經元數量在內的1 000種超參數組合。模型性能通過ROC曲線評估。使用Garson方法評估miRNA的重要性。
1.6" miRNA數據庫
使用R語言multiMiR程序包檢索miRNA和mRNA之間交互作用的證據。
1.7" 蛋白質相互作用網絡構建
使用STRING數據庫構建mRNA的相互作用網絡,其中最小所需相互作用評分設置為0.4。獲得的蛋白質相互作用(PPI)網絡導入到Cytoscape中進行分析,使用CytoHubba插件提供的最大團中心性(MCC)算法計算網絡中mRNA的重要性。
1.8" 受試者招募與臨床樣本采集
納入2022年6月至2023年7月于江蘇大學附屬醫院神經內科確診的36例PD患者。納入標準:符合國際運動障礙學會(MDS)2015年發布的診斷標準。排除標準:易與PD混淆的其他神經系統疾病(如腦血管病、癲癇等);藥物誘導的帕金森綜合征;其他嚴重器質性病變或腫瘤,年齡lt;55歲;PD家族史。同時,納入36例年齡相仿的健康體檢者作為對照組。所有參與者均完成PD評定量表(UPDRS)評分,并簽署知情同意書。本研究已獲得醫學倫理委員會批準(倫理批號:SWYXLL20210401-11)。
采集受試者清晨空腹肘靜脈血5 mL,用含枸櫞酸鈉的抗凝管收集,3 000 r/min離心10 min,分離上層血清。隨后使用山東思科捷生物技術有限公司的miRNA試劑盒提取血清總RNA,通過紫外分光光度計測定其濃度和純度。
1.9" qRT-PCR檢測RNA相對表達量
逆轉錄、qRT-PCR檢測使用的試劑盒以及相關引物由山東思科捷生物技術有限公司提供。分別使用U6、β-肌動蛋白作為miRNA、mRNA的內參基因。miRNA逆轉錄的反應流程:37 ℃ 2 min,50 ℃ 15 min,85 ℃ 2 min。qRT-PCR主要反應流程:94 ℃ 3 min,40個循環(94 ℃ 20 s,60 ℃ 20 s,72 ℃ 30 s),熔解曲線(95 ℃ 15 s,60 ℃ 60 s,95 ℃ 15 s)。使用2-ΔΔCT方法計算RNA相對表達量。引物序列:hsa-miR-214-3p,5′-GTCGTATCCAGTGCAGGGTCCG-AGGTATTCGCACTGGATACGACACTGCC-3′;U6,5′-CGAATTTGCGTGTCATCCTTGCG-3′;hsa-miR-214-3p,上游5′-ACGAGAACACAGCAGGCACAG-3′,下游5′-ATCCAGTGCAGGGTCCGAGG-3′;β-肌動蛋白,上游5′-CTACTCATGAAGATCCTGACC-3′,下游5′-CACA-GCTTCTCTTTGATGCAC-3′;STAT3,上游5′-ACCAA-GCGAGGACTGAGCATC-3′,下游5′-CAGCCAGACC-CAGAAGGAGAAG-3′。
1.10" 統計分析方法
應用R語言進行統計學分析。采用Shapiro-Wilk檢驗評估數據的正態性,兩組間計量資料符合正態分布采用兩樣本t檢驗;計數資料采用χ2檢驗;相關性分析采用Pearson檢驗;采用約登指數確定ROC曲線最佳閾值。Plt;0.05為差異有統計學意義。
2" 結果
2.1" 差異分析、WGCNA確定核心mRNA
通過差異基因表達分析識別出612個差異表達的mRNA,圖1A中標出了根據校正后的P值排名前10的基因。從WGCNA模塊與臨床特征之間的相關性熱圖(圖1B)可以看出,其中一個深綠色的基因模塊與PD的診斷關系最為緊密,相關系數為0.57,且差異有統計學意義(Plt;0.001)。該模塊包含1 831個mRNA,通過與之前識別的差異表達mRNA進行交集分析,確定了207個核心mRNA,這些mRNA可能是PD發生發展的關鍵分子。
2.2" 差異分析、機器學習確定核心miRNA
差異分析結果顯示,在PD患者與對照組之間,59個miRNA的表達存在顯著差異(圖2)。46個樣本按照診斷進行分層抽樣,隨機分為訓練集(34個)和測試集(12個),機器學習的模型均使用訓練集數據進行訓練,在測試集上評估其預測性能以防止過擬合。
在LASSO模型中,應用隨機超參數調優,共測試了100個不同λ值模型,取值范圍由glmnet包根據樣本數和變量數自動評估,當懲罰參數λ設置為0.069時,LASSO模型對測試集數據預測的二項偏差達到最低,為1.03,說明此模型具有較高的預測效力。此時,模型中回歸系數不為0的mRNA有9個(圖3),這些成為模型中的關鍵特征。
在SVM模型中,通過特征遞歸消除方法發現,當保留10個特征時,模型的預測準確率最高,達到0.795。這10個miRNA作為核心支持向量,在模型的分類決策中發揮重要作用。使用這10個miRNA在SVM模型中的權重作為其重要性評價指標(圖4)。
在NNET模型中,對其神經單元數量、迭代次數、懲罰系數3個超參數進行網格交叉調優,超參數取值范圍:神經單元數量1~10個、迭代次數50~150次、懲罰系數10(-10~0),共測試了10 000種超參數組合,以模型在測試集上的ROC曲線下面積為性能指標,發現包含3個隱藏神經單元,懲罰系數為0.994,迭代次數為88次的參數組合展示了最優的預測性能。訓練集和測試集ROC曲線下面積為0.932和0.914,根據Garson方法評估,10個miRNA的特征重要性最高(圖5)。
通過對3個模型的重要特征進行交集分析,并繪制韋恩圖,確定了4個關鍵miRNA:hsa-miR-6883-3p、hsa-miR-3691-3p、hsa-miR-214-3p和hsa-miR-421。這些miRNA的表達量在不同模型中均是關鍵的參數,表明其可能在PD預測中扮演關鍵角色。
2.3" miRNA與RNA的交互作用
使用TargetScan、TarBase、miRTarBase、miRWalk等數據庫檢索了核心miRNA與和差異表達mRNA之間的相互作用證據,其中miR-6883和miR-3691相關證據中,mRNA與miRNA在差異分析中呈現相同的表達趨勢;而miR-214和miR-421所涉及的相互作用中,mRNA與miRNA呈現相反的表達趨勢,且核心mRNA占比較高(圖6)。因此miR-214和miR-421及其下游核心mRNA可能在PD中扮演重要角色。
縱軸代表miRNA與mRNA在數據庫中相互作用的證據條數,橫軸代表不同的數據庫,證據類型中“支持”代表miRNA與mRNA在數據庫中有相互作用的證據,并且兩者表達趨勢相反;“矛盾”表示miRNA與mRNA表達趨勢相同。核心mRNA指不僅在差異分析中Plt;0.05,而且在WGCNA分析中與PD顯著相關(Plt;0.05)的基因;非核心mRNA指僅在差異分析中Plt;0.05的mRNA
網絡中的mRNA根據與miR-214和miR-421的互作關系分為3組:僅與miR-214結合的mRNA,與兩種miRNA都有互作的mRNA,僅與miR-421結合的mRNA。結果顯示,與miR-214結合的mRNA數量顯著多于miR-421,提示miR-214在網絡中起主導作用。進一步通過MCODE算法,識別出兩個蛋白復合體模塊,并且都與miR-214緊密連接。在這兩個模塊中STAT3的MCC評分為29,明顯高于其他mRNA,表明其在網絡中的核心地位(圖7)。
圖中每個圓形圖標為1個mRNA,每個橢圓形圖標為1個miRNA,不同的連線顏色代表互作證據的類型,圓形圖標的底色代表mRNA在整個互作網絡中的MCC評分,圓形的邊框顏色為不同MCODE聚類的標識
2.4" PPI網絡功能富集分析
GO分析的結果集中于干擾素-α、白細胞遷移和趨化反應等免疫與炎癥相關功能(圖8),KEGG分析揭示了它們在調控吞噬功能和趨化因子募集途徑中的潛在角色(圖9)。
2.5" 臨床樣本UPDRS Ⅲ評分與miR-214、STAT3表達量的關系
PD患者和健康對照組的UPDRS Ⅲ評分比較,差異有統計學意義(P<0.001),其他指標均無統計學差異。見表1。
結果顯示,PD患者血清中miR-214的相對表達量明顯低于對照組,而PD患者血清中STAT3的相對表達量則明顯高于對照組,差異均有統計學意義(Plt;0.01);Pearson相關性分析提示,miR-214與STAT3的表達量存在明顯的相關性(r=-0.62,Plt;0.001),見圖10。使用臨床收集樣本測得的miR-214、STAT3相對表達量構建邏輯回歸模型。當miR-214與STAT3同時作為自變量時,邏輯回歸模型的曲線下面積顯著高于單獨使用miR-214或STAT3作為自變量(圖11),且約登指數最高為72.3%(表2)。
此外,miR-214與STAT3表達量均與PD患者的UPDRS Ⅲ評分具有相關性(r=-0.59、r=0.63,P均lt;0.001),見圖12。由此表明,miR-214與STAT3均具有較強的診斷效力,兩者之間可能存在調控關系,且其表達量與病情嚴重程度具有一定相關性。
3" 討論
本研究通過生物信息學分析,確認miR-214和STAT3為最重要的miRNA和mRNA,并通過臨床樣本驗證了miR-214與STAT3之間的相關性及其診斷效力,發現其表達量與PD患者UPDRS Ⅲ評分具有一定的相關性;GO和KEGG富集分析顯示,這些生物標志物主要涉及炎癥和免疫相關過程。神經炎癥是PD的重要發病機制之一,與α-突觸核蛋白的異常積累存在密切關系。
已有研究表明,STAT3主要通過參與神經炎癥過程在PD中發揮作用。在Calhm2敲除小鼠中,小膠質細胞STAT3下游信號下調以及炎癥細胞因子水平降低[10]。在另一項PD小鼠模型和細胞實驗中,β-羥基丁酸通過抑制STAT3介導的NLRP3炎癥體激活,有效抑制了體內外PD模型的焦亡[11]。Yang等[12]研究發現,刺五加皂苷通過抑制IL-6/JAK2/STAT3信號通路,減少小鼠多巴胺能神經元的凋亡。在使用α-突觸核蛋白纖維刺激小膠質細胞的PD炎癥模型實驗中,小膠質細胞中STAT3信號通路的激活及一氧化氮和白介素-1等炎癥因子的產生,表明α-突觸核蛋白可能通過JAK2/STAT3信號通路加劇了炎癥反應和神經元損傷[13]。因此,STAT3對PD中的神經炎癥具有促進作用。
既往關于miR-214在PD中的研究主要集中于神經保護效應。Wang等[14]在1-甲基-4-苯基-1,2,3,6-四氫吡啶(MPTP)誘導的PD小鼠模型和人類神經母細胞瘤細胞系SH-SY5Y中發現,miR-214對α-突觸核蛋白表達具有負向調控作用,對PD細胞模型轉染miR-214模擬物和抑制子,可顯著影響α-突觸核蛋白的mRNA和蛋白表達水平。在另一項研究中[15],MPTP誘導的PD模型小鼠miR-214表達水平較對照組顯著下降,而熱休克轉錄因子1(heat shock transcription factor 1,HSF1)的上調可顯著增加miR-214表達,從而對神經炎癥和微膠質細胞激活產生抑制作用;表明HSF1通過直接作用于miR-214的啟動子區域,增強其在PD小鼠模型中的表達。這種上調不僅減輕了小膠質細胞的激活,還降低了炎性細胞因子IL-1β、IL-6和TNF-α水平,同時提高了抗炎細胞因子TGF-β1和IL-10水平。此外,有研究表明miR-214表達及PD患者血清中的抗氧化酶水平均有所下降[16]。以上結果提示,miR-214一方面下調α-突觸核蛋白的表達,另一方面通過減輕細胞的氧化應激起到神經保護作用。
結合以上研究,推測STAT3和miR-214在PD中的聯系可能體現在對α-突觸核蛋白表達的調控。STAT3的激活可能促進α-突觸核蛋白的異常聚集和炎癥反應,而miR-214除了直接抑制α-突觸核蛋白mRNA表達,還可能通過下調STAT3間接減少α-突觸核蛋白的異常聚集。
本研究拓展了從高通量數據中探索生物標志物的思路和研究方法,結合多種生物信息學工具,可作為探索目標mRNA和miRNA上、下游調控關系的工具。
綜上所述,STAT3和miR-214可能在PD的病理過程中相互作用,共同影響疾病的進展。這種相互作用可能為PD的治療提供新的靶點,通過調節STAT3和miR-214的活性,減輕PD的病理特征,如α-突觸核蛋白的異常聚集、神經炎癥以及氧化應激。但目前研究仍存在一定的局限性,包括樣本量相對有限,未在動物或者細胞模型上進行干預性實驗以深入探究STAT3和miR-214的作用機制。
[參考文獻]
[1]" 王曉蓓, 楊珊, 李亞曇, 等. 外泌體miR-1246對帕金森病的診斷價值[J]. 新醫學, 2024, 55(11): 861-869.
[2]" 王珅, 楊婷, 方慶娟, 等. 帕金森病患者血壓晝夜節律與動脈粥樣硬化關系的臨床觀察[J]. 心肺血管病雜志, 2023, 42(7): 702-707.
[3]" 楊文平, 馬玉蘋, 陸小偉, 等. 老年帕金森病患者骨質疏松危險因素分析[J]. 中國臨床研究, 2022, 35(10): 1401-1405.
[4]" Bloem BR, Okun MS, Klein C. Parkinson′s disease[J]. Lancet, 2021, 397(10291): 2284-2303.
[5]" Armstrong MJ, Okun MS. Choosing a parkinson disease treatment[J]. JAMA, 2020, 323(14): 1420.
[6]" Kern F, Fehlmann T, Violich I, et al. Deep sequencing of sncRNAs reveals hallmarks and regulatory modules of the transcriptome during Parkinson′s disease progression[J]. Nature Aging, 2021, 1(3): 309-322.
[7]" Irmady K, Hale CR, Qadri R, et al. Blood transcriptomic signatures associated with molecular changes in the brain and clinical outcomes in Parkinson′s disease[J]. Nat Commun, 2023, 14(1): 3956.
[8]" 陳鋒, 陳濤, 章曉云, 等. 基于生物信息學探討骨關節炎miRNA-mRNA調控網絡及其作用機制[J]. 江蘇大學學報(醫學版), 2022, 32(5): 391-397.
[9]" Brumm MC, Siderowf A, Simuni T, et al. Parkinson′s progression markers initiative: a milestone-based strategy to monitor Parkinson′s disease progression[J]. J Parkinsons Dis, 2023, 13(6): 899-916.
[10]" Bo X, Xie F, Zhang J, et al. Deletion of Calhm2 alleviates MPTP-induced Parkinson′s disease pathology by inhibiting EFHD2-STAT3 signaling in microglia[J]. Theranostics, 2023, 13(6): 1809-1822.
[11]" Jiang Z, Yin X, Wang M, et al. β-Hydroxybutyrate alleviates pyroptosis in MPP+/MPTP-induced Parkinson′s disease models via inhibiting STAT3/NLRP3/GSDMD pathway[J]. Int Immunopharmacol, 2022, 113(Pt B): 109451.
[12]" Yang X, Yv Q, Ye F, et al. Echinacoside protects dopaminergic neurons through regulating IL-6/JAK2/STAT3 pathway in Parkinson′s disease model[J]. Front Pharmacol, 2022, 13: 848813.
[13]" Chen CM, Yen CY, Chen WL, et al. Pathomechanism characterization and potential therapeutics identification for Parkinson′s disease targeting neuroinflammation[J]. Int J Mol Sci, 2021, 22(3): 1062.
[14]" Wang ZH, Zhang JL, Duan YL, et al. MicroRNA-214 participates in the neuroprotective effect of Resveratrol via inhibiting α-synuclein expression in MPTP-induced Parkinson′s disease mouse[J]. Biomed Pharmacother, 2015, 74: 252-256.
[15]" Liao Y, Gu Y, Wang J, et al. HSF1 inhibits microglia activation to attenuate neuroinflammation via regulating miR-214-3p and NFATc2 in Parkinson′s disease[J]. Folia Neuropathol, 2023, 61(1): 53-67.
[16]" Ghit A, Deeb HE. Cytokines, miRNAs, and antioxidants as combined non-invasive biomarkers for Parkinson′s disease[J]. J Mol Neurosci, 2022, 72(5): 1133-1140.
[收稿日期]" 2024-05-10" [編輯]" 郭" 欣