[摘要]"海量醫學數據的積累和人工智能技術的迅猛發展為構建精準的腦卒中臨床事件預測模型帶來可能。本文綜述腦卒中臨床預測模型的研究進展,分析不同模型在數據來源、算法選擇及性能方面的優缺點,同時通過總結臨床預測模型在實際醫療場景中的應用,全面呈現當前該領域的研究現狀,并提出構建腦卒中臨床事件預測模型面臨的挑戰,以期為開發更優化、更具臨床實用性的預測模型提供可靠參考。
[關鍵詞]"腦卒中;預測模型;機器學習;深度學習
[中圖分類號]"R319""""""[文獻標識碼]"A""""""[DOI]"10.3969/j.issn.1673-9701.2025.16.023
中國腦卒中發病人數約占全球的1/3,隨著人口老齡化的加劇與人們生活方式的改變,腦卒中患病人數持續增加[1]。傳統的腦卒中風險評估主要依賴于臨床醫生的經驗和簡單的生理指標,這些方法往往缺乏準確性和全面性,且存在滯后性,難以滿足精準醫療的需求。近年來,人工智能與大數據技術快速發展;通過數據挖掘、機器學習及深度學習,可實現對海量醫學數據的深度分析和挖掘,為腦卒中的基礎研究提供新的視角和方法[2-3]。
1""腦卒中臨床事件預測模型的構建方法
1.1""早期基于傳統統計學的模型
在早期腦卒中臨床事件預測模型研究中,傳統統計方法得到廣泛應用。這類模型主要包括回歸模型、分類模型及風險評分系統等,通過收集患者的臨床信息,如年齡、病史、實驗室檢查結果等,運用統計學方法進行分析,建立預測模型。
在傳統統計模型中,改良的弗明漢卒中量表(Framingham"stroke"profile,FSP)模型利用Cox比例風險回歸模型,基于分析長期隨訪研究得到的大量數據,確定影響腦卒中發病風險的因素,建立風險評分與腦卒中發病率之間的數學模型。楊勝男等[4]使用FSP進行發病風險等級分組,通過多分類Logistic回歸模型分析,定量評估顱內動脈粥樣硬化性狹窄對腦卒中發病的影響程度。有研究收集患者的年齡及相關臨床信息,構建基于Logistic回歸的列線圖模型,預測腦卒中發病情況與危險因素的關聯[5]。
隨著數據量的增加和對預測準確性要求的提高,傳統統計模型的局限性逐漸顯現。傳統統計模型主要采用臨床數據與實驗室檢查結果,數據來源相對單一,通常僅使用患者的靜態信息,缺乏對治療過程中動態變化的考慮。在算法分析上,難以捕捉復雜的非線性關系和變量間的交互作用,預測準確性相對較低。
1.2""基于機器學習的預測模型
機器學習算法可自動從大量數據中學習復雜的模式和規律,無需事先假設數據的分布形式,對非線性關系的建模能力更強。多個研究團隊將機器學習算法應用于對腦卒中的診斷、恢復和預后風險預測。王小曼等[6]構建隨機森林(random"forest,RF)、支持向量機(support"vector"machine,SVM)、極端梯度提升(extreme"gradient"boosting,XGBoost)3種機器學習模型預測缺血性腦卒中患者院內死亡風險。另一項研究收集相關缺血性腦卒中患者的臨床資料,根據靜脈溶栓治療情況進行分組,以獨立預測因素建立Logistic回歸、K-近鄰、SVM、RF"4種機器學習模型預測早期神經功能惡化風險,整體預測能力較優[7]。
部分研究對比統計模型與機器學習算法的預測性能。在相同數據集中同時使用FSP等傳統統計預測模型及SVM、RF等機器學習模型,對比實驗表明機器學習在腦卒中臨床預測任務中展現出比傳統統計模型更好的性能[2]。另一項研究對比機器學習模型與統計回歸模型評估腦卒中患者神經功能缺失程度的性能,結果顯示機器學習模型的性能全面優于傳統統計回歸模型[8]。
然而,機器學習算法也存在一些不足,如模型可解釋性較差,難以直觀理解模型的決策過程和各因素的作用機制[9]。這在一定程度上限制其在臨床中的廣泛應用,醫生往往更傾向于借助可解釋性強的模型進行診斷和決策。
1.3""基于深度學習的預測模型
深度學習是基于多層神經網絡自動學習數據特征以解決復雜問題的學習方法。近年來深度學習在腦卒中預測領域取得突破性進展,其強大的特征提取能力和復雜模式識別潛力,在醫學影像分析、時序數據處理和多模態融合中展現出顯著優勢[10]。
卷積神經網絡(convolutional"neural"networks,CNN)擅長處理圖像數據,可對腦卒中影像分析預測提供直觀依據。Mohapatra等[11]采集12h內接受CT平掃的缺血性腦卒中患者的圖像信息,訓練CNN模型定位平掃CT上不同區域早期梗死特征。結果顯示模型的平均曲線下面積(area"under"the"curve,AUC)大于0.70,該模型對梗死病變識別的準確率達95.6%。循環神經網絡及其變體長短期記憶網絡(long"short-term"memory,LSTM)在處理時間序列數據方面表現出色,可挖掘患者生命體征、病情發展等隨時間變化的規律,把握疾病動態發展趨勢。Yu等[12]利用LSTM在處理時間信號上的優勢模擬源灌注加權磁共振成像信號的時間特征,并結合彌散加權成像(diffusion"weighted"imaging,DWI)預測急性腦卒中出血轉化的發生和程度,AUC達0.89。
1.4""基于多模態融合的混合模型
基于多模態融合的混合模型將來自不同模態的數據(如文本、圖像、語音、視頻等)利用深度學習算法和技術進行融合及建模,充分利用多模態數據的互補性和協同性,在構建臨床事件預測模型中得到應用[13]。除患者的臨床病史、影像資料、實驗室檢查結果等,有研究開始結合患者的面部、肢體動作等多模態數據進行腦卒中預測[14-15]。這些豐富的數據維度為全面捕捉腦卒中相關信息提供基礎,突破單一數據類型的局限,已在腦卒中預測任務中取得有效成果[16]。
Liu等[17]通過融合DWI和急性期臨床信息構建深度學習模型預測急性缺血性腦卒中患者90d后改良Rankin量表(modified"Rankin"scale,MRS)評分。通過對比發現,與僅使用臨床信息或成像數據的模型相比,融合模型顯示出優越的性能。Ma等[18]提出一種基于LSTM將時序和非時序臨床記錄與表格數據融合的模型,在腦卒中患者院內死亡風險和長時間住院預測兩項任務中的效果普遍優于對比模型,AUC分別為0.848和0.938。此外,還有研究構建基于不同模態磁共振影像的腦卒中最終梗死區預測模型,并引入統計學習的思想提高預測性能[19]。
多模態數據在腦卒中預測中展現出巨大潛力,可充分利用不同模態數據包含不同角度和層次的信息,融合后能更全面地描述對象,提高模型的穩定性和可靠性。然而,數據融合過程中也面臨諸多挑戰,如模態缺失、如何有效整合不同類型的特征等,需要進一步研究和探索有效的解決方案[16]。
2""腦卒中臨床事件預測模型的實際應用
2.1""在腦卒中患者預后預測中的應用
腦卒中患者的功能結局對其生活質量、家庭負擔及社會回歸能力影響深遠,準確預測功能結局有助于臨床醫生進行康復治療,改善功能恢復情況。Liu等[20]利用融合平掃CT和急性期臨床數據的深度學習模型預測90d的MRS評分,平均絕對誤差僅為0.94,預測不良預后的AUC為0.91,優于單純影像模型和單純臨床信息模型。Lee等[21]運用機器學習預測急性缺血性腦卒中后認知障礙(post-stroke"cognitive"impairment,PSCI),明確皮質梗死、內側顳葉萎縮等關鍵預測因素,為預測PSCI提供新方法,助力臨床識別高危患者,開展早期干預。
腦卒中的高復發率一直困擾著醫護人員和患者。王玥等[22]建立Cox風險預測模型預測2年內腦卒中復發風險,并確定相關獨立危險因素,其模型一致性指數為0.83,為及時預測腦卒中的復發概率、確定高危人群提供有效參考。沈展等[23]使用RF、XGboost、Logistic回歸等機器學習算法構建腦卒中復發預測模型,XGboost模型的AUC達0.86。關于腦卒中患者死亡風險的預測,羅梟等[24]構建可解釋XGboost模型預測重癥缺血性腦卒中患者1年內死亡風險,AUC為0.857,并明確年齡、序貫器官衰竭評估評分等為重要預測變量。
2.2""在腦卒中診斷中的應用
基于腦卒中高發病率的特點,及時準確的診斷對患者治療和預后至關重要。腦卒中臨床預測模型主要應用在早期診斷、病情評估和卒中類別鑒定[25]。Ou等[26]利用多模態深度學習模型,結合面部、肢體動作及語音特征分析,同時引入動作特征對比學習,顯著提升腦卒中早期識別的準確性和敏感度,AUC為0.80。黃莉等[27]收集急性腦卒中患者的臨床、影像等資料,通過最優子集回歸和Logistic回歸建立風險預測模型,其一致性指數達0.845,為PSCI的病情評估和早期干預提供參考。Garg等[28]利用機器學習與自然語言處理技術挖掘臨床文本數據,使用多種機器學習模型進行訓練,實現缺血性腦卒中亞型自動分類,最優模型的科恩卡帕系數達0.72。
3""腦卒中臨床事件預測模型研究的挑戰
目前越來越多的研究集中在利用機器學習、深度學習技術構建預測模型,研究在取得重要成果的同時,仍面臨著諸多挑戰。
首先,構建模型需要有大規模、高質量的數據集。臨床數據涉及患者隱私,在收集、存儲和使用數據時需嚴格遵守法規,給數據獲取與共享帶來限制[29]。腦卒中患者多次住院可產生反映疾病進展的重要時序數據,但患者在多家不同的醫院和非住院期間的數據收集十分困難,且質量難以保障。建設開放的、可獲取的、高質量的、多模態患者數據集是模型構建的重要挑戰。
其次,真實世界場景中患者將出現無法避免的、不確定的模態缺失問題,從而限制基于多模態融合預測模型的應用。有研究針對特定模態缺失采用基于自編碼器和對抗生成網絡的模態補全方法,也有研究者利用對比學習、蒸餾學習技術融合缺失模態并保證模型的穩健性能[30-32]。基于多模態數據構建腦卒中臨床事件預測模型,數據融合技術除了要解決模態缺失的問題,還要解決多模態數據可能存在的較長時間跨度、時間間隔不等問題[33]。
再次,深度學習模型經過復雜的非線性組合,其性能可與專家媲美,但醫生和患者或許并不清楚這些模型因何及如何做到這一點。模型的“黑箱”特性使模型和結果都難以被理解,從而降低這些模型的臨床適用性和接受度[9]。深度學習模型不依賴特征工程,使得目前常用的解釋性技術(如Shapley可加性解釋技術)并不適用。因此,通過融入臨床知識、多任務學習等提升深度學習模型的可解釋性,使之能夠在真實臨床實踐場景中進行“透明的”臨床事件預測,是構建疾病輔助診療模型、促進模型落地的重要挑戰。
4""小結與展望
腦卒中臨床事件預測模型的研究已從傳統的統計方法到機器學習算法再到更為復雜的深度學習算法,從應用單一模態數據發展到多模態數據融合,模型涉及的臨床應用日益廣泛。盡管這些模型已取得長足進步,但仍面臨諸多挑戰。未來對如何充分應用廣泛的多模態臨床數據構建模型、如何利用患者的動態數據反映疾病進程、如何提升模型的可解釋性從而加速臨床應用等方向的深入研究和探索,將進一步提升腦卒中臨床預測模型在早期診斷、疾病預后和個性化治療中的作用。
利益沖突:所有作者均聲明不存在利益沖突。
[參考文獻]
[1] 《中國卒中中心報告2022》編寫組,"王隴德."《中國卒中中心報告2022》概要[J]."中國腦血管病雜志,"2024,"21(8):"565–576.
[2] 楊爽."基于傳統模型和機器學習的腦卒中首發預測與評估[D]."重慶:"西南大學,"2023.
[3] 劉柘君,"唐田,"譚天陽,"等."缺血性腦卒中模型研究進展[J]."中國藥物警戒,"2024,"21(12):"1393–1397,"1404.
[4] 楊勝男,"譚蘭."Framingham卒中量表評分與顱內動脈粥樣硬化性狹窄關系[J]."青島大學學報(醫學版),nbsp;2023,"59(1):"109–112.
[5] 王倩雯,"詹樂昌,"歐陽雨婷,"等."恢復期腦卒中患者發生認知障礙的風險預測模型構建與評價[J]."中國康復醫學雜志,"2024,"39(12):"1810–1817.
[6] 王小曼,"游一鳴,"韓夢琦,"等."基于機器學習模型對缺血性腦卒中住院期間死亡風險的預測[J]."現代預防醫學,"2024,"51(19):"3457–3462,"3482.
[7] 呂喆,"楊歡,"王耀輝,"等."基于機器學習的急性缺血性腦卒中靜脈溶栓后早期神經功能惡化預測模型的建立與評價[J]."中華危重病急救醫學,"2023,"35(9):"945–950.
[8] 張穿洋,"朱文莉,"李曉冉,"等."急性腦卒中預后預測模型:"機器學習與傳統回歸模型的比較[J]."中國CT和MRI雜志,"2023,"21(7):"24–26.
[9] BELTRAMIN"D,"LAMAS"E,"BOUSQUET"C."Ethical"issues"in"the"utilization"of"black"boxes"for"artificial"intelligence"in"medicine[J]."Stud"Health"Technol"Inform,"2022,"295:"249–252.
[10] FENG"R,"BADGELEY"M,"MOCCO"J,"et"al."Deep"learning"guided"stroke"management:"A"review"of"clinical"applications[J]."J"Neurointerv"Surg,"2018,"10(4):"358–362.
[11] MOHAPATRA"S,"LEE"T,"SAHOO"P"K,"et"al."Localization"of"early"infarction"on"non-contrast"CT"images"in"acute"ischemic"stroke"with"deep"learning"approach[J]."Sci"Rep,"2023,"13:"19442.
[12] YU"Y,"PARSI"B,"SPEIER"W,"et"al."LSTM"network"for"prediction"of"hemorrhagic"transformation"in"acute"stroke[M]//OURSELIN"S,"JOSKOWICZ"L,"SABUNCU"M"R,"et"al."Medical"Image"Computing"and"Computer"Assisted"Intervention"–"MICCAI"2019."Berlin:"Springer,"2019.
[13] 高浩."基于多模態數據融合的ICU患者風險預測方法研究[D]."鄭州:"鄭州大學,"2023.
[14] CAI"T,"NI"H,"YU"M,"et"al."DeepStroke:"An"efficient"stroke"screening"framework"for"emergency"rooms"with"multimodal"adversarial"deep"learning[J]."Med"Image"Anal,"2022,"80:"102522.
[15] LEE"T,"JEON"E"T,"JUNG"J"M,"et"al."Deep-learning-"based"stroke"screening"using"skeleton"data"from"neurological"examination"videos[J]."J"Pers"Med,"2022,"12(10):"1691.
[16] SHURRAB"S,"GUERRA-MANZANARES"A,"MAGID"A,"et"al."Multimodal"machine"learning"for"stroke"prognosis"and"diagnosis:"A"systematic"review[J]."IEEE"J"Biomed"Health"Inform,"2024,"28(11):"6958–6973.
[17] LIU"Y,"YU"Y,"OUYANG"J,"et"al."Functional"outcome"prediction"in"acute"ischemic"stroke"using"a"fused"imaging"and"clinical"deep"learning"model[J]."Stroke,"2023,"54(9):"2316–2327.
[18] MA"M,"WANG"M,"GAO"B,"et"al."Research"on"multimodal"fusion"of"temporal"electronic"medical"records[J]."Bioengineering,"2024,"11(1):"94.
[19] 姜博源."基于多模態磁共振影像的腦卒中最終梗死區預測系統研究[D]."杭州:"浙江大學,"2020.
[20] LIU"Y,"YU"Y,"OUYANG"J,"et"al."Prediction"of"ischemic"stroke"functional"outcomes"from"acute-phase"noncontrast"CT"and"clinical"information[J]."Radiology,"2024,"313(1):"e240137.
[21] LEE"M,"YEO"N,"AHN"H,"et"al."Prediction"of"post-stroke"cognitive"impairment"after"acute"ischemic"stroke"using"machine"learning[J]."Alz"Res"Ther,"2023,"15(1):"147.
[22] 王玥,"侯曉雯,"陳會生,"等."基于顱內斑塊影像組學聯合傳統標志物預測缺血性腦卒中復發風險[J]."磁共振成像,"2023,"14(8):"1–9.
[23] 沈展,"卞曉波,"黃鶯,"等."利用機器學習算法初步構建基于常規檢驗項目的腦卒中復發預測模型[J]."檢驗醫學,"2024,"39(12):"1190–1195.
[24] 羅梟,"程義,"吳騁,"等."預測重癥缺血性腦卒中死亡風險的模型:"基于內在可解釋性機器學習方法[J]."南方醫科大學學報,"2023,"43(7):"1241–1247.
[25] DAIDONE"M,"FERRANTELLI"S,"TUTTOLOMONDO"A."Machine"learning"applications"in"stroke"medicine:"Advancements,"challenges,"and"future"prospectives[J]."Neural"Regen"Res,"2024,"19(4):"769–773.
[26] OU"Z,"WANG"H,"ZHANG"B,"et"al."Early"identification"of"stroke"through"deep"learning"with"multi-modal"human"speech"and"movement"data[J]."Neural"Regen"Res,nbsp;2025,"20(1):"234–241.
[27] 黃莉,"區騰飛,"楊潔,"等."腦卒中后認知障礙預測模型的構建與驗證[J]."西安交通大學學報醫學版,"2023,"44(2):"214–220.
[28] GARG"R,"OH"E,"NAIDECH"A,"et"al."Automating"ischemic"stroke"subtype"classification"using"machine"learning"and"natural"language"processing[J]."J"Stroke"Cerebrovasc"Dis,"2019,"28(7):"2045–2051.
[29] Price"W"N,"Cohen"I"G."Privacy"in"the"age"of"medical"big"data[J]."Nature"Medicine,"2019,"25(1):"37–43.
[30] Zhou"T,"Canu"S,"Vera"P,"et"al."Feature-enhanced"generation"and"multi-modality"fusion"based"deep"neural"network"for"brain"tumor"segmentation"with"missing"MR"modalities[J]."Neurocomputing,"2021,"466:"102–112.
[31] WANG"M,"FAN"S,"LI"Y,"et"al."Robust"multi-modal"fusion"architecture"for"medical"data"with"knowledge"distillation[J]."Comput"Meth"Prog"Bio,"2025,"260:"108568.
[32] WANG"M,"FAN"S,"LI"Y,"et"al."Missing-modality"enabled"multimodal"fusion"architecture"for"medical"data[J]."J"Biomed"Inform,"2025,"163:"104796.
[33] Huang"Y,"Wang"M,"Zheng"Z,"et"al."Representation"of"time-varying"and"time-invariant"EMR"data"and"its"application"in"modeling"outcome"prediction"for"heart"failure"patients[J]."J"Biomed"Inform,"2023,"143:"104427.
(收稿日期:2025–02–17)
(修回日期:2025–05–16)