【摘要】 急性缺血性腦卒中(AIS)具有高致殘率、高病死率及高復(fù)發(fā)率等特點(diǎn),給患者及社會(huì)造成沉重的負(fù)擔(dān)。隨著大數(shù)據(jù)時(shí)代的到來,預(yù)測(cè)模型在患者的診治決策、預(yù)后管理以及衛(wèi)生資源配置等方面的應(yīng)用越來越多,其價(jià)值也愈發(fā)重要。機(jī)器學(xué)習(xí)方法是預(yù)測(cè)AIS患者預(yù)后的重要方法之一,且已廣泛應(yīng)用。本文以機(jī)器學(xué)習(xí)方法為重點(diǎn),就AIS預(yù)后預(yù)測(cè)研究的最新進(jìn)展予以綜述,并提出機(jī)器學(xué)習(xí)預(yù)測(cè)模型目前所面臨的問題與挑戰(zhàn),為AIS患者預(yù)后結(jié)局早期評(píng)估與預(yù)測(cè)在方法上提供新的思路和參考。
【關(guān)鍵詞】 缺血性卒中;預(yù)后預(yù)測(cè);機(jī)器學(xué)習(xí);預(yù)測(cè)模型;綜述
【中圖分類號(hào)】 R 743.3 【文獻(xiàn)標(biāo)識(shí)碼】 A DOI:10.12114/j.issn.1007-9572.2024.0090
Advances in the Prognostic Prediction of Acute Ischemic Stroke:Using Machine Learning Predictive Models as an Example
【Abstract】 Acute ischemic stroke(AIS)is characterized by high rates of disability,mortality,and recurrence,posing a significant burden on patients and society. In the era of big data,predictive models are increasingly used in patient diagnosis,treatment decisions,prognosis management,and healthcare resource allocation,highlighting their growing importance. Machine learning methods have become a crucial tool for predicting the prognosis of AIS patients and have been widely applied. This review explores recent advancements in the study of AIS prognosis prediction,focusing on machine learning methods. It discusses current issues and challenges faced by machine learning models,aiming to provide new insights and references for methods of early assessment and prediction of prognosis outcomes in AIS patients.
【Key words】 Ischemic stroke;Prognosis prediction;Machine learning;Prediction model;Review
腦卒中是全球第二大死亡原因和主要?dú)埣苍颍?],是全球范圍內(nèi)的重大健康問題。我國(guó)腦卒中的粗死亡率呈現(xiàn)持續(xù)上升的趨勢(shì),且上升速度遠(yuǎn)超其他國(guó)家[2]。急性缺血性腦卒中(AIS)是最常見的卒中類型,約占全部卒中的80%,具有高致殘率、高病死率及高復(fù)發(fā)率等特點(diǎn)[3],給患者及社會(huì)造成沉重的疾病負(fù)擔(dān)。因此,準(zhǔn)確預(yù)測(cè)AIS患者的預(yù)后,對(duì)臨床早期進(jìn)行個(gè)體化干預(yù)及康復(fù)治療有重要意義。隨著大數(shù)據(jù)時(shí)代的到來,醫(yī)療領(lǐng)域積累了海量的臨床數(shù)據(jù),傳統(tǒng)的預(yù)測(cè)方法已難以滿足臨床的需求,而機(jī)器學(xué)習(xí)(ML)方法在處理復(fù)雜數(shù)據(jù)上的優(yōu)勢(shì)已使其廣泛應(yīng)用于醫(yī)療衛(wèi)生領(lǐng)域[4]。本文以ML方法為重點(diǎn),就AIS預(yù)后預(yù)測(cè)研究的最新進(jìn)展予以綜述,以期為AIS患者預(yù)后結(jié)局早期評(píng)估與預(yù)測(cè)在方法上提供新的思路和參考。
1 文獻(xiàn)檢索策略
檢索PubMed、Web of Science、萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)、中國(guó)知網(wǎng)(CNKI)數(shù)據(jù)庫(kù),檢索時(shí)間設(shè)定為建庫(kù)至2023年12月,中文檢索詞包括“缺血性腦卒中”“預(yù)后預(yù)測(cè)”“機(jī)器學(xué)習(xí)”,英文檢索詞包括“acute ischemic stroke”“prognosis prediction”“machine learning”。納入標(biāo)準(zhǔn):文獻(xiàn)內(nèi)容涉及ML有關(guān)的AIS預(yù)后研究,以近3年發(fā)表的代表性文獻(xiàn)為主。排除標(biāo)準(zhǔn):與本文主題無(wú)關(guān)聯(lián)、無(wú)法獲得全文、質(zhì)量差的文獻(xiàn)。最終納入文獻(xiàn)60篇。
2 AIS預(yù)后研究
預(yù)后預(yù)測(cè)通常是指基于患者的臨床或非臨床特征,對(duì)其在特定時(shí)間內(nèi)發(fā)生特定健康狀況的風(fēng)險(xiǎn)和可能性進(jìn)行預(yù)測(cè)[5]。AIS預(yù)后預(yù)測(cè)研究則是指針對(duì)AIS患者進(jìn)行預(yù)后評(píng)估,以確定其功能結(jié)局與生存情況的研究,旨在識(shí)別與AIS不良預(yù)后結(jié)局相關(guān)的因素,并通過開發(fā)預(yù)測(cè)模型來及時(shí)發(fā)現(xiàn)存在不良功能結(jié)局的患者。AIS具有高致殘率、高病死率及高復(fù)發(fā)率等特點(diǎn)[3],而及時(shí)對(duì)AIS患者預(yù)后進(jìn)行預(yù)測(cè)有助于臨床醫(yī)生及時(shí)采取有針對(duì)性的治療措施,對(duì)各類可預(yù)防的危險(xiǎn)因素進(jìn)行干預(yù),促進(jìn)患者康復(fù)、減少預(yù)后不良發(fā)生。
預(yù)后預(yù)測(cè)研究通常包括變量選擇、模型構(gòu)建和模型驗(yàn)證這幾個(gè)步驟。其中,傳統(tǒng)的模型構(gòu)建方法多采用回歸分析方法,如Logistic回歸[6-7]。該方法簡(jiǎn)單易用、可解釋性強(qiáng),但也存在一定的局限性。使用回歸方法構(gòu)建預(yù)測(cè)模型通常受限于所納入變量數(shù)[8]、大規(guī)模數(shù)據(jù)處理能力、模型復(fù)雜度、難以捕捉預(yù)后因素之間的非線性關(guān)系[9]。這些不足將對(duì)變量的選擇、預(yù)測(cè)效果產(chǎn)生影響。隨著醫(yī)學(xué)領(lǐng)域大數(shù)據(jù)的不斷發(fā)展,臨床數(shù)據(jù)愈發(fā)復(fù)雜多樣,這更加促使研究者尋找新的預(yù)測(cè)研究方法,對(duì)臨床數(shù)據(jù)進(jìn)行充分利用。
此外,既往的AIS預(yù)后預(yù)測(cè)研究中常使用評(píng)分量表對(duì)患者預(yù)后進(jìn)行評(píng)估,如洛桑急性卒中登記分析(ASTRAL)評(píng)分、血管事件總體健康風(fēng)險(xiǎn)(THRIVE)評(píng)分以及缺血性卒中風(fēng)險(xiǎn)預(yù)測(cè)評(píng)分(IScore)等[10-11],這些評(píng)分量表在AIS預(yù)后預(yù)測(cè)中取得了一定的效果,但仍存在局限性[12]。首先,評(píng)分量表僅納入患者入院情況、既往病史等簡(jiǎn)單的指標(biāo),而對(duì)治療后的數(shù)據(jù)不再進(jìn)行收集,預(yù)測(cè)精度不夠。如THRIVE評(píng)分,其各指標(biāo)均為患者入院時(shí)的臨床數(shù)據(jù)組成,雖然獲取數(shù)據(jù)方便快捷,但卻缺少患者相應(yīng)的影像學(xué)評(píng)估和實(shí)驗(yàn)室檢查,這會(huì)在一定程度上降低該評(píng)分的預(yù)測(cè)效能。其次,AIS的預(yù)后與多種因素有關(guān),包括人口學(xué)特征、腦灌注情況、炎癥反應(yīng)、藥物作用等,這些變量共同影響著患者的預(yù)后,但評(píng)分量表無(wú)法解釋因素間的相互影響。
3 ML方法概述
ML是人工智能(AI)的一個(gè)分支,AI先驅(qū)ARTHUR SAMUEL將ML定義為一類無(wú)須明確編程就可以賦予計(jì)算機(jī)自主學(xué)習(xí)能力方法的總稱[13]。ML旨在探索數(shù)據(jù)統(tǒng)計(jì)分析與計(jì)算機(jī)算法的交集[14],通過從海量的數(shù)據(jù)中學(xué)習(xí)并提取出其中的規(guī)律,其可以產(chǎn)生可靠且可重復(fù)的決策,特別是在分類、回歸、聚類等與高維數(shù)據(jù)相關(guān)的任務(wù)中表現(xiàn)出良好的適用性[15]。
ML在醫(yī)學(xué)領(lǐng)域的應(yīng)用主要在以下幾方面:(1)疾病發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)。ML算法通過學(xué)習(xí)患者的臨床檢測(cè)數(shù)據(jù)對(duì)疾病的發(fā)生風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),不僅可以幫助醫(yī)生對(duì)疾病進(jìn)行提前干預(yù)和治療,減少患者患病風(fēng)險(xiǎn),同時(shí)有助于降低醫(yī)療成本,對(duì)疾病的防控具有重要意義[16-18]。(2)輔助診斷。ML可以實(shí)現(xiàn)臨床檢驗(yàn)結(jié)果解讀的自動(dòng)化,有助于節(jié)省時(shí)間,還能夠有效提高診斷準(zhǔn)確率,具有便捷、可重復(fù)等優(yōu)勢(shì),已廣泛用于臨床疾病的輔助診斷[19-21]。(3)預(yù)后評(píng)估。ML可對(duì)患者預(yù)后進(jìn)行早期預(yù)測(cè),有助于臨床采取個(gè)體化治療干預(yù)措施,減少患者預(yù)后不良的發(fā)生,提高患者的生存率及生存質(zhì)量[22-23]。
4 ML方法在AIS預(yù)后預(yù)測(cè)中的應(yīng)用
ML算法可從大量開放特征中有效地識(shí)別出與結(jié)果高度相關(guān)的特征,且有諸多參數(shù)可以進(jìn)行配置優(yōu)化,在處理高維數(shù)據(jù)和識(shí)別變量之間復(fù)雜相互作用方面表現(xiàn)出色[24]。多個(gè)研究顯示,ML方法較傳統(tǒng)預(yù)測(cè)模型相比有更好的預(yù)測(cè)效果。極端梯度提升(XGBoost)是一種樹提升集成算法,其通過優(yōu)化決策樹算法以改進(jìn)對(duì)數(shù)據(jù)集的處理,可通過正則化和內(nèi)置交叉驗(yàn)證來提高精度,有效解決過擬合的問題[25]。TONG等[26]使用了XGBoost模型與傳統(tǒng)Logistic模型預(yù)測(cè)AIS患者預(yù)后,發(fā)現(xiàn)XGBoost模型具有更佳的預(yù)測(cè)性能。人工神經(jīng)網(wǎng)絡(luò)(ANN)是模擬人腦神經(jīng)元結(jié)構(gòu)之間的信號(hào)傳導(dǎo)方式以進(jìn)行信息分析處理的ML算法,其由相互連接的處理單元組成,包括輸入層、隱藏層和輸出層,通過這種復(fù)雜的信號(hào)通路結(jié)構(gòu)來分析數(shù)據(jù)之間的內(nèi)在關(guān)系[27]。而深度神經(jīng)網(wǎng)絡(luò)模型(DNN)是ANN更深層次的應(yīng)用,其從分層結(jié)構(gòu)中受益,可以在更高層的隱藏層中重用在給定隱藏層中計(jì)算的特征,提高在固定參數(shù)預(yù)算上近似函數(shù)的精度,并且可以在學(xué)習(xí)新示例后提高泛化能力[28]。HEO等[29]使用DNN對(duì)AIS患者預(yù)后進(jìn)行預(yù)測(cè),并將其與ASTRAL評(píng)分進(jìn)行比較,結(jié)果顯示DNN的預(yù)測(cè)能力顯著高于ASTRAL評(píng)分,表明ML模型在預(yù)測(cè)AIS患者的長(zhǎng)期結(jié)果方面具有更加出色的性能。類似地,其他ML模型在AIS預(yù)后預(yù)測(cè)方面展現(xiàn)出較好的預(yù)測(cè)性能。JIANG等[30]利用多個(gè)臨床和影像學(xué)特征構(gòu)建ML模型,并將該模型與美國(guó)國(guó)立衛(wèi)生研究院卒中量表(SPAN-100)指數(shù)模型進(jìn)行比較,發(fā)現(xiàn)使用ML模型能夠?qū)IS患者預(yù)后進(jìn)行更準(zhǔn)確的預(yù)測(cè)。SPAN-100指數(shù)已被證明能夠預(yù)測(cè)患者預(yù)后以及血管治療后的并發(fā)癥風(fēng)險(xiǎn),但其主要的局限性是不適用于年輕患者,而該研究中的ML模型克服了這一局限,其適用于18歲以上的任何AIS患者,擴(kuò)大了適用范圍。此外,常用的ML方法還有支持向量機(jī)(SVM)[31]、隨機(jī)森林(RF)[32]、深度學(xué)習(xí)[33-34]等,這些ML的方法在AIS預(yù)后預(yù)測(cè)方面發(fā)揮了重要作用。
4.1 ML方法預(yù)測(cè)AIS功能結(jié)局
30%~70%的腦卒中幸存者處于殘疾狀態(tài),這會(huì)直接或間接影響AIS患者的生活質(zhì)量[35]。早期識(shí)別AIS患者的不良功能結(jié)局,并及時(shí)進(jìn)行干預(yù)和治療,可有效降低殘疾負(fù)擔(dān),提高患者的生活質(zhì)量。使用ML的方法對(duì)AIS患者功能預(yù)后進(jìn)行預(yù)測(cè)已被研究者所重視。PARK等[36]使用多種ML模型預(yù)測(cè)AIS后3個(gè)月功能結(jié)局,其中SVM模型的受試者工作特征曲線下面積(AUC)為0.850,F(xiàn)1得分最高為0.860,預(yù)測(cè)性能較好。該研究所提出的模型是基于入院時(shí)的初步評(píng)估和檢查結(jié)果建立的,能夠在住院后短時(shí)間內(nèi)對(duì)患者的預(yù)后進(jìn)行預(yù)測(cè),但缺少入院后更詳細(xì)的臨床數(shù)據(jù),可能會(huì)對(duì)模型的性能產(chǎn)生一定的影響。而JO等[37]在一項(xiàng)回顧性研究中,分別采用臨床模型、結(jié)合了影像學(xué)特征的卷積神經(jīng)網(wǎng)絡(luò)模型以及結(jié)合了影像和臨床特征的集成模型對(duì)AIS患者3個(gè)月的功能結(jié)局進(jìn)行預(yù)測(cè)。結(jié)果顯示,集成模型具有更優(yōu)的預(yù)測(cè)性能,同時(shí)指出患者年齡、NIHSS評(píng)分以及早期神經(jīng)系統(tǒng)惡化情況是影響AIS功能結(jié)局的影響因素。OZKARA等[38]基于臨床、實(shí)驗(yàn)室和影像學(xué)數(shù)據(jù)構(gòu)建ML模型,對(duì)伴有近端大腦中動(dòng)脈閉塞的AIS患者的短期和中期功能結(jié)果進(jìn)行預(yù)測(cè),結(jié)果顯示,梯度提升決策樹(LightGBM)模型預(yù)測(cè)效能最佳,AUC為0.958。此外,有研究發(fā)現(xiàn)與傳統(tǒng)預(yù)測(cè)模型休斯敦動(dòng)脈內(nèi)再通治療(HIAT)評(píng)分、THRIVE評(píng)分和NADE列線圖相比,RF模型在預(yù)測(cè)AIS患者6個(gè)月功能結(jié)局時(shí)具有更好的預(yù)測(cè)性能[39]。LEE等[40]研究指出,XGBoost模型在預(yù)測(cè)AIS后3個(gè)月功能結(jié)局時(shí)表現(xiàn)出最佳性能,同時(shí)指出預(yù)測(cè)功能結(jié)局的關(guān)鍵因子是初始NIHSS評(píng)分、早期神經(jīng)功能惡化、年齡和白細(xì)胞計(jì)數(shù)。然而,目前有關(guān)AIS后功能結(jié)局的研究大多數(shù)局限于短期預(yù)測(cè),未來的研究應(yīng)多關(guān)注患者長(zhǎng)期的功能預(yù)后情況,以及時(shí)識(shí)別具有不良功能結(jié)局高風(fēng)險(xiǎn)的患者。
4.2 ML方法預(yù)測(cè)AIS死亡風(fēng)險(xiǎn)
腦卒中現(xiàn)已成為位居我國(guó)農(nóng)村居民第2位、城市居民第3位的死亡病因,為國(guó)家和社會(huì)帶來了沉重的疾病負(fù)擔(dān)[41]。WANG等[42]開發(fā)多種ML預(yù)測(cè)模型對(duì)AIS患者1年內(nèi)死亡風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),研究發(fā)現(xiàn),XGBoost模型的預(yù)測(cè)性能最出色,C反應(yīng)蛋白(CRP)、同型半胱氨酸(Hcy)水平、腦卒中嚴(yán)重程度和腦卒中病灶數(shù)是AIS患者1年內(nèi)死亡的獨(dú)立影響因素。同樣的,在另一項(xiàng)基于臨床、影像學(xué)和生物標(biāo)志物數(shù)據(jù)構(gòu)建神經(jīng)網(wǎng)絡(luò)模型對(duì)卒中后1年死亡率進(jìn)行預(yù)測(cè)的研究中,該模型預(yù)測(cè)性能良好,并指出免疫炎癥因子(白介素6、腫瘤壞死因子α、白介素10、轉(zhuǎn)化生長(zhǎng)因子β等)和凝血生物標(biāo)志物(凝血因子Ⅷ、血管性血友病因子和纖維蛋白原等)可作為AIS后1年死亡率的預(yù)測(cè)因子,有助于提高模型預(yù)測(cè)性能[43],這為臨床相關(guān)指標(biāo)和治療方案的制訂提供了一定參考依據(jù)。此外,在AIS亞型中,小血管閉塞型(SVO)在接受抗凝治療時(shí)比其他亞型具有更高的死亡風(fēng)險(xiǎn),ZHANG等[44]通過構(gòu)建具有典型血液特征的ML模型來對(duì)AIS患者進(jìn)行早期病因?qū)W診斷,結(jié)果顯示ML模型在AIS分型診斷中效果良好,其中用于SVO亞型病因?qū)W診斷的ML模型,AUC達(dá)0.780,有助于早期識(shí)別AIS亞型并給予針對(duì)性的治療方案以降低死亡風(fēng)險(xiǎn)。
4.3 ML方法預(yù)測(cè)卒中患者復(fù)發(fā)風(fēng)險(xiǎn)
腦卒中具有高復(fù)發(fā)性的特點(diǎn),全球卒中終生風(fēng)險(xiǎn)約為25%[45]。識(shí)別AIS高危復(fù)發(fā)人群,并及時(shí)進(jìn)行診斷和治療,有助于降低患者的殘疾率和死亡率,提高患者生活質(zhì)量。ML的方法有助于對(duì)AIS復(fù)發(fā)高危人群進(jìn)行預(yù)測(cè)。WANG等[8]通過建立ML預(yù)測(cè)模型來對(duì)AIS患者1年內(nèi)卒中復(fù)發(fā)風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),結(jié)果發(fā)現(xiàn),RF模型預(yù)測(cè)性能最佳,AUC為0.946。同時(shí),研究發(fā)現(xiàn)右半球偏側(cè)性、Hcy、CRP水平和腦卒中嚴(yán)重程度是AIS患者腦卒中復(fù)發(fā)的獨(dú)立危險(xiǎn)因素。此外,在一項(xiàng)回顧性研究中,研究人員基于無(wú)監(jiān)督高斯混合模型,利用92種不同來源的生物標(biāo)志物(包括血液成分、凝血功能、肝腎功能、炎癥因子等)將AIS患者分為4種具有不同特征的臨床表型,結(jié)果發(fā)現(xiàn),以炎癥和腎功能異常為特征的表型2具有最高的卒中復(fù)發(fā)風(fēng)險(xiǎn)[46]。該ML模型有助于識(shí)別AIS后復(fù)發(fā)風(fēng)險(xiǎn)較高的患者,為其提供個(gè)體化的治療方案。MA等[47]通過構(gòu)建RF模型來識(shí)別具有高復(fù)發(fā)風(fēng)險(xiǎn)的AIS患者,發(fā)現(xiàn)在引入血漿苯乙酰谷氨酰胺(PAGln)水平后,RF模型的AUC從0.949提高到0.980,具有較好的預(yù)測(cè)性能,同時(shí)指出納入PAGln變量的ML模型可以更有效地預(yù)測(cè)卒中患者復(fù)發(fā)風(fēng)險(xiǎn),并強(qiáng)調(diào)了該生物標(biāo)志物在預(yù)測(cè)卒中復(fù)發(fā)風(fēng)險(xiǎn)中的重要性。
4.4 ML方法預(yù)測(cè)AIS相關(guān)并發(fā)癥
AIS的多種并發(fā)癥如出血性轉(zhuǎn)化(HT)、卒中后認(rèn)知障礙(PSCI)等與其不良預(yù)后密切相關(guān)。對(duì)AIS后并發(fā)癥發(fā)生風(fēng)險(xiǎn)進(jìn)行合理及時(shí)的預(yù)測(cè)評(píng)估,有助于選擇適宜的預(yù)防及治療方法,從而改善AIS患者的預(yù)后情況。目前,已有多種ML方法用于AIS患者并發(fā)癥預(yù)測(cè),且預(yù)測(cè)效果顯著。CHOI等[48]使用SVM、XGBoost和ANN等ML方法預(yù)測(cè)AIS患者HT,其中ANN算法在預(yù)測(cè)HT發(fā)生方面表現(xiàn)最好。但該研究?jī)H使用患者的臨床數(shù)據(jù)進(jìn)行預(yù)測(cè),缺少影像學(xué)數(shù)據(jù)的分析,存在局限性。而在REN等[49]一項(xiàng)預(yù)測(cè)經(jīng)過靜脈溶栓治療后AIS患者發(fā)生HT的風(fēng)險(xiǎn)研究中,開發(fā)了基于臨床數(shù)據(jù)、影像組學(xué)和臨床影像組學(xué)相結(jié)合的ML模型,結(jié)果顯示,臨床影像組學(xué)相結(jié)合的ML模型的性能高于單純的臨床模型和影像組學(xué)模型。研究指出將臨床數(shù)據(jù)與影像組學(xué)進(jìn)行結(jié)合可提高AIS后HT的風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確性。此外,LEE等[50]使用ML方法預(yù)測(cè)AIS后的PSCI,發(fā)現(xiàn)XGBoost模型的預(yù)測(cè)性能最好,AUC為0.792,準(zhǔn)確性達(dá)79.6%,有利于在早期階段及時(shí)采取措施診斷和改善患者認(rèn)知狀態(tài)。JI等[51]采用ML算法來預(yù)測(cè)AIS后3~6個(gè)月內(nèi)PSCI的發(fā)生,并識(shí)別與之有關(guān)的關(guān)鍵因素,研究發(fā)現(xiàn)高斯樸素貝葉斯模型預(yù)測(cè)性能最佳,在測(cè)試集中的AUC為0.919,同時(shí)確定了年齡、受教育程度、NIHSS評(píng)分、腦蛋白變性、Hcy和CRP為PSCI發(fā)生的重要預(yù)測(cè)因子。然而,目前關(guān)于PSCI的預(yù)測(cè)研究具有一個(gè)普遍的局限性,即只是對(duì)患者短期內(nèi)的PSCI發(fā)生風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),而無(wú)法評(píng)估這些患者在6個(gè)月后的認(rèn)知表現(xiàn)。未來的研究應(yīng)擴(kuò)大預(yù)測(cè)的時(shí)間跨度,為患者長(zhǎng)期的認(rèn)知表現(xiàn)提供可靠的預(yù)測(cè)手段。
5 目前研究所面臨的問題與挑戰(zhàn)
盡管ML方法在AIS預(yù)后預(yù)測(cè)具備一定的優(yōu)勢(shì),但其在臨床實(shí)踐、轉(zhuǎn)化上仍面臨著諸多問題與挑戰(zhàn)。
5.1 預(yù)后預(yù)測(cè)普遍存在的問題
隨著大數(shù)據(jù)時(shí)代的到來,可獲得的醫(yī)學(xué)數(shù)據(jù)的規(guī)模和特征的維度急劇增加,因此對(duì)數(shù)據(jù)分析方法提出了更高的要求[52]。然而,對(duì)于腦卒中患者復(fù)發(fā)、死亡的預(yù)測(cè)研究很多沒有考慮生存時(shí)間,或有違背等比例風(fēng)險(xiǎn)的情況存在。ML方法對(duì)于數(shù)據(jù)分布的限制少,在處理大數(shù)據(jù)方面有著獨(dú)特的優(yōu)勢(shì),因此,采用ML模型進(jìn)行生存分析研究是一種可行的方法。此外,目前的研究多使用某一時(shí)刻的數(shù)據(jù),忽視了變量之間的因果關(guān)系和時(shí)間演進(jìn)與疾病變化的規(guī)律。對(duì)于腦卒中預(yù)后預(yù)測(cè)研究,使用ML方法進(jìn)行動(dòng)態(tài)預(yù)測(cè)具有重要價(jià)值。
5.2 ML方法可解釋性不足
在目前的ML應(yīng)用過程中,大多數(shù)研究主要關(guān)注于預(yù)測(cè)準(zhǔn)確性,對(duì)于結(jié)合具體數(shù)據(jù)進(jìn)行解釋的研究卻相對(duì)不足。由于ML模型的復(fù)雜性,用于產(chǎn)生最終輸出的過程常缺乏透明度,模型結(jié)果通常難以解釋[53-54]。在臨床應(yīng)用中,ML模型通常只在一個(gè)狹窄的環(huán)境中針對(duì)特定的疾病進(jìn)行訓(xùn)練和評(píng)估,依賴研究者個(gè)人的統(tǒng)計(jì)學(xué)和ML專業(yè)技術(shù)知識(shí)。為了便于醫(yī)療工作者理解并使用模型進(jìn)行預(yù)測(cè),進(jìn)一步對(duì)高度復(fù)雜的預(yù)測(cè)模型進(jìn)行解釋是必要的[55]。ML的可解釋性與實(shí)現(xiàn)高預(yù)測(cè)準(zhǔn)確性同樣重要[56],未來的ML應(yīng)重點(diǎn)發(fā)展提高臨床決策可解釋性的方法。
5.3 數(shù)據(jù)質(zhì)量良莠不齊,標(biāo)準(zhǔn)化存在困難
高質(zhì)量、大規(guī)模、多樣化的數(shù)據(jù)集是ML模型成功的關(guān)鍵[57]。醫(yī)療數(shù)據(jù)的質(zhì)量問題主要表現(xiàn)在數(shù)據(jù)不精確、異常值、不完整、孤立的數(shù)據(jù)記錄以及過時(shí)等方面[58]。同時(shí),各醫(yī)療機(jī)構(gòu)和體系間的數(shù)據(jù)互聯(lián)互通程度較低[59]。但目前數(shù)據(jù)的獲取、管理與應(yīng)用尚未有標(biāo)準(zhǔn)的規(guī)范與專家共識(shí),同時(shí)受制于患者依從性、隱私和研究保護(hù)政策的影響,難以保障數(shù)據(jù)的同質(zhì)化和完整性。這更加需要各部門協(xié)調(diào)合作,構(gòu)建醫(yī)療數(shù)據(jù)質(zhì)量治理體系,提高數(shù)據(jù)質(zhì)量、促進(jìn)數(shù)據(jù)共享。
5.4 最佳ML模型的選擇存在困難
腦卒中預(yù)后相關(guān)數(shù)據(jù)多是不平衡數(shù)據(jù),而具有數(shù)據(jù)平衡技術(shù)的ML方法是處理不平衡數(shù)據(jù)的有效工具[60]。然而,ML模型的性能部分取決于輸入數(shù)據(jù)與模型的適配性,不同類型算法所納入的數(shù)據(jù)不同,應(yīng)用場(chǎng)景也有較大差異,并沒有統(tǒng)一的標(biāo)準(zhǔn)說明何種算法的分類效果更佳。此外,由于患者個(gè)體差異和臨床癥狀不同,不同ML算法對(duì)腦卒中的結(jié)局預(yù)測(cè)也不盡相同,構(gòu)建能夠準(zhǔn)確反映每個(gè)患者獨(dú)特情況的模型是一大挑戰(zhàn)。未來的研究需要統(tǒng)一ML算法的數(shù)據(jù)納入標(biāo)準(zhǔn)和規(guī)范應(yīng)用場(chǎng)景,增強(qiáng)模型的泛化能力,使其能夠適用于不同的患者群體和醫(yī)療環(huán)境。
6 小結(jié)與展望
AIS患者的預(yù)后預(yù)測(cè)對(duì)于幫助臨床決策、提升護(hù)理質(zhì)量、優(yōu)化資源利用、加強(qiáng)醫(yī)患溝通均具有重要意義。隨著ML和AI技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用不斷深入,通過結(jié)合來自不同來源的數(shù)據(jù),如影像組學(xué)、生物標(biāo)志物和電子病歷等,綜合利用多模態(tài)數(shù)據(jù)的方法能夠更好地捕捉腦卒中患者的復(fù)雜生物學(xué)特征和臨床表現(xiàn),進(jìn)而提供更全面的預(yù)后預(yù)測(cè)。預(yù)計(jì)ML在AIS患者預(yù)后預(yù)測(cè)研究將在多模態(tài)數(shù)據(jù)的融合、模型解釋性的提升、實(shí)時(shí)動(dòng)態(tài)預(yù)后監(jiān)測(cè)、個(gè)體化預(yù)后預(yù)測(cè)等方面取得顯著進(jìn)步。
參考文獻(xiàn)
GBD Neurology Collaborators. Global,regional,and national burden of neurological disorders,1990-2016:a systematic analysis for the Global Burden of Disease Study 2016[J]. Lancet Neurol,2019,18(5):459-480. DOI:10.1016/S1474-4422(18)30499-X.
王擁軍,李子孝,谷鴻秋,等. 中國(guó)卒中報(bào)告2020(中文版)(1)[J]. 中國(guó)卒中雜志,2022,17(5):433-447. DOI:10.3969/j.issn.1673-5765.2022.05.001.
HANKEY G J. Stroke [J]. Lancet,2017,389(10069):641-654. DOI:10.1016/S0140-6736(16)30962-X.
HANDELMAN G S,KOK H K,CHANDRA R V,et al. eDoctor:machine learning and the future of medicine[J]. J Intern Med,2018,284(6):603-619. DOI:10.1111/joim.12822.
MOONS K G M,ROYSTON P,VERGOUWE Y,et al. Prognosis and prognostic research:what,why,and how?[J]. BMJ,2009,338:b375. DOI:10.1136/bmj.b375.
GONG P Y,LIU Y K,GONG Y C,et al. The association of neutrophil to lymphocyte ratio,platelet to lymphocyte ratio,and lymphocyte to monocyte ratio with post-thrombolysis early neurological outcomes in patients with acute ischemic stroke[J]. J Neuroinflammation,2021,18(1):51. DOI:10.1186/s12974-021-02090-6.
FAINARDI E,BUSTO G,ROSI A,et al. Tmax volumes predict final infarct size and functional outcome in ischemic stroke patients receiving endovascular treatment[J]. Ann Neurol,2022,91(6):878-888. DOI:10.1002/ana.26354.
WANG K,SHI Q Q,SUN C,et al. A machine learning model for visualization and dynamic clinical prediction of stroke recurrence in acute ischemic stroke patients:a real-world retrospective study[J]. Front Neurosci,2023,17:1130831. DOI:10.3389/fnins.2023.1130831.
TONG L,SUN Y,ZHU Y Q,et al. Prognostic estimation for acute ischemic stroke patients undergoing mechanical thrombectomy within an extended therapeutic window using an interpretable machine learning model[J]. Front Neuroinform,2023,17:1273827. DOI:10.3389/fninf.2023.1273827.
SHEN B,YANG X,SUI R B,et al. The prognostic value of the THRIVE score,the iScore score and the ASTRAL score in Chinese patients with acute ischemic stroke[J]. J Stroke Cerebrovasc Dis,2018,27(10):2877-2886. DOI:10.1016/j.jstrokecerebrovasdis.2018.06.011.
COORAY C,MAZYA M,BOTTAI M,et al. External validation of the ASTRAL and DRAGON scores for prediction of functional outcome in stroke[J]. Stroke,2016,47(6):1493-1499. DOI:10.1161/STROKEAHA.116.012802.
DROZDOWSKA B A,SINGH S,QUINN T J. Thinking about the future:a review of prognostic scales used in acute stroke[J]. Front Neurol,2019,10:274. DOI:10.3389/fneur.2019.00274.
BA?TANLAR Y,OZUYSAL M. Introduction to machine learning[J]. Methods Mol Biol,2014,1107:105-128. DOI:10.1007/978-1-62703-748-8_7.
OBERMEYER Z,EMANUEL E J. Predicting the future - big data,machine learning,and clinical medicine[J]. N Engl J Med,2016,375(13):1216-1219. DOI:10.1056/NEJMp1606181.
JANIESCH C,ZSCHECH P,HEINRICH K. Machine learning and deep learning[J]. Electron Mark,2021,31(3):685-695. DOI:10.1007/s12525-021-00475-2.
KOBAYASHI M,HUTTIN O,MAGNUSSON M,et al. Machine learning-derived echocardiographic phenotypes PredictHeartFailure incidence in asymptomatic individuals[J]. JACC Cardiovasc Imaging,2022,15(2):193-208. DOI:10.1016/j.jcmg.2021.07.004.
SHAO H,SHI L Z,F(xiàn)ONSECA V. Comment on segar et Al. machine learning to predict the risk of incident heart failure hospitalization among patients with diabetes:the WATCH-DM risk score. diabetes care 2019;42:2298-2306[J]. Diabetes Care,2020,43(2):e25. DOI:10.2337/dc19-1891.
SEGAR M W,JAEGER B C,PATEL K V,et al. Development and validation of machine learning-based race-specific models to predict 10-year risk of heart failure:a multicohort analysis[J]. Circulation,2021,143(24):2370-2383. DOI:10.1161/CIRCULATIONAHA.120.053134.
KASHOU A H,MEDINA-INOJOSA J R,NOSEWORTHY P A,et al. Artificial intelligence-augmented electrocardiogram detection of left ventricular systolic dysfunction in the general population[J]. Mayo Clin Proc,2021,96(10):2576-2586. DOI:10.1016/j.mayocp.2021.02.029.
BRATT A,KIM J,POLLIE M,et al. Machine learning derived segmentation of phase velocity encoded cardiovascular magnetic resonance for fully automated aortic flow quantification[J]. J Cardiovasc Magn Reson,2019,21(1):1. DOI:10.1186/s12968-018-0509-0.
YANG F F,CHEN X T,LIN X X,et al. Automated analysis of Doppler echocardiographic videos as a screening tool for valvular heart diseases[J]. JACC Cardiovasc Imaging,2022,15(4):551-563. DOI:10.1016/j.jcmg.2021.08.015.
DEBAUN M R,CHAVEZ G,F(xiàn)ITHIAN A,et al. Artificial neural networks predict 30-day mortality after hip fracture:insights from machine learning[J]. J Am Acad Orthop Surg,2021,29(22):977-983. DOI:10.5435/JAAOS-D-20-00429.
JU C S,ZHOU J D,LEE S R,et al. Derivation of an electronic frailty index for predicting short-term mortality in heart failure:a machine learning approach[J]. ESC Heart Fail,2021,8(4):2837-2845. DOI:10.1002/ehf2.13358.
OBERMEYER Z,EMANUEL E J. Predicting the future - big data,machine learning,and clinical medicine[J]. N Engl J Med,2016,375(13):1216-1219. DOI:10.1056/NEJMp1606181.
WANG X Y,LYU J H,MENG Z H,et al. Small vessel disease burden predicts functional outcomes in patients with acute ischemic stroke using machine learning[J]. CNS Neurosci Ther,2023,
29(4):1024-1033. DOI:10.1111/cns.14071.
TONG L,SUN Y,ZHU Y Q,et al. Prognostic estimation for acute ischemic stroke patients undergoing mechanical thrombectomy within an extended therapeutic window using an interpretable machine learning model[J]. Front Neuroinform,2023,17:1273827. DOI:10.3389/fninf.2023.1273827.
BI Q,GOODMAN K E,KAMINSKY J,et al. What is machine learning? A primer for the epidemiologist[J]. Am J Epidemiol,2019,188(12):2222-2239. DOI:10.1093/aje/kwz189.
KRIEGESKORTE N,GOLAN T. Neural network models and deep learning[J]. Curr Biol,2019,29(7):R231-236. DOI:10.1016/j.cub.2019.02.034.
HEO J,YOON J G,PARK H,et al. Machine learning-based model for prediction of outcomes in acute stroke[J]. Stroke,2019,50(5):1263-1265. DOI:10.1161/STROKEAHA.118.024293.
JIANG B,ZHU G,XIE Y,et al. Prediction of clinical outcome in patients with large-vessel acute ischemic stroke:performance of machine learning versus SPAN-100[J]. AJNR Am J Neuroradiol,2021,42(2):240-246. DOI:10.3174/ajnr.A6918.
TEKKE?IN A ?. Artificial intelligence in healthcare:past,present and future[J]. Anatol J Cardiol,2019,22(Suppl 2):8-9. DOI:10.14744/AnatolJCardiol.2019.28661.
BADILLO S,BANFAI B,BIRZELE F,et al. An introduction to machine learning[J]. Clin Pharmacol Ther,2020,107(4):871-885. DOI:10.1002/cpt.1796.
YANN L,YOSHUA B,GEOFFREY H. Deep learning[J].Nature,2015,521(7553):436-444. DOI:10.1038/nature14539
GREENER J G,KANDATHIL S M,MOFFAT L,et al. A guide to machine learning for biologists[J]. Nat Rev Mol Cell Biol,2022,23:40-55. DOI:10.1038/s41580-021-00407-0.
YANG Y,SHI Y Z,ZHANG N,et al. The disability rate of 5-year post-stroke and its correlation factors:a national survey in China[J]. PLoS One,2016,11(11):e0165341. DOI:10.1371/journal.pone.0165341.
PARK D,JEONG E,KIM H,et al. Machine learning-based three-month outcome prediction in acute ischemic stroke:a single cerebrovascular-specialty hospital study in South Korea[J]. Diagnostics,2021,11(10):1909. DOI:10.3390/diagnostics11101909.
JO H,KIM C,GWON D,et al. Combining clinical and imaging data for predicting functional outcomes after acute ischemic stroke:an automated machine learning approach[J]. Sci Rep,2023,13(1):16926. DOI:10.1038/s41598-023-44201-8.
OZKARA B B,KARABACAK M,HAMAM O,et al. Prediction of functional outcome in stroke patients with proximal middle cerebral artery occlusions using machine learning models[J]. J Clin Med,2023,12(3):839. DOI:10.3390/jcm12030839.
LI X,PAN X D,JIANG C L,et al. Predicting 6-month unfavorable outcome of acute ischemic stroke using machine learning[J]. Front Neurol,2020,11:539509. DOI:10.3389/fneur.2020.539509.
LEE J,PARK K M,PARK S. Interpretable machine learning for prediction of clinical outcomes in acute ischemic stroke[J]. Front Neurol,2023,14:1234046. DOI:10.3389/fneur.2023.1234046.
《中國(guó)腦卒中防治報(bào)告2021》編寫組,王隴德.《中國(guó)腦卒中防治報(bào)告2021》概要[J]. 中國(guó)腦血管病雜志,2023,
20(11):783-793.
WANG K,GU L Y,LIU W C,et al. The predictors of death within 1 year in acute ischemic stroke patients based on machine learning[J]. Front Neurol,2023,14:1092534. DOI:10.3389/fneur.2023.1092534.
LEHMANN A L C F,ALFIERI D F,DE ARAúJO M C M,
et al. Immune-inflammatory,coagulation,adhesion,and imaging biomarkers combined in machine learning models improve the prediction of death 1year after ischemic stroke[J]. Clin Exp Med,2022,22(1):111-123. DOI:10.1007/s10238-021-00732-w.
ZHANG J,YUAN T,WEI S X,et al. New strategy for clinical etiologic diagnosis of acute ischemic stroke and blood biomarker discovery based on machine learning[J]. RSC Adv,2022,
12(23):14716-14723. DOI:10.1039/d2ra02022j.
GBD Lifetime Risk of Stroke Collaborators,F(xiàn)EIGIN V L,NGUYEN G,et al. Global,regional,and country-specific lifetime risks of stroke,1990 and 2016[J]. N Engl J Med,2018,
379(25):2429-2437. DOI:10.1056/NEJMoa1804492.
DING L L,MANE R,WU Z Z,et al. Data-driven clustering approach to identify novel phenotypes using multiple biomarkers in acute ischaemic stroke:a retrospective,multicentre cohort study[J]. EClinicalMedicine,2022,53:101639. DOI:10.1016/j.eclinm.2022.101639.
MA L,F(xiàn)U G P,LIU R R,et al. Phenylacetyl glutamine:a novel biomarker for stroke recurrence warning[J]. BMC Neurol,2023,23(1):74. DOI:10.1186/s12883-023-03118-5.
CHOI J M,SEO S Y,KIM P J,et al. Prediction of hemorrhagic transformation after ischemic stroke using machine learning[J].
J Pers Med,2021,11(9):863. DOI:10.3390/jpm11090863.
REN H H,SONG H J,WANG J J,et al. A clinical-radiomics model based on noncontrast computed tomography to predict hemorrhagic transformation after stroke by machine learning:
a multicenter study[J]. Insights Imaging,2023,14(1):52. DOI:10.1186/s13244-023-01399-5.
LEE M,YEO N Y,AHN H J,et al. Prediction of post-stroke cognitive impairment after acute ischemic stroke using machine learning[J]. Alzheimers Res Ther,2023,15(1):147. DOI:10.1186/s13195-023-01289-4.
JI W C,WANG C J,CHEN H Q,et al. Predicting post-stroke cognitive impairment using machine learning:a prospective cohort study[J]. J Stroke Cerebrovasc Dis,2023,32(11):107354. DOI:10.1016/j.jstrokecerebrovasdis.2023.107354.
RAJPURKAR P,CHEN E,BANERJEE O,et al. AI in health and medicine[J]. Nat Med,2022,28(1):31-38. DOI:10.1038/s41591-021-01614-0.
BELTRAMIN D,LAMAS E,BOUSQUET C. Ethical issues in the utilization of black boxes for artificial intelligence in medicine[J]. Stud Health Technol Inform,2022,295:249-252. DOI:10.3233/SHTI220709.
REYES M,MEIER R,PEREIRA S,et al. On the interpretability of artificial intelligence in radiology:challenges and opportunities[J]. Radiol Artif Intell,2020,2(3):e190043. DOI:10.1148/ryai.2020190043.
楊豐春,鄭思,李姣. 可解釋機(jī)器學(xué)習(xí)方法在疾病預(yù)測(cè)中的應(yīng)用:膿毒血癥患者死亡風(fēng)險(xiǎn)研究[J]. 首都醫(yī)科大學(xué)學(xué)報(bào),2022,43(4):610-617. DOI:10.3969/j.issn.1006-7795.2022.04.015.
LUNDBERG S M,ERION G,CHEN H,et al. From local explanations to global understanding with explainable AI for trees[J]. Nat Mach Intell,2020,2(1):56-67. DOI:10.1038/s42256-019-0138-9.
HAGENDORFF T. Linking human and machine behavior:a new approach to evaluate training data quality for beneficial machine learning[J]. Minds Mach,2021,31(4):563-593. DOI:10.1007/s11023-021-09573-8.
WANG M Y,LI S Y,ZHENG T,et al. Big data health care platform with multisource heterogeneous data integration and massive high-dimensional data governance for large hospitals:design,development,and application[J]. JMIR Med Inform,2022,10(4):e36481. DOI:10.2196/36481.
高景宏,李明原,王琳,等. 健康醫(yī)療大數(shù)據(jù)在精準(zhǔn)醫(yī)療領(lǐng)域的應(yīng)用與挑戰(zhàn)[J]. 醫(yī)學(xué)信息學(xué)雜志,2022,43(5):15-20. DOI:10.3969/j.issn.1673-6036.2022.05.003.
WU Y F,F(xiàn)ANG Y. Stroke prediction with machine learning methods among older Chinese[J]. Int J Environ Res Public Health,2020,17(6):1828. DOI:10.3390/ijerph17061828.