海瑞 王慧 張蓉 徐亞萍 楊益



基金項目 新疆維吾爾自治區(qū)研究生創(chuàng)新項目,編號:XJ2021G230
作者簡介 海瑞,碩士研究生在讀
通訊作者 楊益,E?mail:yangyi2671@163.com
引用信息 海瑞,王慧,張蓉,等.基于機器學習的老年慢性心力衰竭病人衰弱風險預測模型的構(gòu)建[J].護理研究,2024,38(12):2103?2109.
Construction of predictive model of frailty risk in elderly patients with chronic heart failure based on machine learning
HAI Rui, WANG Hui, ZHANG Rong, XU Yaping, YANG Yi
School of Nursing, Xinjiang Medical University, Xinjiang 830011 China
Corresponding Author? YANG Yi, E?mail: yangyi2671@163.com
Abstract? Objective:To construct a predictive model of frailty risk in elderly patients with chronic heart failure(CHF) based on machine learning,and to provide a new method for accurate prediction of frailty occurrence in clinical elderly patients with CHF.Methods:Clinical data related to CHF patients from the cardiovascular medicine department of a tertiary grade A hospital in Urumqi from January 2023 to May 2023 were collected and randomly divided into training and testing sets in the ratio of 7∶3,with the occurrence of frailty as the outcome variable.The frailty risk prediction models were constructed based on four algorithms:Logistic regression(LR),decision tree(DT),random forest(RF),and support vector machines (SVM).The performance of the models was evaluated based on the area under curve (AUC),accuracy,precision,sensitivity,specificity,F(xiàn)1 value,and the optimal model was selected.Results:A total of 423 patients with CHF were included,182 of whom developed frailty(43%).All four prediction models had high accuracy,and the AUC values of the LR,DT,SVM,and RF models were 0.917,0.863,0.941 and 0.952,respectively,with the RF models having the highest AUC values,and the RF model had the highest accuracy,precision,sensitivity,specificity,and F1 value were the highest.The importance of the feature variables was further ranked based on the RF model,and the top five feature variables were hemoglobin,interleukin?6,albumin,malnutrition,and Charlson Comorbidity Index(CCI) scores.Conclusion:The predictive model of frailty risk in elderly patients with chronic heart failure based on RF machine learning has the best performance,which is helpful for early clinical assessment and prevention of frailty risk.
Keywords? chronic heart failure; frailty; machine learning; predictive model
摘要? 目的:基于機器學習算法構(gòu)建老年慢性心力衰竭(CHF)病人衰弱風險預測模型,為臨床老年CHF病人衰弱發(fā)生的精準預測提供新方法。方法:收集2023年1月—5月烏魯木齊市某三級甲等醫(yī)院心血管內(nèi)科的CHF病人相關臨床資料,按7∶3比例隨機劃分為訓練集和測試集,以是否發(fā)生衰弱為結(jié)局變量,分別基于邏輯回歸(LR)、決策樹(DT)、隨機森林(RF)、支持向量機(SVM)4種機器學習算法構(gòu)建衰弱風險預測模型。基于受試者工作特征曲線下面積(AUC)、準確度、精確度、靈敏度、特異度、F1分數(shù)評估模型性能,選出最優(yōu)模型。結(jié)果:共納入423例CHF病人,其中182例病人發(fā)生衰弱,衰弱發(fā)生率為43%。4種預測模型都有較高的準確性,LR、DT、SVM、RF模型的AUC值分別為0.917,0.863,0.941,0.952,其中RF模型AUC值、準確度、精確度、靈敏度、特異度、F1分數(shù)均最高。進一步基于RF模型對特征變量進行重要性排序,其中排名前5位的特征變量依次為血紅蛋白、白細胞介素?6、白蛋白、營養(yǎng)不良、查爾森合并癥指數(shù)(CCI)。結(jié)論:基于RF機器學習算法構(gòu)建的老年CHF病人衰弱風險預測模型性能最優(yōu),有助于臨床早期評估和預防其衰弱風險的發(fā)生。
關鍵詞? 慢性心力衰竭;衰弱;機器學習;預測模型
doi:10.12102/j.issn.1009-6493.2024.12.007
預計到2035年,我國≥60歲人口占比將超過20%,進入中度老齡化社會[1]。由于老齡化速度的加快,心力衰竭的長期管理是全球醫(yī)療保健的主要問題之一。慢性心力衰竭(CHF)作為各類型心臟疾病的終末階段,在老年人中發(fā)病率很高,是導致高發(fā)病率和死亡率的重要來源。老年CHF病人容易反復發(fā)生心功能惡化或急性失代償,且多合并衰弱、營養(yǎng)不良、肌少癥等常見老年綜合征,其心力衰竭進程也會因此而加速[2]。衰弱被定義為一種臨床上可識別的、由于多個生理系統(tǒng)的儲備和功能下降而增加的脆弱狀態(tài)[3],它在很大程度上與年齡和多種疾病相關[4]。衰弱在CHF病人中很常見,約1/3的衰弱病人合并CHF,39%的CHF病人合并衰弱,但是衰弱與CHF之間的患病率也會隨著研究人群的不同而有所差別[5]。衰弱顯著影響CHF病人的預后,研究發(fā)現(xiàn),CHF合并衰弱病人的全因死亡率和再住院率等不良預后指標均升高[6?7],其死亡和住院風險約增加了1.5倍[8?9]。由此可見,衰弱的早期評估和干預對減少不良臨床結(jié)局和CHF管理非常重要。近年來,機器學習越來越多地融入臨床實踐,應用范圍從臨床前數(shù)據(jù)處理到病人分層和治療決策[10],尤其在疾病診斷和預測方面優(yōu)勢顯著。因此,本研究基于機器學習算法挖掘老年CHF病人衰弱發(fā)生的風險因素,并基于不同算法建立CHF病人衰弱風險預測模型,評價、比較各預測模型的效能,以篩選出最佳的預測模型,為臨床老年CHF病人衰弱發(fā)生的精準預測提供新思路,為制定科學有效的干預措施提供科學依據(jù)。
1? 對象與方法
1.1 研究對象
選取2023年1月—5月烏魯木齊市某三級甲等醫(yī)院心血管內(nèi)科住院的423例CHF病人。納入標準:年齡≥60歲;符合《中國心力衰竭診斷和治療指南2018》[11]診斷標準;依據(jù)美國紐約心臟病學會(NYHA)分級為Ⅱ~Ⅳ級;意識清楚、能夠理解指令,正常溝通;知情同意后自愿參加本研究。排除標準:合并嚴重肝腎功能不全、惡性腫瘤;嚴重精神疾病、嚴重癡呆病人;正參與其他臨床試驗的病人。
1.2 資料收集
基于本研究目的,綜合相關文獻,參考相關臨床經(jīng)驗,結(jié)合病人信息的數(shù)據(jù)特點,收集以下數(shù)據(jù):1)社會人口學資料,包括性別、年齡、身高、體重、文化程度、婚姻狀況、吸煙史、飲酒史等;2)疾病用藥相關因素,包括共病、多重耐藥、過去1年跌倒史、血紅蛋白、C反應蛋白、氨基末端腦鈉肽前體(NT?proBNP)等;3)心臟B超相關檢驗指標,包括左心室射血分數(shù)、左房內(nèi)徑、主動脈內(nèi)徑、E/A比值等;4)結(jié)局指標,選用Fried衰弱量表[12]進行衰弱風險篩查和評估,包括行走速度下降、握力下降、體力活動下降、疲勞、不明原因的體重下降5項內(nèi)容,每項計1分,共5分,得分0~2分為非衰弱,≥3分為衰弱,將病人分為衰弱組和非衰弱組。
1.3 數(shù)據(jù)預處理
根據(jù)相關專業(yè)知識刪除重復特征并去除完全共線性特征,將缺失率超過20%的變量或者研究對象予以刪除,對數(shù)據(jù)缺失率不足20%的變量加以填補。連續(xù)性變量使用均值方法進行填補,而分類變量使用隨機插補法進行填補,對性別、文化程度、心功能分級等多分類變量進行獨立編碼,并采用線性函數(shù)歸一化方法對數(shù)據(jù)集進行歸一化處理,以保證后期分析中數(shù)據(jù)的一致性。
1.4 模型開發(fā)與驗證
基于4種常見的機器學習算法構(gòu)建模型,分別是邏輯回歸(Logistic regression,LR)、決策樹(decision tree,DT)、隨機森林(random forest,RF)、支持向量機(support vector machines,SVM)。首先將數(shù)據(jù)集按照7∶3比例隨機劃分為訓練集和測試集,訓練集用于模型的構(gòu)建,測試集用于模型的評估。本研究選取單因素分析方法篩選出差異有統(tǒng)計學意義的變量納入 LR、DT、SVM、RF算法中,模型構(gòu)建過程采用十折交叉驗證(cross?validation,CV),即將訓練集數(shù)據(jù)分成10等份,每份數(shù)據(jù)都在上述機器學習模型中進行訓練和測試,每次選擇其中1份作為驗證集,剩余9份作為訓練集,最終模型評估結(jié)果取10次訓練結(jié)果的平均值,以更準確地評估模型的泛化性能。通過網(wǎng)格搜索(grid search)調(diào)整模型參數(shù),不斷對模型進行優(yōu)化。模型性能的評估選用靈敏度、特異度、準確度、精確度、F1分數(shù)和受試者工作特征(ROC)曲線下面積(AUC)為評價指標。靈敏度是指陽性結(jié)果的真正陽性樣本的比例,特異度是指陰性結(jié)果的真正陰性樣本的比例,準確度衡量正確預測的百分比,精確度衡量所有正預測中真正正預測的百分比,F(xiàn)1分數(shù)是精確率和召回率的調(diào)和平均值,是平衡這兩個指標之間權(quán)衡的有用指標。最終繪制4個模型ROC曲線,更加直觀地顯示各模型的AUC值差異。
1.5 統(tǒng)計學方法
基于IBM SPSS 26.0、python 3.8、開源的Anaconda 23.1.0發(fā)行版本、spyder 5.4.1版開發(fā)環(huán)境進行統(tǒng)計分析和建模。符合正態(tài)分布的定量資料以均數(shù)±標準差(x±s)表示,組間比較采用t檢驗;不符合正態(tài)分布的定量資料以中位數(shù)(四分位數(shù))[M(P25,P75)]表示,組間比較采用非參數(shù)檢驗。定性資料采用例數(shù)、百分比(%)表示,組間比較采用χ2檢驗或Fisher精確概率法。以P<0.05為差異有統(tǒng)計學意義。
2? 結(jié)果
2.1 兩組病人一般資料比較
共納入CHF病人423例,平均年齡為67歲,男290例,女133例,其中182例病人發(fā)生衰弱(衰弱組),241例病人未發(fā)生衰弱(非衰弱組),衰弱發(fā)生率為43%。衰弱組與非衰弱組一般資料比較見表 1。
2.2 特征變量重要性排序
選用RF模型對老年CHF病人衰弱發(fā)生的風險因素重要性進行排名,根據(jù)特征排序以及數(shù)值大小發(fā)現(xiàn),血紅蛋白、白細胞介素?6、白蛋白、營養(yǎng)不良、CCI、尿素、年齡等特征是CHF病人衰弱發(fā)生的重要危險因素。具體結(jié)果見圖1。
2.3 各模型預測效能比較
基于LR、DT、SVM、RF分別建立了4種老年CHF病人衰弱風險預測模型,使用測試集進行內(nèi)部驗證得到各模型的預測效能,見表2,ROC曲線見圖2。結(jié)果顯示,LR、DT、SVM、RF模型的AUC值分別為0.917,0.863,0.941,0.952,其中RF模型的AUC值最高,DT模型的AUC值最低,LR、DT、SVM模型的特異度相等。此外,RF模型靈敏度、特異度、準確率、精確度、F1分數(shù)、AUC值均為最高,即整體的預測效能優(yōu)于其他3種模型。
3? 討論
3.1 老年CHF病人衰弱患病率
衰弱是老年CHF中高度普遍的多系統(tǒng)綜合征[13],顯著增加CHF病人的不良健康結(jié)局[6]。研究顯示,由于衰弱與心力衰竭的重疊機制特征,心力衰竭病人的衰弱概率約是無心力衰竭病人的3倍[5]。本研究中423例CHF病人有182例合并衰弱,衰弱患病率高達43%,與Denfeld等[14]研究結(jié)果相近。因此,臨床醫(yī)護人員應對CHF病人進行早期篩查,及時識別衰弱并積極采取相應措施進行個性化管理。
3.2 老年CHF病人衰弱風險預測模型的分析與比較
LR模型是目前臨床上常用的模型,但對于多重共線性數(shù)據(jù)較為敏感,容易欠擬合,分類精度不高,且很難處理數(shù)據(jù)不平衡的問題。而機器學習算法具有處理醫(yī)療結(jié)構(gòu)混雜、特征高維的大數(shù)據(jù)的能力,近年來,已被廣泛應用于國內(nèi)外醫(yī)療護理領域。傳統(tǒng)的DT模型在單機情況下,無論是計算能力還是存儲能力都有一定局限性。RF泛化能力強,能更好地避免過擬合現(xiàn)象。SVM將數(shù)據(jù)分成2個或多個類別,應用于復雜的數(shù)據(jù)類型中可避免出現(xiàn)過度擬合或局部極值現(xiàn)象。本研究應用以上4種算法構(gòu)建老年CHF病人衰弱風險預測模型,結(jié)果顯示,相比于LR、DT、SVM模型,RF模型的預測效能最佳,其靈敏度、特異度、準確度、精確度、F1分數(shù)、AUC值均為最高,可為臨床早期篩查衰弱風險提供科學依據(jù)。張晗等[15]分別基于DT、LR、RF算法構(gòu)建創(chuàng)傷性休克病人院內(nèi)死亡預測模型中,橫向?qū)Ρ劝l(fā)現(xiàn)RF模型的準確度及AUC值最高。本課題組成員認為RF模型最優(yōu)的原因可能是,RF算法可以處理高維特征的數(shù)據(jù),且不依賴特征選擇[16],同時具有很強的抗干擾性,對于不平衡數(shù)據(jù)仍然可以維持較高的準確度[17]。
3.3 老年CHF病人衰弱發(fā)生的風險因素
本研究利用RF模型對納入的特征進行重要性排序,進一步確定了血紅蛋白、白細胞介素?6、白蛋白、營養(yǎng)不良、CCI、尿素、年齡等是影響CHF病人衰弱發(fā)生的因素。既往研究表明,營養(yǎng)狀況不佳是CHF病人衰弱發(fā)生的重要危險因素,其病人生化指標如白蛋白、血紅蛋白與衰弱呈負相關[18],本研究結(jié)論與之相近。營養(yǎng)不良可以導致衰弱,而衰弱本身也可以導致病人營養(yǎng)攝入不足,兩者是互為因果的關系[19?20],提示老年CHF病人衰弱的營養(yǎng)狀況評估以及個性化營養(yǎng)支持顯得尤為重要。研究發(fā)現(xiàn),各個年齡階層的老年衰弱病人的白細胞介素?6、C?反應蛋白水平都會升高[21]。白細胞介素?6作為經(jīng)典的炎癥標志物,無論在心力衰竭還是衰弱的發(fā)生發(fā)展過程中均起一定作用。心力衰竭病人發(fā)病時低灌注、組織缺氧、細胞損傷,使其炎癥反應上調(diào);同時,白細胞介素?6的升高可能導致肌肉力量降低,運動能力下降,衰弱加重。由于虛弱和心力衰竭的重疊機制特征,白細胞介素?6對心力衰竭病人衰弱的作用機制需進一步探究。多病共存既是老年人發(fā)生衰弱的誘發(fā)因素,又是導致衰弱加重的重要原因[22]。研究表明,合并癥負擔對心力衰竭病人的不良臨床結(jié)局有顯著影響[23]。Pandey等[24]一項研究多變量分析也顯示,合并癥負擔是衰弱的顯著預測因子。雖然這些研究闡明了積極管理并發(fā)疾病的重要性,但心力衰竭和衰弱兩種疾病之間的癥狀重疊,往往對傳統(tǒng)的心力衰竭療法耐受性較差[13]。因此,建立針對患有多種合并癥的老年心力衰竭病人的管理策略是具有挑戰(zhàn)性的。年齡已被多項研究證明是老年CHF病人衰弱發(fā)生的重要危險因素[25?27],隨著年齡的增長,CHF病人更易合并衰弱。這可能與老年人的機體各組織器官趨于老化,各項生理功能逐漸退化,使其抵御外界應激源的能力減弱有關,醫(yī)護人員應早期識別老年CHF合并衰弱病人,進而及早干預,延緩衰弱的發(fā)生發(fā)展。
4? 小結(jié)
綜上所述,本研究利用所收集臨床數(shù)據(jù)的多個特征變量,基于LR、DT、SVM和RF機器學習算法分別構(gòu)建了不同的老年CHF病人衰弱風險預測模型,其中RF模型的預測效能較好。該模型可以幫助醫(yī)護人員早期識別老年CHF病人發(fā)生衰弱的潛在群體,并根據(jù)相關重要風險因素,制定科學有效的干預措施,延緩其衰弱的發(fā)生發(fā)展,減少不良健康結(jié)局的發(fā)生。但本研存在一定的局限性:首先,單中心研究存在地域局限性,推廣性較弱,且未進行外部驗證,之后將繼續(xù)進行前瞻性的研究,進一步調(diào)整模型參數(shù),提高模型性能;其次,本研究只對比了4種最為常用的算法所構(gòu)建的模型,其他算法的效果有待進一步驗證。
參考文獻:
[1]? 健康中國行動推進委員會.關于印發(fā)“十四五”健康老齡化規(guī)劃的通知[EB/OL].[2023-06-11].https://baike.baidu.com.
Healthy China Action Promotion Committee.Notice on the issuance of the "14th Five-Year Plan" for healthy aging[EB/OL].[2023-06-11]. https://baike.baidu.com.
[2]? 中華醫(yī)學會老年醫(yī)學分會心血管疾病學組.老年人慢性心力衰竭診治中國專家共識(2021)[J].中華老年醫(yī)學雜志,2021,40(5):550-561.
Cardiovascular Diseases Group,Geriatric Society of Chinese Medical Association.Chinese experts consensus on the diagnosis and treatment of chronic heart failure in the elderly[J].Chinese Journal of Geriatrics,2021,40(5):550-561.
[3]? XUE Q L.The frailty syndrome:definition and natural history[J].Clinics in Geriatric Medicine,2011,27(1):1-15.
[4]? ESPINOZA S E,QUIBEN M,HAZUDA H P.Distinguishing comorbidity,disability,and frailty[J].Current Geriatrics Reports,2018,7(4):201-209.
[5]? MARENGONI A,ZUCCHELLI A,VETRANO D L,et al.Heart failure,frailty,and pre-frailty:a systematic review and meta-analysis of observational studies[J].International Journal of Cardiology,2020,316:161-171.
[6]? SOYSAL P,ARIK F,SMITH L,et al.Inflammation,frailty and cardiovascular disease[J].Adv Exp Med Biol,2020,1216:55-64.
[7]? UCHIKADO Y,IKEDA Y,OHISHI M.Current understanding of the role of frailty in cardiovascular disease[J].Circulation Journal,2020,84(11):1903-1908.
[8]? MCALISTER F A,SAVU A,EZEKOWITZ J A,et al.The hospital frailty risk score in patients with heart failure is strongly associated with outcomes but less so with pharmacotherapy[J].Journal of Internal Medicine,2020,287(3):322-332.
[9]? YANG X B,LUP?N J,VID?N M T,et al.Impact of frailty on mortality and hospitalization in chronic heart failure:a systematic review and meta-analysis[J].Journal of the American Heart Association,2018,7(23):e008251.
[10]? VERMA A A,MURRAY J,GREINER R,et al.Implementing machine learning in medicine[J].Canadian Medical Association Journal,2021,193(34):E1351-E1357.
[11]? 中華醫(yī)學會心血管病學分會心力衰竭學組.中國心力衰竭診斷和治療指南2018[J].中華心血管病雜志,2018,46(10):760-789.
Heart Failure Group, Society of Cardiology, Chinese Medical Association.China guidelines for diagnosis and treatment of heart failure 2018[J].Chinese Journal of Cardiology,2018,46(10):760-789.
[12]? FRIED L P,TANGEN C M,WALSTON J,et al.Frailty in older adults:evidence for a phenotype[J].The Journals of Gerontology:Series A,2001,56(3):M146-M157.
[13]? LADDU D R,OZEMEK C,SABBAHI A,et al.Prioritizing movement to address the frailty phenotype in heart failure[J].Progress in Cardiovascular Diseases,2021,67:26-32.
[14]? DENFELD Q E,WINTERS-STONE K,MUDD J O,et al.The prevalence of frailty in heart failure:a systematic review and meta-analysis[J].International Journal of Cardiology,2017,236:283-289.
[15]? 張晗,張愛舷,羅嘉琪,等.基于機器學習的創(chuàng)傷性休克病人院內(nèi)死亡預測模型研究[J].解放軍醫(yī)學院學報,2023,44(4):339-344;371.
ZHANG H,ZHANG A X,LUO J Q,et al.In-hospital mortality prediction model for patients with traumatic shock based on machine learning[J].Academic Journal of Chinese PLA Medical School,2023,44(4):339-344;371.
[16]? WANG F Y,WANG Y C,JI X K,et al.Effective macrosomia prediction using random forest algorithm[J].International Journal of Environmental Research and Public Health,2022,19(6):3245.
[17]? 黃光成,周良,石建偉,等.機器學習算法在疾病風險預測中的應用與比較[J].中國衛(wèi)生資源,2020,23(4):432-436.
HUANG G C,ZHOU L,SHI J W,et al.Application and comparison of machine learning algorithms in disease risk prediction[J].Chinese Health Resources,2020,23(4):432-436.
[18]? 江恒,夏麗莉,劉瀅.老年慢性心力衰竭病人衰弱相關因素分析[J].實用老年醫(yī)學,2020,34(6):597-600.
JIANG H,XIA L L,LIU Y.Analysis of frailty-related factors in elderly patients with chronic heart failure[J].Practical Geriatrics,2020,34(6):597-600.
[19]? LAUR C V,MCNICHOLL T,VALAITIS R,et al.Malnutrition or frailty? Overlap and evidence gaps in the diagnosis and treatment of frailty and malnutrition[J].Physiologie Appliquee,Nutrition et Metabolisme,2017,42(5):449-458.
[20]? 姜珍,李結(jié)華,蔣品.常見血清學指標及衰弱評分對老年慢性心力衰竭病人的臨床意義[J].心腦血管病防治,2022,22(4):83-85;89.
JIANG Z,LI J H,JIANG P.Clinical significance of common serological indexes and weakness score in elderly patients with chronic heart failure[J].Cardio-Cerebrovascular Disease Prevention and Treatment,2022,22(4):83-85;89.
[21]? VELISSARIS D,PANTZARIS N,KONIARI I,et al.C-reactive protein and frailty in the elderly:a literature review[J].Journal of Clinical Medicine Research,2017,9(6):461-465.
[22]? 李雪嘉,楊開慶,黎偉娟,等.中國老年住院病人衰弱影響因素的Meta分析[J].老年醫(yī)學研究,2023,4(2):1-6.
LI X J,YANG K Q,LI W J,et al.Factors influencing of frailty in elderly inpatients in China:a meta-analysis[J].Geriatrics Research,2023,4(2):1-6.
[23]? ATHER S,CHAN W,BOZKURT B,et al.Impact of noncardiac comorbidities on morbidity and mortality in a predominantly male population with heart failure and preserved versus reduced ejection fraction[J].Journal of the American College of Cardiology,2012,59(11):998-1005.
[24]? PANDEY A,KITZMAN D,WHELLAN D J,et al.Frailty among older decompensated heart failure patients:prevalence,association with patient-centered outcomes,and efficient detection methods[J].JACC Heart Failure,2019,7(12):1079-1088.
[25]? SZE S,PELLICORI P,ZHANG J F,et al.Identification of frailty in chronic heart failure[J].JACC Heart Failure,2019,7(4):291-302.
[26]? 鞏靜文.老年慢性心力衰竭住院病人衰弱的影響因素分析[D].貴陽:貴州醫(yī)科大學,2022.
GONG J W.The influencing factors analysis of frailty in hospitalized elderly patients with chronic heart failure[D].Guiyang:Guizhou Medical University,2022.
[27]? 顧怡沁.基于營養(yǎng)指標構(gòu)建慢性心力衰竭病人的衰弱風險預測模型研究[D].南京:南京中醫(yī)藥大學,2022.
GU Y Q.Development of a diagnostic model focusing on nutritional indicators for frailty classification in people with chronic heart failure[D].Nanjing:Nanjing University of Chinese Medicine,2022.
(收稿日期:2023-07-03;修回日期:2024-06-03)
(本文編輯 蘇琳)