







摘要 目的:基于交互式列線圖建立心力衰竭病人90 d內再入院的預測模型并進行內部驗證。方法:回顧性連續納入2016年12月—2019年6月在四川省自貢市第四人民醫院住院的心力衰竭病人1 532例,按7∶3比例隨機分為建模組和驗證組,使用Lasso回歸和共線性篩查篩選建模變量,應用廣義線性回歸及R的regplot和shiny包建立單機版和網頁版心力衰竭病人90 d內再入院的交互式列線圖模型。在建模組和驗證組進行模型性能評價,內容包括校準度(校準曲線)、區分度(受試者工作特征曲線下面積)和有效性(決策曲線分析)評價。結果:篩選的建模變量為收縮壓(SBP)、舒張壓(DBP)、心力衰竭類型(左心衰竭、右心衰竭和全心衰竭)、紅細胞平均血紅蛋白濃度(MCHC)和總膽固醇(TC),Logit(y)=-14.641+0.011×SBP(mmHg)+0.014×DBP(mmHg)-1.114(右心衰竭)-0.928(全心衰竭)+0.025×MCHC(g/L)+0.866×TC(mmol/L),建立的交互式列線圖包括單機版和網頁版,其中網頁版通過訪問網頁https://shengsong.shinyapps.io/readmission_at_3_months_in_HF_patient獲取。建模組和驗證組模型經校準度、區分度和有效性評價性能良好。結論:建立的預測模型有助于評估心力衰竭病人90 d內再入院風險和早期識別高危病人,且模型有良好的預測性能。
關鍵詞 心力衰竭;90 d再入院;預測模型;交互式列線圖;網頁計算器
doi:10.12102/j.issn.1672-1349.2023.16.002
Establishment and Validation of the Interactive Nomogram Model for All-cause Readmission within 90-days in Patients with Heart Failure
SHENG Song, HUANG Ye
Xiyuan Hospital, China Academy of Chinese Medical Sciences, Beijing 100091, China
Corresponding Author HUANG Ye, E-mail: yellow_926@163.com
Abstract Objective:To develop predictive modeling and internal validation of all-cause readmission within 90-days in patients with heart failure based on interactive Nomogram.Methods:A total of 1 532 patients with heart failure were randomly divided into the modeling group and the validation group with ratio of 7∶3.Lasso regression and covariance screening were used to identify modeling variables,and generalized linear regression as well as the regplot and shiny packages for R were applied to model interactive column-line plots of readmission within 90 days in stand-alone and web-based versions of heart failure patients.The model performance evaluation was performed in the modeling group and validation group,which included evaluation of calibration(calibration curves),discrimination(receiver operating characteristic area under the curves),and validity(decision curve analysis).Results:The modeling variables screened were systolic blood pressure(SBP),diastolic blood pressure(DBP),type of heart failure(left heart failure,right heart failure,and whole heart failure),mean corpuscular hemoglobin concentration of red blood cells(MCHC),and total cholesterol(TC).Logit(y)=-14.641+0.011×SBP(mmHg)+0.014×DBP(mmHg)-1.114(right heart failure)-0.928(whole heart failure)+0.025×MCHC(g/L)+0.866×TC(mmol/L).The interactive nomogram included the stand-alone and web-based version,and the web version could be obtained by visiting the" web page https://shengsong.shinyapps.io/readmission_at_3_months_in_HF_patient.The model performance of calibration,discrimination and validity were evaluated in the modeling group and the validation group.Conclusion:The established predictive model was developed to help assess the risk of all-cause readmission within 90-days in patients with heart failure and early identification of high-risk patients,with better predictive performance.
Keywords heart failure; readmission within 90-days; predictive model; interactive Nomogram; web calculator
心力衰竭是我國常見的心血管疾病之一,一項心力衰竭流行病學調查顯示,我國現有心力衰竭病人890萬例[1-2],與2000年相比患病人數增加了500萬例[3]。目前我國心力衰竭病人規范化診療水平較2015年有所提高[4-5],但心力衰竭病人預后仍較差,其90 d內再入院率高達24.8%[4,6],由此帶來的心力衰竭病人人均年住院治療費用高達2萬元[7],心力衰竭已成為影響我國居民健康和加重社會經濟負擔的重要公共衛生問題。因此,準確評估心力衰竭病人預后,早期識別高危病人并給予重點關注和干預以減少再入院是加強心力衰竭病人管理和醫保控費的關鍵環節?,F有的心力衰竭病人再入院預測模型80%以上來源于北美洲和歐洲[8],其中多數未經過外部驗證,這些模型在我國心力衰竭人群中的適用性受限。
本研究回顧性分析1 532例心力衰竭住院病人臨床資料,基于我國人群建立心力衰竭病人90 d內再入院的交互式列線圖模型(包括單機版和網頁版),旨在為評估心力衰竭病人再入院風險提供便捷的評估預測工具,及早對高危病人實施干預措施以減少再入院事件。
1 資料與方法
1.1 研究人群
分析數據源自Research Resource for Complex Physiologic Signals(PhysioNet)數據庫中一個回顧性心力衰竭隊列(https://physionet.org/content/heart-failure-zigong/1.2/)[6]。根據網站協議通過倫理考核后,可自由下載和使用數據[9]。該心力衰竭隊列回顧性連續納入四川省自貢市第四人民醫院2016年12月—2019年6月住院的2 008例心力衰竭病人的電子病歷,心力衰竭住院病人的識別基于國際疾病分類(ICD)-9編碼,診斷標準參照2016年歐洲心臟病學會(ESC)心力衰竭診治指南[10]。本研究排除存在數據缺失的心力衰竭病人,最終納入1 532例。
1.2 臨床資料收集
入院時納入一般人口學和臨床資料,包括性別、年齡、體質指數、入院方式(急診/非急診)、體溫、脈搏、呼吸、收縮壓(SBP)、舒張壓(DBP)、查爾森共病指數、心力衰竭類型(左心衰竭、右心衰竭和全心衰竭)、紐約心臟病協會(NYHA)心功能分級、Killip心功能分級、格拉斯哥昏迷量表評分和吸氧濃度;入院時實驗室檢查指標包括血肌酐、尿酸、腎小球濾過率、胱抑素C、白細胞計數、紅細胞分布寬度變異系數、紅細胞分布寬度標準差、淋巴細胞計數、平均紅細胞血紅蛋白含量、紅細胞平均血紅蛋白濃度(MCHC)、平均血小板容積、嗜堿性粒細胞計數、嗜酸性粒細胞計數、血紅蛋白、血小板計數、血小板分布寬度、血小板比容、中性粒細胞計數、D-二聚體、超敏肌鈣蛋白T、腦鈉肽、清蛋白、總膽固醇(TC)、低密度脂蛋白膽固醇、三酰甘油和高密度脂蛋白膽固醇[6]。研究結局事件為入院索引日期90 d內全因再入院。
數據庫建立和信息采集經自貢市第四人民醫院倫理委員會批準(審批號:2020-010)。由于本研究中所有分析均是匿名進行,因此無需病人二次知情同意[11-12]。
1.3 數據分析
采用R 4.0.3(https://www.r-project.org/,The R Foundation)進行數據分析。符合正態分布的連續變量、偏態分布的連續變量和分類變量分別以均數±標準差(x±s)、中位數、四分位數[M(P25,P75)]和例數、百分比(%)表示。研究數據按7∶3的比例隨機分為建模組和驗證組,建模組和驗證組比較按照上述變量類型順序分別采用獨立t檢驗、Mann-Whitney U檢驗和χ2檢驗。建模組篩選變量方法采用Lasso回歸,使用10折交叉驗證法選取最佳lambda值,選取標準為10次交叉驗證得到的錯誤均值在最小值1個標準差范圍內對應的最大lambda值(lambda.1se)[13]。在建模前再對篩選到的變量進行共線性篩查,剔除方差膨脹系數(VIF)>10的變量。在建模組中采用廣義線性建模(GLM)得到每個建模變量的回歸系數、比值比(OR)和95%置信區間(CI),分別應用R的regplot和shiny包建立單機版和網頁版的交互線段式動態列線圖[14-15]。
在建模組和驗證組中分別評價模型性能,包括校準度、區分度和有效性。模型校準度評價采用校準曲線[16];模型區分度評價采用受試者工作特征(ROC)曲線下面積(AUC),一般認為AUC在0.70~0.80區分度為中等,AUC>0.80區分度較高[17];模型有效性評價采用決策曲線法(DCA)[18]。
2 結 果
2.1 兩組臨床資料比較
共納入心力衰竭住院病人1 532例,其中23.37%的病人在90 d內再入院,其中建模組1 068例,驗證組464例。建模組經急診入院比例、紅細胞分布寬度變異系數、MCHC和D-二聚體低于驗證組,清蛋白高于驗證組,差異有統計學意義(P<0.05)。詳見表1。
2.2 變量篩選和回歸模型構建
建模組通過Lasso回歸篩選得到的變量為SBP、DBP、心力衰竭類型、MCHC和TC,此時對應的最佳lambda=0.04(log lambda=-3.21)。經共線性篩查保留上述全部變量后建立簡化模型(見表2),模型赤池信息準則(AIC)=963.44,Logit(y)=-14.641+0.011×SBP(mmHg)+0.014×DBP(mmHg)-1.114(右心衰竭)-0.928(全心衰竭)+0.025×MCHC(g/L)+0.866×TC(mmol/L)。應用regplot包建立單機版的交互式列線圖(已聯系作者獲?。?,輸入TC=5.81 mmol/L、MCHC=295 g/L、左心衰竭、DBP=109 mmHg、SBP=160 mmHg,自動計算出90 d內再入院概率為0.736,95%CI[0.580,0.849]。詳見圖1。基于shiny包的網頁版交互式列線圖通過訪問網頁https://shengsong.shinyapps.io/readmission_at_3_months_in_HF_patient自動計算心力衰竭病人的90 d內再入院概率,病人SBP=131 mmHg、DBP=77 mmHg、左心衰竭、MCHC=325 g/L、TC=4 mmol/L,點擊“predict”自動計算90 d內再入院概率為0.378,95%CI[0.330,0.427]。詳見圖2。
2.3 模型性能驗證與評價
2.3.1 模型校準度評價
校準曲線圖橫坐標代表預測值,縱坐標代表實際值,圖中對角線為參考線(ideaL),代表預測值=實際值。在建模組和驗證組中校準曲線(logistic calibration)均與參考線重合或接近時,說明建模組和驗證組實際值和預測值接近,模型校準度良好。詳見圖3。
2.3.2 模型區分度評價
ROC曲線分析顯示,建模組AUC=0.785,95%CI[0.755,0.816],敏感度為0.579,特異度為0.815;驗證組AUC=0.706,95%CI[0.625,0.760],敏感度為0.564,特異度為0.721。建模組和驗證組AUC在0.70~0.80,模型區分度為中等。詳見圖4。
2.4 模型有效性評價
DCA圖中橫坐標為閾概率(threshold probability),縱坐標是凈獲益率(net benefit,NB)。None和All兩條線代表2種極端情況,其中None代表所有病人結局判定為陰性,所有人均未干預,NB為0;All表示所有病人結局判定為陽性,所有人均接受干預,其NB是個斜率為負值的反斜線。本研究DCA表明建模組90 d內再入院概率為0%~75%,驗證組為0%~70%,模型應用準確性和凈獲益最高,超出該范圍模型準確性有限,凈獲益明顯下降。詳見圖5。
3 討 論近20年來,隨著心力衰竭病人發病率不斷升高[1-3],高再入院率受到越來越多的關注,準確評估再入院風險成為降低心力衰竭病人再入院率、改善其健康結局的重要前提。
由于種族、基本國情和診療環境的差異,歐美國家開發的心力衰竭預測工具適用性可能有限,由于各種原因導致我國心力衰竭病人短期內(30 d)傾向于不入院除非癥狀嚴重不能耐受,相較于30 d,出院后90 d可能對我國心力衰竭病人再入院評估更有價值[6,19]。心力衰竭病人出院后90 d由于血流動力學惡化和出院時治療不充分,住院治療時間過短,合并癥控制不佳,病人依從性差等,導致出院時有充血癥狀,病人死亡率和再入院率顯著升高,這一特殊時期定義為“心力衰竭易損期”[20-21]。本研究選擇90 d再入院作為時間點建立心力衰竭病人再入院預測模型,旨在為“易損期”心力衰竭病人提供可早期識別和干預再入院風險評估的工具。
一項回顧性研究收集了湖南省人民醫院350例心力衰竭病人電子病歷,采用Logistic回歸建立了心力衰竭病人90 d再入院風險的預測模型,模型中的納入變量包括N末端腦鈉肽前體(NT-proBNP)、紅細胞分布寬度變異系數和查爾森共病指數[22],這是一項基于我國心力衰竭人群的90 d再入院風險預測模型,但由于模型納入研究對象的樣本量有限,未進行廣泛的臨床驗證,準確性有待進一步確認。相較于Tan等[22]構建的預測模型,本研究建立的90 d再入院預測模型進一步擴大了樣本量,納入的心力衰竭住院病人1 532例,其次本研究基于R的regplot和shiny包開發了單機版和網頁版的交互式列線圖替代傳統列線圖,可自動計算結果,因此,臨床應用方便快捷,有利于模型的進一步推廣和驗證。本研究建立的模型中包含的所有變量在臨床是常規進行測量且易進行評估,在臨床實踐中方便實用。與既往不同再入院時間截點的心力衰竭預測模型相比,本研究中建立的預測模型除了納入SBP、DBP、TC這些常規的預測因子外,首次納入了MCHC和心力衰竭類型。心力衰竭病人長期組織缺氧,血液中促紅細胞生成素增多導致血液中血紅蛋白量代償性增加,引起MCHC升高。MCHC與心力衰竭病人再入院是否存在關聯尚未明確;不同類型的心力衰竭是否對再入院有獨立作用目前無相關文獻支持,需進一步研究驗證。
本研究存在一定局限性:1)模型預測數據來源于單中心,雖然內部驗證和模型性能評價良好,但能否外推到其他地域人群或其他場景未可知,仍需進一步多中心外部驗證。2)本研究基于回顧性研究數據,數據記錄的完整性、同質性均不如前瞻性研究,可能存在暴露、懷疑、偏倚等固有偏倚影響結果的可靠性[23]。3)原始隊列中所屬病人隨訪時間存在缺失,因此,不能使用比例風險回歸模型,未關注結局基礎上隨訪時間對結局的影響。
本研究建立的預測模型有助于評估心力衰竭病人90 d內再入院風險和早期識別高危病人,且模型具有良好的預測性能。
參考文獻:
[1]METRA M,LUCIOLI P.Corrigendum to ′Prevalence of heart failure and left ventricular dysfunction in China:the China Hypertension Survey,2012-2015′[Eur J Heart Fail 2019;21:1329-1337][J].European Journal of Heart Failure,2020,22(4):759.
[2]HAO G,WANG X,CHEN Z,et al.Prevalence of heart failure and left ventricular dysfunction in China:the China Hypertension Survey,2012-2015[J].European Journal of Heart Failure,2019,21(11):1329-1337.
[3]顧東風,黃廣勇,吳錫桂,等.中國心力衰竭流行病學調查及其患病率[J].中華心血管病雜志,2003,31(1):3-6.
[4]國家心血管病醫療質量控制中心專家委員會心力衰竭專家工作組.2020 中國心力衰竭醫療質量控制報告[J].中國循環雜志,2021,36(3):221-238.
[5]ZHANG Y H,ZHANG J,BUTLER J,et al.Contemporary epidemiology,management,and outcomes of patients hospitalized for heart failure in China:results from the China heart failure(China-HF) registry[J].Journal of Cardiac Failure,2017,23(12):868-875.
[6]ZHANG Z H,CAO L H,CHEN R G,et al.Electronic healthcare records and external outcome data for hospitalized patients with heart failure[J].Scientific Data,2021,8(1):46.
[7]HUANG J,YIN H J,ZHANG M L,et al.Understanding the economic burden of heart failure in China:impact on disease management and resource utilization[J].Journal of Medical Economics,2017,20(5):549-553.
[8]SUN Z J,DONG W,SHI H R,et al.Comparing machine learning models and statistical models for predicting heart failure events:a systematic review and meta-analysis[J].Frontiers in Cardiovascular Medicine,2022,9:812276.
[9]GOLDBERGER A L,AMARAL L A,GLASS L,et al.PhysioBank,PhysioToolkit,and PhysioNet:components of a new research resource for complex physiologic signals[J].Circulation,2000,101(23):E215-E220.
[10]PONIKOWSKI P,VOORS A A,ANKER S D,et al.2016 ESC guidelines for the diagnosis and treatment of acute and chronic heart failure:the task force for the diagnosis and treatment of acute and chronic heart failure of the European Society of Cardiology(ESC).Developed with the special contribution of the Heart Failure Association(HFA) of the ESC[J].European Journal of Heart Failure,2016,18(8):891-975.
[11]BANGALORE S,GUO Y,SAMADASHVILI Z,et al.Everolimus-eluting stents or bypass surgery for multivessel coronary disease[J].The New England Journal of Medicine,2015,372(13):1213-1222.
[12]FILION K B,AZOULAY L,PLATT R W,et al.A multicenter observational study of incretin-based drugs and heart failure[J].The New England Journal of Medicine,2016,374(12):1145-1154.
[13]張瀝今,魏夏琰,陸嘉琦,等.Lasso回歸:從解釋到預測[J].心理科學進展,2020,28(10):1777-1791.
[14]WOJCIECHOWSKI J,HOPKINS A,UPTON R.Interactive pharmacometric applications using R and the shiny package[J].CPT:Pharmacometrics amp; Systems Pharmacology,2015,4(3):146-159.
[15]ZHANG Z H,CORTESE G,COMBESCURE C,et al.Overview of model validation for survival regression model with competing risks using melanoma study data[J].Annals of Translational Medicine,2018,6(16):325.
[16]KIM Y,MARGONIS G A,PRESCOTT J D,et al.Nomograms to predict recurrence-free and overall survival after curative resection of adrenocortical carcinoma[J].JAMA Surgery,2016,151(4):365-373.
[17]ROBBA C,CARDIM D,TAJSIC T,et al.Ultrasound non-invasive measurement of intracranial pressure in neurointensive care:a prospective observational study[J].PLoS Medicine,2017,14(7):e1002356.
[18]VICKERS A J,VAN CALSTER B,STEYERBERG E W.A simple,step-by-step guide to interpreting decision curve analysis[J].Diagnostic and Prognostic Research,2019,3:18.
[19]RIESTER M,MCAULIFFE L,COLLINS C,et al.Development and validation of the tool for pharmacists to predict 30-day hospital readmission in patients with heart failure(ToPP-HF)[J].Am J Health Syst Pharm,2021,78(18):1691-1700.
[20]黃峻.心力衰竭“易損期”及其心率管理的新認識新理念[J].中華心力衰竭和心肌病雜志(中英文),2018,2(2):111-113.
[21]石珂,賈永平.心力衰竭易損期再入院率和死亡評估新進展[J].中西醫結合心腦血管病雜志,2019,17(18):2783-2786.
[22]TAN B Y,GU J Y,WEI H Y,et al.Electronic medical record-based model to predict the risk of 90-day readmission for patients with heart failure[J].BMC Medical Informatics and Decision Making,2019,19(1):193.
[23]EUSER A M,ZOCCALI C,JAGER K J,et al.Cohort studies:prospective versus retrospective[J].Nephron Clinical Practice,2009,113(3):c214-c217.
(收稿日期:2022-07-18)
(本文編輯薛妮)
基金項目 2019年國家中醫藥管理局全國中醫藥創新骨干人才項目(No.010100003)
通訊作者 黃燁,E-mail:yellow_926@163.com
引用信息 盛松,黃燁.心力衰竭病人90 d內再入院的交互式列線圖模型建立與驗證[J].中西醫結合心腦血管病雜志,2023,21(16):2909-2915.