陳紅爽,王琴潞,鄒海歐
中國醫(yī)學科學院北京協(xié)和醫(yī)學院護理學院,北京 100144
衰弱通常表現(xiàn)為因各種因素導致多個器官系統(tǒng)的生理能力下降,從而出現(xiàn)機體易損性增加、抗應激能力減退的狀態(tài)[1-2],常為多種慢性疾病、某次急性事件或嚴重疾病的后果[3],與病人不良結局的發(fā)生密切相關,可增加病人發(fā)生死亡、跌倒、失能等事件的風險[4-7]。已有研究顯示,衰弱不僅限于老年人群,65 歲以下的人群,尤其是患有多種疾病的人群,也有發(fā)生衰弱或處于衰弱前期的可能[2-8],其嚴重程度是波動變化的[1]。及時預測發(fā)生衰弱的風險,能夠早期識別發(fā)生衰弱的高危人群,制定針對性的干預措施,以幫助病人擺脫衰弱狀態(tài)或避免衰弱的發(fā)生。近年來,衰弱風險預測模型研究明顯增多,但各研究中預測模型的適用對象、預測因子等存在異質(zhì)性。本研究對國內(nèi)外相關預測模型的構建及應用狀況、預測因子及性能進行范圍綜述,分析目前該領域相關研究存在的問題,以期為臨床護理工作和未來研究提供借鑒。
1)目前存在哪些衰弱風險預測模型的研究?2)模型通常涉及哪些預測因子?3)目前衰弱風險預測模型的建模方法有哪些?性能如何?4)目前研究存在哪些不足及對未來相關研究的啟示是什么?
檢索的數(shù)據(jù)庫為PubMed、the Cochrane Library、EMbase、CINAHL、Web of Science 核心集、中國生物醫(yī)學文獻數(shù)據(jù)庫、中國知網(wǎng)、萬方數(shù)據(jù)庫,檢索時限為建庫至2022 年6 月30 日,采用主題詞和自由詞相結合的方式進行檢索,中文檢索詞包括:“衰弱綜合征”“衰弱”“脆弱”“預測因素”“預測”“預測模型”,英文檢索詞包 括:“frailty”“frailty syndrome”“frailness”“frail”“risk prediction”“risk assessment” “prediction”“nomograms”“prediction rule*” “prediction model*”“prognosis model*”“prediction*”。以PubMed 數(shù)據(jù)庫為例,檢索策略如下:
#1 "frailty"[MeSH Terms] OR "frailty syndrome"[Title/Abstract]OR "frailness"[Title/Abstract] OR "frail"[Title/Abstract]
#2 "risk prediction"[Title/Abstract] OR "risk assessment"[MeSH Terms] OR "prediction"[Title/Abstract] OR "nomograms"[MeSH Terms] OR "prediction rule*" [Title/Abstract] OR "prediction model*"[Title/Abstract] OR "prognosis model*"[Title/Abstract] OR "prediction*"[Title/Abstract]
#3 #1 AND #2
納入標準:以構建或者驗證衰弱風險評估工具為研究內(nèi)容;中英文文獻;原始研究(隊列研究、病例對照研究、橫斷面研究等)、指南、專家共識等。排除標準:會議摘要、學位論文;未說明預測模型的內(nèi)容或方法。
將檢索到的文獻題錄導入EndNote X9 軟件中去除重復文獻。由2 名研究人員根據(jù)納入及排除標準閱讀文題和摘要獨立進行初篩,再閱讀全文進行復篩。篩選文獻存在爭議時與第3 名研究者討論,最終確定符合標準的文獻。
應用預測模型研究的偏倚風險評估工具(PROBAST)[9]對納入文獻進行質(zhì)量評價。
由2 名研究者對納入文獻獨立進行數(shù)據(jù)提取,有異議時與第3 名研究者討論。提取信息包括作者、發(fā)表年份、國家、研究對象、研究設計、模型構建和(或)驗證方法、模型預測因子、展示方式及性能等,并進行匯總分析。
初步檢索獲得文獻8 846 篇,其中,英文文獻8 174篇,中文文獻672 篇,經(jīng)過查重及閱讀題目、摘要、全文后,最終納入12 篇文獻[10-21]。12 篇文獻均為橫斷面研究,衰弱發(fā)生率為10.6%~68.2%,發(fā)表年份為2018—2022 年,其中中 國9 篇[13-21]、巴西1 篇[10]、泰國1 篇[11]、荷蘭1 篇[12]。文獻篩選流程及結果見圖1,納入文獻基本特征見表1。

表1 納入文獻基本特征

圖1 文獻篩選流程及結果
根據(jù)PROBAST 對模型建立的研究對象、預測因子、結局、分析4 個方面進行偏倚風險評價,納入研究整體的預測因子和分析部分偏倚風險較高,可能與預測因子統(tǒng)計分析方法選擇、模型建立時是否考慮復雜統(tǒng)計問題等有關,評價結果見表2。

表2 納入研究的偏倚風險評價
2.3.1 模型構建基本情況
模型研究人群主要集中于老年人,疾病種類多樣,涉及術后病人、住院病人、門診病人、社區(qū)人群等,樣本量為145~14 314 例。模型構建方法可分為兩類,其中Logistic 回 歸 模 型11 項[10,12-21],人 工 神 經(jīng) 網(wǎng) 絡 模型1 項[11]。
2.3.2 模型預測內(nèi)容及展示方式
納入研究的預測因子數(shù)量為2~10 個,模型展示可分為兩類,即根據(jù)各因子的回歸系數(shù)得出風險評分公式;列線圖、網(wǎng)頁計算器的可視化展示。其中,根據(jù)各因子的回歸系數(shù)得出風險評分公式的研究較多。模型預測內(nèi)容及展示方式見表3。對結果進行匯總、分類,最終將預測因子分為4 類,分別為一般資料、實驗室檢查指標、疾病相關因素、其他因素,出現(xiàn)頻次最高的3 項預測因子為合并癥、年齡、多重用藥。預測因子分類見表4。

表3 模型預測內(nèi)容及展示方式

表4 預測因子分類 單位:個
2.3.3 模型驗證及性能
12 個 模 型 中,7 個 模 型[10-11,13,15,17-19]未 報 告 驗 證 方法,3 個模型[12,14,21]采用Bootstrap 自舉重采樣法,1 個模型[16]進行內(nèi)部驗證,1個模型[20]進行外部驗證。在模型性能方面,7 個模型[13-14,16-17,19-21]應用Hosmer-Lemeshow擬合優(yōu)度檢驗P>0.05,提示模型預測值與實際觀測值差異不明顯,模型校準度良好。10 個模型[12-21]報告了受試者工作特征曲線下面積(AUC)以展示模型的區(qū)分度,AUC 為0.727~0.940,顯示模型區(qū)分度良好。部分模型報告了靈敏度與特異度,靈敏度為56%~89%,特異度為67%~97%,提示模型具有較好的判斷能力。模型驗證及性能見表5。

表5 模型驗證及性能
近年來風險預測模型得到學者們的高度關注,研究數(shù)量明顯增加[22]。衰弱風險預測模型能夠輔助醫(yī)護人員對病人衰弱發(fā)生風險進行評估,識別導致衰弱發(fā)生的個體化危險因素,進而為制定針對性的干預內(nèi)容提供證據(jù)支持。風險預測模型是以疾病多風險因素為基礎,利用數(shù)學公式計算病人未來發(fā)生某個事件的概率的一種統(tǒng)計性評估方式[22]。通過對預測模型的判斷,可達到促進(共享)醫(yī)療決策和改善健康結果的目的[23]。此外,還可應用風險預測模型對發(fā)生衰弱的病人進行動態(tài)評估。本研究對納入的預測因子進行頻次排序,結果顯示,合并癥、年齡、多重用藥在衰弱風險預測中應用較多。但本研究發(fā)現(xiàn),納入研究對建模樣本選擇存在一定異質(zhì)性,同樣是老年病人,年齡界限、疾病、來源情況不同,模型納入的預測因子特點不同,如針對老年肺癌術前病人建立的衰弱風險預測模型預測因子包含腫瘤分期,能夠體現(xiàn)一定的疾病特點;而在針對老年多病病人建立的衰弱風險預測模型預測因子納入了具體的合并疾病。提示,即使對象年齡相似,其處于不同疾病狀態(tài)時影響衰弱發(fā)生的危險因素也不相同,預測因子存在一定異質(zhì)性,不同情形下需要針對性地識別衰弱發(fā)生風險,未來在構建預測模型時應充分考慮疾病相關特征,從而促進風險預測模型的準確性。
模型建立的偏倚風險分析結果顯示,本研究納入的研究偏倚風險較高,可能與應用Logistic 回歸建模時存在將連續(xù)變量轉換為分類變量有關。同時,研究中對于數(shù)據(jù)的復雜問題(如刪失、競爭風險、對照抽樣等)處理是否恰當缺乏詳細的報告,可能增加分析階段的偏倚風險。此外,本研究納入的部分研究缺乏模型驗證,僅有3 個模型[12,14,21]采用了Bootstrap 驗證法,1 個模型[16]進行內(nèi)部驗證,1 個模型[20]進行外部驗證,導致盡管相關預測模型的區(qū)分度、校準度良好,但適用性及外推性有待探討,臨床實用性可能不高。預測模型的有效性關鍵之一在于驗證結果,這就意味著驗證集的選擇十分重要,在驗證時應選擇具有代表性的數(shù)據(jù)集建立模型并進行外部驗證[24]。
Chumha 等[11]在研究設計時考慮避免模型過擬合的問題,選擇人工神經(jīng)網(wǎng)絡進行建模。隨著信息化技術的發(fā)展,機器學習算法在建模中的應用也越來越受到人們關注,機器學習具有強大的數(shù)據(jù)分析與探索能力,在疾病預測方面具有顯著優(yōu)勢[25]。在其他領域中,機器學習具備優(yōu)于Logistic 回歸分析的優(yōu)勢,能處理建模過程中因子的選擇及共線性問題[26-27],機器學習可使用大量數(shù)學運算更好地定義預測因子與結果間的復雜關系,能夠契合實際臨床工作全面性、復雜性的特點[25],但機器學習算法和傳統(tǒng)統(tǒng)計學方法間的性能比較尚存爭議,未來仍需對兩種方法進行深入研究[28]。此外,本研究中有4 項研究[12,14,20-21]采用了可視化的模型展示方式,有利于臨床應用并提高風險篩查的便利性和效率,未來可選擇便于臨床實際應用和模型更新的形式進行模型展示,如網(wǎng)頁計算器、賦值、列線圖等。
目前,越來越多的學者關注衰弱風險的早期識別并開發(fā)了預測模型,本研究共納入12 個衰弱風險預測模型,綜述了模型的基本特征,分析了目前模型建立中仍可進一步優(yōu)化的部分。建議未來研究者進一步進行基于現(xiàn)有模型的多中心、前瞻性外部驗證研究,經(jīng)過臨床實踐驗證后再推廣使用,進而提高模型準確率。此外,未來可考慮嘗試應用機器學習算法進行衰弱風險因素的建模,提高人工智能技術與研究的結合程度,并嘗試應用可視化方式展示模型,方便醫(yī)護人員直觀預估風險、減輕工作負擔。