任媛淵, 丁 福, 徐志會, 付榮娟
(重慶醫科大學附屬第一醫院, 1. 全科醫學科, 2. 護理部, 重慶, 400016;3. 重慶市合川區人民醫院 護理部, 重慶, 401533; 4. 重慶市墊江縣人民醫院 護理部, 重慶, 408300)
跌倒是全世界范圍內的主要公共衛生問題之一,也是全球意外傷害死亡的第2大原因,更是住院患者最常見的安全事件之一[1], 不僅延長患者住院時間,加重個人、家庭和社會的經濟負擔[2-3], 而且可導致殘疾和功能損害[4-5], 甚至死亡[6-8]。防范跌倒是評價醫院護理質量的重要指標[9], 也是全球范圍內患者安全領域被持續關注的目標之一[10], 盡早識別跌倒風險并給予護理干預,能將院內跌倒發生率降低20%~30%[11]。跌倒風險預測模型作為重要的預測工具,對早期預測跌倒風險并實施預見性護理,進而降低跌倒發生率具有重要意義。本文對國內外住院患者跌倒風險預測模型的研究現狀進行綜述,以期為臨床選用及構建跌倒風險預測工具提供參考依據。
基于Pubmed數據庫,以“inpatients/patients in hospital/hospitalized patients”“fall/fall down/tumble/slip/stumble”“risk prediction model/prediction model”為主題詞精確搜索2017年12月—2022年12月文獻,共獲得住院患者跌倒風險預測模型構建相關文獻45篇,其中通過傳統方法建模的文獻17篇,通過機器學習方法建模的文獻28篇。文獻分析結果顯示,國外住院患者跌倒風險預測模型的構建具有以下特點。
美國學者HARRINGTON P[12]認為,機器學習是將無序的數據轉換成有用的信息。英國學者FLACH P[13]則將機器學習概括為“使用正確的特征構建正確的模型,以完成既定的任務”。雖然機器學習的定義并不統一,但學習的關鍵在于利用計算機的運算能力從大量數據中發現“函數”或“模型”,并通過其來模擬現實世界事物間的關系,從而實現預測或判斷的功能[14]。機器學習的核心要素為數據、算法和模型[15], 具有從經驗中學習,利用系統進行自我改進,并隨著學習提高性能的特點[16-17], 主要分為監督學習、無監督學習和強化學習3大類[18]。現有文獻顯示,國外基于機器學習構建住院患者跌倒風險預測模型多采用監督學習方法。荷蘭學者DORMOSH N等[19]借助Bolasso回歸分析開發涵蓋跌倒史、記憶或注意力問題、骨關節炎等10個危險因素的跌倒風險預測模型; 韓國CHO I等[20]基于貝葉斯網絡構建的模型包括人口學特征、認知因素、行為因素等6大類預測因子; 日本NAKANISHI T等[21]基于決策樹構建的模型由9個分支構成,第1分支是譫妄,第2分支為跌倒史,其余為使用助行器、步態不穩、攜帶輸液管道等。美國OSHIRO C E S等[22]基于Lasso回歸分析構建模型,共納入年齡、行走問題、多重用藥等13個關鍵預測因子; YE C Y等[23]和LINDBERG D S等[24]分別采用隨機森林、極限梯度提升、支持向量機、k-近鄰法、分類樹、Bagging、自適應提升等集成學習算法構建跌倒風險預測模型,納入一般信息、入院信息、臨床數據等預測因子。
雖然應用機器學習建模已成為研究熱點,但機器學習方法是否在任何條件下均優于傳統方法尚無定論。VOLOVICI V等[25]認為,現有研究存在濫用和誤用機器學習現象。濫用機器學習建模將增大臨床對模型的解釋難度,誤用機器學習可能導致機器學習“黑匣子”原理支撐的臨床決策與臨床實踐相悖[25]。為了比較機器學習與傳統方法的建模效果,韓國JUNG H等[26]比較Logistic回歸、Cox比例風險回歸和決策樹3種方法的效果,發現基于Logistic回歸分析構建的模型性能最佳。因此,在機器學習成為構建住院患者跌倒風險預測模型主要方法的大趨勢下,研究者更應審慎考慮機器學習的必要性和適當性,以實際臨床問題和需求為導向,充分考慮數據集的類型、規模和維度,選用恰當的建模方法,并以統計指標為依據、以臨床實際為基礎從多角度合理解讀所得的模型。
國外研究者無論采用傳統方法還是機器學習方法建模,大多數據都來源于某一家醫院的電子病歷,從Pubmed數據庫檢索到的45篇構建住院患者跌倒風險預測模型的相關文獻中,僅CHOI Y等[27]和WANG Y等[28]基于多中心數據建模,其余均為單中心數據。單中心數據可在一定程度上降低數據采集難度,但數據可能缺乏代表性,數據偏頗還會影響模型的預測性能及臨床適用性。此外,即使是采用傳統方法建模,數據也主要來自電子病歷系統。美國學者LOHSE K R等[29]和韓國學者JUNG H等[26]均基于電子病歷數據建模,總體數據量為2 007、15 480人,跌倒數據量為131、310人,采集數據的時間線為1.5、3.0年。另有多項研究[19-24,27-28]采用機器學習方法建模,數據同樣來源于電子病歷,數據量為814~176 816人,跌倒數據量為238~4 778人,數據采集周期長短不一,為1~10年。隨著醫療信息化技術和電子病歷系統的不斷發展與完善,雖然電子病歷數據已成為臨床大數據的主要來源,但國外研究者在應用電子病歷數據建模的過程中,總體樣本量和跌倒數據量差距較大,數據類別不平衡問題突出,基于這類偏數據構建的跌倒風險預測模型可能無法完整描述臨床跌倒問題,甚至會放大性別歧視、種族歧視等問題[25]。
對于構建的模型,研究者可采用不同方法在不同測試人群中進行驗證。一方面,國外研究者驗證模型的方法呈現多樣化特點,韓國JUNG H等[26]、美國LOHSE K R等[29]和LINDBERG D S等[24]分別采用5倍交叉驗證和10倍交叉驗證對模型進行驗證,荷蘭DORMOSH N等[19]和韓國CHO I等[20]分別將10倍交叉驗證和Bootstrap、跨時間站點相結合進行模型驗證,日本NAKANISHI T等[21]基于留出法驗證模型,美國學者YE C Y等[23]采用保序回歸方法進行模型驗證。雖然各國學者采用的驗證方法有所不同,但這些方法均是機器學習的經典方法,具有較強的科學性。研究者應根據臨床數據的性質選用不同的驗證方法: 如果研究數據量非常大,可以選用留出法; 如果研究數據量較大,可以選用交叉驗證法; 如果研究數據無序性較強,則可以選擇保序回歸法。另一方面,模型驗證可分為內部驗證和外部驗證,測試人群相同或相似為內部驗證,測試人群不同則為外部驗證[30]。對檢索到的文獻進行分析,僅法國學者BEAUCHET O等[31]對模型進行外部驗證,其余研究[19-21, 27-28]均采用內部驗證評價模型,提示各研究所得模型并未落實于臨床實踐,且尚未在臨床應用及推廣。
基于CNKI數據庫,以“住院患者/住院病人”“跌倒”“風險/預測/風險預測/預測模型/模型”為主題詞精確檢索2017年12月—2022年12月文獻,共獲取住院患者跌倒風險預測模型構建相關文獻6篇(均采用傳統方法建模); 基于Pubmed數據庫,以“inpatients/patients in hospital/hospitalized patients”“fall/fall down/tumble/slip/stumble”“risk prediction model/prediction model”為主題詞精確搜索2017年12月—2022年12月中國研究者發表的文獻,獲得相關文獻4篇(均采用機器學習方法建模)。文獻分析結果顯示,中國住院患者跌倒風險預測模型的構建具有以下特點。
中國大陸地區研究者主要采用傳統統計學方法構建住院患者跌倒風險預測模型。林麗娜等[32]、程正楠等[33]均采用單因素分析和Logistic回歸分析建模,分別納入活動受限、跌倒史、用藥等7個危險因素和性別、抑郁、疲乏等6個風險因素; 陳森蕓等[34]采用多因素Logistic回歸分析和列線圖構建的模型包含Morse跌倒風險評分、血鉀濃度、夜尿/排便增多、跌倒風險認知4個預測因子。近年來,中國香港和中國臺灣地區學者更傾向于采用機器學習方法建模。WANG H L等[35]基于張量分解算法探索患者、跌倒時間、地點和科室之間的內在關系,從而預測住院患者不同科室和地點的跌倒事件。HSU Y C等[36]基于極限梯度提升方法構建包括教育水平、體溫、脈率等高危因素的跌倒風險預測模型; LIU C H等[37]采用決策樹、貝葉斯網絡、支持向量機、隨機森林、Bagging及自適應提升4種監督學習和2種集成學習方法建模,得出Bagging和隨機森林相結合的集成學習方法構建的模型預測性能最佳,該模型共納入入院診斷、手術記錄、用藥記錄等54個危險因子。分析中國學者的相關文獻可發現,臺灣、香港地區學者[35-38]已采用機器學習方法建模,大陸地區學者[32-34]仍主要采用傳統的Logistic回歸分析方法建模。Logistic回歸分析實現簡單、計算量小,常用于危險因素分析、疾病風險預測及疾病診斷,但其不能解決非線性問題,難以處理不平衡數據,且準確度不高[39]。構建方法的選擇是開發預測模型的關鍵,相較于國外,中國目前的建模方式(以傳統方法為主)一定程度上限制了跌倒風險預測模型的整體性能和臨床適用性。
中國的研究者通過不同數據源構建住院患者跌倒風險預測模型,例如現場詢問、電話調查[32]、半結構式訪談或問卷調查[33]等方法采集的原始資料。近年來,中國港臺地區學者開始嘗試應用電子病歷[36]、電子健康記錄[38]、跌倒安全報告系統[35-36]等電子信息系統數據構建模型。雖然建模的數據源存在差異,但無論是基于傳統方法還是機器學習方法建模,數據均為單中心數據,且總體樣本量和跌倒樣本量均偏小。采用傳統方法建模的研究中,總體樣本量最小僅226人[34], 最大950人[33]; 跌倒樣本量最小僅93人[33], 最大113人[34]; 數據收集周期最短僅4個月[33],最長3.5年[34]。采用機器學習方法建模的研究中,雖然總體樣本量最大可達108 940人[37], 但跌倒樣本量仍偏小,為256~349人[35-38], 采集數據的時間段為9個月~4.5年[35-38]。相較于國外,中國該領域的數據類別不平衡問題更加突出,偏數據建模將直接影響模型的預測性能。此外,雖然HSU Y C等[36]和CHU W M等[38]采用機器學習方法建模,但其樣本量僅639人和1 101人,既不符合臨床大數據的建模條件,也不適用于機器學習這種以大數據為基礎的建模方法。
在驗證方法方面,中國絕大多數研究者仍習慣對模型進行傳統統計學驗證[32-33, 36-37], 而忽視對機器學習驗證方法的探索,僅CHU W M等[38]和陳森蕓等[34]對交叉驗證和Bootstrap進行了嘗試,整體而言模型驗證方法較單一。在驗證過程方面,中國學者大多僅對模型進行內部驗證[32-38], 缺乏將模型應用于不同測試人群的外部驗證,且未對模型進行重新校準和動態更新,故構建的風險預測模型并未真正發揮作用。在驗證結果方面,中國研究者構建的模型,受試者工作特征曲線的曲線下面積為0.57~0.90[32-38], 區分度顯著低于國外研究[19-24, 26-29, 31]的0.70~0.99; 無論采用傳統方法還是機器學習方法建模,中國學者構建的跌倒風險預測模型的靈敏度和特異度均低于國外研究[26, 32-33, 38]。
良好的風險預測模型是早期識別住院患者跌倒風險的重要保障[40-44], 從電子病歷系統直接采集數據,并以機器學習為主要方法建模,正成為這一領域的研究熱點[45-47]。但現有研究顯示,住院患者跌倒風險預測模型的構建尚存在數據規模與方法不匹配,數據普適性、平衡性較差,經外部驗證的模型較少,臨床適用性不強等問題。未來,護理研究者應特別注意算法與大數據“4V”特性[48]的匹配性,根據數據特征,科學選擇機器學習方法,同時加強醫療機構信息互通與合作,收集實時、多中心、大樣本數據,以推動跌倒風險預測模型的真實世界研究,并立足臨床,以研究結果反哺臨床問題的解決,提升住院患者跌倒風險預測模型的科學性和臨床適用性。