劉 艷,傅映平*,張智香,李 月,陳文敏
1.云南中醫藥大學護理學院,云南 650500;2.昆明市延安醫院
冠心病(coronary heart disease,CHD)是由于冠狀動脈管腔狹窄或閉塞導致的心臟病,患病率、復發率、死亡率均較高。《中國心血管健康與疾病報告2021》指出,未來10年內心血管疾病患病人數仍會快速增長[1]。冠心病高危人群的早期識別,針對性的預防和治療非常重要。疾病風險預測模型采用的是定量研究方法,能夠更準確地預測發病風險,通過直觀的數據呈現研究結果。冠心病發病風險預測模型可以幫助醫護人員識別高危病人,采取相應的預防措施和干預手段,降低冠心病的患病率,減輕冠心病給病人及其家庭帶來的負擔[2]。目前,國內外已經有多項研究開發、驗證冠心病發病風險的預測模型,但文獻質量和結果不同。因此,本研究對冠心病發病風險預測模型進行系統性分析、評價,以期為醫護人員選擇合適的風險預測模型預防冠心病的發生提供參考。
計算機檢索PubMed、EMbase、Web of Science、the Cochrane Library、中國知網、中國生物醫學文獻數據庫、萬方數據庫、維普數據庫中有關冠心病發病風險預測模型的文獻,檢索時限為建庫至2022年8月31日。以coronary artery disease;artery disease,coronary;artery diseases,coronary;left main coronary artery disease;left main disease;left main coronary disease;arteriosclerosis,coronary;coronary arteriosclerosis;risk prediction model為英文檢索詞,以冠心病、冠狀動脈粥樣硬化心臟病、冠狀動脈硬化心臟病、冠狀動脈性疾病、冠狀動脈心臟病、冠狀動脈粥樣硬化、冠狀動脈粥樣硬化癥、冠狀動脈粥樣硬化性心臟病、動脈粥樣硬化性心臟病、冠狀動脈硬化性心臟病、冠心病、冠狀動脈性心臟病、冠狀動脈粥樣硬化性疾病,預測模型、預測因素、危險因素、預測為中文檢索詞。用主題詞和關鍵詞相結合的方式進行檢索,檢索語種限制為中文、英文。同時補充通過引文追溯到的文獻。
1.2.1 納入標準
1)研究對象是冠心病病人;2)研究內容為冠心病預測模型的構建和(或)驗證研究;3)闡述了模型構建或驗證的方法、過程,模型效果評價信息完整。
1.2.2 排除標準
1)只分析危險因素但未建立風險預測模型的研究;2)會議論文、學位論文; 3)數據不全、不能獲取原文的研究。
2名研究者按照納入標準和排除標準獨立篩選文獻,若2人存在意見分歧時,尋求第3方意見。納入文獻后,使用預測模型研究系統評價的關鍵評估和數據提取清單[3]提取、整理數據。
2名研究者使用偏倚風險評估工具[4]評估納入文獻的偏倚風險和適用性。偏倚風險的評估包括研究對象、預測因子、結果、分析4個領域。4個領域共包括20個問題,每個問題有“是”“可能是”“否”“可能否”和“無信息”5個選項。在一個領域中,所有評價均為“是”或“可能是”,判定該領域偏倚風險低;任意一個問題回答為“否”或“可能否”,判定該領域偏倚風險高;如果相關信息不足,則該領域偏倚風險不清楚。所有領域偏倚風險低,則總體偏倚風險低;任意一個領域偏倚風險高,則總體偏倚風險高;任意一個領域偏倚風險不清楚而其他領域偏倚風險低,則總體偏倚風險不清楚。用研究對象、預測因子、結果3個領域評估適用性。用“適用性好”“適用性差”和“適用性不清楚”評價。每個領域均好,則總體適用性好;任意一個領域差,則總體適用性差;任意一個領域不清楚則該研究總體適用性不清楚。
檢索得到相關文獻1 549篇,其中重復文獻534篇,閱讀題目和摘要剔除文獻926篇,閱讀全文后剔除80篇(只分析危險因素但未建立模型39篇、未描述模型建立方法30篇、學位論文2篇、無法獲取全文9篇),最終納入9篇[5-13]。9篇研究預測結果均為冠心病,納入文獻的基本特征見表1。

表1 納入文獻基本特征
9項研究候選預測變量數有6~19個,樣本總量為1 262~268 315例,結果事件數為270~4 860例。Genders等[10]的研究中無缺失數據。建立模型的方法包括Logistic回歸、Cox比例風險模型、Logistic回歸聯合卡方自動交互檢測(chi-squared automatic interaction detector,CHAID)決策樹。冠心病發病風險預測模型的建立情況見表2。

表2 冠心病發病風險預測模型建立情況
除Honda等[7]、Genders等[10]的研究外,其余7個模型的受試者工作特征曲線下面積(area under the curve,AUC)為0.70~0.86,預測性能較好。9項研究均進行了內部驗證或外部驗證,最終預測模型包含7~14個預測因子。預測因子由高到低排序依次為年齡、吸煙、糖尿病、性別、高血壓、高密度脂蛋白膽固醇、心絞痛、低密度脂蛋白膽固醇、體質指數。基層醫療機構也可對這些指標進行評估。模型的最終呈現形式不同,通過風險評分的方式、冠心病發病率方程呈現結果。所有模型的性能及預測因子見表3。

表3 冠心病風險預測模型性能及預測因子
2.4.1 與研究對象有關的偏倚
若研究選擇的數據來源不合適或未按照事先的納入標準和排除標準選擇研究對象,會造成選擇偏倚。經過評估,9項研究偏倚風險均較低。
2.4.2 與預測因子有關的偏倚
該領域需考慮所有研究對象是否用類似的方式定義和評估、研究是否在不了解結果數據的情況下進行、在使用模型時是否所有的預測因子都可用。經評估4項研究在預測因子領域偏倚風險高[5-7,9],其余偏倚風險均低。使用多中心醫療機構的數據時,各中心預測變量評估方法的不同會產生偏倚。Chen等[5]和Genders等[10]研究的數據來自數據庫,明確指出統一標準評估預測變量。李婕等[9]回顧性研究數據也來自多中心臨床數據庫,未提及采取統一的方式預測變量。因此,“所有研究對象的預測因子是否以類似的方式定義和評估”的回答為“可能否”。如果不對預測因子評估者實施盲法也會造成偏倚。由于無法得知預測指標的評估是否在不了解結果的情況下進行,所以2項研究在“預測因子的評估是否在不了解結果數據的情況下進行”回答為“無信息”。
2.4.3 與結果有關的偏倚
該部分適當確定結果、使用預先指定的標準定義結果、結果是否剔除了預測因子、確定結果是否在不知道預測因子的情況下、預測因子評估和確定結果時間間隔合適的問題均要考慮。有1項研究[7]在結果領域偏倚風險高,2項研究[10,12]偏倚風險低,其余6項研究[5-6,8-9,11,13]偏倚風險不清楚。Honda等[7]研究在“結果的定義和確定方式是否相似”回答為“可能否”。由于2項研究[11,13]中關于“是否在不知道預測因子信息的情況下確定結果”無信息,故偏倚風險回答為“不清楚”。
2.4.4 分析領域和總體偏倚分析的評估
該項評估涉及結果事件數量的合理情況、處理連續變量和分類變量、登記者參與在分析中、丟失數據的處理、考慮數據復雜性、合理評估模型性能、考慮樂觀偏差、最終模型的預測因子及其分配的權重與多變量分析結果相符。
9項研究偏倚風險均較高。除Jang等[11]未提及結果事件數,其余研究結果事件數均大于100。二分類連續變量的模型會降低預測能力,有6個模型對連續變量進行了二分類[5,7,9-10,12-13]。在缺失數據處理方面,4項研究沒有提供相關信息[5-6,9,11],4項用了完整案例分析[7-8,12-13],1項無缺失數據[10]。有1項研究為考慮競爭風險和時間分析[5],可能會忽視數據的復雜性。關于模型性能評估,僅有2項研究同時報告了校準度和區分度[5,11]。在5項開發研究中,2項為隨機交叉驗證[9,13],其余為自助采樣法驗證。
2.4.5 適用性評價
在適用性方面,所有納入的模型在各領域和總體的適用性均較好。
本研究共納入了9個冠心病風險預測模型,文獻質量整體較好。大部分模型采用Logistic回歸方法建模且模型AUC>0.70。年齡、吸煙、糖尿病、血壓和血脂異常是模型中常用的預測因子。
模型的性能依賴于研究設計、建模方法、評估工具的選擇。本研究所有納入模型研究設計較完整和縝密,都進行了內部和(或)外部驗證,研究方法學質量評價結果整體較好。Logistic回歸能根據回歸系數的權重給各個預測因子進行賦值,針對性地預測病人發生冠心病的風險,因此模型的可操作性較強[14]。Framingham模型是國際上心血管疾病風險評估較常用模型,但研究表明只適用于發達國家人群[15]。Xu等[6]開發出了較適宜發展中國家人群的預測模型。而有的研究[5]樣本量較小且未采用特殊統計學方法處理,應慎用該類模型。
冠心病的危險因素較多,但納入各模型的預測因子存在一定的共性,包括年齡[5-13]、吸煙[6-13]、糖尿病[6-13]、血脂異常[5-10,12-13]、性別[5-7,9-11]、高血壓[5-6,10]。5個模型[5-7,9-11]中,性別是獨立預測因子,可能原因為:女性絕經前受到雌激素保護,血管得到弱化[16],而絕經后發病率差異不大。故對絕經后女性應做好健康宣教,盡早診斷并及時就醫。糖尿病也是重要的預測因子,可能是因為糖尿病和冠心病有肥胖和高血壓等相似的高危發病因素[17-18]。2013年美國心臟協會指南推薦將冠狀動脈鈣化作為中風險人群的臨床決策輔助[19],但由于未建立模型,不納入本研究。國內模型缺少對日常生活習慣,如鍛煉、久坐等的觀察,應提高對此關注度,以降低冠心病的發生[20]。
由于研究的納入標準、研究設計、模型評價指標存在差異,無法匯總結果進行Meta分析,僅能進行定性總結,尚不能回答何種預測模型最適合我國人群。本研究剔除會議論文、學位論文等文獻,一些重要研究可能漏選。本研究的模型雖都進行了驗證,但缺乏大樣本、多中心的外部驗證,發表偏倚仍存在。
冠心病風險預測模型能夠有效識別病人發病風險,早期篩查和識別高危人群有助于醫護人員提供有針對性的預防措施,提高醫療資源的使用效率,改善病人結局。本研究中預測模型的預測性能和適用性較好,可將納入的高質量預測模型應用于冠心病管理和干預。目前,針對某個群體設計并考慮競爭風險的預測模型罕見,Liu等[13]的研究在此方面較有遠見,但也存在一定局限性。后期醫護人員可使用人工智能技術建立風險預測信息平臺,提高預測模型的精準度。
本研究共納入9個預測模型,納入研究的方法學質量評價和預測效能整體較好,可幫助醫護人員早期識別冠心病高風險人群,由于模型的外推性未得到及時評價,未來可對模型外部驗證進行進一步研究。