劉 龍 湯 哲 李 霞 羅艷俠 郭 晉 李海彬 劉相佟 陶麗新 閆傲霜,3* 郭秀花*
(1.首都醫科大學公共衛生學院流行病與衛生統計學系 北京市臨床流行病學重點實驗室,北京 100069;2.首都醫科大學宣武醫院流行病學和社會醫學部,北京 100069; 3.北京市科學技術委員會,北京 100195)
?
基于競爭風險模型的北京市老年人群心血管疾病短期風險評估
劉龍1湯哲2李霞1羅艷俠1郭晉1李海彬1劉相佟1陶麗新1閆傲霜1,3*郭秀花1*
(1.首都醫科大學公共衛生學院流行病與衛生統計學系 北京市臨床流行病學重點實驗室,北京 100069;2.首都醫科大學宣武醫院流行病學和社會醫學部,北京 100069; 3.北京市科學技術委員會,北京 100195)
【摘要】目的 在考慮“競爭事件”的前提下,對北京市老年人群心血管疾病(cardiovascular disease,CVD)進行5年的風險評估。方法基于傳統的心血管疾病影響因素年齡、糖尿病、吸煙、婚姻狀況、體質量指數、血壓(blood pressure, BP)、總膽固醇(total cholesterol,TC)、高密度脂蛋白膽固醇(high-density lipoprotein cholesterol, HDL-C),構建競爭風險模型,計算未來5年心血管疾病的絕對風險,通過受試者工作特征曲線(receiver operating characteristic curve,ROC)及依時受試工作者曲線下面積(areas under the ROC curve, AUC)值來衡量模型的判別能力,采用校正圖來衡量模型的校正度。經過Bootstrap重抽樣技術對風險預測模型進行內部驗證以減少過度擬合偏倚。結果1992年基線檢查無心血管疾病者共1 775人,其中男性886人(49.92%),女性889人(50.08%),至2012年末隨訪結束,共有473人死于心血管疾病,693人死于非心血管疾病,609人存活或失訪。男性與女性心血管疾病的風險評分總分分別為65分和62分,最佳切點分別為34分和30分。預測模型具有較好的判別能力與校正度。結論利用心血管疾病的傳統危險因素,借助競爭風險模型,構建了北京市老年人群心血管疾病的短期風險評估工具,為有效篩查心血管疾病的高危人群提供了科學依據和技術手段。
【關鍵詞】心血管疾病;競爭風險模型;風險評估;老年人群
心血管疾病(cardiovascular disease,CVD)已經成為全球的頭號死因,據世界衛生組織估計,2012年大約有1 750萬人死于心血管疾病,占全球死因的31%[1]。北京自1990年開始就已經進入了老齡化社會,截止到第6次全國人口普查,北京的60歲以上老年人口達到246萬[2]。針對于北京市老年人心血管疾病的篩查變得尤為迫切。目前,許多國家已經開發了適合本國人群的心血管疾病風險評估工具,如美國Framingham心臟研究、歐洲的Score研究、日本的Suita研究以及我國的中國多省市隊列研究(China Multi-provincial Cohort Study, CMCS)隊列研究等[3-6]。然而,以上研究均采用Cox比例風險回歸模型、Logistic回歸模型和Weibull比例風險模型等傳統的生存分析方法,僅關心某一個終點的情況,在可能會發生多個終點事件的情況下,將會由于“競爭風險”的存在而導致對這些終點事件概率的估計產生偏差。競爭風險(competing risks)是指研究對象出現感興趣事件(interesting event)的同時還會出現其他結局事件,這些結局事件將阻止感興趣事件的出現或使其發生的概率降低,各結局事件間形成所謂的“競爭”關系,這一系列事件稱作競爭事件。老年人群是一個“競爭事件”高發的人群,由于存在嚴重的“競爭事件”,阻礙了對“感興趣事件”的觀察,從而導致對心血管疾病發病風險的估計產生偏差。與傳統的生存分析方法不同,競爭風險模型是一種用于處理具有“競爭事件”的生存分析技術,它可分析面臨多種潛在結局的生存數據,這些數據包括失效的時間跨度和導致失效的終點事件。本研究將基于競爭風險模型構建北京市老年人群心血管疾病的風險預測模型,并構建老年人群心血管疾病的短期(5年)風險評估工具,預測個體未來五年發生心血管疾病的風險,不僅有助于早期識別心血管疾病的高危個體,而且對老年人群心血管疾病危險因素的控制和預防提供了參考依據。
1資料與方法
1.1資料
資料來源于1992至2012年北京老齡化多維縱向研究,以北京市55歲以上老年人作為調查對象(不是聯合國定義的大于等于60歲),其中包括患者基本信息、心理健康、慢性病情況、飲食習慣、衛生行為、生活活動能力,實驗室檢查結果和死亡狀況等幾個方面信息。本研究選取1992年基線調查無心血管疾病的1 775人,其中男性886人(49.92%),女性889人(50.08%),隨訪截止日期為2012年12月31號。本研究的終點事件為發生或死于心血管疾病,即“感興趣事件”,非心血管疾病死亡定義為“競爭事件”。至隨訪結束,共有473人發生或死于心血管疾病,693人死于非心血管疾病,609人存活或失訪。
糖尿病診斷標準按照空腹血糖值≥7. 0 mmol/L 或餐后血糖≥11. 1 mmol/L或接受胰島素治療進行判定。高血壓指收縮壓≥140 mmHg(1 mmHg=0.133 kPa)和(或)舒張壓≥90 mmHg;高血壓1級指收縮壓140~159 mmHg和(或)舒張壓90~99 mmHg;高血壓2級指收縮壓160~179 mmHg和(或)舒張壓100~109 mmHg;高血壓3級指收縮壓≥180 mmHg和(或)舒張壓≥110 mmHg;正常血壓或正常高值血壓指收縮壓<140 mmHg 和(或) 舒張壓<90 mmHg??偰懝檀?total cholesterol,TC):<5.17 mmol/L為合適范圍,5.17~6.21 mmol/L為邊緣升高,≥6.21 mmol/L為升高。體質量指數(body mass index,BMI)的分組按照<24 kg/m2為正常,≥24 kg/m2為超重或肥胖。高密度脂蛋白膽固醇(high-density lipoprotein cholesterol,HDL-C):<0.91 mmol/L為合適范圍,0.91~1.55 mmol/L為邊緣升高,≥1.55 mmol/L為升高?;橐鰻顩r分為單身或有配偶;吸煙狀態分為吸煙或者不吸煙。
1.2方法

模型的評價從判別度和校正度兩個方面來衡量,傳統的受試者工作特征曲線(receiver operating characteristic curve,ROC)及受試者工作特征曲線下面積(areas under the ROC curves, AUC),只能處理結局為二分類的情況,對于存在“競爭事件”的多分類結局,本研究將采用依時ROC曲線及AUC值來衡量[8]。通過1 000次的Bootstrap重抽樣技術對模型進行內部驗證。最后根據Fine and Gray模型的協變量系數,對危險因素的不同水平進行賦分。年齡作為一個連續型變量,對不同年齡段取中位數,然后用此中位數乘以年齡的系數。其余分類變量都是協變量的系數乘以10,然后四舍五入,取整數[5]。
本研究通過R 3.1.3軟件的“time ROC”包繪制依時ROC曲線及計算AUC值。在模型校正能力方面,本研究通過Excel繪制了模型的校正圖(calibration plot),其余所有分析均通過STATA 13.0完成。
2結果
2.1一般情況
1992年基線調查無心血管疾病的1 775人,其中男性886人(49.92%),女性889人(50.08%);平均年齡男性為70.22歲,女性為69.70歲。207例(23.36%)男性發生CVD事件,266例(29.92%)女性發生CVD事件。差異性分析發現,TC、HDL-C、BMI、吸煙及血壓(blood pressure, BP)的基線調查結果存在性別差異,經t檢驗、χ2檢驗及秩和檢驗,差異具有統計學意義,1992年基線調查的結果如表1所示。
由于心血管病在多種危險因素上存在性別效應,結合本研究的結果,決定對老年人群分性別構建風險預測模型及風險評估工具。男性的HDL-C(<0.91 mmol/L、≥1.55 mmol/L)、女性的血壓(stage-1 hypertension)及HDL-C(<0.91 mmol/L、≥1.55 mmol/L)在競爭風險模型中無統計學意義,其他影響因素的回歸系數和部分分布的危險度均有統計學意義,結果如表2所示。
本研究將拆遷及移居外地、身體原因等不能繼續參加研究,以及其他原因的死亡而退出研究作為失訪。其中,非CVD事件的死亡作為競爭事件處理,發生CVD事件作為感興趣事件處理,其余的都作為刪失數據處理。
2.2模型評價
模型的判別能力通過依時ROC曲線及AUC值來衡量,本研究繪制time=5年的ROC曲線及AUC值(time=5年),如圖1、2所示,男性模型的AUC值為0. 783(95%CI: 0.726~0.840),女性模型的AUC值為 0.835(95%CI: 0.793~0.877)。綜上,模型均具有較好的判別能力。模型的校正能力通過校正圖(calibration plot)來衡量,如圖3、4所示,在不同分位數分組上,預測值十分接近觀測值,模型具有較好的校正能力。

表1 研究對象基線特征
TC: total cholesterol; HDL-C: high-density lipoprotein cholesterol; BMI: body mass index.

表2 心血管疾病發病的競爭風險模型回歸結果
2.3內部評價
通過1 000次的Bootstrap 重抽樣技術對預測模型進行內部驗證,樂觀修正的ROC曲線下面積(optimism-corrected AUC),男性模型為0. 761(95%CI: 0.703~0.819),女性模型為0.813(95%CI: 0.758~0.868),表明以上模型通過了內部驗證。
2.4風險評分
男性短期風險評分的總分為65分,女性為62分,最佳切分點分別為34分和30分,靈敏度與特異度分別為0.75、0.72和0.82、0.68??梢哉J為在未來5年男性心血管病短期風險評分大于34分,女性大于30分發生心血管疾病的風險較高,即屬于高危人群。年齡作為心血管疾病的頭號危險因素,其所對應的評分最高,男性年齡的最高得分為24分,女性年齡的最高得分為25分,如表3和表4所示。

圖1 ROC曲線

圖2 依時AUC曲線

圖3 男性校正圖

圖4 女性校正圖
3討論
目前,許多國家和地區都構建了適合本地人群特點的風險評估工具,并不斷的對心血管疾病風險預測模型及風險評估工具進行完善和更新,如美國的Framingham心臟研究、歐洲的Score研究、日本的Suita研究以及我國的CMCS隊列研究等[3-6]。然而,以上研究均未考慮“競爭事件”對心血管疾病預測的影響,可能導致對發病風險的估計存在誤差。本研究在考慮“競爭事件”的前提下,構建了針對老年人群的心血管疾病的風險預測模型;模型的評價及內部驗證的結果均比較理想。
近年來,競爭風險模型在醫學研究領域得到了廣泛的應用,例如,2型糖尿病的臨床試驗研究,探討老年人群心腦血管疾病的影響因素研究,以及我國35至55歲人群心血管疾病終生風險研究等,該模型適用于存在多種潛在結局的生存數據,這些數據包括失效的時間跨度和導致失效的終點事件。Koller等[9]采用競爭風險模型構建了美國和歐洲老年人群冠狀動脈粥樣硬化性心臟病的風險預測模型,模型具有較好的判別能力和校正度。
本研究從臨床應用的角度出發,未考慮心理因素等對心血管疾病的影響,采用了心血管疾病的傳統危險因素,隨著數字醫療的發展,手機APP的應用越來越廣泛,調查手段已經發生跨時代的變化,未來筆者考慮將與心血管疾病有關的更多危險因素納入該風險預測模型,以求進一步提高模型的預測精度。此外,本研究的不足之處在于采用了各危險因素基線調查的結果,未考慮各危險因素隨時間的變化,可能會使心血管疾病的短期風險評估存在一定的誤差,今后,筆者將致力于構建心血管疾病風險預測的動力學模型。由于隨訪時間長達20年,本研究存在一定程度的失訪偏倚。最后,本研究只進行了內部驗證,尚未將該預測模型應用于其他人群,進行有效的外部驗證。

表3 心血管疾病發病的短期風險評分表

表4 北京市老年人群心血管疾病發病的短期風險
在短期風險評估的基礎上,本課題組將著力解決當前研究中存在的局限性,不斷完善和發展疾病風險評估的相關技術,進一步開展北京市老年人群心血管疾病的長期(10年)風險評估,并構建相應的風險評估工具。
4參考文獻
[1]World Health Organization. Cardiovascular diseases (CVDs)[EB/OL]. (2015-06-18)[2015-09-25]. http://www.who.int/mediacentre/factsheets/fs317/en/.
[2]易成棟, 張純, 吳淑萍,等.2000-2010年北京市老年人口空間分布及其變動研究 [J]. 城市發展研究,2014, 21(2): 66-71.
[3]Wilson P W, D’Agostino R B, Levy D, et al. Prediction of coronary heart disease using risk factor categories[J]. Circulation,1998, 97(18): 1837-1847.
[4]Conroy R M, Py?r?l? K, Fitzgerald A P, et al, et al. Estimation of ten-year risk of fatal cardiovascular disease in europe: the SCORE project[J]. Eur Heart J, 2003, 24(11): 987-1003.
[5]Nishimura K, Okamura T, Watanabe M, et al. Predicting coronary heart disease using risk factor categories for a Japanese urban population, and comparison with the Framingham risk score: the suita study[J]. J Atheroscler Thromb, 2014,21(8): 784-798.
[6]Liu J, Hong Y, D’Agostino R B Sr, et al. Predictive value for the chinese population of the Framingham chd risk assessment tool compared with the chinese multi-provincial cohort study[J]. JAMA, 2004, 291(21): 2591-2599.
[7]Fine J P, Gray R J. A proportional hazards model for the subdistribution of a competing risk[J]. J Am Stat Assoc,1999,94(446):496-509.
[8]Wolbers M, Blanche P, Koller M T, et al. Concordance for prognostic models with competing risks[J]. Biostatistics,2014, 15(3): 526-539.
[9]Koller M T, Leening M J, Wolbers M, et al. Development and validation of a coronary risk prediction model for older U.S. and european persons in the cardiovascular Health Study and the Rotterdam Study[J]. Ann Intern Med, 2012, 157(6): 389-397.
編輯孫超淵
A short-term risk assessment for cardiovascular diseases among the elderly in Beijing based on competing risk model
Liu Long1, Tang Zhe2, Li Xia1, Luo Yanxia1, Guo Jin1, Li Haibin1, Liu Xiangtong1, Tao Lixin1, Yan Aoshuang1,3*, Guo Xiuhua1*
(1.DepartmentofEpidemiologyandHealthStatistics,SchoolofPublicHealth,CapitalMedicalUniversity;BeijingMunicipalKeyLaboratoryofClinicalEpidemiology,Beijing100069; 2.DepartmentofEpidemiologyandSocialMedicine,XuanwuHospital,CapitalMedicalUniversity,Beijing100069,China; 3.BeijingMunicipalScienceandTechnologyCommission,Beijing100195,China)
【Abstract】ObjectiveThe study aimed at developing a 5-year risk prediction model of cardiovascular disease (CVD) based on competing risk model, and developing a user-friendly risk score tool for risk assessment of cardiovascular disease.MethodsWe used competing risks model to evaluate the risks of developing a first CVD event. Sub-distribution hazard ratios (SHR) and 95% confidence intervals (95%CI) were computed for the associations between each risk factor and CVD.Time-dependent receiver operating characteristic (ROC) curve and time-dependent areas under the ROC curves (AUC) were used to evaluate the discrimination ability of the models, calibration plot was applied to assess the calibration of the models. Internal validation of predictive accuracy was performed via 1 000 times of bootstrap resampling.ResultsOf the 1 775 subjects without CVD at baseline, 473 incident cases of CVD were documented for a median 8-year follow-up. The participants were 886 men and 889 women between the ages of 55 and 96 years old without cardiovascular disease at baseline with 20 years of follow-up.Multivariable risk functions were derived that incorporated age, total cholesterol(TC), high-density lipoprotein cholesterol(HDL-C),blood pressure, smoking, diabetes, marital status and overweight or obesity body mass index (BMI). The model showed good discrimination and calibration.Male and female cardiovascular disease risk scores were 65 points and 62 points, the best point were 34 points and 30 points. ConclusionA sex-specific multivariable risk factor algorithm based competing risk model was made. The BLSA CVD risk prediction model can be used to predicted an individual’s risk of CVD and provides a useful guide to identify the groups at high risk for CVD among over 55 years old man. A user-friendly risk score tool predicting 5-year probability of cardiovascular disease was developed.
【Key words】cardiovascular disease; competing risks model; risk assessment; elderly population
(收稿日期:2016-01-08)
【中圖分類號】R 195
[doi:10.3969/j.issn.1006-7795.2016.02.015]
*Corresponding author, E-mail: yanaspublic@126.com; guoxiuh@ccmu.edu.cn
基金項目:“十二五”國家科技支撐計劃項目(2011BAI08B01),國家自然科學基金(81302516, 81373099),北京市自然科學基金重點項目(7131002),教育部人文社科基金(13YJCZH090)。This study was supported by National Twelfth Five-year Science and Technology Support Program (2011BAI08B01), National Natural Science Foundation of China (81302516, 81373099), Key Project of Beijing Natural Science Foundation (7131002), Humanities and Social Sciences Fund of the Ministry of Education, China (13YJCZH090).
網絡出版時間:2016-04-1221∶12網絡出版地址:http://www.cnki.net/kcms/detail/11.3662.r.20160412.2112.022.html
· 基礎研究 ·