999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的冠心病風險預測模型構建與比較

2025-01-01 00:00:00岳海濤何嬋嬋成羽攸張森誠吳悠馬晶
中國全科醫學 2025年4期
關鍵詞:冠心病高血壓模型

【摘要】 背景 冠狀動脈粥樣硬化性心臟病(以下簡稱冠心病)是全球重要的死亡原因之一。目前關于冠心病風險評估的研究在逐年增長。然而,在這些研究中常忽略了數據不平衡的問題,而解決該問題對于提高分類算法中識別冠心病風險的準確性至關重要。目的 探索冠心病的影響因素,通過使用2種平衡數據的方法,基于5種算法建立冠心病風險相關的預測模型,比較這5種模型對冠心病風險的預測價值。方法 基于2021年美國國家行為風險因素監測系統(BRFSS)橫斷面調查數據篩選出112 606名研究對象的健康相關風險行為、慢性健康狀況等24個變量信息,結局指標為自我報告是否患有冠心病并據此分為冠心病組和非冠心病組。通過進行單因素分析和逐步Logistic回歸分析探索冠心病發生的影響因素并篩選出納入預測模型的變量。隨機抽取112 606名受訪者的10%(共計11 261名),以8∶2的比例隨機劃分為訓練與測試的數據集,采用隨機過采樣和合成少數過采樣技術(SMOTE)兩種過采樣的方法處理不平衡數據,基于k最鄰近算法(KNN)、Logistic回歸、支持向量機(SVM)、決策樹和XGBoost算法分別建立冠心病預測模型。結果 兩組年齡、性別、BMI、種族、婚姻狀態、教育水平、收入水平、家里有幾個孩子、是否被告知患高血壓、是否被告知處于高血壓前期、是否被告知患妊娠高血壓、現在是否在服用高血壓藥物、是否被告知患有高脂血癥、是否被告知患有糖尿病、吸煙情況、過去30 d內是否至少喝過1次酒、是否為重度飲酒者、是否為酗酒者、過去30 d內是否有體育鍛煉、心理健康狀況以及自我健康評價比較,差異有統計學意義(Plt;0.05)。逐步Logistic回歸分析結果顯示:年齡、性別、BMI、種族、教育水平、收入水平、是否被告知患高血壓、是否被告知處于高血壓前期、是否被告知患妊娠高血壓、現在是否在服用高血壓藥物、是否被告知患有高脂血癥、是否被告知患有糖尿病、吸煙情況、過去30 d內是否至少喝過1次酒、是否為重度飲酒者、是否為酗酒者以及自我健康評價為冠心病的影響因素(Plt;0.05)。風險模型構建的分析結果顯示:k最鄰近算法、Logistic 回歸、支持向量機、決策樹和XGBoost采用SMOTE處理不平衡數據的總體分類精度分別為59.2%、67.4%、66.2%、69.2%和85.9%,召回率分別為75.2%、71.4%、70.5%、62.9%和34.8%,精確度分別為15.4%、18.2%、17.5%、17.6%和28.7%,F值分別為0.256、0.290、0.280、0.275和0.315,受試者工作特征曲線下面積分別為0.80、0.78、0.72、0.72和0.82;采用隨機過采樣處理不平衡數據的總體分類精度分別為62.5%、68.5%、69.0%、60.2%和70.1%,召回率分別為70.0%、69.5%、71.9%、69.0%和67.6%;精確度分別為15.8%、18.4%、19.1%、14.8%和19.0%,F值分別為0.258、0.291、0.302、0.244和0.297,受試者工作特征曲線下面積分別為0.80、0.77、0.72、0.72和0.83。結論 本研究不僅確認了已知冠心病的影響因素,還發現了自我健康評價水平、收入水平和教育水平對冠心病具有潛在影響。在使用2種數據平衡方法后,5種算法的性能顯著提高。其中XGBoost模型表現最佳,可作為未來優化冠心病預測模型的參考。此外,鑒于XGBoost模型的優異性能以及逐步Logistic回歸的操作便捷和可解釋性,推薦在冠心病風險預測模型中結合使用數據平衡后的XGBoost和逐步Logistic回歸分析。

【關鍵詞】 冠心病;機器學習;風險預測模型;Logistic回歸;k最鄰近算法;支持向量機;決策樹;XGBoost

【中圖分類號】 R 541.4 【文獻標識碼】 A DOI:10.12114/j.issn.1007-9572.2023.0323

Coronary Heart Disease Risk Prediction Model Based on Machine Learning

YUE Haitao1,HE Chanchan1,CHENG Yuyou1,ZHANG Sencheng1,WU You2*,MA Jing1*

1.Institute for Hospital Management,Tsinghua University,Shenzhen 518055,China

2.Institute for Hospital Management/ School of Medicine,Tsinghua University,Beijing 100084,China

*Corresponding authors:WU You,Doctoral supervisor;E-mail:youwu@tsinghua.edu.cn

MA Jing,Professor,Master supervisor;E-mail:jingma@sz.tsinghua.edu.cn

YUE Haitao and HE Chanchan are co-first authors

【Abstract】 Background Coronary atherosclerotic heart disease(CHD) is one of the leading causes of mortality worldwide,and research on risk assessment for CHD has been growing annually. However,the issue of data imbalance in these studies is often overlooked,despite its crucial role in enhancing the accuracy of CHD risk identification within classification algorithms. Objective To investigate the factors influencing CHD and to establish predictive models for CHD risk using two data balancing methods based on five algorithms,comparing the predictive value of these models for CHD risk.

Methods Utilizing cross-sectional survey data from the 2021 Behavioral Risk Factor Surveillance System(BRFSS) in the United States,a cohort of 112 606 participants was identified,featuring 24 variables related to risk behaviors and health status,with self-reported coronary heart disease(CHD) as the outcome measure. Factors influencing the incidence of CHD were explored through univariate analysis and stepwise logistic regression to select pertinent variables for inclusion in the predictive model. A random sample comprising 10% of the participants(11 261 individuals) was drawn and then randomly divided into training and testing datasets at an 8∶2 ratio. To address data imbalance,two over-sampling techniques were employed:random oversampling and the Synthetic Minority Over-sampling Technique(SMOTE). Based on these methods,CHD predictive models were constructed using five different algorithms:K-Nearest Neighbors(KNN),Logistic Regression,Support Vector Machine(SVM),Decision Tree,and XGBoost. Results Univariate analysis revealed significant differences(Plt;0.05) between the CHD and non-CHD groups across all input variables except for rental housing and being informed of prediabetic status. Stepwise Logistic regression identified age,gender,BMI,ethnicity,education level,income level,being informed of hypertension,being informed of prehypertension,being informed of pregnancy-induced hypertension,current use of antihypertensive medication,being informed of hyperlipidemia,being informed of diabetes,smoking status,alcohol consumption within the last 30 days,heavy drinking status,and self-assessed health as factors influencing CHD. The performance of risk models using SMOTE showed overall classification accuracies of 59.2%,67.4%,66.2%,69.2%,and 85.9%;recall rates of 75.2%,71.4%,70.5%,62.9%,and 34.8%;precision of 15.4%,18.2%,17.5%,17.6%,and 28.7%;F-values of 0.256,0.290,0.280,0.275,and 0.315;and AUC values of 0.80,0.78,0.72,0.72,and 0.82,respectively. Using random oversampling,the models achieved classification accuracies of 62.5%,68.5%,69.0%,60.2%,and 70.1%;recall rates of 70.0%,69.5%,71.9%,69.0%,and 67.6%;precision of 15.8%,18.4%,19.1%,14.8%,and 19.0%;F-values of 0.258,0.291,0.302,0.244,and 0.297;and AUC values of 0.80,0.77,0.72,0.72,and 0.83,respectively. Conclusion This study not only confirmed known factors affecting CHD but also identified potential impacts of self-assessed health level,income level,and education level on CHD. The performance of the five algorithms was significantly enhanced after employing two data balancing methods. Among them,the XGBoost model exhibited superior performance and can be referenced for future optimization of CHD prediction models. Additionally,considering the excellent performance of the XGBoost model and the convenience and interpretability of stepwise logistic regression,a combined use of these approaches after data balancing is recommended in CHD risk prediction models.

【Key words】 Coronary disease;Machine learning;Risk prediction model;Logistic regression;K-nearest neighbor;Support vector machine;Decision tree;XGBoost

冠狀動脈粥樣硬化性心臟病(簡稱冠心病),居全球死亡原因之首。2019年,全球冠心病患者約有1.97億例,因冠心病死亡人數約914萬例。中國正面臨人口老齡化和心腦血管疾病危險因素增多的雙重壓力,致使這類疾病的發病率與患病率持續增長[1]。據統計,目前冠心病患者已達1 139萬例[2],死亡風險居高不下。在過去三十年間,全球增加的冠心病死亡病例中,38.2%來自中國[3]。與此同時,高發病率和高死亡率伴隨的還有沉重的經濟負擔:1990年至2019年間,全球因冠心病引發的經濟負擔增加了82%,年均達到1.82億美元[2]。然而,從健康狀態轉變為冠心病常通常歷時數十年,在此期間有充足的機會采取有效措施進行干預,因此,建立冠心病風險預測模型可以盡早發現患病高危人群,并針對其發病風險進行個性化干預,從而預防冠心病的發生。

目前冠心病的早期風險評估研究在逐年增長,國際上比較成熟的心血管疾病風險預測模型包括弗雷明漢風險評分(FRS)[4]、匯總隊列方程[5]以及歐洲冠心病風險評分系統[6]等,但這些模型開發時間較早,且隨著社會經濟發展冠心病的影響因素也在發生變化,此外,這些模型主要是基于特定地區的研究,所覆蓋的區域較窄。

近年來,隨著醫療數據的深入挖掘,越來越多的機器學習算法在冠心病人群中開發、驗證[6-7]。然而,大多數研究僅采用了邏輯回歸算法[8-9]。此外,許多研究忽視了數據分布不平衡的問題[10-12],導致采用整體分類準確性為目標的機器學習算法在訓練過程中忽視少數類,使其性能不佳[13],而采用過采樣方法進行樣本重構是提高模型性能的關鍵。此外,一些研究顯示部分分類算法在識別風險時準確性較差,且這些研究主要集中于心血管疾病的預測[14],對于更為細分的冠心病領域研究較少,考慮到冠心病復雜性,探索其危險因素十分必要。為了解決上述研究中數據集不平衡性問題并探索冠心病的更多潛在影響因素,本研究使用2021年美國行為風險因素監測系統(Behavioral Risk Factor Surveillance System,BRFSS)的大規模人群數據,通過采用2種過采樣方法平衡數據,基于K最鄰近算法(KNN)、支持向量機(SVM)、決策樹、Logistic回歸和XGBoost,構建冠心病的預測模型并通過混淆矩陣和受試者工作特征(receiver operating characteristic curve,ROC)曲線確定最優模型。

1 資料與方法

1.1 數據來源

數據集是從2021年美國BRFSS橫斷面調查數據中獲取[15]。BRFSS是美國首要的健康相關電話調查系統,主要收集有關美國居民健康相關風險行為、慢性健康狀況等[16]。

1.2 研究對象

本研究選取對象為2021年美國BRFSS的112 606名受訪者。排除標準:(1)小于45歲;(2)本研究的24個變量有信息缺失的受訪者。采用隨機抽樣的方式,從112 606名受訪者中抽取了10%的樣本,即11 261

名,以此作為研究的代表性訓練和測試集。在樣本抽取過程中,設定固定隨機種子為42,以確保抽樣的可復制性。

1.3 變量選擇

以受訪者是否被告知患有冠心病為因變量(輸出變量),并以此為根據將受訪者分為冠心病組和非冠心病組。通過查閱冠心病危險因素的相關文獻,選擇23個自變量(輸入變量),包括年齡、性別、BMI、種族、婚姻狀態、教育水平、收入水平、家里有幾個孩子、是否租房、吸煙情況、過去30 d內是否至少喝過1次酒、是否為重度飲酒者、是否為酗酒者、自我健康評價、心理健康狀況、過去30 d內是否有體育鍛煉、是否被告知患高血壓、是否被告知患妊娠高血壓、是否被告知處于高血壓前期、現在是否在服用高血壓藥物、是否被告知患有高脂血癥、是否被告知患有糖尿病和是否被告知處于糖尿病前期,詳見表1。

1.4 統計學方法

使用R 4.1.3和Python 3.9.13軟件完成所有的數據統計分析,計量資料采用(x-±s)表示,計數資料采用相對數表示。通過單因素分析將刪除Pgt;0.01的變量,此外,采用逐步Logistic回歸分析確定最終納入預測模型的變量,每個變量選擇一個類別作為對照,并計算其他類別的OR值和95%CI。此外,由于受試者中冠心病組占比較低(約為9.35%),屬于非平衡數據,為解決數據集不平衡的問題,本研究分別通過隨機過采樣(random oversampling)和合成少數過采樣技術(synthetic minority over-sampling technique,SMOTE)處理訓練集,其中隨機過采樣技術是解決數據集類別不平衡問題的一種基本方法,主要通過復制少數類樣本以平衡類別分布。而SMOTE由CHAWLA等[17]于2002年提出,該技術通過在位置相近的少數類樣本間進行插值生成新樣本點,以此來實現數據的平衡,改善模型對少數類別的預測能力。在2種采樣方法處理后的訓練集中利用篩選出的變量選擇k最鄰近算法、支持向量機、決策樹、Logistic回歸和XGBoost進行建模,各模型訓練集和測試集按8∶2比例,9 009例樣本用于訓練,2 252例樣本用于預測。在測試集中采用混淆矩陣和ROC曲線對模型進行評價,所有檢驗為雙側檢驗,檢驗水準α=0.05。

2 結果

2.1 兩組基本特征比較

兩組年齡、性別、BMI、種族、婚姻狀態、教育水平、收入水平、家里有幾個孩子、是否被告知患高血壓、是否被告知處于高血壓前期、是否被告知患妊娠高血壓、現在是否在服用高血壓藥物、是否被告知患有高脂血癥、是否被告知患有糖尿病、吸煙情況、過去30 d內是否至少喝過1次酒、是否為重度飲酒者、是否為酗酒者、過去30 d內是否有體育鍛煉、心理健康狀況以及自我健康評價比較,差異有統計學意義(Plt;0.05);兩組是否租房以及是否被告知處于糖尿病前期比較,差異無統計學意義(Pgt;0.05),見表2。

2.2 Logistic回歸分析

將單因素分析中Plt;0.01的21個變量納入逐步Logistic回歸分析中進行變量篩選,結果顯示,年齡、性別、BMI、種族、教育水平、收入水平、是否被告知患高血壓、是否被告知處于高血壓前期、是否被告知患妊娠高血壓、現在是否在服用高血壓藥物、是否被告知患有高脂血癥、是否被告知患有糖尿病、吸煙情況、過去30 d內是否至少喝過1次酒、是否為重度飲酒者、是否為酗酒者以及自我健康評價為冠心病的影響因素(Plt;0.05,見表3)。

2.3 冠心病預測模型結果分析

本研究采用隨機抽樣方法,從112 606名受訪者中選取了10%(即11 261名)的樣本,以構建代表性的訓練集和測試集。對比總體樣本(n=112 606)與隨機抽取的樣本(n=11 261)在預測模型的17個變量上的差異,結果顯示差異無統計學意義(Pgt;0.05),詳見表4。此外,按照8∶2的比例將數據隨機抽取樣本分為訓練集(80%)和測試集(20%),并對訓練集樣本(n=9 009)與測試集樣本(n=2 252)在預測模型的17個變量上進行比較,結果顯示差異無統計學意義(Pgt;0.05),詳見表5。分別利用5種算法對原始數據集和平衡后的數據集構建冠心病預測模型,預測模型的總體分類精度、精確度、召回率、F值見表6。在不平衡數據集中使用機器學習方法建模后,測試集中預測模型的召回率、精確度、F值較低。相比之下,經過數據平衡處理后,機器學習方法建立模型的整體效能提高,尤其是對于陽性樣本的分類正確率。在采用Rand-Oversample和SMOTE過采樣方法訓練的5種算法中,XGBoost模型在預測冠心病方面表現最出色,其測試集的ROC曲線下面積(AUC)達到0.83。其次是KNN模型,測試集中AUC為0.80。在測試集中,除支持向量機模型與決策樹模型在預測冠心病風險方面表現較差,AUC僅為0.72外,其余幾種機器學習算法建立的冠心病預測模型的效能均較佳。兩種不同采樣方法下的各個模型的測試集工作特征曲線如下圖1和圖2所示。

3 討論

本研究探索了多種冠心病發病的影響因素,通過使用隨機過采樣和SMOTE兩種數據平衡方法,建立了基于5種不同算法的冠心病風險預測模型,并對其預測價值進行了比較。結果表明,數據平衡顯著提升了模型的性能,尤其是XGBoost模型在總體分類精度、召回率、精確度、F值和AUC值方面的表現均優于其他模型,顯示出其在冠心病風險預測上的強大潛力。

3.1 冠心病發病的影響因素

本研究結果確認了已知的冠心病風險因素,如年齡、性別、高血壓、高脂血癥、糖尿病和吸煙等。但更重要的是發現自我健康評價水平、收入水平和教育水平是冠心病的潛在影響因素。其中,自我健康評價和收入水平對冠心病發病的影響與ORIMOLOYE等[18]和HEMINGWAY等[19]的研究結果相同。盡管自我健康評價是主觀的評價指標,但在流行病學和健康經濟學研究中,此指標已被證實與死亡率、住院率及慢性病發病率等客觀健康指標密切相關。例如,DESALVO等[20]的研究發現,自我健康評價與死亡風險之間存在顯著關系,即使在控制了其他健康指標后,這種關系仍然存在。MAVADDAT等[21]的系統綜述中也發現,在既往有和沒有心血管疾病的人群中,自評健康狀況不佳都與心血管死亡率有關。因此,自我健康評價在個體冠心病風險的預測中具有不容忽視的價值。然而,考慮到自我健康評價可能受到個人主觀感受的影響,存在一定程度的主觀偏差,在應用這一指標時應保持謹慎。教育水平與TILLMAN等[22]的研究結果相反,這可能是因為教育水平高的人雖然健康意識更高,但其職業壓力和不健康的飲食習慣更多,這一定程度上也會增加冠心病的風險。此外,本研究發現患有妊娠高血壓或糖尿病前期并不能增加患冠心病的風險。這與當前許多研究結果不一致,如妊娠高血壓[23]以及糖尿病前期[24]與冠心病有關的研究結果。但是,本研究結果與HOZAWA等[25]關于高血壓前期與心腦血管疾病的關系研究結果一致。同時,當前服用高血壓藥物能夠降低冠心病的發病風險,這與CORRAO等[26]的研究結果一致。無論是已經戒煙、現在偶爾吸煙還是現在每天吸煙都能夠顯著增加患冠心病的風險,并且已經戒煙的人群中患冠心病的風險更高,與相關研究一致[27]。關于喝酒對冠心病的影響,本研究發現過去30 d內至少喝過1次、重度飲酒以及酗酒都能顯著降低冠心病的發病風險,目前比較的成熟的研究表明平均飲酒量對冠心病的影響呈J型,輕度至中度飲酒者的冠心病發病風險比戒酒者低,但重度飲酒者中的冠心病風險最高[28],此外,ZHAO等[29]的研究也證實與不飲酒者相比,輕度至中度飲酒能夠顯著降低心血管疾病的死亡率。

3.2 冠心病風險預測模型

本研究結果表明在經過不平衡數據的處理后,5種算法在準確率和穩定性方面都有了顯著提高,其中XGBoost模型對冠心病的預測效能最佳,這與ZHANG等[30]在冠狀動脈疾病風險預測模型構建中得到的結論一致,而支持向量機模型與決策樹模型在預測冠心病風險方面表現較差。因為相比其他4種機器學習方法,XGBoost采用了更為優秀的樹結構優化方法,例如葉子節點權重縮減等[31]。此外,在每次訓練模型時,XGBoost還會對模型進行正則化,以避免過擬合,并且使用了一種經過優化的目標函數,這能夠更有效地控制決策樹的生成,從而提高模型的精度[32]。此外,XGBoost在訓練過程中還能夠對特征進行子采樣并且還支持并行計算,能夠利用多核中央處理機和分布式環境加速模型訓練[33]。

在模型的總體分類精度表現方面k最鄰近算法得分較低,這與PAPANIKOLAOU等[34]的研究結果一致,但其簡單性和易于實現可能在某些情況下具有優勢[35],雖然決策樹算法的準確率略低,但其是一種成熟的算法,在TEAM[36]的研究發現決策樹算法在冠心病風險預測表現較好,本研究結果與其不一致的原因可能是決策樹算法對輸入數據的微小變化很靈敏,這可能導致樹結構和預測結果發生很大變化并且進一步降低冠心病風險預測模型的穩定性,從而導致準確性降低[37]。支持向量機算法在精準度、召回率和F1評分方面表現良好,JAISWAL等[38]在使用多種機器學習方法構建冠心病的診斷模型中也得到相同的結論,可見使用支持向量機算法構建的預測模型可以有效降低疾病診斷的假陽性率。邏輯回歸在精度和穩定性方面表現出良好的性能,所以這可成為大規模人群預測模型研究的最佳選擇。雖然XGBoost是5種算法中冠心病風險預測的最佳算法,但算法的選擇將取決于預測任務的具體要求,其較低的召回率表示在實際使用的過程中可能無法篩查出陽性。一般來說,算法的性能受到數據集的大小和質量以及使用的預測變量的數量的影響[38]。本研究強調了不同算法在冠心病風險預測中的優勢和劣勢,未來計劃擴展研究,包括更多的算法和更大的數據集,以更好地評估這些算法的性能。

3.3 本研究的優點和局限性

本研究的一個顯著特點是采用了先進的數據平衡技術,并探索了多種機器學習算法在處理冠心病數據時的效能。優化后的XGBoost模型不僅性能出色,且考慮到其與逐步Logistic回歸分析的綜合應用,為臨床實踐提供了更高的可行性和準確性。此外本次研究有模型輸入變量都來自自我報告,所以具有可及性高、數據信噪比較低以及貼近實際應用場景等優勢。然而,本研究的方法也存在一定的局限性。首先,由于機器學習模型的構建基于邏輯回歸篩選后的變量,可能忽略了一些未被初步選中但實際上對疾病預測有潛在價值的變量。其次,本文的研究數據來源于美國人群自我報告的橫斷面BRFSS數據庫,數據的可獲取性和實際應用場景的貼近性是其優勢所在。然而,此類數據可能受到回憶偏差的影響,且橫斷面研究的設計限制了對因果關系的探討,并存在結局變量影響輸入變量的可能。此外,研究中僅考察了有限的預測模型,并未包括已驗證有效的其他模型,如人工神經網絡(Artificial Neural Network,ANN)、隨機森林和樸素貝葉斯。盡管有研究顯示CatBoost和LightGBM等梯度提升模型在風險預測上有優秀表現,但本研究未能涉及[39-40]。

4 小結

在處理不平衡數據后,KNN、SVM、決策樹、邏輯回歸和XGBoost這5種機器學習算法在預測冠心病風險方面的性能可以顯著提高,XGBoost是這五種算法中表現最佳的。但是,算法的選擇將取決于預測任務的具體要求,以及考慮預測準確性、計算能力、可解釋性和運行效率等方面[41]。此外,雖然本研究所采用的方法論和策略在其他人群中具有普適性,但特定的風險預測結果并不適宜直接應用于非美國地區。未來的研究可以通過納入更廣泛的預測模型和多元化的數據來源,來提高模型的普適性和預測的精確度。

作者貢獻:岳海濤、何嬋嬋負責數據分析及解讀、文章撰寫、文章修改;成羽攸、張森誠協助數據分析及文章撰寫;吳悠、馬晶負責研究設計、文章的質量控制與審查,監督管理,對文章整體負責。

本文無利益沖突。

參考文獻

馬麗媛,王增武,樊靜,等. 《中國心血管健康與疾病報告2021》要點解讀[J]. 中國全科醫學,2022,25(27):3331-3346. DOI:10.12114/j.issn.1007-9572.2022.0506.

SAFIRI S,KARAMZAD N,SINGH K,et al. Burden of ischemicheart disease and its attributable risk factors in 204 countries and territories,1990-2019[J]. Eur J Prev Cardiol,2022,29(2):420-431. DOI:10.1093/eurjpc/zwab213.

DAI H J,MUCH A A,MAOR E,et al. Global,regional,and national burden of ischaemic heart disease and its attributable risk factors,1990-2017:results from the Global Burden of Disease Study 2017[J]. Eur Heart J Qual Care Clin Outcomes,2022,8(1):50-60. DOI:10.1093/ehjqcco/qcaa076.

D'AGOSTINO R B Sr,VASAN R S,PENCINA M J,et al. General cardiovascular risk profile for use in primary care:the Framingham Heart Study[J]. Circulation,2008,117(6):743-753. DOI:10.1161/CIRCULATIONAHA.107.699579.

ANDRUS B,LACAILLE D. 2013 ACC/AHA guideline on the assessment of cardiovascular risk[J]. J Am Coll Cardiol,2014,63(25 Pt A):2886. DOI:10.1016/j.jacc.2014.02.606.

CUENDE J I,CUENDE N,CALAVERAS-LAGARTOS J. How to calculate vascular age with the SCORE project scales:a new method of cardiovascular risk evaluation[J]. Eur Heart J,2010,31(19):2351-2358. DOI:10.1093/eurheartj/ehq205.

ZHANG L Y,NIU M M,ZHANG H Y,et al. Nonlaboratory-based risk assessment model for coronary heart disease screening:model development and validation[J]. Int J Med Inform,2022,162:104746. DOI:10.1016/j.ijmedinf.2022.104746.

AMBRISH G,GANESH B,GANESH A,et al. Logistic regression technique for prediction of cardiovascular disease[J]. Glob Transitions Proc,2022,3(1):127-130. DOI:10.1016/j.gltp.2022.04.008.

馬婧怡,劉相佟,呂世云,等. 北京市成年人冠心病七年發病風險評估與預測模型[J]. 心肺血管病雜志,2022,41(1):25-30,50. DOI:10.3969/j.issn.1007-5062.2022.01.006.

李婕,向菲. 冠心病風險因素識別及其預測模型構建[J]. 中華醫學圖書情報雜志,2020,29(6):7-13. DOI:10.3969/j.issn.1671-3982.2020.06.002.

王曉麗,施天行,彭德榮,等. 兩種機器學習算法構建老年冠心病患病風險評估模型的效能比較研究[J]. 中華全科醫學,2021,19(4):523-527. DOI:10.16766/j.cnki.issn.1674-4152.001852.

譚志軍,梁英,石福艷,等. 基于企業健康管理的勞動力人群冠心病風險評估模型研究[J]. 現代預防醫學,2017,44(12):2192-2195,2210.

ALI H,MOHD SALLEH M N,SAEDUDIN R,et al. Imbalance class problems in data mining:a review[J]. Indones J Electr Eng Comput Sci,2019,14(3):1552. DOI:10.11591/ijeecs.v14.i3.pp1552-1563.

齊俊鋒,韓勝紅,李俊琳,等. 心血管病危險因素的風險特征分析及疾病預測模型研究[J]. 現代預防醫學,2022,49(18):3283-3287. DOI:10.20043/j.cnki.MPM.202111359.

Delaware Department of Health and Social Services,Division of Public Health,Delaware Behavioral Risk Factor Survey (BRFS) [EB/OL]. [2023?04?30]. https://dhss.delaware.gov/dhss/dph/index.html.

The behavioral risk factor surveillance system[EB/OL].(2022?12?02)[2023?04?30]. https://www.cdc.gov/brfss/index.html.

CHAWLA N V,BOWYER K W,HALL L O,et al. SMOTE:synthetic minority over-sampling technique[J]. Jair,2002,16:321-357. DOI:10.1613/jair.953.

ORIMOLOYE O A,MIRBOLOUK M,IFTEKHAR UDDIN S M I,et al. Association between self-rated health,coronary artery calcium scores,and atherosclerotic cardiovascular disease risk:the multi-ethnic study of atherosclerosis(MESA)[J]. JAMA Netw Open,2019,2(2):e188023. DOI:10.1001/jamanetworkopen.2018.8023.

HEMINGWAY A. Determinants of coronary heart disease risk for women on a low income:literature review[J]. J Adv Nurs,2007,60(4):359-367. DOI:10.1111/j.1365-2648.2007.04418.x.

DESALVO K B,BLOSER N,REYNOLDS K,et al. Mortality prediction with a single general self-rated health question. A meta-analysis[J]. J Gen Intern Med,2006,21(3):267-275. DOI:10.1111/j.1525-1497.2005.00291.x.

MAVADDAT N,PARKER R A,SANDERSON S,et al. Relationship of self-rated health with fatal and non-fatal outcomes in cardiovascular disease:a systematic review and meta-analysis[J]. PLoS One,2014,9(7):e103509. DOI:10.1371/journal.pone.0103509.

TILLMANN T,VAUCHER J,OKBAY A,et al. Education and coronary heart disease:Mendelian randomisation study[J]. BMJ,2017,358:j3542. DOI:10.1136/bmj.j3542.

CANOY D,CAIRNS B J,BALKWILL A,et al. Hypertension in pregnancy and risk of coronary heart disease and stroke:a prospective study in a large UK cohort[J]. Int J Cardiol,2016,222:1012-1018. DOI:10.1016/j.ijcard.2016.07.170.

HUANG Y L,CAI X Y,MAI W Y,et al. Association between prediabetes and risk of cardiovascular disease and all cause mortality:systematic review and meta-analysis[J]. BMJ,2016,355:i5953. DOI:10.1136/bmj.i5953.

HOZAWA A,KURIYAMA S,KAKIZAKI M,et al. Attributable risk fraction of prehypertension on cardiovascular disease mortality in the Japanese population:the Ohsaki Study[J]. Am J Hypertens,2009,22(3):267-272. DOI:10.1038/ajh.2008.335.

CORRAO G,NICOTRA F,PARODI A,et al. Cardiovascular protection by initial and subsequent combination of antihypertensive drugs in daily life practice[J]. Hypertension,2011,58(4):566-572. DOI:10.1161/HYPERTENSIONAHA.111.177592.

BOUABDALLAOUI N,MESSAS N,GREENLAW N,et al. Impact of smoking on cardiovascular outcomes in patients with stable coronary artery disease[J]. Eur J Prev Cardiol,2021,28(13):1460-1466. DOI:10.1177/2047487320918728.

MATSUMOTO-YAMAUCHI H,KONDO K,MIURA K,et al. Relationships of alcohol consumption with coronary risk factors and macro- and micro-nutrient intake in Japanese people:the INTERLIPID study[J]. J Nutr Sci Vitaminol,2021,67(1):28-38. DOI:10.3177/jnsv.67.28.

ZHAO J H,STOCKWELL T,ROEMER A,et al. Alcohol consumption and mortality from coronary heart disease:an updated meta-analysis of cohort studies[J]. J Stud Alcohol Drugs,2017,78(3):375-386. DOI:10.15288/jsad.2017.78.375.

ZHANG S S,YUAN Y Y,YAO Z H,et al. Improvement of the performance of models for predicting coronary artery disease based on XGBoost algorithm and feature processing technology[J]. Electronics,2022,11(3):315. DOI:10.3390/electronics11030315.

LIU J L,WU J F,LIU S R,et al. Predicting mortality of patients with acute kidney injury in the ICU using XGBoost model[J]. PLoS One,2021,16(2):e0246306. DOI:10.1371/journal.pone.0246306.

ZHENG H T,YUAN J B,CHEN L. Short-term load forecasting using EMD-LSTM neural networks with a xgboost algorithm for feature importance evaluation[J]. Energies,2017,10(8):1168. DOI:10.3390/en10081168.

DHALIWAL S,NAHID A A,ABBAS R. Effective intrusion detection system using XGBoost[J]. Information,2018,9(7):149. DOI:10.3390/info9070149.

HASSAN C A U,IQBAL J,IRFAN R,et al. Effectively predicting the presence of coronary heart disease using machine learning classifiers[J]. Sensors,2022,22(19):7227. DOI:10.3390/s22197227.

PAPANIKOLAOU M,EVANGELIDIS G,OUGIAROGLOU S. Dynamic k determination in k-NN classifier:a literature review[C]//2021 12th International Conference on Information,Intelligence,Systems amp; Applications(IISA). Chania Crete,Greece. IEEE,2021:1-8. DOI:10.1109/IISA52424.2021.9555525.

KIM J,LEE J,LEE Y. Data-mining-based coronary heart disease risk prediction model using fuzzy logic and decision tree[J]. Healthc Inform Res,2015,21(3):167-174. DOI:10.4258/hir.2015.21.3.167.

TEAM C. Decision Tree[EB/OL].(2022-11-29)[2023-02-12].

https://corporatefinanceinstitute.com/resources/data-science/decision-tree/.

GARAVAND A,SALEHNASAB C,BEHMANESH A,et al. Efficient model for coronary artery disease diagnosis:a comparative study of several machine learning algorithms[J]. J Healthc Eng,2022,2022:5359540. DOI:10.1155/2022/5359540.

JAISWAL S,GUPTA P. Ensemble approach:XGBoost,CATBoost,and LightGBM for diabetes mellitus risk prediction[C]//2022 Second International Conference on Computer Science,Engineering and Applications(ICCSEA). Gunupur,India. IEEE,2022:1-6. DOI:10.1109/ICCSEA54677.2022.9936130.

白皙,羅云云,周智博,等. 基于機器學習算法的大于胎齡兒風險預測模型[J]. 中華流行病學雜志,2021,42(12):2143-2148. DOI:10.3760/cma.j.cn112338-20210824-00677.

馬倩倩,孫東旭,石金銘,等. 基于支持向量機與XGboost的成年人群腫瘤患病風險預測研究[J]. 中國全科醫學,2020,23(12):1486-1491. DOI:10.12114/j.issn.1007-9572.2020.00.066.

(收稿日期:2024-03-16;修回日期:2024-09-11)

(本文編輯:崔莎)

猜你喜歡
冠心病高血壓模型
一半模型
全國高血壓日
西部醫學(2021年10期)2021-10-28 08:25:50
ADAMTs-1、 CF6、 CARP在冠心病合并慢性心力衰竭中的意義
茶、汁、飲治療冠心病
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
警惕冠心病
智慧健康(2019年36期)2020-01-14 15:22:58
如何把高血壓“吃”回去?
基層中醫藥(2018年4期)2018-08-29 01:25:58
高血壓,并非一降了之
基層中醫藥(2018年6期)2018-08-29 01:20:14
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲精品午夜天堂网页| 欧美成人区| a毛片免费看| 亚洲高清国产拍精品26u| 国产在线八区| 久久天天躁狠狠躁夜夜躁| 91在线中文| 欧美激情,国产精品| 国产成人在线小视频| 黄色网址免费在线| 日本一本在线视频| jijzzizz老师出水喷水喷出| 狠狠干综合| 亚洲天堂久久| 91无码人妻精品一区二区蜜桃| 欧美一区二区福利视频| 人妻21p大胆| 国产精品成人第一区| 国产女人爽到高潮的免费视频| 一区二区日韩国产精久久| 97人人模人人爽人人喊小说| 日本爱爱精品一区二区| 国产成本人片免费a∨短片| 国产精品私拍在线爆乳| 黄色网页在线观看| 精品自窥自偷在线看| 亚洲天堂网视频| 在线毛片免费| 黄片在线永久| 国产中文一区a级毛片视频| 免费视频在线2021入口| 在线观看无码av五月花| 亚洲浓毛av| 手机在线看片不卡中文字幕| 操美女免费网站| 国产成人综合在线观看| 国产SUV精品一区二区6| 88av在线| 四虎精品黑人视频| 无码内射在线| 国产网站在线看| 亚洲成人黄色网址| 日本不卡在线播放| AV天堂资源福利在线观看| 狠狠v日韩v欧美v| 久久综合色88| 国产欧美网站| 真人免费一级毛片一区二区| 免费在线色| 亚洲精品国偷自产在线91正片| 国产精欧美一区二区三区| 在线免费无码视频| 国产亚洲欧美在线人成aaaa| 多人乱p欧美在线观看| 亚洲中久无码永久在线观看软件 | 永久免费无码成人网站| 精品国产aⅴ一区二区三区| 国产国模一区二区三区四区| 这里只有精品在线| 国产精品制服| 思思99热精品在线| 99色亚洲国产精品11p| 国产老女人精品免费视频| 国产va在线| 国产一级裸网站| 亚洲成人www| 亚洲第一香蕉视频| 黄网站欧美内射| 国产精品香蕉在线观看不卡| 亚洲,国产,日韩,综合一区| 精品撒尿视频一区二区三区| 亚洲国产av无码综合原创国产| 狠狠色成人综合首页| 日本久久网站| 中文字幕中文字字幕码一二区| 国产精品视频第一专区| 欧美精品1区2区| 免费在线观看av| 毛片网站在线看| 亚洲伊人天堂| 在线免费看黄的网站| 91美女视频在线观看|