李婷 孫媛媛 李雪玲 董慧



摘要:為了輔助醫生進行糖尿病的診斷,增加診斷的準確性,探尋最適合用于糖尿病輔助診斷的機器學習分類算法。研究使用隨機森林、樸素貝葉斯分類、邏輯回歸、BP神經網絡以及Adaboost集成算法5類機器學習分類算法進行建模,預測糖尿病的患病風險,同時采用多個評價指標驗證模型效果的優劣。結論:五種算法的準確率均高于73%,其中邏輯回歸模型和BP神經網絡模型準確率最高,達76.6%,但邏輯回歸模型的精確率最高且ROC曲線包圍面積(AUC) 最大,精確度高,達到82%。綜合比較五種算法的評價指標可見,基于邏輯回歸算法的模型更適合用于構建糖尿病輔助診斷模型。
關鍵詞:機器學習算法;輔助診斷;數據挖掘;糖尿病;風險預測
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2024)10-0027-03