黃錦靜,陳 岱,李夢天
(中國礦業大學 計算機科學與計算學院,江蘇 徐州 221116)
基于粗糙集的決策樹在醫療診斷中的應用
黃錦靜,陳 岱,李夢天
(中國礦業大學 計算機科學與計算學院,江蘇 徐州 221116)
網上醫療診斷越來越受歡迎,電子病例的數據也越來越多。如何從眾多的醫療數據中降低醫療數據的冗余度,快速提取有用的醫療價值,提高醫療診斷的速度和精度,成了一個大家研究的熱點問題。針對這一系列問題,研究了醫療系統關于肺癌診斷的一些數據,建立了基于屬性依賴改進的可分辨矩陣屬性約簡的C4.5算法,并用隨機森林進行算法改進。屬性約簡算法降低了醫療數據的冗余度,決策樹算法提取了肺癌診斷的一些規則,隨機森林提高了醫療診斷的準確性。文中對肺癌診斷場景進行了仿真實驗與應用,并將單純的C4.5算法,屬性約簡與單棵C4.5決策樹,屬性約簡和C4.5決策樹隨機森林進行性能比較。實驗結果表明,該方法加快了計算速度,提高了醫療診斷的精度。
粗糙集;屬性約簡;可分辨矩陣;C4.5算法;決策樹
隨著計算機行業的快速發展,醫院也開始走向電子化時代,網上掛號、網上診斷、電子病例等,積累了海量的醫療數據。如何利用這些數據挖掘出醫療價值,即基于醫療的數據挖掘,成為一個非常熱門的研究領域。醫療數據的挖掘在醫療領域應用的主要內容包括醫療圖像數據挖掘、醫療管理檢索系統和電子病例的分析等。例如,在醫療圖像方面,文獻[1]提出了一種基于成像的神經退行性疾病的分類方法,以提取突出的腦模式。……