肖劍容
摘 要 近年來,醫療影像系統在醫院的普及越來越廣泛,醫療影像數據日益豐富,已經有了大量的數據支撐,如何高效迅速地在海量數據中選擇有助于病人治療和醫學發展的數據成為醫療領域所關注的焦點問題。本文主要從兩個方面探討數據挖掘技術在醫學影像信息系統中的應用:在病患就診檢查項目方面使用關聯方規則算法,在醫院設備類型檢查量方面使用時序算法。
關鍵詞 數據挖掘技術;醫學影像信息系統;應用
隨著科學技術的發展,醫學影像信息系統日益普及,收集了大量的數據,但醫療領域對這些數據的利用程度不夠高,缺乏對數據的深度挖掘和分析,數據挖掘技術的應用,有效緩解了這一問題,實現了對數據的深度挖掘和分析。
1 關于數據挖掘技術
數據挖掘是一個,先將大量的、片面的、嘈雜的、模糊的現實數據收集起來,再將其中蘊含、但我們并未發現的有價值、有意義的信息提取出來的過程。
1.1 數據挖掘的三階段
一般情況下,數據挖掘技術主要分為三個階段,分別為:準備數據階段、挖掘數據階段、表達結果和分析解釋階段。在準備數據階段,具體由三個部分組成,分別為:數據集成部分、數據選擇部分和數據預處理部分。挖掘數據階段四個部分,分別為:確定數據挖掘目標部分、選擇挖掘工具部分、挖掘操作部分和證實發掘部分。表達結果和分析解釋階段的要求,不僅將數據挖掘的操作結果展示出來,還將信息進行進一步的過濾,經過再處理的數據信息如果沒有達到標準,則需要重復過濾,直至得到滿意結果[1]。
1.2 數據挖掘的工具
數據挖掘需要有專業的工具進行操作,通常數據挖掘技術有關聯規則分析技術、人工精神網絡技術、決策樹分析技術、時序分析技術、聚類分析技術等。本文著重分析醫學影像系統中的關聯規則分析和時序分析技術的應用。
2 醫學影像信息系統
近年來,醫學領域逐漸信息化,醫院里醫療影像信息系統的應用和普及越來越廣泛,醫療影像信息系統包括醫學影像信息系統和醫學圖像存檔與傳輸系統兩部分。對于病患的登記、檢查、拍片、報告編審、科室管理等是由醫學影像信息系統負責的;醫學圖像的獲取、傳輸、存儲、顯示查看和圖像的管理是由醫學圖像存檔與傳輸系統負責的。
目前有一應用醫療影像信息系統多年的三甲醫院已經積累了一百多萬條檢查記錄,五百多萬條影像記錄,海量的信息數據積累是完成準確、科學的數據挖掘的前提[2]。
3 有關檢查項目關聯分析
3.1 關聯規則算法
檢查項目關聯分析用到關聯規則算法,其方法是從提供的數據及數據庫中進行篩選,將數據在數據庫中出現的品讀關系分析出來,在海量數據中找出數據集之間有意義有價值的聯系。在進行數據的關聯規則挖掘時,需要將數據資料庫中各個事件當作數據項,而將幾個數據項組成一個特定的事務項集。例如,病患就診在醫學影像數據庫中,所進行檢查的每個項目就是它的數據項集。微軟數據分析服務的關聯規則算法,有兩個步驟構成:首先是將每個支持度大于等于是想定義的最小支持度閾值的頻繁項集找出來,然后將滿足最小置信度的強關聯規則由頻繁項集產生出來。
3.2 數據準備
在數據準備時,需要將數據進行處理,這是因為數據使用年限久遠,在每次對數據的利用、維護、轉移時沒有進行數據校驗,可能會導致數據出現差錯,而且影像信息系統軟件普及率增高,醫療領域的工作人員在進行數據的錄入時可能會出現失誤導致數據出錯。以上的客觀或主管的因素都有可能導致數據質量低,數據重復、數據缺失、數據錯誤。為了確保數據有較高的質量,需要在數據準備時進行數據處理,還可以管理醫院的檢查項目,對檢查項目進行統一規范的處理。
3.3 頻繁項集和關聯規則
挖掘頻繁項集是關聯規則算法的第一任務。病患的檢查項目眾多,得到有用的項集和規則需要將模型的處理時間降低。通過某醫院挖掘出來的頻繁項集可得知,住院病人所檢查的最多的單個項目是頭顱CT平掃和胸部CR,而腎臟、輸尿管、膀胱、前列腺的彩超和肝、膽、脾、胰的彩超是同時做得最多的項目。關聯規則分析可以將病患在醫院就診時所檢查的各個項目的關聯度進行分析,在此基礎上,再根據病患的疾病分析,就能為醫院的臨床路徑管理提供基礎[3]。
4 設備檢查量預報
當前醫院影像科的數字成像設備已經很成熟,數據庫原始項目信息表通過醫學影像信息系統和醫學圖像存檔與傳輸系統生成后,將其中各個類型的設備的每月檢查量提取出來,建立設備的月檢查表,為時序模型的建立提供依據和基礎。
5 醫療影像數據庫
建立醫療影像數據庫,首先要通過醫學影像信息系統和醫學圖像存檔與傳輸系統中的數據進行分析,再與醫院放射科的管理需求分析結合起來,確定數據庫的主題后,就能初步將醫療影像數據庫建立。將實例系統完善后,可以加入可視化技術和多維數據分析技術,對醫療影像數據結果進行展示和分析。
6 結束語
醫院運用數據挖掘技術到醫療影像信息系統中,對其多年內積累的數據進行分析處理,挖掘出其中有用信息,運用關聯規則算法對醫院內病患的檢查項目進行分析,將成為醫院臨床路徑管理改革完善的基礎。數據挖掘技術中的時序算法也會在嘗試與探索中逐漸投入使用,對于醫院的數據信息建設,需要我們從實際情況出發,不斷的探索創新,提高醫院的數據管理水平,提高管理效率,減輕人工管理的工作量,為醫療事業做出貢獻。
參考文獻
[1] 肖革新.公共衛生數據中心存儲系統設計思路與實踐討論[J].信息網絡安全,2012,(2):71-73.
[2] 母曉梨.區域醫療影像數據中心存儲系統研究與設計[J].中國數字醫學,2010,5(1):57-59.
[3] 周琳.醫院臨床數據中心存儲系統構建分析[J].中國數字醫學,2012,(1):75-78.