孟 勛
數據挖掘在醫院信息系統的應用
孟 勛
新的信息技術,計算機技術,網絡技術的出現為醫療信息化帶來了巨大影響和技術支持,數據倉庫和數據挖掘技術在醫療信息化進程中為醫院信息系統(HIS)建設和使用中發揮著重要作用。本文就數據挖掘在醫院信息系統中的應用進行闡述,先后從技術背景、醫院信息系統信息數據的特點、數據挖掘在醫院信息系統中的關鍵技術、應用意義等方面進行了探討,是數據挖掘在醫院信息系統應用的一份重要參考文獻。
新的信息技術,計算機技術,網絡技術的出現為醫療信息化帶來了巨大影響和技術支持,數據倉庫和數據挖掘技術在醫療信息化進程中為醫院信息系統(HIS)建設和使用中發揮著重要作用,數據挖掘在醫院信息系統(HIS)中隨著大量醫療數據的出現和輔助診斷系統,遠程醫療等技術形式的出現得到大量使用。本文就數據挖掘在醫院信息系統的應用進行研究探討。
數據挖掘
隨著信息技術的發展,數據和信息大量出現和積累,如何從存儲和出現的可能含有大量冗余信息中提取有用的,有價值的知識成為信息技術包括計算機技術和網絡技術研究的重要問題,出現了數據挖掘技術,及其相關理論和方法用來研究這類問題。
醫院信息系統
醫院信息系統就是在新的信息技術,計算機技術,網絡技術迅速發展和普及的條件下,利用計算機和通訊設備以及網絡技術,為醫院各部門提供病人診療信息和行政管理部門提供管理信息的收集、存儲、處理、提取和數據交換的能力,并滿足所有授權用戶的功能需求的信息系統。
醫院信息系統信息數據的特點
隨著醫院信息系統的發展,出現了大量的“以病人為中心”醫療信息數據和以管理人、財、物為中心的管理信息數據。對于這些大量出現的醫院信息系統數據,數據的收集存儲處理從數據庫發展到數據倉庫,信息數據的提取以及數據信息的處理,數據挖掘技術在醫院信息系統中得到應用,輔助診斷以及遠程醫療等的發展需要對這些數據尤其醫療數據進行分析,這里介紹以下醫院信息系統信息數據的特點。
海量數據
醫院信息系統的發展和普及,出現了大量的信息數據,這些數據不僅有醫療數據,還有管理方面的數據。大量出現的醫療數據以及管理數據不僅要滿足醫療輔助診斷的需要,隨著醫療信息化的發展還要滿足遠程醫療和輔助教學等的需要。大量的數據存儲和交換,提取等信息處理過程,數據挖掘技術在醫院信息系統中得到應用。
多態性
這些需要醫院信息系統處理的數據不僅有文字,數字,文本等形式的數據,還有圖片,動畫,音頻,視頻等形式的信息數據。圖片有CT,MRI圖像等多種形式和各種計算機圖片形式,比如jpg,bmp,dib等。醫院信息系統需要處理的信息數據形式多樣,具有多態性的特點。
不規范性
大量的具有多態的信息數據,需要以規范的形式來表述和描述。比如對于一些醫學圖像有DICOM標準等,在具體的醫院信息系統也有一定的規范來約束。數字、文本形式的數據也有一定規范性要求。盡管如此,大量的多種形式數據處理要求,不規范性問題仍然是醫院信息系統需要重視的一個問題。
不完整性
由于現實條件的有限性,使一些醫療信息不能全面地正確反應。同時主觀條件的一些約束使市醫院信息系統的數據存在不完整性。
冗余性
對于具體的使用,可能僅僅需要部分或階段的信息數據,一些數據變得冗余,因而醫院信息系統需要處理的一些數據具有一定冗余性的特點。
面對醫院信息系統的諸多數據特點,數據挖掘技術在醫院信息系統中得到應用;醫院信息系統的醫療數據的諸多特點決定了醫療數據挖掘的應用特點。
數據預處理:面對醫院信息系統中含有海量的、不同來源、多態的包括大量模糊的、不完整的、帶有噪聲和冗余的原始信息數據,在數據挖掘之前,對這些信息進行數據預處理,以確保數據的一致性和確定性,以及提高醫療數據的完整性和規范性,將其處理成適合醫療數據挖掘的形式和方式。
規范性和完整性處理:即醫療信息數據的融合技術處理。面對諸多不同來源、多態的,多源的必須進行相應處理,使其在屬性和表現形式上趨于一致和合理。廣義地稱其為醫療信息數據融合技術處理,狹義地有比如醫學圖像配準融合等。
醫療數據挖掘算法:醫療數據挖掘算法具有一般數據挖掘算法的特點,又由于醫療數據的一些特點,因為具有醫療數據挖掘的鮮明特征,比如因醫療數據的大小,格式而決定的醫療數據挖掘算法的魯棒性,適用性和實用性。
可靠性和安全性:醫療數據挖掘的數據來源必須具有可靠性的特點,在進行醫療數據挖掘時結合數據庫以及數據倉庫和醫療數據的一些技術特點具有數據挖掘的數據安全性設計考慮。
醫院信息系統應用數據挖掘的主要算法有分類、聚類、關聯、預測、公式發現、模糊邏輯、描述和可視化等。對疾病按照種類通過建立訓練集進行分類,常見算法有決策樹、神經網絡、貝葉斯算法等;把具有某些相似特征的疾病或功能部門集中到一個類別中進行聚類;通過關聯規則,我們發現醫院信息系統中一些醫療數據之間的關聯性,從而找出之間的聯系和規律,為疾病診斷和輔助診斷找出途徑,提供方法和手段;通過一些統計學預測方法,及早預測出疾病的規律,為疾病的治療提供信息和途徑;對一些臨床數據,通過公式發現摸索出規律,并進行模糊邏輯分類;對一些醫院信息系統數據進行描述和可視化,是一種對醫院信息系統數據挖掘的表示。數據挖掘在醫院信息系統中的應用根據目的和目標的不同,采用的算法相應變化,隨著新的信息技術,統計學,人工智能算法的發展而不斷充實發展。
醫院信息系統是利用現代的信息技術,計算機技術和網絡技術,面對大量的醫療和管理信息數據進行收集、存儲、處理、數據交換和提取等信息處理過程的信息系統。隨著醫療信息化的進程,面對的諸多需要處理的醫療信息數據和相應的管理信息數據,以及隨著時間推移存儲的大量需要處理的數據,提取和數據交換工作的需要和要求,醫療數據挖掘技術在醫院信息系統中得到應用。對大量的、模糊的、不確定的、不規范的醫療數據,結合數據挖掘技術的特點,對這些進行醫療數據挖掘具有重要意義,是醫療數據的特點和特征要求,也是醫院信息系統進行數據挖掘適應信息化發展的要求和結果。數據挖掘技術擴展了醫院信息系統的發展空間,推動了醫院信息系統數據處理的效率和方式的發展。數據挖掘在醫院信息系統的應用是隨著信息技術和醫療信息化發展的而出現的。醫院信息系統中數據挖掘的應用,將醫院信息系統中的大量的、模糊的、不確定的、冗余的數據進行處理,具有使醫院信息系統中的數據具有高層管理、高層智能的作用,將需要人工的工作通過數據挖掘變得清晰、確定、簡潔地提供給醫院信息系統的使用者,大大減輕了使用者的工作強度。
數據挖掘在醫院信息系統的應用是隨著數據挖掘技術等相關技術和醫院信息系統的發展而出現的,拓展了醫院信息系統的發展空間和方式,提高了醫院信息系統數據處理的效率和效果。本文就數據挖掘在醫院信息系統中的應用進行闡述,先后從技術背景、醫院信息系統信息數據的特點、數據挖掘在醫院信息系統中的關鍵技術、應用意義等方面進行了探討,是數據挖掘在醫院信息系統應用的一份重要參考文獻。
10.3969/j.issn.1001-8972.2015.21.020