牟 勇
(東北石油大學,黑龍江大慶,163318)
數據挖掘技術在醫院信息化系統中應用
牟 勇
(東北石油大學,黑龍江大慶,163318)
當今的醫療信息系統有很多都是基于數據庫的使用上,并沒有對數據進行有效的集成。在此情況下,筆者論述了數據發掘的定義及其實現方法,研究并完成了以B/S方式為基礎的醫療信息處理系統。以醫療信息系統的數據庫為主要數據源,從醫學研究的角度為醫療信息化的研究人員提供了新的手段和方法。
數據挖掘;醫院;信息系統
從使用的技術上來說,數據挖掘是從很多不完整的數據里,挖掘出當中沒有被發現的有利用價值的信息,它最大的特征即從數據堆中的數據進行索引、研究以及處理的過程。總體來說,數據挖掘即通過數據堆里的很多數據里找到有利用價值的信息的過程。
醫療數據包括了醫學過程和醫院的各種信息,主要來說具備下列的幾個主要特征。
(1) 時間性:醫院中的很多數據,包括患者的個人信息等信息,即使沒有時間性,缺皆為描述患者在一定時間內醫療信息的記錄。
(2) 多樣性:醫院的救治信息包括有病例等文字、各類成像系統形成的圖像照片、語音、數據流以及視頻等多種信息,信息量巨大,這也是其與別的專業信息相比較最大的特點,且這種特點大大提高了信息挖掘的難度。
(3) 重復性:醫學領域的信息及其巨大,每時每刻皆有很多類似的或者是部分類似的數據進入其中。舉例來說,很多病癥的救治方法、檢測方式、病患特征都可能是相同的。
(4) 缺陷型:醫院中數據信息的不完全導致數據庫難以保證對各種病癥都能完整的表現。另外,大量治療信息的描述自己也是不確定的。由此,造成了醫院數據的缺陷性。
在具體的挖掘過程中,以下是研究的核心思路:
(1) 迅速挖掘:醫學類信息包括的范圍大,同時其中的數據也多。想于其中挖掘有用的信息,就可能使用很多的時間,所以應該重點研究挖掘過程中如何提高效率,這一問題會大大的影響治療效率以及治療費用。
(2) 信息的前期處理:由于醫學信息中包括極多的、獲得途徑不一的原始數據,他們既有可能是缺陷的或者是重復的。因此,在信息的挖掘前,需要把其中的信息整理及分類,使其適于被醫療工作者們所挖掘。
(3) 精確供給信息:醫學信息的挖掘是為治療病患提供準確的建議,所以應該確保挖掘出的信息是精確的和合理的。怎樣能夠增強挖掘信息的精確性及合理性,是挖掘是不是可以應用于醫療工作的重點問題。

圖1 典型數據挖掘系統的結構
(4) 數據的整合:醫學信息是由多種類型的信息,如文字、圖片等很多信息所構成。如此多不同類型的信息,需要使用各自最佳的方法來處理。
3.1 系統的構成
本文所提出的系統總共包括三層,包括網絡服務器、應用服務器以及數據庫服務器,具體的使用方法為使用者首先登陸網絡,確認其資格,并且給予對應權限。在獲得權限的范圍內上傳挖掘請求,之后參照使用者具體的要求,使用需要的挖掘借口進行聯系。在運用所需要的算法對信息處理、查找之后,把信息反饋給網絡服務器,并且使用適合的各類軟件,提供結果給使用者。
網絡與數據庫的充分連接,可以使得信息的查詢更加精確、快捷。查詢的過程應該是實用的,當查詢者的查詢需要有所改變的時候,只需要對查詢的過程進行重組就能夠滿足,這一系統不會不定時的進行客戶端更新,不會出現客戶端與數據庫不兼容的情況。
和以往的數據挖掘系統相比較,以往的數據挖掘系統大多數都是使用C/S的模式,把數據的辨別和提取作為系統的一小部分,很容易產生下列的缺陷:
挖掘系統的使用方法是單一的,但是查詢者對于挖掘系統的需要實在一直改變的,由此,在不定時出現更新的情況下,還會產生系統不停的出現使用擴展的情況。C/S模式僅可以為查詢者供給單一的界面,并且它一切的功能都是整合于一的,對于剛剛接觸系統的查詢者來說操作過于復雜繁瑣。
上述情況的發生是由于忽略了數據系統以及數據分析系統使用的特征。雖然使用的流程是確定的,但是由于使用類型包括查找、增加。修改以及刪除等,必然需要信息精確。數據挖掘系統要求對海量的數據進行分析,不過使用的具體需要卻是多種多樣的。所以,使用B/S模式是一種可以有效解決上述問題的方法。
3.2 系統的組成
系統主要是有一下的功能模塊所構成的:
(1) 顯示系統,包括圖片信息以及表格信息等信息的顯示,是網絡層的一部分;
(2) 查詢者權限設定系統,因為數據庫中包含有大量的隱私,屬于需要保密的資料,所以,對于查詢者的權限進行設置是很有必要的,這一系統主要包括查詢者身份的驗證以及查詢者權限的設置,這樣,既可以保證隱私性,又可以提供有效的服務。
(3) 信息挖掘系統,可以完成全部的挖掘方法,并且可以參照具體的要求增加新的挖掘方法。
本文研究并開發了一種使用B/S模式的醫療信息挖掘系統,能夠針對各類查詢者不同的需要提供最佳的查詢結果,對查詢者權限的設定可以在達到信息隱私這一目標的基礎上,為查詢者提供最佳的服務。該信息挖掘系統的獨特結構具有操作便捷、容易拓展的特點,具有很高的使用前景,可以為醫療工作者的工作提供精確、有效的信息服務。
[1] 聶永紅.計算機等級考試信息的數據挖掘分析.微計算機信息,2008,2-3: 178-179。
[2] 劉明同等.數據挖掘技術及其應用.北京:國防工業出版社,2001:165-178。
[3] 康曉東著.基于數據倉庫的數據挖掘技術.北京:機械工業出版社,2004:120-145。
[4] 帥立,吳永明.數據挖掘技術在 HIS 中的應用探討.計算機應用與軟件.2004,(3):91 一 99。
[5] 劉志敏.oracle 數據倉庫應用管理解決方案.北京:電子工業出版社,2002:56-59。
[6] 王寧,陳澇,俞本權.一個基于 Corba 的異構數據庫集成系統設計.軟件學報,1998,9(5):378-382。
Data mining technology application in hospital information system
Mu Yong
(Northeast Petroleum University,Daqing,163318,China)
Now there are a lot of medical information system is based on the use of the database,Not the data for effective integration.In this case,author discusses the definition of data mining and its implementation methods,research and completed based on B/S mode of medical information processing system. In the database of medical information system as the main data source, from the perspective of medical research for researchers in medical informatization provides a new means and methods.
data mining;hospital;Information system