宋曉鋒
(邯鄲市永年區中醫院,河北 邯鄲 057150)
醫學信息包含在醫學活動過程中錯產生的各種文字,圖像,聲音,溫度,壓力等多種物理數據,這些數據通過醫學信息數據庫的建立,將基礎理論醫學、社會醫學、臨床醫學等方面的資料集成于一庫,為用戶提供咨詢服務。我國的一些醫療機構也已開始著手醫學信息數據庫的建設工作,目前來看已經取得了可喜的回報。由于醫學技術具有很強的實踐性,實驗性及統計性,因此,探索醫學信息數據庫的建立與數據挖掘技術在醫學信息方面的應用就具有更重要的實用價值和廣闊的發展前景。
就目前來看,我國醫學信息的處理大多還停留在基于數據庫技術支持的操作型事務處理的水平上,例如說數據的査詢、修改等,其中部分典型醫學數據,重要知識點,只有部分行內的專家知曉,其信息的覆蓋面過于狹窄,對我國醫學的發展幫助很小。那么,擺在我們面前這個巨大的醫學資源寶庫究竟能為我們做些什么呢?這就需要我們建立一個全面的醫學信息數據庫,并將其覆蓋的范圍最大化,同時還要對數據進行深挖處理,盡可能多的將各項醫學信息呈現到用戶的面前。
網絡信息資源內容極為豐富,包括各類型的數據庫、電子出版物、各種綜合網站與專業網站等等;形式也多樣化,有全文數據,題錄文摘、圖片資料、多媒體信息、醫學臨床案例、視頻資料等等,網絡信息在許多方面都超出了館藏文獻的范圍,彌補了館藏文獻的不足,使得文獻資料更加的生動,促進人們對文獻的理解及提高對醫學資料學習的興趣。
網絡信息中有不少是經過篩選加工的二、三次文獻,包含了前人的勞動,是較成熟的信息,這對于用戶來說免去了用戶大量的重復勞動,想要查詢什么資料,直接輸入關鍵詞,便可檢索出與之相關的各項信息,為用戶節約了大量的時間和精力。另外對網絡一次文獻中的全文數據和圖片資料等等也可直接拿去利用,從而避免了用戶再次抄錄。
醫學不同于其他的學科,對信息更新的時效性要求極高,人類的發展無時無刻不在進行,所以說醫學的發展也在每時每刻都在發生,網絡數據庫的建立,滿足醫學信息及時有效的這一要求,對于信息更新的的時效性極強,速度及快,幾乎全世界都有不停的更新這醫學的各項信息數據,這使用戶能快速和有效地利用到信息,從而更好的為人類的健康進行服務。
網絡信息資源最顯著的特點就是具有極強的傳播性,醫學信息,借助了網絡信息這一特點,可以將最先進的醫學咨詢以最快的速度傳遞到每個用戶的手上,極大的方便了用戶的學習,這也十分有利于我國醫學科研工作的順利進行,科研工作者可以利用網絡最快的了解到世界各地的最新醫學信息,從而使我國醫學的科研工作少走了很多彎路,在提高工作效率的同時也為我國醫學科研工作節約了很大的經濟投入,變相的提高了科研工作的經濟效益。
所謂數據倉庫是支持管理決策過程的、面向主題的、集成的、與時間有關的、持久的數據集合,它以傳統的敝據庫技術作為存儲數據和管理資源的基本手段,以統計分析技術作為分析數據和提取信息的有效方法,以人工智能技術作為挖掘知識和發現規律的科學途徑,是與網絡通信技術、面向對象技術、并行技術、多媒體技術、人丁智能技術等相互浸透、互相結合與綜合應用的技術。醫學信息數據庫的創建基于HIS的數據倉庫.是從已有數據出發的數據倉庫的設計方法.稱之為“數據驅動”的系統設計方法。它的基本思路是:利用以前建設的數據庫系統的數據,按照分析領域對數據及數據之間的聯系進行重新考慮。組織數據倉庫中的主題,利用數據模型有效地識別數據和數據倉庫中的主題的數據的 “共同性”來重新組建數據庫。
網絡數據不同于其他紙質文檔,它會隨著時間的推移,其倉庫中的數據量會不斷的增加,這些日積月累的數據中是否存在著某種關系、模式或者趨勢,是很難一眼就看得出來的。或者知道有某種關系、但必須進一步加以證明或修正,這時數據挖掘技術就有用武之地了。數據挖掘是基于人工智能、機器學習、統計學等技術,高度自動化地分析原有數據,作出歸納性的推理,從中挖掘出潛在的模式或行為,以幫助決策者作出正確決策的過程.也就是說為了尋找未知的模式或趨勢而在細節數據中進行搜索的過程,從而生成新的信息和知識數據挖掘利用人工智能中的一些成熟的算法和技術作為發現知識的方法,如人工神經網絡、遺傳算法、鄰近搜索算法、規則推理等,利用關聯分析、序列模式分析、分類分析、聚類分析作為數據挖掘的分析方法.
綜上所述,建立醫學信息數據庫是利用數據倉庫和數據挖掘技術,對醫學上各類信息進行歸納整理并充分利用的必要手段,這是我國醫學發展的必將之路,醫學信息數據庫的建立及數據挖掘會極大的方便各大醫療結構的管理決策及為醫務工作者的日常工作代理極大的便利,同時也勢必為我國醫學的科學研究工作作出巨大的貢獻。