李霽雨
(河北工業大學,天津 021000)
數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際數據中,提取并發現隱含在其中的、不為人知的,但同時又具有極大潛在使用價值的信息和知識的過程。
數據挖掘的過程是先確定挖掘目標,根據現有數據資源建立數據庫。然后通過清洗數據、分析、選擇或轉換與挖掘目標有關的變量,對原始數據進行預處理。根據數據挖掘的目標和數據特征,選擇適合的模型。最后,選用合適的數據挖掘技術與工具,進行模式的分析,從而選擇最優的模型,運用到實際問題中。常見的數據挖掘方法有關聯規則、聚類、決策樹、神經網絡、支持向量機等[1]。
醫院信息系統包括臨床醫療信息和醫院管理信息。醫療數據由于其專業性及特殊性,與其他行業數據相比有所不同,對醫院信息系統的數據挖掘也存在其自有的特點[2]。
醫療數據中包含數字型數據和非數字型數據如(信號、圖像、文字、語音、視頻等)。模式的多態性大大的增加了數據挖掘的難度。
以病歷為例,病歷的書寫過程本身就有不確定和模糊的因素存在,與醫生的主觀因素有關,有個體差異存在,不能對疾病的信息進行全面的反應與記錄,因此形成了醫療數據的不完整性。
醫療數據記錄的是患者在某一特定時間內接受醫療活動的記錄,醫療檢查的波形和圖像也都是關于時間的函數。
醫療數據庫是十分龐大的數據資源,對于某些疾病某些癥狀,可能會采取相同的治療,檢查與化驗的結果也都可能完全一樣。如此下來,就會產生大量相同或者相似的數據信息。在數據挖掘過程中,增加了數據預處理的復雜性。
在數據挖掘之前,醫療數據庫中包含著數量相當的不完整的、模糊的、帶有噪聲的冗余信息。數據預處理技術要完成的主要任務是,將這些冗余信息進行篩選和過濾,將多余的、沒有意義的信息刪除,把預處理后的數據整理成與數據挖掘時相匹配的形式。
由于醫療數據模式的多態性特征,使得處理不同屬性的數據時,應采用不同的技術和措施。多種數據類型并存,加大了信息融合的難度[3]。
對醫療數據進行挖掘,得到的結果必須具有較高的準確度與可靠性,這樣才能為臨床醫療活動和醫院的管理提供有效的數據支持和決策依據,使理論更好的指導實踐,發揮價值。
醫院管理信息系統主要處理醫院日常經營和內部管理方面的信息,現有的醫院信息管理系統,可以實現查詢統計、輸入修改等基本功能,通過對醫療數據的挖掘,能夠實現質控管理、費用控制、人員管理等更多更強大的功能。①通過對門診人流量的數據進行挖掘,可以分析出就診時人流量的分布,能夠使醫生合理安排工作時間,減少患者就診等待時間,提高醫療資源的使用效率,提高服務質量。②將醫院各部門不同的系統數據匯總,建立數據倉庫,對醫院的成本、收益等情況進行深入分析,可以實現對資源的合理配置,規范醫療行為,提高服務效率。有助于掌握醫院經營狀況,提高醫院經濟效益及核心競爭力。③通過數據挖掘技術,對醫療費用進行分析。可以通過分析醫療費用項目的構成,推斷醫療行為是否合理,可以有效控制醫療費用不合理增長。④單病種管理。通過對醫療數據進行挖掘,可以幫助規范臨床路徑,為醫療質量管理提供理論依據,可以縮短患者住院時間、提高床位使用率,提高醫院整體收入。⑤質控管理。通過數據挖掘技術,將各個部門的考核指標篩選出來,對各部門進行評價考核,制定管理目標,提高醫院的綜合實力。⑥對醫用耗材的備貨管理。醫用耗材的消耗容易受到季節、疾病好發時段及手術擇期規律的影響,應用數據挖掘技術中的時間序列預測方法,對醫院現有的醫用耗材用量信息進行計算模擬,得出醫用耗材消耗模型。根據實際情況自動產生下一時間段的醫用耗材領用量,滿足了醫院感染管理和各種手術的需要,提高了醫用耗材備庫的合理性和科學性。
疾病的診斷,是醫生通過自己掌握的各種醫學理論知識,以癥狀與檢查結果為基礎,進行推理的過程。醫學數據挖掘可以為醫生進行疾病診斷提供幫助。
①通過對患者的性別、年齡、所在地區等個人信息進行分析,用關聯規則挖掘出發病率較高的疾病種類,使醫療工作更具針對性,提高服務效率。②利用決策樹可以將疾病進行分類,對疾病的嚴重程度進行分級,分析不良事件成因,篩選危險因素,對處方藥物劑量監控,對治療方案是否合理做出判斷。③CT、MRI等醫學圖像作為重要的醫療數據,已成為疾病診斷的一種重要工具,對醫學圖像數據進行數據挖掘,篩選出有效的規則、模型等信息,有助于醫生更加準確的診斷疾病。
在醫療方面除了上述應用,數據挖掘還可以用于醫療科研、新藥開發,預防保健、流行病學研究、醫療資源利用評價、醫藥市場預測等諸多方面。
在醫院的支出項目中,藥品和醫療設備的采購占比較大,通過數據挖掘技術,對藥品數量和種類進行動態監測,制定有針對性的藥品采購計劃,可以避免不必要的浪費。通過監測醫療設備的運行狀態和維修保養情況,可以對資源進行合理配置,有效降低采購成本。
通過對醫療數據進行挖掘,是醫院科研創新的重要手段,是服務創新的新方法。數據挖掘技術的發展有助于推動醫院開展多樣化醫療服務。
醫院綜合實力的本質就是知識和技能,提高醫院的綜合實力,對醫療技術的提升與醫院經濟效益的提高都有著至關重要的作用。
通過對HIS系統中的數據進行挖掘,可以分析出就診患者的信息,可以制定不同的服務策略來滿足不同類型的患者,提高服務質量和效率,建立和諧醫患關系。通過數據挖掘,對醫院醫療技術、診療水平有較客觀的認識,通過發揮優勢補足劣勢,使醫院醫療技術水平得到提高與發展,提升核心競爭力。
數據挖掘技術作為一個在海量數據中獲取知識的有力工具,在為醫院管理中新知識的發現開辟了新的途徑,快速發展的圖像數據挖掘技術更是具有較高的學術價值和廣闊的應用前景。但存在的問題是醫療數據庫中存在許多臟數據和已破壞了的數據、數據庫中的臨床信息標準不統一或者不規范使得數據挖掘過程中對數據庫的矯正、去除噪聲等顯得相當困難,這些實際應用中的困難有待于進一步的研究并給予解決。