王順民
(內江師范學院,內江 641000)
營造現代化的醫療系統、搶占醫療市場既是未來醫院信息化的重點,也是內江市第六人民醫院新業務的一個亮點。以此為要求,現有的醫院醫保信息系統(hospital information system,HIS)、社區醫療系統和數字醫療設備的應用都具有一定局限性:可以實現數據錄入、查詢、統計等功能,卻無法發現隱藏在數據背后的知識,均無法改變“數據爆炸,知識貧乏”的現象。
該院HIS、社區醫療系統分別從2004年、2006年開始投資和運作,根據近幾年運行情況來看,其主要表現在運行效率較低下,在線時間長,信息反饋滯后,各環節管理較困難;醫護人員因為就醫與手續問題不能及時滿足病人、家屬要求;不能為醫院的決策者提供定性數據支持,醫院的決策者只能依據一些滯后的數據了解、監控和調整針對號志口片區的就醫醫療狀況;難以滿足日益龐大的數據能給現代化的醫院管理提出的新要求。作為醫院的決策者很難對這些海量數據進行復雜分析處理,更談不上實時處理;難以滿足現代醫療體系反應快速化、服務體系化、目標系統化的要求,成為醫院開展有價值增值服務的一大技術障礙。
DM技術(Data Mining,DM)[1]即數據挖掘技術,它首先是利用數據庫技術對數據進行前端處理,然后利用機器學習方法從處理后的數據中提取有用的知識。DM技術在處理醫院信息平臺的數據庫主要包括以下五個步驟[2]:
數據預處理是數據挖掘過程中的一個重要步驟,尤其當數據庫中包含噪聲、不完整,甚至是不一致的數據時,更需要數據的預處理。在一個完整的數據挖掘過程中,數據預處理通常要花費60%左右的時間,而挖掘工作僅占整個過程的10%左右[3]。
DM要處理的對象是存儲在醫院數據庫系統中的、長期積累的大量復雜數據。而這些數據一般并不適合直接挖掘,需要做些準備處理工作。這是決定對醫院數據挖掘結論是否正確的關鍵性步驟。由于醫院數據具有冗余性、多樣性等特征,需要在重要性和相關性檢驗的基礎上采樣以消減數據。通過這個步驟的數據準備,將原始數據轉換為特定數據挖掘方法所需要的數據形式。
數據挖掘主要是依據目標,選取相應的算法參數,分析數據,從而得到可以形成知識的模式模型。這是醫院信息平臺知識發現過程中的另一個關鍵性步驟。這一步驟包括模型的選擇,訓練與檢驗程序的確定,模型的建立與評估。實現數據挖掘的方法包括粗糙集理論、神經網絡、進化計算、決策樹等。數據挖掘的精確度在很大程度上取決于挖掘方法與研究目標的匹配程度。
主要依據評估標準完成對模式模型的評估,剔除無效、無用的模式模型,并將其以一種易于理解的方式傳送給決策者。作為評估所得到的知識,應對醫院信息平臺的數據挖掘的結論進行解釋,并與最初的設想目標相比較。通過使用各種挖掘方法,選擇最佳的算法,得到最有效的模型。
對形成模式模型的知識做一致性檢查,在運用所得知識的過程中,要有計劃性地實施和控制,發現和解決實施過程中出現的問題,消除其中的矛盾與沖突,并對運用情況進行階段性總結,指導今后的實際應用。然后運用數據分析手段對挖掘出的知識做二次處理,形成專業化、可視化、形象化的數據表現形式。
上述過程可轉化為是一個不斷循環、反饋、完善的過程模型,如圖1數據挖掘技術的處理醫院信息數據模型,每一階段都可以返回上一階段重新調整、重新執行。

圖1 數據挖掘技術的處理醫院信息數據模型
作為新型的現代醫院信息平臺的基礎是醫院HIS、社區醫療信息系統及計算機網絡等,其作用是為病人提供更好的醫療服務,為醫院的發展創造更好的前途,豐富和拓展醫院的信息查詢、統計、處理、反饋等基本功能。它應該能與病區管理系統、社區管理系統、廠商管理系統、財務管理系統、領導決策支持系統等相聯:從病區管理系統獲取需用數據和數據,實現病床的供求平衡;從廠商管理信息系統獲取相關業務單位、企業、組織機構信息,統一病人和藥品、耗材等編碼,完成病人和供貨單位藥品、耗材等貨物消耗、流轉查詢、分析和統計計算;為財務管理信息系統提供貨物核算方面的有關記賬憑證數據,使財務管理信息系統實現會計核算和財務管理;為領導決策支持系統提供貨物配送管理方面的信息、病人就醫狀況、本地區醫療市場狀況等信息,為領導的決策提供信息支持。
新型現代醫院信息平臺的數據不只是來源于病人就醫刷卡系統,更多的數據來自社區綜合醫療系統、計算機網絡等系統。病人就醫的實時信息在傳給領導決策的同時,也支持病人的查詢與跟蹤。
目前醫院醫療綜合業務主要由社區醫療和住院醫療組成。采用數據挖掘技術搭建的新型醫院信息平臺能夠以數據流為紐帶、以電子處方、電子病歷為手段、以業務流程優化為基礎,有效地對社區醫療和住院醫療進行整合,實現醫院業務系統的高度集成。
社區醫療系統平臺主要包括社區門診管理、社區成員健康檔案管理、財務管理等綜合管理平臺,與社區網站、社區門診、健康檔案、服務等密切相聯,存在著緊密的數據交互與信息傳遞關系。而HIS系統的信息平臺包括業務系統、醫務管理系統、病人就醫系統(門診、住院、醫保管理系統等)等組成。作為新型的現代醫院信息平臺可以將社區醫療系統與HIS系統很好地整合成為一個有機的整體,實現信息數據的融合。
基于數據挖掘技術搭建的新型醫院信息平臺使醫院的業務范圍不再局限于當前的傳統醫療業務,它還可以提供諸如病人結算費用情況、進行病人就醫調查與預測、還可提供采購信息、庫存情況分析及咨詢服務等增值服務。將已有的數據分析的結果和挖掘的知識提供給決策者,一方面可以獲取病人認可,另一方面對增值業務的開展也是大有裨益的。
當前醫院信息處理采用的數據庫類型、數據結構、表單樣式、數據組織形式、數據庫對象等都各不相同,彼此間有些是可以單向交互的、有些是可以雙向交互的。采用數據挖掘技術搭建的新型現代醫院信息平臺可利用不同病人跨平臺的數據庫接口,實現對不同病人的個性化數據的集成和綜合。
采用數據挖掘技術搭建的新型現代醫院信息平臺,通過選用優秀的數據挖掘算法、數據備份機制與轉移機制,以及采用三層結構等技術措施,可以使查詢速度得到大幅度的提升。
數據分析處理的實時性是使醫院信息平臺具有市場競爭力的關鍵。它能為病人、季節病等在第一時間內提供病種分析決策支持資料,對廠商管理模塊采用用戶只需進入就可以輕易地完成所需的數據分析處理和藥材等跟蹤查詢。
數據挖掘算法的選擇是平臺搭建的關鍵。目前成熟的數據挖掘算法中關聯規則挖掘在電信、金融、氣象分析、地質分析等商業領域已經得到成功應用。對醫院醫療信息數據,在數據量龐大而頻繁產生項目集相對較多的數據挖掘處理而言,則可以選用以分類和預測的智能化方法:粗糙集理論、決策樹、人工神經網絡等算法為代表的層次算法作為數據挖掘算法[5]。
醫院HIS、社區醫療系統部分由于運作時間長,帶來數據量的急劇增加。新型的現代醫院信息平臺可通過在數據倉庫管理模塊中對庫中數據進行甄別,后期數據挖掘和數據分析要用到的歷史數據可以繼續留在數據倉庫中,而對很多無用的或使用頻率很小的數據進行備份和轉移。同時在前期設計中,對數據結構、表結構等進行合理優化,增強數據的重用性,避免重疊定義和反復,這樣可以從根本上解決大量數據在時間軸上的縱深性問題。
作為醫院其信息數據容量是呈膨脹狀態,而數據庫更是一個復雜數據庫,包括電子病歷、醫學影像、病人信息、疾病信息等信息,利用數據挖掘技術來構建具有市場競爭力和抗風險能力的醫院信息平臺。打造真正意義上的現代化醫院信息平臺,為服務地區、病人提供強有力的技術支持與保障。
[1] 范明,孟小峰,譯.數據挖掘概念與技術[M].北京:機械工業出版社,2007.
[2] 紀征.醫學數據挖掘應用[J].情報探索,2010,(6):105-106.
[3] 劉莉,等.數據挖掘中數據預處理技術綜述[J].甘肅科學學報,2003(1):117.
[4] 王徐冬,楊希武.數據倉庫和數據挖掘在醫院信息系統中的應用[J].醫療衛生裝備,2008,29(8):47-49.
[5] 強永乾,郭佑民,等.數據挖掘技術在臨床醫學中的應用[J].中國高等醫學教育,2007(4):92-83
[6] 張馳,劉燕翌.醫院管理測評金字塔模型[J].中國醫療前沿,2008,5:43-45