包冬冬
【摘 要】本文提出結合醫院實際特點,應用數據倉庫技術對已有業務數據庫進行集成,并利用數據挖掘技術在其上進行數據分析,挖掘潛在有用的知識,從而進一步改善醫院服務質量,提高效益,降低成本,并指導管理者做出科學決策分析,提高醫院核心競爭力。
【關鍵詞】數據倉庫 數據挖掘 醫院管理
【中圖分類號】TP391 【文獻標識碼】A 【文章編號】1672-5158(2013)03-0083-01
1 引言
目前,我國大中型醫院均建立了醫院信息系統(hospitalinformation system,HIS)系統,隨著時間的推移HIS系統中相關的信息數據也急劇膨脹如何運用科學的技術和手段從海量數據中發現有用的信息并充分利用,發現醫院運作的基本規律,預測醫院發展的趨勢,從宏觀上把握醫院的發展方向,更好地為廣大患者服務,這是醫院管理者企盼解決的深層問題因此采用數據倉庫技術、數據挖掘技術對HIS數據進行再次開發已成為新的趨勢。
2 數據倉庫建設過程
數據倉庫建設是一個循環往復的過程,通常涉及數據的選擇、數據的變換,建立模型,評估、解釋模型,運用和鞏固模型等步驟。它可以由領導和基層管理人員,進行自發挖掘。但由于數據挖掘過程比較復雜,還必須有受過專門訓練的技術人員實施有目的的挖掘工作。
2.1確定主題數據倉庫中的數據是按分析主題來組織數據的。因此確定主題是數據倉庫建設的首要目標。同時還要根據主題確定子主題、維度和數據來源等。
2.2數據準備數據準備的好壞將影響到數據挖掘的效率和準確度以及最終模型的有效性。數據準備工作包括數據的選擇(選擇相關和合適的數據)、探索(盡可能了解數據,如了解分布情況和異常數據等)、修正(包括缺失數據的插值等)、變換(離散值數據與連續值數據之間的相互轉換,數據的分組分類,數據項之間的計算組合等)。
2.3建立模型該步為最關鍵的步驟,選取數據挖掘工具提供的算法應用于以上已準備好的數據,選取相應參數,生成模型。
2.4評估、解釋模型對生成的模型進行比較和評估,直到生成一個相對最佳模型。再對此模型用業務的語言加以解釋。如果沒有問題,可以對模型加以試驗型的應用。如果有問題,再重復上面的數據準備和建立模型的過程,直到建立滿意的模型為止。
2.5數據準備建立模型評估、解釋模型運用、鞏固模型對使用人員理解的、并被認為是符合實際和有價值的模型進一步監控其在實際應用中的表現,如果發現模型表現不好的情況,應對模型作進一步的考察,以反映業務運作規律的變化。
3 數據挖掘技術在醫院中的應用
醫院利用數據挖掘軟件從數據倉庫中提取有用數據,并且進行微觀、中觀乃至宏觀的統計、綜合和推理,發現事物間的相互關聯,提供更高層次的數據分析功能,對未來的醫院業務進行預測,更好地為醫院管理決策提供支持。本系統完成了以下功能分析:
3.1 患者費用構成進行分析
患者費用由手術、治療、檢查、化驗、藥品等組成。該功能可以分析醫院、科室乃至各個病房內的患者費用構成,從而能有針對性地控制費用比例,探究醫療費用項目結構的合理性,使醫院管理者有針對性的控制醫療費用。例如:國家對藥品占醫療總收入的比例有嚴格的要求,利用數據倉庫內的信息,可以分析在某段時間內,某科室開具處方的藥品是否超過了合理的比例,從而為醫院合理控制藥品比例提供了決策依據。
3.2 同期費用對比分析
該功能可以按不同的時間維度( 包括按年綜合、按旬綜合、按月綜合) 對各個科室或各個病房同期的各種費用進行對比分析,并以各種專業報表、視圖的形式反映給醫院管理者,找出收入增加或減少的原因。例如:各科室、各病房近 5a 藥品收入時間變化趨勢,尋找變化的原因,促進有利因素,減少不利因素。
3.3患者結構分析
我們可以運用秩和比法對醫院門診住院患者的地區分布、性別分布、身份分布、職業分布、年齡分布等方面進行分析,從而得到不同地域、不同性別、不同年齡、不同身份、不同職業患者的經濟狀況、需求的主要醫療服務類型等信息,使醫院管理者了解患者差異對醫院收益的影響,能夠針對不同類型患者采取一些措施來提高服務質量,增加門診量和住院收容量。
3.4患者流動轉情況分析
該功能可以分析門診患者從掛號到取藥再到離開醫院的時間分布以及住院患者從入院到出院各個就醫環節的時間分布。分析出患者的就醫瓶頸,掌握影響患者診療效率的因素,以便能針對這些因素采取措施來幫助醫院管理者進行業務流程的更新和改進,提高患者的就診效率。
3.5 醫療工作量影響因素分析
科學合理地評價各種醫療工作量影響因素,找出影響醫療工作量變化的主要因素,是進行醫療工作量影響分析的目的,為醫院管理決策提供了支持依據。例如:醫院收治患者數是醫院工作量的重要指標之一,它直接影響醫院的經濟效益和社會效益。利用數據挖掘技術中的灰色關聯分析方法對醫院收治患者數的影響因素進行分析發現:病床周轉次數、住院患者手術人次、年收治患者人數、平均開放病床數和年平均醫生人數與年收治患者數關聯程度較高。
3.6單病種分析
該功能以ICD-10疾病分類標準,對單病種進行分析,包括對單病種的住院費用、住院天數、轉歸、病情、治療方案等方面進行分析,為醫療質量管理提供依據,使醫生能夠及時總結經驗,找出最佳治療手段。既縮短了患者的就診住院時間,減輕了患者的負擔,同時也提高了工作效率,增加了經濟效益。
3.7患者就診時間分析
由于醫院患者的入院季節性較強,可以通過分析每月、每季度的門診人次、住院人次、床位周轉率,利用數據倉庫,通過時間維度分析,建立數據挖掘中的灰色預測模型,來預測下一時期的門診和住院人次。根據預測信息,醫院管理者可以提出有針對性的措施,確定最優的服務項目時間表,從而作出終止或開拓某種醫療服務項目的決定,以便對人力資源、醫療設施、醫療設備做出適當配置。
3.8科室綜合評價的分析
利用數據挖掘技術對醫院各科室進行綜合評價分析,從數據倉庫中選出代表性強、獨立性好、能反映科室工作效率、治療質量、經濟效益、綜合管理等方面的多項指標進行綜合評價分析,從而可以找到科室的薄弱環節,并采取相應的措施進行調整,以提高科室的綜合水平。
4 結論
運用數據倉庫和數據挖掘技術,對醫院醫療活動過程中產生的海量數據進行深度加工可從中得到長期的、系統的、綜合的數據;同時還可以通過決策樹、神經網絡、遺傳算法、聚類等技術,對數據進行深層次的挖掘和有效利用,得到豐富的輔助決策信息。這兩種技術的綜合應用,能為醫院的科學管理提供支持和依據可以幫助醫院管理者預測醫院發展的趨勢,滿足更大范圍、更深層次的管理分析需求,從宏觀上把握醫院的發展方向。
參考文獻:
[1]JiaweiHan,MichelineKamber著,范明孟小峰等譯.數據挖掘概念與技術[M].機械工業出版社,2003:9
[2]周愛華,鄭應平,王令群.醫學數據挖掘綜述[J].中華醫學實踐雜志,2005,2,l4
[3]陳金雄,劉雄飛,王慶森.醫療衛生裝備,2004:8