王玨 許朝暉 夏新



摘要:通過搭建高性能的數據倉庫,利用數據挖掘相關技術結合運營指標構建院科兩級綜合運營評價模型,幫助醫院管理者充分利用醫院業務數據,更加高效的對醫院各科室的運營情況進行客觀評價,幫助科室發現在運營過程中存在的問題,并為后續的醫院發展方向提供決策支持。
關鍵詞:商業智能;數據倉庫;醫院管理;決策支持
中圖分類號:TP311.52? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.3969/j.issn.1006-1959.2019.08.006
文章編號:1006-1959(2019)08-0019-03
Abstract:By building a high-performance data warehouse, using data mining related technology combined with operational indicators to build a two-level comprehensive operational evaluation model of the hospital, to help hospital administrators make full use of hospital business data, and more objectively and efficiently evaluate the operation of hospital departments. Help the department to identify problems in the operation process and provide decision support for the subsequent hospital development direction.
Key words:Business intelligence;Data warehouse;Hospital management;Decision support
近年來隨著醫院信息化建設的飛速發展,尤其是國家電子病歷等級評審的要求,醫院的信息系統不斷深化著應用的范圍,在提升醫院工作效率,方便患者就醫的同時,也積累了海量的業務數據[1]。隨著大數據技術的不斷發展,商業智能(BI)的不斷成熟,快速、準確的獲取有用的數據,結合各類算法直接獲得分析結果是未來大數據應用的主流方向[2]。本文主要探討利用BI技術從醫院不同業務系統對數據進行抽取、清洗、加載,形成面向主題的數據倉庫,并最終通過引入密切值算法,完成醫院臨床科室綜合運營評價模型的設計。
1 BI及其關鍵技術
1.1數據倉庫? 數據倉庫是將不同業務系統中分散的數據,經過抽取、清洗及轉換(extract-transform-load,ETL)后根據數據分析的要求加載到數據倉庫中,為后續數據分析建模做準備[3]。其中,ETL技術是數據倉庫技術的核心,通過ETL處理抽取各業務系統中的數據,并通過數據一致性檢查、異構數據源標準化處理、缺失數據處理等技術將各系統數據整合到同一主題數據倉庫中。數據倉庫獨立于業務系統數據庫之外,在數據倉庫中進行數據查詢時不會對醫院正常業務的產生任何影響,同時與面向事務設計的業務數據庫相比,面向主題設計的數據倉庫在數據分析決策的應用上,查詢效率有極大的提升。
1.2數據挖掘? 數據挖掘是通過各類算法從海量數據中獲取潛在的信息和知識的過程[4]。數據挖掘技術是大數據時代統計學的技術延伸,同時也與近年來熱門的人工智能、模式識別和機器學習的搜索算法和建模技術有著一定的聯系。包括關聯和聚類等描述性挖掘方法及分類,以及回歸等預測性挖掘方法,數據挖掘的最終目標是根據需求選擇合適的分析方法從海量數據中挖掘出有價值的信息[5]。
2密切值算法基本原理
密切值法是一種常用的多目標決策分析方法,適用于多項指標的綜合評價,其數據模型簡單易懂、評價結果客觀合理,因而在績效評價、公共衛生、醫療質量等多個領域都有廣泛應用[6]。密切值法在面對多目標、多維度的指標時,對于同時存在正向指標(即數值越高越好,如業務工作量)和負向指標(即數值越低越好,如藥占比)的進行標準化處理,可以得出各評價指標的“最優點”和“最劣點”,并通過計算每個評價對象與“最優點”及“最劣點”的距離,最后得到的密切值的大小可以排出各評價對象的優劣順序[7]。醫院有n個臨床科室,每個臨床科室有m個評價指標,構建原始數據指標矩陣:
(i=1,2,…,m;j=1,2,…,n),aij是第i個科室第j個指標的原始數據
對原始數據矩陣做同向化處理:當評價指標為正向指標時(如業務收入、手術量等),數值取正值;當評價指標為負向指標時(如藥占比、平均住院日),數值取負值。
對不同的指標做標準化處理(如門診人次、床位使用率),使不同單位或量級的指標可以統一標準。
從標準化矩陣中找到“最優點”D+及“最劣點”D-,代表每一項指標的最高分集合和最低分集合。
最優點D+=(r1+,r2+,…rm+)
最劣點D-=(r1-,r2-,…rm-)
計算出各科室的密切值,密切值Ci越小,代表科室各項指標距離最優點越近,距離最劣點越遠,綜合評價越高。