白國剛,楊宏橋
解放軍第309醫院 a.醫務部;b.信息科,北京 100091
醫院數據中心建設研究
白國剛a,楊宏橋b
解放軍第309醫院 a.醫務部;b.信息科,北京 100091
為了充分利用醫院數據信息資源,挖掘出對醫院管理有用的模型、規律和知識,本文就醫院數據中心建設進行研究,運用商業智能技術建設醫院數據中心。通過數據倉庫(Data Warehouse,DW)、數據萃取、轉換、載入(Extraction-Transformation-Loading,ETL)工具、聯機分析處理(Online Analytical Process,OLAP)和數據的多維度分析與展現技術,形成統一的數據視圖和綜合決策分析支持系統,并以此為基礎,結合醫院的戰略管理和業務運營,對醫療數據資源進行充分的應用、分析與挖掘。
醫院數據中心建設;數據倉庫;聯機分析處理;商業智能
醫院在信息系統的建置上投入了大量資金,也為醫院積累了大量的、有價值的業務信息。但這些信息都儲存在各個信息系統里,逐漸形成了所謂“信息孤島”[1],見圖 1。加上傳統的信息系統只著重在事務層面的管理與作業數據的記錄,無論是查詢、統計,還是生成報表,都只能對指定的數據進行簡單的數字處理。缺乏數據實時轉化為管理決策信息的能力,不能對這些數據所包含的內在信息進行有效的提取、分析、挖掘等再開發利用。因此,往往耗費大量人力在決策分析報表的制作上,不僅時效上不甚經濟,且亦不能完全滿足管理決策者的需求。
為了充分利用好數據信息資源,挖掘出對醫院管理有用的模型、規律和知識,近年來,所有醫院越來越重視內部信息的集成、管理、開發及應用,期望能在數據中找出有助于增加營運績效、降低成本的有用信息與知識,并作為管理者決策支持的依據。醫院數據中心的研究與應用應運而生。

圖1 醫院信息孤島向數據中心的轉變
醫院數據中心通過建設全醫院數據管理平臺,形成統一的數據視圖和綜合決策分析支持系統,并以此為基礎結合醫院的戰略管理和業務運營,對醫療數據資源進行充分的應用、分析與挖掘。以提供對醫院管理和運營的決策支持,為各部門所需的管理決策、臨床決策及科研決策等信息挖掘提供基礎支持平臺。
通過醫院數據中心的建設,來自不同系統的數據將進行統一集中,使醫院獲取一個集成的[3],以數據倉庫為核心的醫院信息資源管理平臺。醫院的信息使用者,特別是管理層和決策層用戶,將擁有一個一致的信息訪問入口[3],在獲取所需信息的過程中,無需考慮數據的來源,而能夠以數據為基礎開展經營分析,為科學化的醫院管理提供有效的支持和依據。整合了來自不同系統的數據,從而使全局化的醫院運營視圖成為可能。
對傳統的信息系統,醫院需要新的技術來彌補原有數據庫系統的不足,需要把已經廣泛收集到的數據集成到醫院數據中心,從業務數據中提取有用信息,幫助醫院在管理決策支持、臨床決策支持和績效評價管理上做出及時、正確的判斷。商業智能是建設醫院數據中心時所采用的最核心的一種技術。
White[4]認為商業智能是透過信息科技及產品工具來提供使用者解決企業問題的所有信息,以支持戰略性或策略性的商業決策。將現金分散于企業內、外部各種信息加以匯整,并依據某些特定的需求進行分析與運算,透過報表、圖表及多維分析的方式將這些結果呈現給決策者,以協助其管理組織績效或作為決策判斷時的重要參考。
運用商業智能建設的醫院數據中心主要包含3大部分,第一部份是數據的采集、匯總與整理,其中,包含了DW及 ETL 工具 ;第二部分是數據的多維度分析與展現,其中,包含了 OLAP ;第三部分是數據分析的展現與決策支持應用,包含了多維分析報表(Multi-dimensional Analytical Reporting,MDAR)展現工具,及在管理決策支持、臨床決策支持與績效評價管理中的應用。醫院數據中心的架構,見圖2。

圖2 醫院數據中心架構
2.1 數據倉庫
數據倉庫之父 Inmon[5]首先提出了數據倉庫之名,并將數據倉庫定義為支持管理決策的數據庫。數據倉庫大師Kimball[6]認為數據倉庫是一種靜態的數據,從日常事務處理系統中取得而來,并且是可以支持決策的數據庫。常用的數據庫建模方式有兩種:關系數據庫和多維數據庫。在醫院信息系統中采用關系數據庫進行建模[7],而數據中心的數據倉庫則采用多維數據庫進行建模。目前多維度建模有 3 種常見的架構 :① 星型架構[8](star schema),它由一個規模很大的事實表和一組規模較小的維度表所組成;②雪花型架構[9](snowflake schema),它是星型架構的擴展,每個維度都可向外連接到多個詳細類別表 ;③ 星系架構(star flake schema),復雜的應用可能需要多個事實數據表共享維度表。針對住院病人費用決策分析所設計的星形架構[4],見圖 3。首先對數據進行整理,創建了住院病人費用事實表,并建立了與之相關的病人身份、入院方式、入院病情、出院方式、治療結果、費用類別、病人性別、住院科室、時間(包括入院時間和出院時間)等維度。

圖3 住院病人費用決策分析星形架構
在醫院數據中心的建設中,所設計的數據倉庫將能實現 :① 為醫院提供一個開放式的數據體系結構,它可以接納全醫院的運營數據,也可以接納外部數據 ;② 對數據倉庫中的數據進行歸檔、備份、以便在數據倉庫遭到破壞時進行恢復,并能實現從數據源所抽取的數據進行篩選、數據標準或內容的統一 ;③ 集成的元數據管理層用于元數據的管理、數據析取 /轉換、服務器管理和最終用戶分析工具;④ 用于日程安排、存儲管理、性能檢測、報警 /時間和通知的核心管理服務。
數據倉庫的開發策略主要有自上而下、自下而上和這兩種策略的聯合使用。自上而下策略在開發前就可以給出數據倉庫的實現范圍,能夠清楚地向決策者和企業描述系統的收益情況和實現目標,是一種有效的數據倉庫開發策略。在自上而下的開發策略中可以采用結構化或面向對象的方法,按照數據倉庫的規劃、需求確定、系統分析、系統設計、系統集成、系統測試和系統試運行的階段完成數據倉庫的開發。
元數據管理指的是一組管理元數據的流程、程序和工具。元數據管理涉及到數據倉庫構建、運行和維護的整個生命周期,是企業級數據倉庫構建過程中重要的一環。元數據管理使元數據集中起來,方便用戶的訪問和溝通,是業務用戶、業務分析人員、數據分析人員和開發人員全面了解企業數據資產的信息來源。元數據管理的主要目標是數據的一致性定義、數據間清晰明確的關系和數據信息的共享。
2.2 數據萃取、轉換與載入
數據倉庫將分散在醫院各個單位的各種信息系統中的數據集成在一起,這個工作就是由 ETL 工具來完成的。之所以稱為 ETL,就是來自于它的 3 個主要的功能 :萃取(Extraction)、轉換(Transformation)及載入(Loading)。
(1) 萃取 :主要將分散在各種不同信息系統中的數據,以最有效率的方式擷取出來,并存放在數據倉庫的待處理數據庫內。
(2)轉換 :這是 ETL 的核心功能,將擷取到的數據以不同的主題方式加以整理,并針對錯誤數據加以修正及清洗,并可以依據不同的邏輯計算產生新的數據。在跨部門及跨系統的數據處理上,能將不同編碼數據整合為一,使得數據倉庫上的數據能夠具有高度的透通性。
(3)載入 :此功能主要是將已經轉換清理好的數據,載入數據倉庫中。使用者可以在數據倉庫系統中,快速取得跨部門及跨系統的集成型數據。
使用 ETL 可以在作業過程將需要數據庫處理的部分,直接處理完畢,并將所有的作業包括匯總、合并、數據比對等都可以整合在同一個服務中,分離新增數據庫與 ETL工具的作業范圍,強化數據庫的高可用度,并可直接進行問題的警示與回報。
ETL 應包含許多非常有效的組件,例如數據和字符相互轉化、計算列、用于分區和篩選的條件操作符、查找、排序、聚集以及合并。高級組件簡化了其他復雜的操作,例如緩慢變化維度的裝載等。對于某些自定義的需求,可以使用靈活和快速的腳本來實現,同時,開發人員可以毫不費力地編寫和分發他們自創的可重用組件。
2.3 聯機分析處理
數據倉庫中所儲存的大都是由各種信息系統所采集的事務型數據,根據 Kimball[3]的定義,都是具有原子粒度的明細數據。以醫院患者住院信息為例,數據倉庫中存放的是每個住院患者的明細記錄,包含患者的住院號、住院科室、出院時間、身份、費別、住院天數、治療效果、醫療費用等字段[10]。 在 這些明細記錄上, 我 們 需 要 再 進 行多種的匯總、統計、分析等處理,最后才能將結果應用在醫院決策與績效管理的各個領域上。而聯機分析處理就是為了配合數據倉庫所發展出來的匯總技術。聯機分析處理能夠藉由完成各種復雜的多維度匯總、交叉分析、同期對比等常用的統計方法,從現有的數據中產生新的業務信息(或智能)[11]。
多維數據集[12](或稱為數據立方體 cube)是指數據的集合。這些數據組織并匯總到一個由一組維度(Dimension)和度量值(Measure)所定義的多維結構中,見圖 4。它使得分析者可以從不同角度(維度)、通過不同的度量值來觀察分析所關心的事實數據。聯機分析處理可以構造用于分析的數據多維數據集,并提供對多維數據集信息的快速客戶端訪問。它將數據倉庫中的數據組織成包含預先計算聚合數據的多維數據集,以便為復雜的分析查詢提供快速解答。其用戶可從多維數據集和關系數據源中創建數據挖掘模型,還可對這兩類數據應用數據挖掘模型[13]。

圖4 多維數據集
度量值是在多維數據集內,基于該多維數據集的事實數據表中的某列的一組值,是進行聚合和分析的主要數值。它通過一個聚合函數對多維數據集的所有可能組合求值,根據所用的聚合函數,度量值可分為分布的、代數的、整體的3類,由此生成一個多維的業務數據集。
由于醫院數據中心涉及許多重要的醫院信息,因此,安全性的控管就變得非常重要,在醫院數據中心建設中,將針對數據倉庫及多維度分析兩個層面提出安全控管機制要求。
2.4 多維分析報表展現與應用
醫院數據中心建設的最后一步就是多維分析報表的展 現 與 應 用[14-15], 見 圖 5。 多 維 分 析 報 表 工 具 能 夠 讓 分析者透過透視表、儀表板、統計分析圖、KPI計分卡、智能地圖等先進報表展現技術,全方位、周密地掌握醫院的整體績效,以多指標、交互式、可視化的方式呈現關鍵的醫院管理及決策輔助信息,其一目了然的動態圖像化報表,能讓分析者快速掌握管理的重點,而其交互式的數據篩選、逐層分析等信息探索能力,則能幫助分析者立刻掌握復雜數據中的關鍵信息,藉以制定應對策略以作為行動的準則,使醫院保有快速應對內外部各種突發狀況的高度敏捷性。
透視表能夠讓分析者從不同的分析維度、階層及數據源,匯整與分析不同的衡量標準與量值,然后以統計分析圖來呈現該量值所代表的意義。透視表提供了鉆研(Drilldown)、展延(Expand)、切片(Slice)或篩選過濾(Filter)等分析動作,讓使用者對數據進行深入的探詢或相互的比較。

圖5 多維分析報表的展現與應用
透視表的可視化的操作界面更能夠讓使用者準確地管理各個關鍵的階段或里程碑。例如計量性指標(如經濟收入達標率)的表現,可以紅、黃、綠等3種顏色燈號,來顯示數值的意義或是與目標值的差距;而趨勢性指標(如經濟收入成長率)則以直線上升、斜線上升、平行、斜線下降與直線下降等5種箭頭形式來表示,讓使用者可以準確地掌握關鍵績效指標的走勢及變化。
運用 KPI計分卡,分析者能夠輕松定義與修正組織的管理目標,是能夠最清楚呈現醫院績效與目標之間關聯性的績效管理工具。利用極易上手且直觀的操作介面,分析者可以實時追蹤并分析醫院活動的績效,可以選擇相關的KPI,并從不同的角度、情境或分類去依據其重要性、趨勢、狀態、目標值、變異數等賦予適當的權重,更客觀且全面地評量績效相對于目標的達成度,不僅有助于營運警訊的及時發現,也能顯著地提升績效管理的效率。
多維分析報表工具不僅能夠提供分析者諸如透視表、儀表板、統計分析圖、KPI計分卡、智能地圖等先進報表展現工具,還集成了常用的經濟統計分析模型,讓分析者可以快速、有效地透過各種分析模型得到所需的結果。
醫院數據中心的建設除了彌補原有信息系統的不足,把已經廣泛收集到的數據透過 ETL 集成到數據倉庫,并從業務數據中利用 OLAP 提取有用的信息外,最重要的就是要應用在各個不同的管理領域,幫助各級管理者在管理決策支持、臨床診斷和績效評價管理上做出及時、準確、有效的判斷與決策。
相較于一般的企業,醫院的業務流程顯得更為復雜與多變,除了在企業中常見的部門(或科室)組織外,醫院中還有門診、住院、檢驗、收費等流程貫穿所有的科室部門。因此,在多維度分析報表的建置上,部門科室和流程的相關指標形成一個矩陣型的關系。我們可單獨從部門科室指標或門診、住院等流程指標上或兩者的交叉組合上進行決策分析。決策分析矩陣,見圖6。

圖6 決策分析矩陣
鄂瓊和陳英耀[16]指出由于評價主體不同,不同的指標體系會有不同的側重。對于醫院管理者和所有者而言,主要是考慮醫院的效益和效率、發展方向能否維持醫院收支平衡、國有資產的保值增值、患者的滿意度;對于科室主任而言,所關注的主要是能否達到一定的臨床效果、經濟收入與醫療質量等,不同的考核指標體系側重有所不同。為滿足醫院各級人員在分析上的不同需求,醫院數據中心將使用“三層矩陣型”的架構來組織相關的多維度報表。醫院數據中心三層矩陣型,見圖7。

圖7 醫院數據中心三層矩陣型
績效指標的管理是現代醫院管理的一個新視角,近年來,越來越受到重視,逐漸成為醫院數字化管理的有效工具,鄂瓊和陳英耀在《我國公立醫院績效評價的現狀與問題》一文中對我國公立醫院績效評價的代表性研究成果、和常用的績效評價指標體系進行詳盡的敘述[7]。讀者可以參考文中所介紹的指標體系進行構建。
通過醫院數據中心的建設,醫院將能夠以現有的業務系統為主要數據源,逐步建立起跨應用、跨平臺的統一的醫院數據倉庫,在此之上開發更豐富的應用,包含管理決策支持、臨床診斷、與績效評價管理等。同時,應用商業智能先進的信息技術,提供強大的數據查詢、統計、匯總及分析等功能,并建立各種分析和決策數學模型,開展跟蹤預測,為醫院管理和決策提供可信度高的數據和數據分析結果。
醫院數據中心的建設在短期效益方面將為醫院決策經營管理提供全面、可靠、及時的數據支持,縮短分析模型及多維報表的定制時間,提高 IT 部門對業務部門的響應速度,降低報表定制成本,整合多種信息系統與數據源,提供統一視圖報表,實時洞察業務狀況,方便最終用戶訪問與管理報表,提升報表處理效率。
在長期效益方面通過對醫院科室的績效、人員的績效、以及部門及全院的任務完成情況,逐步建立一套完整的醫院績效評價體系,提升醫院管理水平,增強醫院的競爭力。通過對醫療衛生市場的結構、趨勢、變化等分析,以及財務分析(如:成本分析、現金流分析)建立一套完整的監控預警以及決策支持體系,及時調整醫院經營策略,增強醫院抗風險能力。
[1] 閆蒞榮,戴健.醫療信息孤島與信息標準[J].中國數字醫學, 2010,5(9):101-102.
[2] Integrating the Healthcare Enterprise,IHE Technical Framework Volume I Integration Profiles(Revision 8.0)[EB/OL]. (2010-07-23)[2012-02-20].http://www.ihe.net/Technical_ Framework.
[3] 楊宏橋,吳飛,劉玉樹,等.基于SOA的醫院信息系統集成研究[J].醫療衛生裝備,2008,29(1):32-34.
[4] Colin J White.The IBM Business Intelligence Software Solution[R]. Morgan Hill:Database Associates International Inc, 1999.
[5] W H Inmon.Building the Data Warehouse[M].India:John Wiley,2002.
[6] Ralph Kimball,Margy Ross.Data Warehouse Toolkit[M].Second Edition.New York:Wiley Computer Publishing,2002.
[7] Luan Hua,Du Xiaoyong,Feng Yu,et al.A comprehensive performance evaluation of buffer replacement strategies in RDBMS[J].Journal of Frontiers of Computer Science and Technology,2008,2(2):139-165.
[8] 劉佳,蘭順碧,張曉祥,等.基于數據倉庫的分析決策系統住院病人費用[J].計算機工程,2007,33(19):267-269.
[9] 劉曉茜,楊壽保,郭良敏,等.雪花結構:一種新型數據中心網絡結構[J].計算機學報,2011,34(1):77-86.
[10] 毛琦敏.數據倉庫在醫院應用的研究[J].醫院研究生學報, 2005,18(4):358-360.
[11] Umeshwar Dayal.An Overview of Data Warehousing and OLAP Technology[C].Palo Alto:ACM Sigmod Record, 1997,26(1):65-74.
[12] 嚴麗平.數據倉庫的構建及其多維數據集分析[J].科技廣場, 2007,(6):22-27.
[13] Albert Greenber,Parantap Lahiri,David A Malhz,et al.Towards a next generation data architecture:Scalability and commoditization[C].Remond WA: Association for Computing Machinery,Inc.2008:57-62.
[14] 何莎莎,馮占春.公立醫院組織績效的內涵探析[J].醫學與社會,2010,23(1):30-32.
[15] 黃偉城,衡反修.商務智能多維分析平臺在醫院的應用[J].中國數字醫學,2011,6(9):86-89.
[16] 鄂瓊,陳英耀.我國公立醫院績效評價的現狀與問題[J].中國衛生事業管理,2007,(5),292-294.
Research for Hospital Data Center Construction
BAI Guo-ganga, YANG Hong-qiaob
a.Medical Service Department; b.Information Center, the 309thHospital of PLA, Beijing 100091, China
In order to make full use of hospital information resources, explore a useful model, rule and knowledge for hospital management, this paper researched the construction of hospital data center, and built hospital data center with business intelligence. By using technology of data warehouse, Extraction-Transformation-Loading, Online Analytical Process, Data Multi-dimensional Analysis and display technology, we have realized uniform data views and decision support system, then together with strategy management and business operations, make full application, analysis and mining of the medical data resources.
hospital data center construction; data warehouse; online analytical process; business intelligence
TN911
A
10.3969/j.issn.1674-1633.2012.07.021
1674-1633(2012)07-0072-05
2012-03-31
2012-6-28
全軍醫學科研計劃課題(10MA018)。
本文作者:白國剛,碩士,高級工程師,醫務部副主任,主要從事醫學工程、管理科學、信息系統等方面研究。
作者郵箱:lxsamao@163.com。