當前醫院已建成覆蓋HIS、LIS、PACS、手術麻醉、EMR、DRG、藥品耗材管理等業務的信息系統集群,基本保障日常運營。然而,因系統建設時序差異、數據標準不統一及接口異構,多源數據難以互通,形成“數據孤島”,導致運營分析依賴半手工統計,時效性與全面性不足。
為破除此瓶頸,本院基于KETTLE(ETL)、數據倉庫(DW)與聯機分析(OLAP)技術,構建新一代統計決策系統,從而有效提高了醫院的經營能力和數據管理能力。
一、決策系統體系結構
體系結構由數據源、數據倉庫、支撐服務、應用端四個部分組成。數據源:醫院各信息系統,包含醫院HIS系統(門診、住院等業務及費用)、LIS(檢驗)、PACS(醫學影像)系統、手術麻醉系統、EMR電子病歷系統、醫保DRG付費、物資耗材等系統。數據倉庫:從數據源匯集的各系統分析主題數據的集合。支撐服務:提供數據查詢、數據計算、權限控制等能力。應用端:報表、分析預警數據展示端(PC端、手機移動端)。
二、決策系統技術支撐
決策系統是一個集查詢、報表和OLAP技術于一體的智能支持系統(如圖1所示)。該系統支持主流平臺,如Windows、Linux和主流關系數據庫(包括Oracle、SQLServer、SybaseASE/IQ、DB2Excel等。采用
技術和B/S架構體系,可與微信公眾號集成,也可以通過Web進行查詢、報表和分析決策。
圖1技術支撐體系

(一)數據清洗加工
對采集到的原始數據進行預處理,清洗去除錯誤數據和異常數據,統一進行數據轉換;數據同步和清洗轉換選擇使用Kettle工具來完成。Kettle提供圖形化的界面,支持用戶通過拖拽組件來設計復雜的ETL(抽取、轉換、加載)流程,適用于各種數據源和目標,不僅限于數據庫。
制定統一的數據標準、字典和架構,確保各部門和系統使用相同的數據格式和字段定義,減少數據轉換和整合的復雜性,實現各部門數據的共享和流通;建立完整的數據治理框架和操作流程,以實現醫療數據的閉環管理和治理,同時規范數據源,確保數據質量。
(二)數據倉儲(DW)
數據倉庫(DataWarehouse)提供所有類型數據支持的戰略集合,是聯機分析應用數據源的結構化數據環境。主要功能是通過信息系統之聯機事務處理(OLTP)
相應時間段累積的數據資料,通過數據倉庫理論所特有的儲存架構,做系統的分析整理,分層建模,并利用聯機分析(OLAP)、數據挖掘(DataMining)等方式分析出有價值的信息,進而支撐系統決策。
1.數據倉庫分層架構
在數據倉庫架構中,層次劃分是一種平衡數據處理效率、規范性與系統復雜度的策略。增加層級能夠提升數據的標準化程度和易用性,使得上層數據更符合分析需求,同時,也使得數據提取與應用更加高效。但更多層次也意味著架構的復雜度提升,會導致數據處理的時效性下降。
ODS層(數據源層):作為數據集成的初步階段,ODS層緊鄰數據源,主要任務是實時地捕獲原始數據,保留其原始形態和細節,便于在后續步驟中對數據進行追溯和驗證。
DW層:DW層可細分為多個子層,包括數據明細層(DataWarehouseDetail,DWD)、數據中間層(DataWareHouseMiddle,DWM)和數據匯總層(DataWareHouseServce,DWS)。
DWD層負責對ODS層數據進行首次全面的清洗與整合。它能夠確保數據質量,消除錯誤、重復和不一致性,標準化數據格式,對數據完成諸如編碼轉換、數據脫敏等處理,同時維持與原始數據相近的粒度,為后續的數據分析奠定堅實基礎。
DWM層通過維度退化策略簡化事實表與維度表之間的關聯,提升查詢效率。此外,它還執行輕度聚合,創建中間表,為DWS層提供更易于消費的數據結構。這有助于降低下游處理的復雜度,增強數據的復用性。DWM層的職責可與DWS層合并,以簡化層次結構。
DWS層作為決策系統數據倉庫的公共匯總層,DWS層關注于構建面向主題域的寬表,提供輕度匯總數據,粒度較DWD層更為大。這些寬表整合了跨多個來源的關鍵指標,支持快速分析特定業務領域的需求。DWS層旨在提高數據的易用性和業務洞察能力。
ADS層(數據應用層):ADS層處于數據處理鏈路的終端,其存儲的是直接服務于數據產品、報表和復雜分析的數據,支持在線查詢、報表生成及數據挖掘任務,確保數據分析人員和決策者能迅速獲取所需信息。
數據倉庫分層建設增強了結構明晰性,有助于促進代碼與計算資源共享,更是將數據的復雜性進行了模塊化分解。在其分解思想的支持下,當某一環節出現問題時,無須全面復查所有數據,這有助于提升業務的適應
性與響應速度。
2.數據倉庫模型設計
采用星型存儲結構,利用“事實表”大數據量的主表和“維表”的小數據量表。維表設計采用了時間維度、層級維度、緩慢變化維度。事實表設計采用了實物事實表和快照事實表。
(1)維表設計
時間維度:是一個非常重要的維度,應包含所有可能用到的時間屬性(如日期、上下午、星期、季度、節假日標識等)。
層級維度:是模型設計最常用的維度,比如人員的地區維度(省、市、縣、鄉鎮等)。通過將多級層次結構展開并扁平化處理,建立具有固定層級數量的維度屬性,可在一定程度上優化上鉆(roll-up)與下鉆(drill-down)的分析效率。
緩慢變化維度:在維度表中為每個變化的記錄添加新的行,并標記有效時間段。舊記錄不會被刪除或覆蓋,而是通過結束日期標記為過期。
(2)事實表設計
事務事實表:事務事實表的粒度是每一行對應一個事務,或者一行對應事務中的一個條目。如一次就診、一次處方開具、一次檢查等。這類表通常包含度量值,如費用、數量、時間戳等,以及指向維度表的外鍵。
快照事實表:在預定義好的間隔(如每天、每周或者每月)上,使用周期快照的方式裝載到事實表中。快照事實表用于記錄在特定時間點或一段時期內數據的狀態或累積結果,它提供了一個時間點上的數據快照。與事務事實表關注單一事件不同,快照表關注一段時間內的匯總或狀態變化。如每月的物資庫存快照表。
(三)聯機分析(OLAP)
聯機分析(On-LineAnalyticalProcessing)用于處理和分析決策系統內的大量多維數據,從多個角度和維度快速、一致、交互地分析數據,并采用鉆取、切片、切塊、旋轉,篩選、排序等操作多維數據展現、數據交叉、數據挖掘等展現手段。OLAP技術與數據倉庫結合,對大量復雜的數據進行分類處理,以提升計算效率,進而滿足決策需求,保障在多維環境下提供咨詢和報表服務。
1.多維數據源分析
開發多維數據分析系統的第一步是需求分析。從醫院實際需要出發,決策系統多維數據分析應能提供各級需要的常規報表和統計指標;第二步是進行數據源分析。聯機分析(OLAP)的基礎是各系統業務數據。主要數據源是:門診和住院人次、門診和住院費用明細、門診和主要電子病歷,以及醫囑、檢驗檢查等臨床信息。其中包含了基礎信息、疾病屬性、治療天數、科室單元、醫生、臨床療效、具體的檢查、治療項目數量、藥品及耗材、費用等。
2.多維數據集定義
基于原始數據源的核心業務屬性,構建患者、門診、住院、手術、體檢及醫技等多主題多維數據集;通過將原數據庫中具有統計意義的字段映射為標準化維度或度量,實現分析模型的規范化定義。如: ① 患者信息表:由門診記錄和住院記錄中的每個患者組成。度量是人數、累計住院日期和累計費用。維度是患者的自然和社會屬性、病種、首診信息、生存信息等。 ② 門診表:度量為門診次數,維度有掛號患者信息、掛號時間、科室、號別、醫師等。 ③ 住院表:度量為住院人次數和住院天數,維度是住院日期、費別、疾病診斷、治療、療效等。 ④ 手術表:度量為臺數和手術等級,維度是手術名稱、類別、時間,以及科室或麻醉、主刀醫生等。 ⑤ 體檢表:度量為體檢人數,維度有體檢患者信息、體檢時間、項目、醫師等。這些數據集涵蓋數據源事實表,并將其關聯。將關系型數據模型轉換為多維模型,使得數據能夠被快速分析和查詢。
3.維度元分析
維度元即維度的個體單元,如手術時間的維度元為當期、出院;手術等級的維度元為國考手術等級、院內考核等級;出院人次時間的維度元為當期、同期、環期、基期等。定義維度元信息分為兩種,一種是藥品類別、藥品類型等描述實體維的屬性維。這種維度規范統一,維度元不會變動。第二種類型的維度元信息需要經常維護,如出院病人手術等級,通常會根據手術難度、醫院開展情況、國考標準定期進行字典升級維護情況的變化而變化。通過SQL語句定義維度元體系結構,并將相關元數據信息存儲在SQL數據表中實現統一調用。
聯,以及圖表結合等方式,可以更好地實現醫療指標分析、病人費用分析和圖表分析展示等功能。目前,決策系統應用端呈現BI分析運營管理、費用分析、醫療質量、藥品分析、醫技分析、手術分析、耗材、績效分析等八大板塊,以及單點登錄績效、DRG、合理用藥模塊。報表板塊在遷移舊版HIS報表的基礎上,增加國考、院內績效考核等自定義指標,集成展現門診、住院、醫技、藥品、病案、醫療質量、體檢、手術、傳染病等醫療統計數據。不需要編寫SQL或MDX語句,直接呈現同環比變化與歷史數據的對比;查看歷年走勢及累計變化情況;通過KPI設置目標警示等,以為領導決策提供良好的數據支撐,實現精細化管理。同時,醫院通過對決策系統異常指標的定位,實現了“精準診斷”與“對癥下藥”。
例1,手術專題分析:決策系統整合HIS系統收費數據、手術麻醉系統治療數據。聯機分析(OLAP)中發現,存在有手術收費記錄但未進行手術登記、手術麻醉系統中有治療記錄而病案首頁沒有手術操作的情況。找出“病因”后,醫院及時優化流程,并對手術數據進行閉環。同時,在業務系統中,對未填寫的病歷增加系統判定和彈送預警,提醒醫生及時處理,以杜絕手術記錄缺失,從而提高手術相關指標的正確率。
四、結束語
統計決策系統的使用實現了全院資源共享、數據共用、信息互通,覆蓋數據治理、業財一體化、運營分析與決策、績效管理等多個業務場景,對管理決策和醫療服務提供支持,從而實現管理維度的多元化、管理力度的精細化、醫療服務的智慧化,進而實現對醫療成本和醫療質量的雙重控制。在此過程中,信息技術的應用為醫院的高質量發展提供了強大的技術支撐。隨著信息技術的不斷發展和深入應用,醫院的管理將越來越規范化。只有不斷提升醫院的信息化技術水平,才能使醫院的發展更加科學、管理更加規范,使醫療資源得到更加合理的配置。
三、效果
新的決策系統整合了醫院因時期不同、標準不同、系統接口不同的各類數據,實現各類業務系統數據無縫對接。通過新的決策系統,自動生成、數據指標相互關
作者單位:張荊中國人民武裝警察部隊重慶市總隊醫院
參考文獻
[1]鄭建智,段占祺.數據倉庫和OLAP技術在衛生統計決策支持系統中的應用[J].中國衛生信息管理雜志,2012,9(03):47-51
[2]胡楊,袁建華.數據倉庫和OLAP技術在集團財務分析中的應用[J].計算機與現代化,2013,(04):31 -35+39
[3]王徐冬,楊希武.數據倉庫與數據挖掘在醫院信息系統中的應用[J].醫療衛生裝備,2008,(08):47-49.
[4]劉喻,劉仕福.醫院數據分析系統的開發與應用[J].中華醫院管理雜志,2009,25(04):223-225.