趙曉婧,黃政
(1.廣東省第二人民醫院 醫學工程部,廣東 廣州 510000;2.中國聯合網絡通信有限公司廣東省分公司數字與智能化創新中心,廣東 廣州 510000)
廣東省第二人民醫院(原解放軍第一七七中心醫院)誕生于1947 年,2004 年3 月更名為廣東省第二人民醫院,是一家集醫療、教學、預防、保健、康復及科研為一體的大型綜合性醫院。自本院信息化建設工作開展以來,已建設有HIS、PACS、SAP、SPD 和微信預約等就診平臺。隨著信息化進程的推進,信息系統建設的逐漸增加,這些系統對醫院正常運營起到了良好的支撐作用。醫院各類信息系統日常運行所產生的數據,也已經由TB 級逐漸發展到PB 級,數據總量巨大且種類繁多,各系統間信息又彼此獨立,形成了各式各樣的“信息孤島”,使得數據不能共享,業務無法協同,給醫院運營帶來的價值也無法體現。
在傳統的醫療信息化當中,數據從產生到消亡并沒有為整個醫療體系帶來顯著的價值。當今的醫療信息系統更多是關注服務,缺少對信息系統所產生數據的深層次分析及價值挖掘。醫療信息系統生產的巨大數據可在醫院日常運營、科研、臨床診療及輔助決策等多個領域帶來巨大的價值。針對以上所述的醫療信息化缺陷,利用數據中臺技術結合現代數據治理方法論,實現數據標準化,建設科研模型、臨床分析診斷模型、決策模型等,為各項醫療業務提供敏捷的數據服務。
中臺是馬云在2015 年參觀一個游戲公司后提出的,其核心理念是“大中臺”“小前臺”,是為了應對像“雙十一”這樣的業務高峰,應對大規模數據線性可擴展的問題和業務系統復雜關聯性的問題。本院數據中臺建設基于阿里巴巴提出的中臺理論,以大數據平臺為基礎,運用大數據(治理準備-治理過程-治理結果)流程,形成一個行之有效的解決方案[1],同時結合醫院各個醫療信息集成交付經驗,抽象、歸納多種應用場景,從而形成一套基于醫療信息化的大數據中臺。此項舉措是促進數據管理體系建設和執行體系落地的有力支撐平臺,將分散、多樣化的核心數據通過標準化、質量清洗、集成及監控等操作進行優化,形成醫院內的數據管控體系,并結合科室部門組織結構,形成數據管控執行體系,在醫院內部持續運行,提升、挖掘主數據的應用價值。
數據中臺提供了數據匯聚、數據融合、數據治理、數據服務和資產管理五大核心能力。數據匯聚實現將各醫療信息系統的數據歸集到數據中心;數據融合支持根據業務需求建立數據模型并實現數據的加工處理;數據治理用于消除數據噪音,提升數據質量;數據服務基于數據服務目錄為各科室部門、各信息系統提供數據共享服務,并支撐基于數據資產的新應用,例如建立患者檔案、臨床診斷輔助決策、科研數據分析、醫療生產運營等[2];資產管理基于數據資產目錄實現對數據資產的動態追蹤盤點。
通過建設醫院數據中臺,形成數據資產到業務應用的閉環,實現數據資產化(對內增值)和資產業務化(對外增效)。見圖1。

圖1 醫院數據中臺總體架構
1.2.1 數據匯聚 系統提供數據源云連接功能進行數據匯聚,支持連接大量結構各異的數據源,進行多樣化的數據整合。一次建立數據連接后,便可隨時抽取該數據源的數據進行建模、治理和共享服務[3-4]。
醫院數據中臺系統支持連接主流關系數據庫(Oracle、DB2、MySQL、SQLServer 和達夢等)、大數據平臺(Hadoop Hive、SPARK 等),NOSQL 數據庫(MongoDB、Redis 等)及MPP 數據庫(Greenplum、TeraData 等)。
為兼容各醫療器械的數據開源問題,數據中臺支持離線數據的導入,支持批量導入EXCEL、TXT、CSV 等文件數據源,支持百萬級數據一次性導入和分批追加。
1.2.2 數據融合 通過建模的方式進行數據融合,提供可視化方式建立庫表數據集、文件數據集、自助數據集、SQL 數據集,幫助用戶輕松建立滿足業務需求的數據模型。
系統提供可視化方式建立庫表數據集,支持一鍵復制多個數據源的多張數據表結構和數據,實現高效的庫表同步。系統支持根據EXCEL、TXT、CSV 等文件格式建立文件數據集,支持數據批量導入和支持數據追加。
醫院數據中臺的核心功能,支持使用圖形化拖拽方式建立自助數據集,支持只用一個流程,將多個數據源與大數據庫中的數據聚合為一個模型,并提供字段選擇、數據過濾、剪切字符串、行列互轉、去除重復記錄、值映射、計算器、字符串替換、合并記錄等豐富的聚合能力[5]。系統支持直接在圖形化建模界面中,通過鼠標點選實時查看每個處理步驟輸出的數據結果,幫助用戶即時驗證流程的正確性,追朔問題步驟,從而正確及時的完成模型建設。
1.2.3 數據治理 數據治理是方法論與工具結合的關鍵,主要包括數據標準與數據質量。
數據標準是指保障數據的內外部使用和交換的一致性和準確性的規范性約束。數據標準一般包含3 個要素:標準分類、標準內容和標準規則[6]。①標準分類:提供對數據標準分類管理功能,支持直接在標準分類樹上進行標準分類的新增、修改、移動、刪除。②標準內容:提供數據標準創建功能,包括設置標準名稱、所屬分類、說明、狀態、質量標準等。③標準規則:提供標準的質量規則設置功能,用于設置標準所應用的數據質量規則。
數據質量管理系統從數據使用角度監控管理數據的質量,其主要特點是自動化智能化,用戶設置質量規則和校驗任務后,系統可自動根據規則對數據進行檢驗,定期輸出數據質量分析報告,準確定位問題數據。
1.2.4 數據服務 數據服務管理提供對數據共享服務的統一管理,包括醫院內部數據共享和外部數據流通,通過構建數據服務目錄、授權數據服務等手段實現數據共享服務,有效完整的記錄數據服務信息,形成數據服務統計,展示數據服務的價值。
數據服務提供數據集服務接口生成及服務接口的相關管理功能,主要功能子項有:數據資源目錄、系統注冊、我的發布、我的訂閱、服務審批、目錄編排。
1.2.5 數據資源目錄 數據資源目錄是醫院數據治理的成果體現之一,整合醫院數據資源,把核心價值數據往外輸出,支撐各科室部門工作開展、上級部門審計審查、科研實驗室數據支撐、院領導輔助決策、臨床診斷輔助等。
數據中臺是企業數據產品和數據服務的搭建和實施的方法論。它不僅僅是工具,還包括系統架構、數據圖譜、數據質量、組織架構、規范流程等一切與醫院數據價值相關的建設體系,并且通過一系列方法和體系來為業務系統提供計算和分析服務[7]。
不同行業的經營策略和數據場景千差萬別,本文結合本院實際情況,制定了適合本院實施的數據治理技術架構及功能規劃。數據中臺的體系建設和管理規范流程,都是有規矩可循;數據中臺的實施,可根據自身機構發展需求探索適用的最佳實踐。
1.3.1 以患者數據為核心的維度建模 在本院數據中臺建設實施過程中,以維度建模的設計思路,建立了以患者為中心的多維度數據模型,包括預約掛號、就診、檢查、住院等多個維度的信息[8]。在財務部的應用中,數據中臺整合了所有患者的收入、成本相關數據,建設成了以患者為最小顆粒度的數據匹配。在財務會計事務中,可按各種維度,分析患者的利潤匹配,成本控制和收入監控,從而輔助財務資金決策。
1.3.2 設備資產管理 在設備管理科中,建設了以設備資產為核心的數據域,基于醫院業務開展的特性,設備績效分析提供精確可信的數據輔助決策業務[9-10],為醫學工程部、醫學裝備委員會、財務、黨委會等組織部門在進行決策時提供有效的手段,使采購流程大幅降本增效。在耗材管理方面,借助各個耗材歷史使用情況,建立耗材消耗模型,摻雜時間、范圍、科室等影響因子訓練各科室使用耗材消耗模型,提升采購部門耗材消耗預測能力,提前預測耗材消耗。
數據中臺的開發實施,是醫療信息數字化轉型的重要里程碑,為本院信息化帶來了巨大的便利。在醫院數字化專項中,引入數據治理的方法論,由數據指導醫院的數字化轉型,發揮數據生產的主觀能動性。本院在數據匯聚、數據融合、數據治理、數據服務和資產管理五大核心能力的助力下,首先實現了核心應用系統的數據標準,保證了各信息系統之間信息傳輸的一致性,且有利于對相關數據進行統計和分析[11-13],為醫院業務經營決策提供可靠的數據支撐;同時,各信息系統實現了數據互聯,最大層度地滿足數據共享的需求,提高工作效率,減少數據變換、轉移所需的成本和時間、降低數據的冗余度,提高數據的有序化程度和使用效率。
在醫院數字化轉型中,數據作為生產要素,已經成為醫院數字化轉型的關鍵基礎。本文結合數據治理方法論,論述了醫院中臺的技術架構及功能構建,實現數據能力的抽象、復用和共享,賦能醫院科研、醫療運營、臨床決策和患者服務。數據中臺的實施,僅僅是醫院數字化轉型的開始,隨著數據應用的場景深化,數據的作為生產要素在醫院運營中發揮著越來越重要的作用,數據安全問題將越來越突出。數據應用安全是未來醫院數字化轉型的挑戰,數據中臺也在不斷的迭代中完善,下一階段的研究工作將會重點對數據安全領域做深入的開展,建立完整數據運營機制,建設安全的數據應用環境。