姬娜 潘杰 馮源 丁濤

摘要:目的:針對醫院未來管理及醫療業務需求,構建基于VMware vSphere的醫院大數據中心平臺。方法:通過ETL的DataStage工具將各異構系統數據進行抽取后,統一存儲管理,構建基于統一數據平臺的數據分析及應用。結果:實現數據中心的日常業務管理、臨床醫療體系管理、資源管理、控制管理以及醫院數據信息的集中共享和交互。結論:統一集中的數據中心平臺保障了醫院業務核心數據完整性、準確性,達到數據管理可視、高效、便捷的交互和應用,為醫院信息系統挖掘臨床數據和臨床事務統一處理提供有力支撐。
關鍵詞:醫院;大數據;異構數據;共享
中圖分類號:TP393? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)18-0015-03
開放科學(資源服務)標識碼(OSID):
1 引言
近年來,隨著高質量發展的要求,各個醫院以信息化為抓手,不斷通過信息技術在診療、服務、管理過程中的應用,推動醫改政策的落實和深化[1]。為了便于業務工作和精細化管理,醫院陸續實施眾多不同的業務及管理信息系統,不同系統的多樣性和復雜性導致各系統間數據分散[2],特別是系統的異構性和數據標準不一致[3]使得數據的共享和深層次挖掘利用變得非常困難,如何通過數據信息整合手段實現分散數據資源的集成和利用,進行統一存儲和管理,構建以患者為中心的臨床數據中心,逐漸成為支撐醫院發展和數字化建設的重要內容。
本文基于VMware vSphere構建醫院大數據中心平臺,實現以患者為中心的服務流程應用、以診療數據為中心的數據挖掘應用、以成本核算為中心的運營決策支持、以專病數據庫為中心的科研管理應用以及以專病案例庫為中心的教學管理應用五大體系,完善歷史數據、歸檔數據中心建設,實現醫院人、財、物信息的一體化管理,患者、診療、業務數據的統一和共享。
2 醫院大數據中心平臺的總體架構
系統采用數據訪問層、Web服務層、客戶端應用層三層架構[4]。在功能上,由四個層面組成,由下往上分別為醫療資源信息平臺應用層、醫療資源信息平臺交換層、醫療資源信息平臺資源層、醫療資源信息平臺應用層。基礎應用層即臨床服務以及醫療管理各業務基礎系統。醫院大數據中心交換層實現各系統基于數據標準的實體信息交換,同時能夠為醫療資源信息平臺數據標準化提供實現路徑,保障業務子系統的協作和信息平臺資源層的標準化獲取。信息平臺交換層通過集成平臺中間件工具來實現。信息平臺資源層是醫療信息資源平臺的核心,由臨床大數據中心、運營大數據中心、科研大數據中心、教學案例庫組成。平臺應用層實現對外交換,接入區域衛生信息平臺或其他醫療機構,實現不同的信息系統、不同的醫療機構之間的信息交互及其共享應用。同時基于信息資源層的數據進行分析利用,如臨床科研分析、運營決策分析等,搭建患者臨床信息集成視圖、健康門戶等,如圖1醫院數據中心平臺架構圖所示。
3 醫院大數據中心功能應用
3.1 臨床數據中心建設
臨床數據中心(CDR)在基于電子病歷的信息平臺中主要扮演信息資源層的角色,用于平臺各類數據的存儲、處理和管理[5]。各業務子系統產生的醫療信息業務數據、臨床及管理信息數據,通過臨床大數據中心進行整合患者基本信息、醫療衛生從業人員注冊信息及各種術語字典等由此形成電子病歷信息。整合集成了醫院分散的各業務系統,建立全方位患者臨床數據中心,對患者在院內發生的所有臨床活動相關的數據以患者為中心進行組織關聯,對患者就診數據做360°全方位展示,更好地輔助醫務人員完成臨床業務,同時為科研工作奠定基礎。臨床輔助決策系統 CDSS 包含智能診斷模塊、治療方案推薦模塊、醫學知識庫模塊,按照不同的模塊又分為幾大核心功能:輔助診斷、檢查推薦、用藥推薦、量表推薦、相似病歷推薦、知識查詢。在建設統一的臨床數據庫的基礎上,逐步建立面向疾病、醫生、患者、衛生經濟等主題數據集,為醫護人員提供統一完整的數據展現。同時,對原始數據進行整合后提供數據檢索和導出工具,服務于醫療科教。實現臨床信息數據的互聯互通,根據診療規范、臨床路徑及循證醫學,輔助醫生進行決策,提高醫療質量。
3.1.1 患者主索引管理(EMPI)
患者主索引(Enterprise Master Patient Index,EMPI),是患者基本信息檢索目錄[6],將來自多個系統的患者標識進行關聯,實現同一病人多業務固定標識號碼(Identity Document,ID)的關聯和患者信息的統一或關聯。其本質上是一個數據整合系統,是在一個復雜的醫療體系內通過唯一的患者標識將多個醫療信息系統有效地關聯在一起。整合后有效解決了多系統中識別病人身份的問題。患者主索引服務是指為保持在多域或跨域中用以標識患者實例所涉及的所有域中患者實例的唯一性所提供的一種跨域的系統服務。實現各個系統之間的互聯互通,保證對同一個患者分布在不同系統中的個人信息采集的完整性和準確性。
3.1.2 主數據管理系統
主數據(Master Data,MD)是指醫院各應用子系統之間的數據共享[7],包括數據實體(公用代碼、疾病代碼、費用代碼、檢驗檢查等數據)和數據字典(科室字典、藥品字典、醫囑字典、手術字典等)。目前由于各應用子系統之間能夠保證一致的主數據只包括少量數據實體,同時各應用子系統的數據字典不統一,醫院得不到全局性的統計數據。通過主數據管理平臺來定義數據的值域和制定標準,建立院內標準體系,提供必要的語義保證來實現互操作,統一管理醫護、病患、科室、醫囑等數據及相關主索引。
3.1.3 臨床數據集成視圖
臨床數據集成視圖是基于臨床數據中心進行數據的整合展現型應用,可以嵌入任何業務系統中,臨床數據集成視圖可以在一個操作界面上對多次就診的所有臨床信息按時間軸進行集中展現。通過時間軸,醫護人員可快速了解患者的歷次診斷、生命體征、出量入量、長囑開立與停止、臨囑開立與執行,各項檢查檢驗結果、手術完整過程、電子病歷書寫過程、臨床路徑出入徑狀況等臨床信息,徹底解決醫護工作者需要通過不同系統不同界面多次訪問才能了解患者臨床信息的狀況。
3.1.4 臨床輔助決策系統
充分利用大數據基礎管理平臺構建的臨床科研數據管理系統進行臨床數據采集、清洗和抽取,同時實現與其他業務系統的協同。考慮加入自然語言處理(分詞+語義分析),建立基于病種的高頻詞+語料庫,完善歷史數據采集。建立科研病歷庫、標本數據庫、基因數據庫,進行大數據存儲和利用。以智能醫學臨床輔助系統和智能醫學科研分析系統實現基于病種的大數據分析,助力科研和臨床工作。
3.2 運營數據中心建設
運營數據中心的建設是醫院內各種業務系統、部門之間協同工作的數據中心,以患者、費用、科室、員工、病種緯度對運營效率進行數據接入和建模,是整體信息化基礎設施的信息中心,用來存儲多媒體、文檔資料和政策法規,是預測決策所需的數據倉庫中心。運營數據中心實現了數據的清洗、轉換、標準化,以患者、費用、科室、員工、病種等緯度對醫院內各種業務系統數據接入和建模,并且通過應用開發、商業智能(Business Intelligence,BI)展現等構建以主題為核心的業務應用,完成了實時動態、門診分析、住院分析、數據上報、醫療質量及運營報表分類下的數十個報表及圖表頁面,將結果反映給管理人員,為醫院預測決策提供支持。
3.3 科研數據中心建設
科研數據中心為有科研需求的醫生提供數據統計、導出功能,輔助科研項目研究,整合集成了醫院分散的各業務系統,建立了以患者為中心,關聯歷次就診記錄的全部診療病歷視圖,以支持診療醫護的連續性,需要以單病種為主線瀏覽患者的歷次就診記錄,進行隊列管理,隨訪補錄,以便對不同分組和隊列病人進行結果的分析和統計,對病人在院內產生的相關的數據提供自定義組合查詢及導出,同時為科研工作奠定基礎。科研數據中心構建了以病人為中心、關聯歷次就診記錄的全部診療病歷視圖,以支持診療醫護的連續性;支持以單病種為主線的患者的歷次就診記錄瀏覽,患者隨訪、補錄,并可以根據各種維度,自由組建患者篩選方案,設置患者觀測指標,對患者臨床數據進行統計導出,有效支持科研進展。
3.4 教學輔助支持系統建設
臨床科教資料的積累是提高教學質量、激發學生學習興趣的重要基礎工作。針對臨床教學資料的積累面臨收集不易、不能共享、質量不高等困難。通過教學輔助支持系統的建設,我們為臨床教學資料的收集、管理和使用提供信息化的工作平臺。開發的教學輔助支持系統是由導師在360視圖中標記具有教學意義的典型病歷,審核通過后,由實習生查看學習的系統。建立三個教學資料庫:標準化病例庫、疾病影像資料庫和學生實習病案庫。三個庫共同支撐臨床教學的資料收集與應用、實習學生病歷書寫能力培養和考核。
3.4.1 數據資料標識與管理
數據資料是指病案、檢查影像、手術錄像、治療過程的影像等臨床資料,在形態上包括動態、靜態影像及語音、文字、圖表等多媒體。數據資料的標識是在臨床工作中,如手術、檢查、病歷書寫或治療過程中隨時對該數據資料標識為臨床教學資料,然后進行管理及數據資料轉錄。
3.4.2 數據資料歸類與標注
資料歸類、標注是對已標識的數據資料按病種、課程或教學單位等進行分類,并進行數據的集成、歸并和標注。
3.4.3 數據資料編目管理
為方便學生和教師對臨床教學資料的使用,按使用權限對已整理好的資料進行編目和分級,方便查詢、瀏覽。
3.4.4 數據資料質量審核
由授權教師對入庫資料進行內容和質量的審核,確保入庫資料符合教學要求。
3.4.5 數據資料檢索與統計
提供資料檢索、統計等管理功能。
3.4.6 數據資料瀏覽
提供教學資料在課堂教學、學生自學的查閱,支持臺式機及手機上的瀏覽。
3.5 歷史數據歸集數據中心建設
整合集成了醫院自2003年以來分散的各系統業務數據,建立患者360視圖,對患者在院內發生的所有臨床活動相關的數據以患者為中心進行組織關聯,更好地輔助醫務人員完成臨床業務,同時為科研工作奠定基礎。
3.5.1 標準化改造
ETL工具集包括對多種異構數據源進行格式和語法層面的抽取、清洗、轉換等自動加工操作,以實現離散數據的互通機制。
3.5.2 數據采集服務
數據采集服務提供平臺通過醫療機構前置系統從醫療機構信息系統采集健康檔案信息,并對數據交換和數據采集行為進行規范化。主要功能包括:采集數據、數據轉換服務、數據封裝、代碼解析、數據導入。
3.5.3 數據遷移服務
利用跨數據庫平臺數據存取技術實現歷史數據和動態數據的整合與遷移,要求數據遷移工具支持常用的四類數據庫系統:Oracle、IBM DB2、Microsoft SQL Server、Cache。利用數據遷移工具對醫院舊系統中的數據進行遷移,提供人工錄入數據的錄入界面,由相應的人員對數據進行錄入。基礎數據錄入完畢后對數據進行測試,包括數據字典測試、新舊數據對比等,保證基礎數據的準確性,在此過程中可以對舊系統中的數據進行優化。
4 系統架構環境及實現
4.1 系統架構環境
采用雙核心交換機Cisco N9k,采用多模光纖雙鏈路聚合模式來實現鏈路冗余。通過虛擬化技術vpc對設備進行融合。網絡架構部署按每層獨立劃分vlan。以內網Cisco N9k為基礎,AP模式的無線網絡覆蓋了全院所有病區,通過Aruba7210對AP節點進行控制,POE交換機無強電匯集各個區域的AP從而達到一體化管理,通過兩臺光纖通道的交換機同步書寫的方式對數據實時保護,以防發生單點故障時,醫院核心業務數據做到“零丟失”,同時可快速切換至容災存儲來恢復業務系統。
4.2 系統實現
3臺數據庫服務器均配置采用H3C,UN-R6900-G3/DL580,CPU:4*5118(12核),內存:1TB,SSD:2*960G,R530-8i支持RAID0.1.5,雙口千兆550W單電。兩臺數據庫服務器實體機均安裝ORACLE LINUX6.9操作系統,通過VMware vSphere平臺部署WEB服務器、緩存服務器、日志服務器、ETL服務器(用于CDR、ODR數據采集)、BI服務,實現負載均衡,滿足數據統一存儲管理及數據備份要求,以保障數據的完整性及連續性。大數據中心通過HIS系統的集成平臺Health Connet與各業務子系統進行數據交互。采用兩臺NetAppA300存儲服務器作為數據的主存儲和容災存儲。使用基礎組件為Stage的IBM DataStage(簡稱DS)作為ETL工具,通過Active Stage完成數據的轉換和加載,Passive Stage與數據庫或者文件進行連接,然后讓Active Stage完成其他操作,將醫院歷史數據歸集。
基于VMware vSphere的大數據中心上線后,以信息大數據反哺臨床醫療、科研和管理,為臨床人員提供統一的數據整合視圖以及實時的診療活動決策支持。根據醫院上報數據要求將本地化非標準數據標準轉換、規則校驗以及敏感信息處理,實現了醫療質量與安全持續改進。
5 醫院大數據中心的運行效果
基于VMware vSphere的醫院大數據中心于2020年10月正式上線運行,其中臨床“患者360視圖”“科研數據中心”“單病種隨訪”“臨床決策支持系統(CDSS)”四個核心模塊能更好地服務于臨床醫療及診療活動、構建以科研管理為核心的數據集成與挖掘、整合院內業務信息系統的各種數據表單,為臨床診療和科研提供數據支撐,有效提升工作效率。數據上報模塊基于完整的全院臨床醫療數據,高效率、高質量地完成“委屬醫院數據上報”“流感數據上報”“流發熱門診數據上報”等近十個數據上報任務,籌建肝脾專病數據庫等專科疾病庫,根據臨床科研工作需要,為后續建立其他專病數據庫提供數據支持,為進一步建設電子病歷、互聯互通和數字化“智慧醫院”奠定堅實基礎。
參考文獻:
[1] 董霞,楊澤華,陳曦.“十四五”時期綜合性公立醫院高質量發展探索與思考[J].中國醫院,2021,25(12):21-23.
[2] 米春香.大數據技術助力醫院精細化管理[J].中國醫療設備,2019,34(7):93-95.
[3] 丁濤,丁小春,周作林,等.醫院多介質多渠道支付流程改造措施研究[J].衛生經濟研究,2020,37(11):66-68.
[4] 賀佳彥.麻醉臨床信息系統的建設及在麻醉質量控制中的應用[J].醫療裝備,2015,28(17):120-122.
[5] 胡笑凱.臨床數據中心建設及數據挖掘、關聯應用[J].電腦知識與技術,2021,17(27):30-32,37.
[6] 周凱.智能化時代醫院信息化建設與管理問題研究[J].電腦知識與技術,2020,16(36):250-252.
[7] 蔡芳.基于統一編碼的企業主數據管理[J].電腦知識與技術,2017,13(31):3-4.
【通聯編輯:代影】