文 | 廣州醫科大學信息中心 黃勁榮
患者主索引(Enterprise Master Patient Index,EMPI)是指在特定區域范圍內,用以標識每個患者實體并保持其唯一性的編碼。使用EMPI可將來自多個系統的患者標識進行關聯,實現同一患者多業務的關聯和患者信息的統一或關聯,能有效解決多系統中識別患者身份的問題,是醫療大數據可以共享的基礎。2020年7月,有關部門發布《關于印發醫院信息互聯互通標準化成熟度測評方案(2020年版)的通知》確定醫院信息互聯互通測評7個等級,2021年12月,《“十四五”國家信息化規劃》中明確加快推動各級醫療衛生機構信息系統數據共享及業務協同,建設互通互聯的各級全民健康信息平臺。患者身份識別是互聯互通產生價值必須要解決的問題,尤其是同一個患者在不同醫療機構、不同醫療信息系統里的標識如何關聯的問題,更是進行現代醫療大數據治理的基礎性工作。只有通過正確的身份識別,才有可能保證患者在不同場所、不同時間就醫信息的連續性和完整性,從而形成全面的患者信息數據。
通過構建患者主索引(EMPI)來識別、匹配、合并、取消重復的數據,凈化病人記錄,利用主索引可獲得完整而單一的病人視圖。EMPI為每個患者創建一個唯一標識符,作為各業務系統進行信息傳遞時的標志;與相關系統的醫療記錄的標識之間建立映射,以確保同一患者分散在不同系統中的醫療信息可以完整和準確地關聯、整合在一起。EMPI構建成功的關鍵是“匹配引擎”。匹配引擎可以是確定的或基于概率的,匹配引擎必須是可以配置和調整的,匹配引擎的準確性和性能是決定EMPI解決方案價值的關鍵因素。匹配引擎配置的屬性應遵循國家衛計委2009年《電子病歷基本架構與數據標準》的規定,包括該標準的H.02服務對象標識、H.03人口學、H.04聯系人、H.05地址、H.06通信等數據組成,具體包括姓名、性別、出生日期、證件類型、證件號碼、聯系電話、聯系人、通信地址等。本文構建的EMPI匹配引擎是將基于確定性匹配和基于概率性匹配相結合的方案,具體流程如圖1所示。

圖1 EMPI匹配引擎主要流程
交叉索引表是記錄匹配前初始化EMPI和最終生成EMPI的關系映射表,含有匹配的過程數據,可用于實際匹配過程和后續的匹配結果質控。
組合匹配是以患者任意的基本信息項進行組合后匹配,屬于確定性匹配,如證件類型和證件號碼形成一個組合進行匹配,不同組合可以按照設定優先級,優先級高的完全匹配后,后續組合不再匹配,自動終止。組合匹配通常由身份辨識度高的患者基本信息項構成,匹配的準確率接近100%,如姓名、出生日期和聯系方式組合,社保卡號組合等。
通過給患者不同的基本信息項進行權重設置和加權結果閾值設定,在實際匹配過程中,每一項基本信息可以選擇模糊匹配或者完全匹配獲得對應的權重得分,并根據權重得分的加權結果與預設定閾值的關系,決定匹配的結果,通常有三種結果,即匹配上進行合并處理,匹配不上進行拆分處理,匹配疑似同一患者進行人工判斷處理,權重匹配屬于基于概率的匹配,閾值設定需要綜合考慮匹配的效率和匹配的質量。
根據以上EMPI構建方法,進行系統架構設計如圖2所示。

圖2 EMPI系統架構圖
系統主要包括以下模塊:
EMPI集成服務:業務系統通過接口調用,進行EMPI生成。
EMPI數據存儲:將EMPI映射的各類數據進行集中存儲和記錄。
EMPI數據質控:以EMPI為監測主線,將EMPI疑似患者數據進行人工處理,與此同時,對按照匹配規則進行自動合并或者拆分的患者EMPI進行隨機抽樣核查,以動態調整匹配模式和匹配規則。
EMPI數據應用:根據EMPI數據存儲中的交叉映射表對醫療大數據平臺中的所有患者數據進行身份識別和處理,形成獨立的患者全病程的視圖,為臨床應用和科學研究提供完整的數據支撐。
系統主要功能包括EMPI查詢、疑似待處理、歷史記錄查詢、組合配置管理和權重配置管理。
EMPI查詢功能:根據檢索條件查詢生成EMPI的患者明細數據,并支持不同患者數據的對比分析,一旦發現EMPI生成錯誤,還可以執行合并或者拆分操作。
疑似待處理功能:將權重匹配過程中滿足疑似同一身份患者閾值范圍要求的患者通過人工判斷后執行合并或者拆分操作。
歷史記錄查詢:用于查詢所有生成EMPI的過程記錄,便于追溯和審計核查。
組合配置管理:用于配置患者不同屬性組合并進行優先級排序。
權重配置管理:用于配置患者不同屬性的權重并進行閾值設定。
構建EMPI是醫療信息系統互聯互通產生價值的前提條件,通過EMPI實現患者不同時空下數據的關聯,才能釋放數據的價值。EMPI主要應用場景如下:
在構建院級數據集成平臺過程中,通過EMPI的構建,實現院內不同業務系統的患者數據的關聯,完成對患者在不同時間和不同系統產生的診療數據的整合,為患者診療和醫生的臨床科研提供高價值和便捷的數據支持。
在構建區域患者健康信息檔案的過程,通過EMPI的構建,實現患者在不同醫療機構的診療數據的關聯,完成患者健康信息檔案的建設,一方面便于患者對于個人健康的管理,另一方面,也有利于醫療結構對患者的病情診治。
在構建國家級、省級、市級、區域級專科數據中心過程中,通過構建不同專科患者的EMPI,將指定區域的患者的所有診療數據進行整合,能有效擴展患者的數據樣本維度,能極大提升科研效率的同時,增強科研數據分析的廣度及深度。
本文以國內某高校的智慧醫療平臺建設為例,該平臺旨在實現大學的6家附屬醫院數據的互聯互通,形成校級3大數據中心——臨床數據中心、科研數據中心和運營數據中心。將本文的EMPI構建方法和系統設計應用于智慧醫療平臺建設中,截至2023年6月底,累計識別出患者實體數約1064萬人,完成合并患者實體數約658萬人,去重率61.84%,通過抽查EMPI的合并結果,合并準確率達到98.63%.
本文從實際問題出發,提出了一種患者主索引(EMPI)的構建方法,并通過系統架構設計和功能設計在國內某高校的智慧醫療平臺上進行驗證,取得了良好的驗證效果,并對EMPI的應用前景進行分析總結。相信在數據已經成為生產要素的時代大背景下,醫療數據互聯互通是大勢所趨,EMPI的構建對于數據價值的持續釋放是不可或缺的,一定會得到更加廣泛的應用。