朱遠燕,林德南
深圳市醫學信息中心,廣東深圳 518001
深圳市區域衛生信息統計數據源質量控制研究
朱遠燕,林德南
深圳市醫學信息中心,廣東深圳 518001
面向衛生信息系統數據源的質量控制,是在建立衛生信息標準的基礎上,實現數據質量有效控制,提升上報數據質量水平,為各醫療機構之間的系統互聯互通、資源共享、業務協同夯實基礎,同時也能為深圳市衛生行政統計管理日報提供數據支撐。該文介紹了深圳市區域衛生信息化建設信息統計數據源質量控制模型,通過建立數據質量控制模型,對各醫療機構報送的數據進行質量監控、考核評分,結合行政督導手段,促進醫療機構不斷完善數據上報工作,提升數據質量。
區域衛生;信息化;數據質量控制
隨著國家政策的推動和信息科技的發展,很多衛生醫療機構已經建立了自身的信息化平臺和系統,極大提高了衛生服務的質量[1-2],但是衛生信息化的深入發展所產生的問題也日益突出。利用現代醫療衛生信息技術,建立區域衛生信息化平臺,整合醫療衛生資源,實現區域內醫療衛生服務機構互聯互通、信息共享和業務協同,提高業務數據處理效率和質量,更好地為公眾、醫療機構、衛生行政管理部門提供服務,是我國衛生事業發展的需要和必然趨勢[3]。
區域衛生信息系統除了要建立衛生數據標準體系外,更要針對各醫療單位報送的數據,基于衛生行政統計管理相關數據,形成科學先進的數據質量監控體系,技術和管理手段相結合,提升區域平臺的數據質量,增強人口健康信息平臺的應用價值[4]。
在整合衛生信息資源的同時,應充分重視標準體系建設和數據質量控制的重要性[5]。深圳市目前的衛生信息化工作在數據質量控制上存在以下特點:傳統的衛生統計工作與區域衛生平臺的數據采集存在工作脫節,體現在醫院的實際工作中,通常衛生統計與數據報送分別由病案統計室和信息科/網絡中心在負責。近幾年開展的區域衛生平臺數據采集業務,其采集上來的數據與統計部門的指標沒有明確的關聯關系,無法形成供衛生行政統計管理需求的各種統計數據;傳統的統計工作也需要平臺數據采集提供部份指標支撐,這種支撐體現在數據采集的及時性會加快衛生統計工作的數據發布頻率、實際管理中部份指標在傳統衛生統計中缺少體現(如社保等信息)。鑒于上述因素,深圳市迫切需要在制定出符合本市實際工作情況的衛生信息標準的基礎上,加強標準的宣傳和貫徹執行,在確保各機構之間的信息系統能實現互聯互通、資源共享、業務協同的同時,一方面滿足衛生統計工作的需要,另一方面以衛生統計應用為切入點,提升平臺數據采集質量水平。
目前,通過開展深圳市“139工程”中區域衛生數據交換與信息共享平臺項目建設,已經建立了含覆蓋全市1 700萬人的居民健康檔案系統、信息集成平臺、居民主索引(MPI)系統、數據標準集系統、數據交換和數據校驗系統等核心業務系統,并且實現了全市61家公立醫院與區域衛生數據交換共享平臺的對接。并且采用了各醫療機構“主動報送”的數據采集方式。以數據為主線的區域衛生信息平臺在解決了數據標準和共享規范的前提下,存在著數據標準落地困難,數據源標準應用符合性不理想,數據集成和交互實現困難,數據應用不深入、展示不全面,數據管理執行力不夠等一系列問題[6-7]。
如何切實提升數據報送的質量是當前面臨的緊迫而重要的任務。根據深圳市區域平臺的特點,采取了數據質量控制模型的質控策略,針對各醫療機構報送的數據,基于衛生行政統計管理相關數據,對其進行質量監控、考核評分,結合行政督導手段,促進醫療機構不斷完善數據上報工作,提升數據質量,形成衛生統計數據源的質量評價和控制模型。通過建立科學先進的數據質量監控體系,技術、管理手段相結合,提升區域平臺的數據質量,增強人口健康信息平臺的應用價值。
深圳市區域衛生信息化的建設經過幾年的發展取得了很大的成效,構建了健康檔案數據中心。但由于健康檔案數據中心的數據是從各個醫療機構、公衛機構的不同系統收集上來的,其數據質量存在較大的問題,難以滿足各類不同應用的要求。數據質量在一定程度上決定了區域醫療信息化建設的成敗。迫切需要提升數據中心的數據質量。
在遵循國家衛生計生委衛生信息化標準規范體系基礎上,以深圳市衛生標準規范標準為依據,結合深圳市衛生行政統計管理報表,從業務完整性、數據規范性、報送及時性等方面,通過嚴密合理的質控規則,制定統一的標準規范體系,基于衛生行政統計管理指標,建立面向衛生統計數據源的質控模型,促進科學先進的數據質量監控體系的建立,以技術、管理手段相結合,提高區域平臺的數據質量,為統計管理工作提供質量量化評價數據,為各醫療機構之間的系統互聯互通、資源共享、業務協同夯實基礎,同時也可以促進標準體系的不斷完善,建立上報數據質量提升和數據標準完善的閉環管理體系。深圳市衛生信息統計數據源質量控制總體思路如圖1所示。
根據區域衛生信息數據代碼標準規范,制定數據質量控制規則及評分模型,規則包括4大類,18小類,共1 170項質控內容,同時也建立數據質量控制系統,從技術手段上監測各醫院的數據質量問題,并把問題及時反饋給各醫院用戶,督促醫院進行整改,整個數據質量控制系統如圖2所示。

圖1 深圳市區域衛生信息統計數據源質量控制總體思路

圖2 數據質量控制系統
其中數據質量控制流程如圖3所示。
通過每日評分、每月評分、年度評分,以年度得分作為該年度醫院信息化考核評分的主要依據以及通過領導約談督導等行政手段,進一步促進醫院做好數據報送工作。
深圳市衛生統計工作,主要依據國家衛生計生委發布的《國家衛生和計劃生育統計調查制度》,并結合了《廣東省醫療機構統計報表制度》和《深圳市衛生統計業務工作規范》。針對各醫院數據報送,基于衛生行政統計管理所需相關業務數據,形成衛生統計數據源的質量評價和控制模型,為統計管理工作提供數據質量量化評價依據。
質控模型主要圍繞以下幾點進行設計:①量化評價:建立可擴充的量化策略庫,設置不同的考核權重,形成可量化的指標。②考核時間點:結合衛生日報,定義每日和每月兩個時間點進行考核。每日的考核圍繞衛生日報進行,每月的考核圍繞固有的月度衛生統計考核進行。③考核指標:考核指標從業務完整性、數據規范性、報送及時性等方面來進行綜合編制。業務完整性是指報送的數據是否有全面覆蓋數據集標準所定義的范圍;數據規范性是指報送數據在數據類型、數據值域等方面是否符合數據集所要求的格式,以及數據代碼標準所要求的值域代碼,另外,在數據關聯上是否符合數據集標準定義的數據間關聯(類似關系型數據庫的外鍵);報送及時性指數據報送時間是否影響到衛生日報的生成。

圖3 數據質量控制流程

圖4 深圳市區域衛生信息統計數據源質量控制模型
深圳市區域衛生信息統計數據源質量控制模型如圖4所示。其中衛生統計數據源質控主要是從業務完整性、數據規范性、報送及時性等方面進行數據質量量化評價,針對各衛生機構的數據推送實際情況,采取三級分布式質控,實現海量數據質控行為的快速化。
①第一級質控即在前置機端對數據進行數據項質控,主要圍繞數據字典進行,包括數據類型、數據長度、數據值是否符合數據代碼標準、數據是否允許空值等來進行。該部份質控結果最終匯聚到平臺端進行數據質量綜合量化評價。
②第二級質控即在平臺端對數據進行常規性的數據關系驗證,主要圍繞數據在業務上的外鍵關系是否符合標準。此處使用邏輯上的外鍵關系而非RDBMS(關系型數據庫)的物理外鍵,主要是便于機構報送數據的考量,同時對整體系統架構也不會產生過大的性能影響。
③第三級質控即在平臺端基于衛生統計業務進行應用級別的數據關系驗證,主要圍繞衛生行政統計管理所涉及的指標定義,即報表內部的平衡和報表間的平衡。對于報表內部平衡,使用報表預先定義的公式來進行平衡試算,同時參考哈迪溫伯格平衡、正態分布、t檢驗等分析方法;對于報表間的平衡,圍繞納入質控范圍內的衛生行政統計管理,將統計指標項代碼化,定義各報表的指標構成,從而自動檢查報表間相同指標數據一致性。
衛生統計數據源的質控整體上參考管理工作的戴明環(PDCA)模型:(1)標準先行:將統計相關的內容預先納入標準規范中,同時將數據報送標準、質控規則明文定義并透明化管理;(2)質控工作制度化:以衛生行政統計管理為應用切入點,以衛生統計數據源質控為質量抓手,結合相關信息系統,對數據報送工作自動進行每日評價,同時結合衛生統計工作以月為單位對數據質量進行考核。(3)監督、反饋:數據報送不規范必然會引起質控得分較低,出現衛生日報數據不準確的現象。因此,質控管理需要結合衛生行政統計管理,對質控結果進行統計分析,將分析結果同時主動反饋給衛生行政統計管理者、數據報送者、質控管理者,輔助數據報送者數據質量的自查以及管理者對數據質量的監督。(4)改進、螺旋式上升:通過對數據質控結果的分析:①協助醫院分析需要改進的環節,逐步提高數據報送質量;②促進標準規范的不斷完善。
基于以上深圳市衛生信息系統數據質量控制總體思路和數據質量控制模型,實現了數據質量控制系統,如圖5所示。
該文描述了深圳區域衛生信息統計數據源質量控制模型的相關研究和建立工作。通過構建面向衛生統計數據源的質控模型,實現數據質量有效控制,提升上報數據質量水平,為各醫療機構之間的系統互聯互通、資源共享、業務協同夯實基礎,同時為深圳市衛生行政統計管理日報提供數據支撐。通過標準約束和構建面向衛生統計數據源的質控模型,實現深圳市衛生信息平臺接入醫療機構上報數據的標準化,并對區域衛生信息化建設提供數據質量評價依據。項目的建設最終將促進各機構之間的信息系統實現互聯互通、資源共享、業務協同,為深圳市區域衛生信息化整體發展打下良好基礎。

圖5 數據質量控制系統
[1]“十二五”國家自主創新能力建設規劃要求加強衛生信息化建設[J].中國衛生信息管理雜志,2013(4):278.
[2]王才有.“十二五”衛生信息化發展規劃研讀[J].中國衛生信息管理雜志,2012,9(2):13-16.
[3]孟群.我國衛生信息標準體系建設[J].中國衛生標準管理,2012,12(4):24-31.
[4]張誠,道理,夏寒,等.我國二、三級醫療機構衛生信息標準應用現狀調查和分析[J].中國衛生信息管理雜志,2013(5):430-434.
[5]陳運奇,趙軍平,薛萬國.對區域醫療衛生信息化建設的思考[J].醫學信息學雜志,2012,33(9):7-11.
[6]黃孝倫,余中心,肖兵,等.以數據為主線探討區域衛生信息平臺建設[J].醫學信息學雜志,2014,35(7):7-11.
[7]李朋,蹇奕蘋,余中心,等.基層醫療機構電子病歷數據標準符合性測評研究[J].中國衛生信息管理雜志,2016(1):61-64.
Study on the Quality Control of Regional Health Information Statistics Data Source in Shenzhen
ZHU Yuan-yan,LIN De-nan
Shenzhen Medical Information Center,Shenzhen,Guangdong Province,518001 China
Quality control for data sources of health information system is based on the establishment of health information standards,which can achieve effective control of data quality,improve the quality of reported data,benefit for the interconnection and interoperability,resource sharing,and business collaboration between each medical organizations,provide data support for the Shenzhen Municipal Health Administration Statistical Management Daily.This paper introduces the quality control model of information technology data source of regional health information construction in Shenzhen.Through the establishment of data quality control model,the monitoring,evaluation and administrative supervision of the quality of submitted data from each medical institution,the data quality can be increasingly improved.
Regional health;Informatization;Data quality control
R19
A
1672-5654(2017)07(c)-0062-04
10.16659/j.cnki.1672-5654.2017.21.062
2017-04-20)
廣東省醫學科學技術研究基金(20151261447563)。
朱遠燕(1967-),女,上海人,本科,高級工程師,研究方向:衛生信息化和數據分析應用。