袁 莎,沈麗寧
(華中科技大學同濟醫學院醫藥衛生管理學院,湖北 武漢 430030)
近年來,隨著數據的興起與發展,醫療數據已經成為了我國數據產業重要戰略目標,《關于促進和規范健康醫療數據應用發展的指導意見》《“健康中國2030”規劃綱要》等文件先后頒布,健康醫療數據越來越受到國家與社會的關注。同時,醫療數據的發展也給我國傳統醫療模式帶來了新的機遇。通過大量文獻發現,我國醫療衛生領域在數據質量評價模型以及醫療數據質量評價體系框架構建等方面的研究較少。基于此,本研究總結了國內外數據的評價框架、維度和指標,根據我國醫療行業現存的數據質量問題以及醫院對電子病歷數據的利用情況來構建醫療數據質量評價指標體系,根據問題提出關于數據質量管理的建議和方法,以期提升醫療數據的價值和效用性、增強醫院信息化管理,為管理決策提供參考[1]。
本研究的評價對象為各級醫療衛生機構產生的電子病歷數據。從數據的原始質量出發,根據醫療機構的電子病歷數據的利用情況來構建評價指標體系。
依據“原始質量-過程質量-結果質量”模型,并結合醫療數據的特征對每個維度的含義做出解釋[2,3],詳見表1。
評價指標的構建和選擇應該全面、合理、科學。因此,本研究在整個構建的過程中應當遵循以下原則[4]:

表1 模型各維度的含義
2.1.1 科學性原則
指標的篩選基于大量文獻閱讀和總結,以科學理論為基礎,不妄加定義和胡亂編造,結合我國醫療數據質量現狀運用科學的方法來構建評價指標體系。
2.1.2 系統性原則
指標體系的構建需要樹立整體和全局意識,不論是指標體系的框架搭建還是每個階段指標的選擇都要符合邏輯、合理、規范、完整。
2.1.3 可擴充性原則
基于國家發布的政策文件和我國數據的情況,隨著相關文件的頒布和數據質量的不斷變化,為了適應國情,指標體系就要不斷地擴充完善,做到與國家標準、規范相符合。
2.2.1 指標來源
通過大量的文獻分析[5-7],國外在數據質量管理方面的發展早于我國,體系更加完善。高質量的數據是醫療衛生信息化事業發展的基礎,近年來我國對數據質量的管理越加重視。因此,本研究以指標構建原則為基礎,結合文獻分析,以國外優秀數據質量評價體系為指導,完成對一級、二級、三級指標的篩選。在對指標初選的過程中,除了借鑒國內外相關數據質量評價指標體系,也響應國內政府頒布的政策文件,如《信息技術 數據質量評價指標(GB/T 36344-2018)》《電子病歷系統功能應用水平分級評價方法及標準》《電子病歷基本數據集標準》以及《衛生信息共享文檔規范:總則》等,從而做到全面、科學、合理地篩選各項指標。
2.2.2 評價指標
根據醫療數據的特征屬性,在運用數據時,各個醫療機構存在服務質量差、人工數據統計不準確、醫療決策不準等醫院信息化水平低的問題。雖然醫療數據目前在各級醫療機構中應用較多,但是由于指標體系的種類繁多,在構建的過程中更加要保證指標的科學性、合理性、實用性。
2.2.3 專家篩選指標
為了進一步完善評價框架,使指標具有權威性,采用專家咨詢的方法對各級指標進行篩選。本研究于2020年1-3月進行兩輪專家咨詢,對評級指標進行篩選、修訂、增減以確定指標,構建醫療數據質量評價指標體系。
2.2.3.1 專家基本情況
本研究主要邀請了10名專家,包括A市某三級醫院信息中心管理人員、衛生信息方向IT技術專家等。所選專家均在其組織部門中有豐富的工作經驗,參與了該院電子病歷評級工作,對于電子病歷數據質量和醫院信息化研究較為熟悉。本次專家咨詢通過問卷打分形式,均要求填寫基本信息調查表和專家權威程度自評表。
2.2.3.2 專家咨詢的可靠性
本研究所構建的評價指標體系很大程度上會受到專家評價的影響,專家給出的指導意見影響該指標體系的準確性、科學性和合理性。
(1)專家的積極程度
問卷回收率的高低代表專家積極程度的高低。本研究第一輪共發放10份問卷,收回問卷10份,有效問卷10份,問卷回收率100%。第二輪共發放10份問卷,問卷回收9份,有效問卷9份,問卷回收率90%。綜上,本研究選取的專家都十分關心本研究,參與的積極程度高。
(2)專家權威程度
專家的權威程度受專家自身學術能力、對問卷中每個指標的熟悉程度以及對指標進行判斷的依據3個因素影響。將專家判斷系數和專家對每個指標的熟悉程度的算術平均值作為專家的權威程度,即Cr=(Ca+Cs)/2。本研究兩輪專家函詢的權威系數Cr均大于0.7,因此本研究專家咨詢的結果可靠,見表2。

表2 專家權威系數
(3)專家意見的協調程度
用Kendall’sW及卡方檢驗評價所有專家對各級指標意見的總體系協調程度[8,9],對全部指標結果進行Kendall協調系數W檢驗,其P值<0.05,具有統計學意義;協調系數W為0~1。本研究兩輪專家咨詢的Kendall’sW系數具有統計學意義(P<0.05),W值分別是0.634和0.482,說明專家意見具有一致性,見表3。

表3 Kendall協調系數W檢驗結果
2.2.4 指標篩選結果
在專家咨詢過程中,用賦值分數的方法來體現指標的重要性,1分表示“不重要”,9分表示“很重要”。本研究中采用指標單個重要性均值低于5、變異系數超過0.4予以刪除的標準;專家特別強調的個別指標,進行討論后再決定去留。
根據兩輪專家咨詢問卷結果發現,C23醫療機構計算機程序機器算法清洗粒度是否合理、C24程序能否過濾不完整數據、C25程序能否過濾錯誤數據、C26程序能否過濾重復數據這4個指標不符合標準。經過討論,對其進行了更改,10位專家基本認同本研究中醫療大數據質量評價體系的構建。最終構建的指標體系包含原始質量、過程質量、結果質量3個維度、17個二級指標以及53個三級指標,見表4。

表4 醫療大數據質量評價指標體系

續表4
本研究以各級醫療衛生機構的電子病歷數據為研究對象,結合醫院對電子病歷數據需求的應用分析,并對相關科室及醫療機構負責人進行深度訪問,從評價的3個維度來進行指標層次分解,形成醫療質量評價指標體系,最終得到17個二級指標,53個三級指標。
在我國,醫療大數據已經成為國家重要的戰略資源,醫療大數據的質量直接關系著整個醫療大數據行業的發展。研究過程中發現,我國在醫療行業相關的數據質量管理和評價方面的研究較少,并且醫療數據質量普遍存在著缺乏規范性、不完整、不一致的現象[10],難以重復適用于醫療大數據。因此,建立科學合理的醫療大數據質量評價指標體系對于醫療大數據具有重要的意義。
相比較于其他大數據質量評價體系,本研究多維度的評價指標體系,具有全面性。此外,領域專家的高度參與保證了指標構建過程的合理、科學、可靠性。最后,評價數據質量是基于醫療數據的整個數據生命周期,并非是某一個階段或者某一數據環節,從而保證了全面性和系統性。因此,本研究所構建的醫療數據質量評價指標體系可以很好地完善我國現有的質量評價體系,為加快我國信息化水平發展針對未來質量評價體系的進一步發展提出以下幾點建議:
(1)加快我國醫療數據質量管理與治理研究
相比國外,我國醫院信息化起步較晚,對于醫療數據的數據質量評估也相對比較滯后,應當加快我國醫療數據質量管理與治理研究,為日后醫療數據的規范化以及效用最大化奠定基礎。
(2)加速制定統一的數據標準
我國各級別醫院電子病歷數據存在著數據采集方式和存儲格式不統一、不規范的問題,以及數據不完整、數據丟失、隱私泄露等隱患。因此,重視并加速制定統一的數據標準對醫療數據質量來說迫在眉睫,也是提升醫院機構的信息化管理能力,提高醫院服務質量與效率的重點。
(3)鼓勵開發新的算法技術,增強數據預處理、分析能力
隨著機器學習和算法技術在數據挖掘、分析、應用方面快速的發展,醫療大數據對數據的預處理、互聯互通、利用等方面要求也越來越高,每個醫療機構信息化發展缺乏獨立研發創新技術的能力暴露明顯,未來應當提倡醫院信息工作人員學習新技術,保證數據質量,從而提高醫療信息化的水平。