北京大學公共衛生學院衛生政策與管理系(100191)
張靚囡 李璟媛 馮 文△
【提 要】 目的 支付標準的測算是DRG實施中的關鍵環節,本研究旨在分析比較四種常用的數據裁剪方法,為實際付費做好準備,也為后續的研究與實踐提供啟示及方法改進的依據。方法 利用中段區間法和縮尾法對某市二級醫院2017-2019年出院病例的住院費用離群值進行裁剪,用變異系數、總體方差減少系數、Kruskal-Wallis H統計量及ROC曲線評價不同方法裁剪后對DRG分組效能的影響。結果 四種方法裁剪離群值后對DRG分組效能指標均有改善,但改善程度各有不同,最適宜的裁剪方法為方法2(裁剪上限Q3+1.5IQR,裁剪下限Q1-0.5IQR)。綜合評價離群值裁剪前后CV、RIV以及ROC曲線的變化,可以得到實現更佳分組效能的數據裁剪方法。結論 恰當裁剪離群值可規避醫保基金的不必要浪費、維持醫院經濟平穩運行、減少患者疾病負擔,地方醫保局可根據實際住院數據恰當選取裁剪方法。
疾病診斷相關分組(diagnosis related groups,DRG)是綜合考慮患者的疾病診斷、手術操作、治療方式、個體特征等因素,將病例進行分類的一種患者分組方案[1]。該方法關注的是“臨床過程”和“資源消耗”兩個維度,分組結果要保障同一個DRG內的病例臨床過程相似,資源消耗相近[2],進而以DRG組為單位制定費用標準進行付費。
在根據歷史出院病例進行DRG分組及病組均數計算、權重測算時,若組內包含遠高于大多數患者住院費用水平的病例,將會導致該組的住院費用平均值被高估[3],使該組的付費權重測算值增大,不僅會占用其余病組的預付金額,還會帶來醫保基金的浪費。反之,該病組的平均費用將被低估,付費權重測算值偏低,會使該類病組收不抵支,可能會導致醫院推諉該類患者,不僅會對醫院管理決策產生重大影響,也將給患者帶來沉重經濟負擔[4]。
2019年10月《國家醫療保障疾病診斷相關分組(CHS-DRG)分組與付費技術規范》中提出“精確付費是DRG實施的重要保障”。同年,國家醫保局、財政部、國家衛生健康委、國家中醫藥局聯合印發的《關于印發按疾病診斷相關分組付費國家試點城市名單的通知》中指出“對于付費異常高值或異常低值的病組,可按項目付費”,但離群值裁剪的指標及范圍如何界定目前尚無統一規定。
中段區間法(也稱四分位間距法)(interquartile range,IQR)和縮尾法(winsorize)是目前最為常見的患者住院費用離群值裁剪的兩種方法。在不同的研究中,研究者又設置了不同的參數。如歐洲學者分別在2003[3]和2008年[5]的研究中采用了中段區間法,但后者對極低界值的設定參數與前者不同。在縮尾法中,取上下2.5%[6]和上下1%[7-8]是常見的臨界值設定方法。在國內各地試行DRG之后,學者在不同的研究中選擇了不同的數據裁剪方法,如張宏等人的研究[9]選用住院費用的第75百分位數加1.5倍四分位數間距的方法裁剪高離群值,袁麗萍等人的研究[10]剔除了住院費用小于1%或大于99%的病例等。國際上,Francesc Cots[3]等人的研究中比較了不同離群值裁剪方法的效果和影響,而國內還鮮見相關比較研究。
本研究旨在通過對某市二級醫院2017-2019年出院病例的住院費用進行裁剪,分析比較四種常用的數據裁剪方法的影響,從而選取較為合適的方法,達到降低DRG病組內數據變異程度、提升分組效能、提高DRG病組權重測算可靠性的目的,為后續實際付費做好準備,同時也為后續相關領域的研究提供啟示及方法改進的依據。
本研究采用2020年6月18日國家醫保局印發的《醫療保障疾病診斷相關分組(CHS-DRG)細分組方案(1.0版)》(共618組)對我國西南地區某市21家二級醫院2017-2019年52.8萬條出院病例進行疾病分組,以DRG病組例數≥30例為穩定病組,保留526739條出院病例,共計369組。
(1)數據裁剪方法
本研究采用四種常用的離群值裁剪方法,具體公式如下:
方法1:裁剪上限=Q3+1.5×IQR,裁剪下限=Q1-1.5×IQR,式中,IQR是住院費用分布的下四分位數(Q1)和上四分位數(Q3)之間的差值[3,11]。
方法2:裁剪上限=Q3+1.5×IQR,裁剪下限=Q1-0.5×IQR[5,12]。
方法3:針對CV>1的病組,按照方法1公式裁剪(為避免過度裁剪,該方法只裁剪存在較大變異問題的病組)。
方法4:裁剪上限=住院費用的第97.5個百分位數,裁剪下限=住院費用的第2.5個百分位數[13-14]。
(2)分組效能評價指標
①組內異質性評價:變異系數(coefficient of variation,CV)是檢驗統計數據聚類擬合度的重要指標[15],國際上通常把變異系數作為從ADRG到DRG尋找分類節點的標志[16]。本研究用DRG組內住院費用的變異系數,反映各DRG組內不同病例住院費用的差異度(離散度),原則上要求組內變異系數小于1。CV值越小,說明組內的變異越小,分組效果越好[10]。
②組間異質性評價
總體方差減少系數(reduction in variance,RIV):為DRG組間差異度,CHS-DRG用RIV來衡量DRG系統的分組效能,RIV越大說明DRG組間異質程度越強,分組系統的區分度越高,分組效果越好。通常要求RIV值達到70%以上[17]。

完全隨機設計秩和(Kruskal-Wallis H)檢驗:可檢驗不符合正態分布的多個獨立樣本間是否來自不同的總體分布,當P<α(α為檢驗水準)差異有統計學意義時,認為多個總體間相比較有差異[18-19]。本研究中,各病組的次均住院費用不滿足正態分布,故使用KW統計量檢驗各病組經不同裁剪方法得到的各組次均費用是否有統計學差異。
③分組效果合理性的綜合評價:受試者工作曲線(receiver operator characteristic curve,ROC)的檢驗變量是分別用方法1、方法2、方法4判斷病例是否為極值,狀態變量是經裁剪強度最小的方法3判斷病例是否為極值。
(3)統計學方法
采用Excel 2019及SPSS 26.0進行數據庫的整理與分析。采用前述指標對DRG分組效能進行評價,Kruskal-Wallis H檢驗水準α=0.05。計數資料以率、百分比表示。
結果顯示,各病組變異系數范圍為0.25~2.87,有3個病組CV>2,有114個(31%)病組CV>1,說明在病組費用測算過程中,首先需要處理極值以減少對病組資源消耗水平的估計偏差。各病組患者的次均住院費用呈偏態分布,除2個病組偏度<0外,各病組的偏度系數均>0,說明病組普遍呈現正偏態分布。有17個病組的偏態系數>10,右側長尾明顯,極大值是影響病組費用分布的主要因素。各病組的峰度范圍為-0.95~506.12,普遍呈現尖峰態,見圖1。
四種裁剪方法對于數據庫的裁剪比例各有不同。對數據庫裁剪強度最大的是方法2,其裁剪比例最高(8.35%),裁剪去除的極大值與極小值比例也最高,分別占5.36%和2.99%;其次為方法1(5.47%),其裁剪去除的極大值比例同方法2,而裁剪低限較方法2寬松,故裁剪去除的極小值比例低于方法2,為0.11%;方法4上下限各裁剪2.50%,裁剪比例低于方法1和2;裁剪比例最低的為方法3(1.30%),見表1。

圖1 裁剪前患者住院費用變異系數、峰度與偏度
結果顯示,入組病組和穩定病組有超過25%的病組內病例住院費用差異較大,方法1、2和3裁剪后數據庫中有1.63%的病組內病例住院費用差異較大,方法4裁剪后數據庫中僅0.54%的病組內(共計8例)病例住院費用差異較大,見表2。

表1 某市二級醫院2017-2019年歷史數據按 CHS-DRG細分組入組數據次均費用裁剪基本情況

表2 某市二級醫院2017-2019年歷史數據裁剪前后病組內次均費用變異情況
經過不同數據裁剪方式,RIV值從穩定病組的0.30最高提升至方法2裁剪后的0.57,即組間變異能夠解釋57%的總變異。相比之下,方法1對初始值的RIV貢獻值低于方法2,為0.25;方法3對初始值的貢獻僅為0.08;方法4最差,為-0.01。
多個獨立樣本的Kruskal-Wallis H檢驗結果顯示,穩定病組庫和經四種裁剪方式裁剪后病例庫各DRG組間卡方值所對應的P值均為<0.001,說明各組間病例次均費用的差異有統計學意義,即分組效果較好,見表3。

表3 某市二級醫院2017-2019年歷史數據裁剪前后的DRG組間差異情況
用ROC曲線評價病例組合分類合理性。結果顯示,三種方法的曲線下面積均大于無效面積0.5(P<0.05)。其中方法1的曲線下面積最大,為0.979,高于方法2的0.964,方法4的曲線下面積略低,為0.695,詳見表4、圖2。

表4 三種數據裁剪方法的ROC曲線檢驗

圖2 三種數據裁剪方法的ROC曲線
研究顯示,不同的離群值裁剪方法對分組效能的改善程度不同。在有同樣的CV值改善和KW檢驗通過的情況下,方法1和方法2在其他分組效能指標上各有所長,方法1在盡可能保留原始數據方面優于方法2,方法2對RIV值的改善程度略優于方法1。由于方法2對離群值的裁剪沒有超過10%,因此,對于本次分組數據,本研究認為用方法2對DRG分組效能改善的程度最佳,方法1為次優選擇,見表5。

表5 四種數據裁剪方法結果
數據裁剪對不同病組的影響不同。本研究中方法1和方法2裁剪的高費用病例數最多(28219例),分析裁剪去除的高費用病例數占前10位的DRG組及其占比。結果顯示,對“尿路結石、阻塞及尿道狹窄,不伴并發癥或合并癥”的影響最大,裁剪掉的高費用病例數超過10%,其次是“腦缺血性疾患”、“呼吸系統感染/炎癥”,裁剪掉的高費用病例數占比分別為6.13%和5.81%,見表6。

表6 數據裁剪去除高費用病例數占前10位的DRG組及其占比
DRG將幾十萬,甚至幾百萬份病例納入600余個病組,故需要評價病例分組的合理性,即分組效能。本研究顯示,除個別病組外,絕大部分DRG病組的費用數據呈現正偏態分布,數據分布陡峭,因此需去掉離群值再判斷分組效能。本研究中費用數據的特征與既往研究一致[20],采用四種方法裁剪離群值,并通過CV值、RIV值、KW統計量、ROC曲線反映裁剪前后DRG分組效能。結果顯示,四種方法裁剪離群值后對DRG分組效能指標均有改善,但改善程度各有不同。
就裁剪強度而言,方法2整體裁剪強度最大,其對極大值的裁剪強度與方法1相同,對極小值的裁剪強度超過方法1;其次是方法4;方法3裁剪強度最低,此法只針對CV>1的病組裁剪,裁剪比例最小,無論是極大值還是極小值裁剪例數均最少,裁剪后對RIV的改善不足,存在極值處理不足的情況。
數據裁剪降低了病組的組內變異,CV值明顯減小,從最初139個CV值大于1的病組(共計97359例)最低減少到方法4裁剪后的2個病組(共計8例),起到了DRG病組歸集的作用。組間變異結果顯示,經KW檢驗后,四種方法裁剪后各組間病例次均費用差異均有統計學意義,但經方法2裁剪后RIV值改善最為明顯,較初始值0.30已經有了較為明顯的提升,方法1、3、4的RIV值依次降低,且方法4對組間變異較初始并無改善作用。
綜合ROC評價結果顯示,以方法3作參考變量,方法1的曲線下面積最大,方法2略低,方法4最低,且均大于無效面積。說明由不同方法裁剪后的數據庫,各DRG組間的住院費用均有統計學差異,進一步說明裁剪后分組結果具有合理性,以方法1的裁剪效果最好。
去除離群值病例數前10位DRG組的分析發現,有9個組超高限病例數占比超過5%,其中包括1組占比超10%的LX15病組,提示醫院可能存在住院適應癥和診療行為不規范問題,提示地方醫保局加強關注。
本研究通過對不同數據裁剪方法的比較,顯示在特定的數據分布特征下,不同的離群值裁剪方法實現了不同程度的分組效能改善。對離群值進行恰當的裁剪幫助醫保合理確定疾病治療成本,進行精準定價;促使醫院規范診療行為,加強成本管理,在控制費用的同時保障患者診療質量與安全,提高患者就醫滿意度,實現醫、患、保的三方共贏。
離群值處理的效果首先取決于原始數據分布特征,本研究探索不同的數據處理方法后,確定了對于本次數據最適宜的數據裁剪方法,并不意味著該方法適用于所有地區、所有分組方案的DRG數據。不同地區和不同類型的醫院,應該進一步探索對于不同分布特征的數據的處理方法,以把握DRG數據裁剪方法的普遍適用性。