高月霞 許瓊瓊 肖 靜 沈 康 強福林 吳徐明△
南通市科技局社會發展項目資助(HS2013004);南通大學博士科研啟動基金(14B16)
1.南通大學公共衛生學院流行病衛生統計系(226004)
2.南通市腫瘤醫院科教科
△通信作者:吳徐明,E-mail:xumingwu@ntu.edu.cn
基于回歸樹模型的肝癌住院費用病例組合研究*
高月霞1許瓊瓊1肖 靜1沈 康2強福林2吳徐明2△
目的探索適合南通市肝癌患者的病例診斷組合相關組(DRGs)及費用標準,為相關部門決策提供依據。方法用多重線性回歸方法對2006-2013年以肝癌為主要診斷的6882例病案數據進行分析,篩選分類節點變量,運用決策樹模型進行病例分組,用絕對值法和相對權重法對住院費用的標準進行測算。結果治療方法、入院途徑、伴隨病、轉歸、并發癥、首次入院、性別等作為肝癌病例分類節點的關鍵變量,共形成17個DRGs 組合和相對應住院費用標準。結論病例分組結果合理,住院費用標準和病種權重可作為相關部門參考。
病例診斷組合相關組 回歸樹 肝癌 住院費用
肝癌是全球常見的惡性腫瘤之一。據國際癌癥研究中心統計[1],2012年全球肝癌新發病和死亡病例分別達78萬和75萬;同年中國肝癌新發病例和死亡病例分別為32萬和37萬,分別位居惡性腫瘤的第3位和第2位[2]。盡管臨床上倡導肝癌臨床路徑的規范化,但患者住院費用變異較大,手術和非手術患者次均住院費用分別為74800和29183元[3]。有必要引進基于疾病診斷相關分組(diagnosis-related groups,DRGs)的預付費制度。美國實施DRGs預付制后,住院費用和住院天數都在降低[4-5]。隨后,歐洲等國也相繼引進該制度[6]。國內學者自1980年以來,開始研究建立疾病診斷相關分組及費用標準制定和成本核算[7]。原發性肝癌的DRGs組合研究的未見相關報道,本研究對南通市腫瘤醫院2006-2013年肝癌患者的住院費用進行分析,建立DRGs分組,測算相關費用標準,為醫保付費制度改革提供參考。
1.數據來源
數據來源于2006-2013年南通市腫瘤醫院主要診斷為肝癌的9429例患者的病案首頁數據及費用明細數據庫。預處理標準:(1)將有缺項、漏項、不符合邏輯的病案剔除;(2)將出院主診斷不是肝癌的病案剔除;(3)將住院天數小于1或大于100天的病案剔除;(4)將住院費用小于1%或大于99%的病案剔除。經篩選納入有效病例為6882例,有效率為72.99%。年齡最小17歲,最大94歲,中位年齡55歲,平均年齡(54.83±10.18)歲。
2.分類節點變量的篩選
用Stata 12.0進行多重線性回歸分析。住院費用最小1715元,最大53840元,均值為(14764±9013)元。為消除物價上漲對住院費用的影響,以2006年為基準,以當年的居民消費價格指數(CPI)調整。住院總費用不服從正態分布(Z=12.947,P<0.001),經對數變換后進行回歸分析,以年齡(連續型變量)、性別、入院途徑、伴隨病、并發癥、轉歸等為自變量,篩選分類節點變量,檢驗水準α=0.05。變量分布及賦值見表1,婚姻狀況中未婚只有11人,沒有納入回歸分析。

表1 6882例肝癌患者基本特征及變量賦值
3.病例組合方法
用SPSS 20.0軟件進行統計分析,卡方自動交互檢測法(chi-squared automatic interaction detection,CHAID) 構建決策樹(decision tree)模型,交叉驗證方法對樹模型自動修剪[8],樣本群數為10。住院天數是影響肝癌住院費用的重要變量[9],本研究將其作為影響變量納入決策樹模型。以住院費用為因變量,以住院天數為影響變量,以回歸分析有意義的變量作為分類節點變量。研究參數設置為:決策樹最大深度為3,父節點的最小樣本數為200,子節點的最小樣本數為100,拆分節點的檢驗水準α=0.01。分組合理性評價:非參數Kruskal-Wallis檢驗和方差減少量[10](reduction in variance,RIV)來檢驗分組的組間變異,用變異系數(CV)來檢驗分組的組內變異。
1.分類節點變量篩選
多重線性回歸結果見表2,治療方法、伴隨病、并發癥、轉歸、首次入院作為分類節點變量。從標準化偏回歸系數看,治療方法對住院費用的影響最大,其次是入院途徑和是否首次入院,轉歸、伴隨病和并發癥對住院費用也有影響。

表2 肝癌患者住院費用多重線性回歸
2.分類結果
本研究6882例肝癌病例共形成17個DRGs組合,各分組的均數、樣本分布見圖1。為確定分組的合理性,對各病例組合進行非參數Kruskal-Wallis檢驗結果均是P<0.001,說明住院費用組間異質性較好;方差減少量RIV值為50.57%,RIV值越大組間的異質性越好。各病例組合變異系數CV值見表3,變異系數均小于1,最小值為0.17,最大值為0.74,說明組內同質性較好,分組較為合理。
3.病例組合住院費用標準制定
采用中位數法作為住院費用控制標準參考值[11],住院費用上限計算時采用各組第75百分位數(Q75)加1.5倍四分位間距[7]。住院費用超過費用上限定義為超標費用,超標總例數為364例,占總例數的5.39%。各病例分組的病種權重見表3,病種權重越高,資源消耗越高。
本研究基于決策樹中的回歸樹模型,選擇CHAID算法住院天數作為影響住院費用的重要變量,不能作為分組變量,可以作為影響變量,納入到決策樹模型,這是本研究在模型設定方面的重要改進。分類節點變量選擇一方面依賴多因素回歸分析的結果,同時也要結合專業判斷,選擇影響費用的重要變量。本研究中治療方案是影響住院費用最重要的變量,納入樹模型。是否急診入院和有無伴隨病可以作為病情嚴重的代理變量,從樹模型的結果也符合了病情越嚴重,資源消耗越多。此外,性別也作為影響住院費用的重要變量[9],也納入到樹模型中。

圖1 肝癌DRGs的分組結果

表3 肝癌DRGs分組結果及住院費用標準
病例組合的費用標準和病種權重的參考價值。醫保部門實際應用中,可根據醫保基金的支付能力,一方面可以中位數為基準,在此基礎上適當地增加支付比重。另一方面可以直接根據病種權重,對所有的疾病組進行排序計算所有病種的總得分,然后用當年醫保基金總量除以總病種分數,算出每一病種權重得分的費用。通過這種DRGs預付制,可以算出每病種的預先支付費用,既能夠給予醫院相對合理的醫療資源消耗補償,也能提高醫保基金的使用效率。
[1] Torre LA,Bray F,Siegel RL,et al.Global Cancer Statistics,2012.CA Cancer J Clin,2015,65(2):87-108.
[2] 陳萬青,鄭榮壽,張思維,等.2012年中國惡性腫瘤發病和死亡分析.中國腫瘤,2016,25(1):1-8.
[3] 陳治水,冷家驊,高廣穎,等.五類腫瘤疾病住院費用及其影響因素分析.中國衛生經濟,2014,33(7):57-60.
[4] Hellinger FJ.Prospective reimbursement through budge review:New Jersey,Rhode Island and Western Pennsylvania.Inquiry,1976,13(3):309-320.
[5] Hsiao WC,Sapolsky HM,Dunn DL,et al.Lessons of the New Jersey DRG payment system.Health Aff(Millwood),1986,5(2):32-45.
[6] Busse R,Geissler A,Quentin W,et al.Diagnosis-related groups in Europe:moving towards transparency,efficiency and quality in hospitals.BMJ,2013,346:f3197
[7] 高子厚,萬崇華,蔡樂,等.按DRGs組合方式制定消化系統疾病患者住院費用的研究.中國衛生統計,2006,23(4):323-325.
[8] Fetter RB,Mills RE,Riedel DC,et al.The application of diagnostic specific cost profiles to cost and reimbursement control in hospitals.J Med Syst,1977,1(2):137-149.
[9] 肖靜,高月霞,陸青云,等.6168例肝癌患者住院費用影響因素的通徑分析.中國衛生經濟,2012,31(1):73-75.
[10] 閻玉霞,徐勇勇.病例組合分類結果的評價.中國衛生統計,2007,24(4):163-165.
[11] 董軍,胡德奎,陳劍偉,等.病種費用控制標準實驗研究.中華醫院管理雜志,2001,17(9):529-531.
Case-MixStudyofPatientswithLiverCancerBasedonDecisionTree
Gao Yuexia,Xu Qiongqiong,Xiao Jing,et al
(SchoolofPublicHealth,NantongUniversity(226019),Nantong)
ObjectiveThe study explored the case-mix diagnosis-related-groups of patients with liver cancer in Nantong and developed related health expense standards,so as to provide evidence for related departments’ decisions.MethodsAccording to 6882 inpatients with the principal diagnosis liver cancer from 2006 to 2013 in Nantong tumor hospital,multiple regression model was employed to screening the classification node variables,and the regression tree model was applied to set up the case-mix diagnosis-related-groups.The absolute value method and relative weights were used to calculate the standard.ResultsThe main classification node variables were therapies,admission from emergency setting,prognosis,concomitant diseases,complication,first hospitalization,and gender.17 diagnosis-related-groups and related health expense standards were established.ConclusionCase-mix diagnosis-related-groups are reasonable,and the health expense standards and related case weight could make references for related departments.
Diagnosis-related-groups;Regression tree;Liver cancer;Hospitalization expense
(責任編輯:張 悅)