付曉萌 劉媛媛 劉曉倩 龔 卉 崔 壯 李長平 馬 駿
天津醫科大學公共衛生學院衛生統計學系(300070)
天津市參保急性心肌梗死患者住院費用分析及病例組合初探*
付曉萌 劉媛媛 劉曉倩 龔 卉 崔 壯 李長平△馬 駿
天津醫科大學公共衛生學院衛生統計學系(300070)
目的 分析影響天津市參保急性心肌梗死患者住院費用的因素指標,探索其病例組合方式及費用模式,為建立適合我國國情的DRGs研究提供統計學參考。方法 采用多重線性回歸分析篩選影響因素,利用數據挖掘中的決策樹方法建立模型并將患者歸組分類。結果 是否手術、醫院類別、住院天數為主要影響因素,并以此作為分割節點建立8種病例組合方式及相應的費用標準。結論 數據挖掘是一種從海量數據中提取有效信息的過程,應用于DRGs研究具備自身優勢。兩種方法證實影響AMI患者住院費用的因素及重要程度一致,是否手術為最主要的疾病診斷分割節點。通過得出的AMI患者費用控制上限可協助醫療保險機構及醫院發現可疑病例,做好預警工作,完善社會醫療保險體系。
急性心肌梗死 數據挖掘 決策樹 DRGs
2011年,我國城市居民因急性心肌梗死(acute myocardial infarction,AMI)導致的疾病別死亡率已達47.36(1/10萬)[1],給患者帶來了嚴重經濟負擔。目前,針對AMI的研究多為探討其危險因素和描述費用構成[2],鑒于國內目前還未有文獻報道對AMI患者病例組合方案的研究,本文旨在以天津市參保AMI患者為依據,在篩選其影響指標基礎上,采用數據挖掘技術對本市AMI的病例組合情況進行初探,探索其預付費制度,為適合我國國情的DRGs研究提供參考。
1.資料來源
2.統計學方法
(1) 影響因素篩選
根據相關文獻研究及專業知識,以數據庫基本情況為依據,制定出可能影響AMI患者費用負擔的因素,采用多重線性回歸模型逐步回歸方法篩選真正影響AMI患者醫療費用的因素。影響指標及賦值如表1所示。
(2) 數據挖掘—決策樹(CART算法)
將多重線性回歸篩選出有意義的影響因素作為輸入變量,以AMI患者合計醫療發生費用作為輸出變量,采用CART算法構建AMI患者的決策樹型結構。其中80%樣本(5172人次)作為訓練集,20%樣本(1295人次)作為測試集,種子數隨機默認為1234567,建立交互模式決策樹模型。針對AMI患者醫療費用負擔影響因素分析采用軟件SPSS 17.0實現,應用 Clementine 12.0進行決策樹模型構建與修剪。
1.統計描述結果
(1) 一般人口學描述
天津市參保AMI患者男性多于女性,2008-2010年總患病人數逐年增長,到2011年有下降的趨勢。四年間,就診于三級醫院的參保AMI患者呈現增加態勢,到2011年達到86.99%,如表2所示。
(2) 參保人員費用描述
2008-2011年,天津市AMI患者總住院醫療費用以醫用材料費、藥品費、治療費和檢查費用構成為主,總費用不斷增加,醫用材料費逐年增長,其余費用構成四年間有不同程度降低或小幅波動。
2.多重線性回歸分析
經多重線性回歸分析,除發病部位(P>0.05),其他因素均為天津市參保AMI患者醫療費用的影響因素,其中是否手術(β′=0.401),醫院類別(β′=0.225),住院天數(β′=0.223)為影響我市AMI患者住院醫療費用的主要因素,其他影響因素的重要程度較小。如表3所示。
3.決策樹模型構建AMI患者的病例組合
(1) 病例分組擬合結果
采用CART算法得出的回歸樹結果表明,影響天津市AMI患者住院費用因素按相對重要程度排序依次為是否手術(0.649),醫院類別(0.222),住院天數(0.078)和年齡(0.045),其他指標影響效果甚微,與多重線性回歸結果吻合。將前四位影響因素納入模型分組,根據回歸樹樹狀結果,最終總結出8種病例組合方式,組合結果如表4所示。
(2) 費用上線控制
由病例組合衍生出相應的費用標準可以預知參保人員費用上線,以P75+1.5Q作為費用上線控制標準[3],超過該組合控制標準視為可疑病例,共計151例,總超額費用共計10579418.33元,占總發生費用6.87%,具體費用標準如表5所示。
(3) 模型評估
通過多重線性回歸和回歸樹決策分析均證明影響AMI患者住院醫療費用的因素為是否手術、醫院類別及住院天數,且重要程度次序一致,表明通過多重線性回歸分析納入模型構建的因素作為回歸樹模型中的分段節點構建決策分類合理。
采用CART分類回歸樹進行模型評價,可從模型收益方面進行評估。根據軟件構建的決策樹得出節點14、13、11、9測試集、驗證集的指數收益分別為223.49%,196.14;159.19,165.77;145.52,129.92;102.00,89.19,絕大部分超過1,說明模型的收益較好[4]。
1.AMI患者基本情況與費用構成
天津市參保AMI患者絕大部分選擇就診于三級醫院,一、二級醫院總和病例數不及三級醫院1/4,說明我市高級別醫院的醫療資源得到了患者認可與信任,但另一方面提示我市醫療資源合理化配置、醫院管理工作有待進一步規劃與調整,使病情較輕的患者分流至低級別醫院,減輕大醫院就診壓力,從而減輕患者看病“難”負擔。
從費用構成可知,AMI患者總費用中醫用材料費比重占到50%以上,且居高不下,可能與AMI病情本身的嚴重程度有關,患者需經皮冠狀動脈介入治療及支架植入術[5]緩解病痛,在治療過程中易發生主觀選擇傾向性或醫生不合理誘導,偏向選擇價格高于國產支架的進口支架,使患者總體醫療費用升高,提示應加大對醫療器械的價格管控,嚴格控制進銷差率,使患者避免承擔持續性看病“貴”難題。
2.病例組合分析
已被國際公認的DRGs(diagnosis related groups)是以病人特征、住院特征和住院期間接受的治療措施為基礎的一種病例分類方案[6],在國內被譯為“疾病診斷相關分類”。我國對DRGs相關研究還處在探索階段,而數據挖掘技術能較好地識別隱藏于數據中的規律,從海量醫療信息資源中挖掘出有助于疾病診斷與治療具有其自身優勢。本次研究采用的CART是經典決策樹算法中的一種,它對輸入、輸出變量的類型要求更寬松,建立的二叉樹相對多叉樹更為靈活[7],表現形式更為直觀。
本研究以數據庫實際情況納入了包括患者、疾病特征情況及外部因素在內的可能影響指標,符合國際關于DRGs的基本思想[8]。表4呈現的組合方式側重對病例情況的描述,不同組合下的患者所接受的治療、醫療需求以及醫療支出高度相關。這種將某一方面相同特征的病例歸為一組作為一種病例組合的方法,一方面是為便于醫療機構對患者進行管理,提高工作效率;另一方面是為我國醫療付費方式實現預付制建立基礎,根據醫療資源消耗強度一致的各病例組合,從而可以對醫院進行合理的費用補償并制定統一的支付標準。通過本次研究發現,是否手術首先被選入模型作為分組節點,說明手術與非手術患者的住院費用發生情況差別較為明顯,更容易劃分,影響手術患者和非手術患者費用差別的因素分別為住院天數和醫院類別,在今后診療過程中可以手術為基礎條件將患者分型,進而根據患者實際情況將其分配至各組合,完成疾病診斷相關分類。
病例組合最直觀體現是協助醫療保險機構和醫院提供適宜的費用標準,表5依據病人特征的各種組合,按照預先設定好的治療方式、住院天數、醫院等級等因素,根據統一標準向醫院償付病人的住院費用,這樣與患者實際發生的費用無直接關聯,從而有效防止了醫療機構為片面追求利潤而出現提供“過度醫療”的行為。其次根據合理的費用范圍,將醫療費用的上限值作為控制標準,有助于醫療衛生機構及時發現可疑病例,進而深入審查是否發生不合理費用,避免誘導醫療需求發生,建立符合各地情況的DRGs體系,有助于醫療保險機構做好預警機制,從根本上減輕患者日益突顯的“看病貴”難題。
本研究僅以天津市AMI患者為依據,試圖初步探尋符合該市人口特征以及發病特點的分類標準,在后期更為完善的數據資料情況下,期望進一步研究AMI患者住院費用的相關因素和分類標準,為我國整體建立符合國情的DRGs預付制付費模式提供參考,為衛生資源管理者提供科學依據。
致謝:衷心感謝導師馬駿教授在論文撰寫期間給予我的悉心指導和鼓勵,馬老師富于創新的思維方式、嚴謹的工作作風和謙和的處世態度是我畢生學習的目標。感謝天津醫科大學流行病與衛生統計學系李長平老師和崔壯老師在研究階段的無私幫助,感謝師兄師姐和師弟師妹及同學在本次研究過程中給予的精誠協作和支持,感謝父母給予我生活上無微不至的關懷,謝謝大家!
[1]中華人民共和國衛生部.2012中國衛生統計年鑒.北京:中國協和醫科大學出版社,2012:270-278.
[2]于麗華.急性心肌梗死患者住院費用影響因素分析.現代預防醫學,2006,33(7):1084-1088.
[3]高子厚,萬崇華,蔡樂,等.按DRGs組合方式制定消化系統疾病患者住院費用的研究.中國衛生統計,2006,23 (4):323-325.
[4]薛薇主編.Clementine數據挖掘方法及應用.北京:電子工業出版社,2012:148-170.
[5]Joynt KE,Blumenthal DM,Orav EJ,et al.Association of Public Reporting for Percutaneous Coronary Intervention with Utilization and Outcomes among Medicare beneficiaries with Acute Myocardial Infarction.JAMA,2012,308(14):1460-1468.
[6]Edwards N,Honemann D,Burley D,et al.Refinement of medicare diagnosis-related groups to incorporate a measure of severity.Health Care Financ Revive,1994,16(2):45.
[7]李長平.Logistic回歸、決策樹和神經網絡在預測2型糖尿病并發末梢神經病變中的性能比較.中國博士學位論文全文數據庫.中國人民解放軍軍事醫學科學院,2009:40-41.
[8]王曉京,朱士俊.醫療費用支付方式的比較.中華醫院管理雜志,2006,22(7):481-483.
(責任編輯:郭海強)
Preliminary Exploration of Hospitalization Expense and Case Mix in Acute Myocardial Infarction Patients of Tianjin
Fu Xiaomeng,Liu Yuanyuan,Liu Xiaoqian,et al
(Department of Health Statistics,Public Health College,Tianjin Medical University(300070),Tianjin)
Objective To analyze the influencing factors of insured inpatients with acute myocardial infarction in Tianjin,and then explore the case mix model and charge pattern in order to establish Diagnosis Related Groups (DRGs) suited to China′s national conditions and provide statistical reference.Methods Adopt multinomial linear regression to screen the factors influencing hospitalization expenses,establishing the case mix model and decision tree were used to generate diagnosis related groups.Results The major influential factors were surgery or not,hospital′s level and length of stay.There are 8 case mix and cost standard from decision tree.Conclusion Data mining is a process of extracting effective information from huge amounts of data,applied in DRGs research has its own advantages.Two methods confirm that the influence factors and significance of AMI inpatient′s expense are the same,the uppermost splitting node is surgery or not in case mix model.The upper limit of medical charge can assist medical institutions in finding suspicious cases,early warning,and perfecting the social medical insurance system.
AMI;Data mining;Decision tree;Diagnosis related groups (DRGs)
國家自然科學基金(71373175);教育部人文社會科學研究項目(11YJCZH080)
△通信作者:李長平,E-mail:lichangping@tijmu.edu.cn