新疆大學數學與系統科學學院(830046) 王 濤 馮 方 吳黎軍
?
基于對數最小二乘偏差函數下的醫療機構單病種費率研究*
新疆大學數學與系統科學學院(830046) 王 濤 馮 方 吳黎軍△
【提 要】 目的 傳統的基于最小偏差函數所制定的分類費率計算較為方便,但偏差較大。現今的廣義線性模型一定程度上可以修正其誤差,但必須借助相關軟件實現。方法 本文在廣義線性模型的基礎上提出對數最小二乘函數。結果 該方法既修正了偏差,又可方便制定分類費率。結論 將該方法用于冠心病和腰椎間盤突出兩種疾病,發現其偏差與收斂速度、穩定性較傳統的最小偏差法和廣義線性模型更好,故在制定分類費率方面有較強的實用性。
【關鍵詞】單病種付費 偏差函數 對數最小二乘 廣義線性模型
單病種付費模式是指通過統一的疾病診斷分類,科學地制定出每一種疾病的定額償付標準,社保機構按照該標準與住院人次向定點醫療機構支付住院費用,使得醫療資源利用標準化,即醫療機構資源消耗與所治療的住院病人的數量、疾病復雜程度和服務強度成正比。單病種付費的特點是,醫療機構的收入僅與每個病例及其診斷有關,而與醫療機構治療該病例所花費的實際成本無關。簡而言之,就是明確規定某一種疾病該花多少錢,從而既避免了醫療單位濫用醫療服務項目、重復項目和分解項目,既可以防止醫院小病大治,又可以保證醫療服務質量,而且操作十分簡便[1-2]。
單病種限額結算是單病種付費的一種結算方式。患者到醫院檢查后,醫院根據其檢查結果對病情進行評估,確定沒有其他并發癥后,醫院在病人自愿的前提下與之簽訂協定,確定該病種的費用支付總額,患者的治療費用在總額范圍以內按總額支付,超出部分由醫院自行承擔的一種收費方式。如果限額以上費用不予報銷,醫療機構就可以通過患者來對醫保部門施加壓力以達到提高限額的目的。如果對超出部分予以適當報銷,就可以最大限度地避免道德風險和減輕醫保部門的壓力。但是由于目前單一的按服務項目付費的計費程序與單病種付費存在著不統一、不協調的矛盾,給按病種付費病人計費增加了難度。同時考慮到新疆公布的25類單病種的付費限額可能來自于經驗談判,其合理性有待檢驗,因此我們有必要從理論上對單病種付費的限額做一個計算,以得到比現在的限額更準確的結果[3]。
本文對2012年1~10月的烏魯木齊市13家定點三級醫院醫保數據進行統計分析,得出腰椎間盤突出與冠心病兩組病人的付費數據。先用傳統的方法進行費用計算,在此基礎上,我們提出了一種新的單病種付費結算方式,旨在給出在此方法下一個病種的結算情況,并將各種方法算出的費用進行比較,發現我們提出的方法更具有實踐性,結果更準確。
最小偏差法由Robert Bailay和Leroy Simon于1960年首次提出,用于同時確定兩個或兩個以上分類變量的相對費率。在最小偏差法中,首先需要確定偏差函數,即最小化的目標函數。常用的偏差函數有邊際總和函數、最小二乘函數、最小χ2函數等。不同的偏差函數可能得到不同的相對費率。
1.邊際總和法
一般而言,一個理想的費率結構應該具有這樣的特點,即對于那些保單數量很大的類別,其純保費應該等于該組實際的經驗賠款。在分類體系中,根據每一個分類變量的不同水平計算的純保費之和應該等于相對應的經驗賠款之和,即估計值和觀察值的邊際總和應該相等。根據保費和賠款邊際總和相等的原則厘定相對費率的方法就是所謂的邊際總和法。
為了簡化起見,假設只有兩個分類變量,每個分類變量的相對費率分別為αi和βj(i =1,2…I;j =1,…,J),cij為各個類別的經驗賠款,nij為各個類別的風險單位數,yij為各個類別的經驗純保費,即yij=Cij/ nij,則為了使得純保費的邊際總和等于經驗賠款的邊際總和,可令:

(1)式中,第一個等式表示觀察值(經驗賠款)的列和等于估計值的列和,第二個方程組表示觀察值的行和等于估計值的行和。對上述方程組進行簡單變形,即可得到相對費率的下述遞推公式:


在迭代公式(2)中,可以令第一個分類變量的初始相對費率為1,如α1=α2=…αI=1,并將其帶入第二個方程組求解βj,如此不斷下去,最后可以得到收斂的結果。
2.最小χ2法
最小χ2法是在下述目標函數最小化的條件下估計相對費率:

(3)式中,αi和βj(i =1,2,…,I;j =1,2,…,J)為每個分類變量的相對費率;nij為各個類別的風險單位數;yij為各個類別的經驗純保費。
(3)式與我們熟悉的χ2統計量具有完全相同的形式,因此被稱作最小χ2法。上式中關于αi和βj分別求偏導,并令其等于零,即得:

求解方程組(4)的方法與邊際總和法相同。
3.最小二乘法
最小二乘法在下述目標函數最小化的條件下估計相對費率

式中αi和βj(i =1,2,…,I;j =1,2,…,J)為每個分類變量的相對費率;nij為各個類別的風險單位數;yij為各個類別的經驗純保費。
對(5)式關于αi和βj分別求偏導,并令其等于零,即得

求解方程組(6)仍然可以用交替迭代法。
4.廣義線性模型
在古典線性回歸模型中,假設因變量服從正態分布,方差為常數,解釋變量通過線性相加關系直接影響因變量本身。而廣義線性模型假設因變量來自于指數型分布族,其方差隨著均值而變化,解釋變量通過線性相加關系對因變量的期望值的某種變換產生影響[3,7-8]。廣義線性模型的假設可歸納如下:
(1)隨機成分,即因變量Y或誤差項的概率分布。因變量Y的每個觀察值Yi相互獨立且服從指數型分布族的一個分布。指數型分布族包括許多常見分布,如正態分布、泊松分布、逆高斯分布、二項分布,伽瑪分布等。
(2)系統成分,即解釋變量的線性組合,表示為η =β1x1+β2x2+…+βpxp。系統成分與古典線性回歸模型沒有任何區別。
(3)聯結函數。聯結函數g單調且可導,它建立了隨機成分與系統成分之間的關系,即g(μ)=η或E (Y)=μ=g-1(η)。可見,在廣義線性模型中,對因變量的預測值并不等于解釋變量的線性組合,而是該線性組合的一個函數變換。
我們介紹了傳統模型的四種計算費率公式,精算師通過對純保費或賠付率進行一系列單項分析,以確定各個分類變量的相對費率。雖然最小偏差法有了很大的進步,但仍然不能提供一個完整的統計分析框架,而且上述四種方法的誤差都較大。計算結果仍然不太理想。
在此基礎上,我們對傳統的最小二乘偏差函數進行改進,得到了新的偏差函數,我們將其定義為對數最小二乘函數。目標函數的形式為:

對數最小二乘法在目標函數最小化的條件下估計相對費率,(7)式中αi和βj(i =1,2,…,I;j =1,2,…,J)為每個分類變量的相對費率;nij為各個類別的風險單位數;yij為各個類別的經驗純保費。
對(7)式關于αi和βj分別求偏導,并令其等于零,即得:

求解方程組(8)仍然可以用交替迭代法。可以令一個分類變量的初始相對費率為1,如α1=α2=…αI=1,并將其帶入第二個方程組求解βj;把得到的βj代入第一個方程組,可以求得一組新的αi;然后再將其代入第二個方程組求解βj;如此不斷下去,最后可以得到收斂的結果。
1.數據的選取
從烏魯木齊市社保局獲得2012年1~10月的13家定點三級醫院醫保數據,主要包括各醫院各病種病人的住院總費用、個人自付費用、各類報銷費用、性別、年齡、疾病類型、科室等信息。采用Execl軟件對上述費用進行分類篩選,刪除錯誤信息、不符合要求的信息,我們得出兩種病種的費用表,見表1~2。
2.模型的計算
通過MATLAB軟件,分別用三種原始的方法和新方法計算費用,結果見表3~5。

表1 各年齡段腰椎間盤突出平均費用表(單位:萬元)

表2 各年齡段冠心病平均費用表(單位:萬元)

表3 腰椎間盤突出相對費率結果(最小卡方法)

表4 腰椎間盤突出相對費率結果(最小二乘法)

表5 腰椎間盤突出相對費率結果(對數最小二乘法)
用同樣的方法我們可以得出腰椎間盤突出的結果,此處不再贅述。
3.模型的分析
在模型的計算中我們已經分析了各個模型的收斂次數,發現邊際總和法的收斂次數多,收斂速度慢,其結果不太理想,所以首先將其排除在外。最小卡方法與本模型在收斂速度上沒有差異,其他方法較差。


圖1 腰椎肩盤突出:三種方法的偏差大小

圖2 腰椎肩盤突出:三種方法穩定性
結果發現,我們改進的方法在收斂的次數、穩定性、偏差等方面都比傳統的偏差函數的結果更優。
本研究進一步考慮廣義線性回歸模型,選取逆高斯分布假設和對數聯結函數,運用SAS軟件,得出結果見表6~7。

表6 腰椎肩盤突出病的SAS參數分析結果表

表7 腰椎間盤突出的SAS預測值表(單位:萬元)
對廣義線性模型做出同樣的偏差估計,目標函數為:

代入數據可得:
針對男性腰椎肩盤突出病,其偏差為:0.0423
(此時對數最小二乘的偏差為0.0011)
針對女性腰椎間盤突出病,其偏差為:0.0110
(此時對數最小二乘的偏差為0.0017)
將廣義線性模型所做的結果與我們選取的對數最小二乘結果進行比較,發現對數最小二乘的偏差更小,與實際值更為接近。從SAS軟件的預測值來看,廣義線性的波動性較大,穩定性也較差。所以,對數最小二乘法更優。
將上述方法用于冠心病,可得出同樣的結論。

表8 冠心病費用表αiβi(對數最小二乘)(萬元)

表9 腰椎間盤突出病費用表αiβi(對數最小二乘)(萬元)
通過對單病種付費方式進行研究,可以看出,相對于傳統的單病種付費方式以及廣義線性模型得出的付費情況,我們給出了一種更優的結算方式,即對數最小二乘偏差函數法。利用對數二乘法,我們計算了兩病種的費率,見表8~9,并在此基礎上,同傳統的偏差函數法進行比較,發現無論從收斂速度,還是偏差大小,或者穩定性,對數最小二乘法都比傳統的方法更優。此外,我們又將得到的對數二乘法,同廣義線性模型做了比較,結果同樣發現對數最小二乘法比廣義線性模型計算精度更高。雖然本文的新方法可以應用于單病種付費,但計算過程還較為繁瑣,只能應用于一些典型的病種,對數據要求較高。
參考文獻
[1]楊迎春,巢健茜.單病種付費與DRGs預付模式研究綜述.中國衛生經濟,2008-06.
[2]張連增,呂定海,等.廣義線性模型在非壽險費率分析中的應用.數理統計與管理,2013-05.
[3]柯雙鳳.湖北省新農合單病種付費實施效果研究.湖北中醫藥大學碩士論文,2014-05.
[4]羅琪,應可滿.醫療保險按病種付費研究綜述.中國衛生事業管理,2012-04.
[5]劉紅玉.中醫按病種付費方式探討.華中科技大學碩士論文,2013-05.
[6]黃雪毅,吳迪,等.單病種付費方式研究.中國衛生統計,2014-06.
[7]楊靜平,非壽險精算學.北京大學出版社,2006-12.
[8]孟生旺,王選鶴.GAMLSS模型及其在車損險費率厘定中的應用.數理統計與管理,2014-04.
[9]周佰成,韓月才,等.汽車保險損失率期權定價模型及實證研.數理統計與管理,2013-02.
(責任編輯:鄧 妍)
*基金項目:國家自然科學基金項目(11361058);國家大學生創新項目(201410755005)
通信作者:△吳黎軍