彭 娟
貝葉斯回歸方法估計成本-效果可接受曲線
彭 娟
成本效果經濟學分析中,許多研究結果表明貝葉斯方法相比于傳統統計方法具有各方面的優勢。本文首先從貝葉斯原理和模擬實證兩方面,比較了貝葉斯計算與傳統統計方法,得出在弱先驗信息的情況下,貝葉斯估計近似于極大似然估計。但在具有可靠經驗信息的情況下,貝葉斯估計更加準確。同時,在此基礎上,計算了意愿支付法下的成本-效果可接受曲線,以及在不同先驗信息下,該曲線的變化情況,得出貝葉斯方法不僅能夠給出更加合理的解釋,而且在同一意愿支付貨幣下,強先驗下增量凈效益大于 0的把握更大。由此,我們提出應該將貝葉斯方法作為成本-效果分析的一個主要研究方向。
貝葉斯回歸;成本-效果;增量凈效益;成本-效果可接受曲線
在國外,貝葉斯方法在成本-效果分析中的研究和應用已經相對較多,但是在國內對該方法的研究很少。在知網、萬方等數據庫上搜索,只有幾篇關于該方法介紹的文章,張玉哲等介紹說貝葉斯法可以利用先驗信息進行推測,可以在理論上準確提供增量成本-效果比、成本-效果可接受曲線(CEAC)、凈貨幣收益的概率闡述。吳晶,劉國恩等給出了CEAC的計算方法。但是為什么貝葉斯方法具有這樣的優點,貝葉斯方法下又怎樣繪制 CEAC?尚沒有文章深入的探討過,以下從方法原理上進行比較并給出模擬實驗,在模擬實驗模型上利用R調用Openbugs軟件繪制了不同先驗信息下的CEAC。
貝葉斯法與傳統方法的區別主要在于傳統方法做出的推斷基于頻率的基礎,對估計值的統計性質實際上是對大量重復實驗做出的推斷,而不能對當前估計值的統計性質給出一個明確的答案,在實際應用中含有更多的不確定性。
經典統計學認為參數是某個未知的常數,可以通過樣本信息來獲得。樣本是來自于某個總體,而該總體用分布函數或密度函數來描述,總體分布往往含有未知參數,如位置參數、形狀參數等。用樣本信息構造的統計量來估計總體參數的過程就稱為參數估計。
而貝葉斯統計學認為參數的取值是隨機的,經驗的或數據的信息形成參數的先驗概率分布。在得到樣本之前,從先驗分布中產生了某個樣本,即參數值。在樣本已知的情況下,似然函數包含了所有的樣本信息,先驗分布和似然函數的乘積得到參數的后驗分布。該參數的估計使得損失函數的數學期望最小。可以看出,在無先驗信息或弱先驗信息的情況下,貝葉斯估計與極大似然估計理論上應一致,在可靠的先驗信息情況下,貝葉斯估計的誤差應該更小。
經典統計學用樣本信息構造的統計量來估計總體參數,為了衡量估計值的誤差范圍,需要給出區間估計。區間估計往往通過統計量的分布來獲得。上下限通常是某個統計量。由于統計量是隨機變量,由抽樣差異導致每次計算的置信區間都是不同的,這些區間要么包含總體參數,要么不包含,也就是說區間是隨機的。理論上,當抽樣次數達到很大時,大約有 100×(1-a)個區間覆蓋真值。1-a為置信水平,置信水平越高,區間越窄。
貝葉斯區間估計則大大不同,由于假設參數是隨機的,前述當獲得參數的后驗分布后,可以計算出該參數落入任何一個區域內的概率,可以給定概率,比如0.95,通常可以找到一些區域,貝葉斯區間選擇使得該區間上的后驗密度值不少于相同概率下其他區域上的值。也就是最高后驗密度的區間即相同概率下最短的區間。由此得到的區間可以解釋為該參數落入其中的概率為 1-a。這與實際中的理解吻合,而避免了重復抽樣的牽強的解釋。
該模擬實驗通過對多因變量的回歸模型的模擬結果,清楚地揭示了先驗信息在貝葉斯分析中的作用,以及貝葉斯回歸分析及傳統回歸分析的區別和聯系(見表1)。模擬數據來自模型:


表1 傳統統計方法與貝葉斯方法參數估計的比較
在弱先驗信息下(先驗估計值的變異程度為33.3),給定兩組不同的初值,iterations=1000,從以上表1可以看出,在弱先驗信息的條件下,MCMC得到的結果與傳統最小二乘法得到的結果基本一致;兩者在beta項上的估計都不準確,但是在自變量參數值的估計上比較準確,從SD可以看出最小二乘法得到的估計要更精確。當調整先驗信息的把握度,(先驗估計值的變異程度為0.033)MCMC結果與真實的結果一致,比傳統方法更為準確。
由此可以得出當先驗信息準確且有把握的情況下,調整先驗信息在MCMC的結果中所占權重,結果偏好于先驗信息。MCMC得到的估計其實是在經驗與數據之間的折衷。同時,可以通過對舊的數據得到的參數估計作為新的先驗信息,更新得到新的模型。
該部分以弱先驗信息下繪制的成本-效果接受曲線為例來說明兩種方法在參數解釋上的差異。引入意愿支付法后,自然得到:

Rc表示增量效果意愿支付的貨幣值,INB代表增量凈效益,prob代表INB>0的概率。
必須在得到的聯合分布后,從而得到增量凈效益的分布,得到增量凈效益>0的概率。用聯合分布可以反應出△E、△C之間的聯系,當兩者獨立時,聯合分布等于各自分布的乘積。
圖1中Rc代表患者對增加單位療效而愿意支付的錢,代表選擇治療方案二和治療方案一相比所獲得的收益。圖中在點Rc=3.9時,p=0.5,貝葉斯派的解釋為當增加單位效果患者愿意付超過3.9元時,則選擇治療有較大的把握能夠獲得盈利,而不是虧本。這里的把握程度會隨著Rc的取值慢慢增大,即概率值增大。但是按頻率派的解釋,當患者愿意支付超過3.9元時,重復100次這樣的治療,大約有超過一半的治療會盈利,而不是虧本,至于該次治療的增量-凈效益會不會>0,是未知的,無法做出推斷。
同時從圖1中可以看出,強先驗信息下,對本次數據結果的INB>0的概率要大于弱先驗信息下的概率,表明在有可靠先驗信息的情況下,對同一數據的結果所得INB>0的把握度(信念)是不一樣的。在信息準確的情況下,△E、△C分布越集中,同一Rc下INB>0的把握越大。進一步說明,先驗信息(經驗的、數據的)將影響最終的決策,甚至可以得出相反的結論。例如,當Rc=11.36時,弱先驗下的概率為0.55,強先驗下的概率為0.877。弱先驗下就有可能選擇第二種方案,而強先驗下只可能選擇第一種方案。

圖1 成本效果可接受曲線
本文主要探討了貝葉斯方法和頻率法之間的區別和聯系,并通過模擬實驗給出了一個清晰的結果。在此基礎上分析了采用貝葉斯方法在成本—效果分析中的作用,計算了成本—效果接受曲線,比較了不同先驗信息下的差異以及兩種方法在解釋上的差異,闡明了在國外經濟學分析中偏好貝葉斯方法的原因。當然本文對成本—效果分析中的一些問題討論的還不夠全面,諸如,成本—效果可接受曲線的一般計算過程、方法等。另外還可以將研究擴展到對增量成本效果比的區間估計做比較,同時還可以在bootstrap法與貝葉斯方法得到的區間估計中做一個作為方法間比較的另一證據。
[1]張玉哲,吳晶,孫利華.藥物經濟學評價中的貝葉斯法介紹[J].中國藥物經濟學,2009(2):51-56.
[2]阿諾德?澤爾納,張堯庭,蔣傳海,等.阿諾德澤爾納[M].上海:上海財經大學出版社,2005:7.
[3]O'Hagan,A.and J.W.Stevens.The probability of costeffectiveness[J].BMC Med Res Methodol,2002(2):5.
[4]朱慧明,林靜.貝葉斯計量經濟模型[M].北京:科學出版社,2009:66-67.
[5]葉慈南,曹偉麗.應用數理統計[M].上海:機械工業出版社,2007:42-67.
[6]薛毅,陳立萍.R統計建模與R軟件[M].北京:清華大學出版社,2007:42-67.
中山大學公共衛生學院醫學統計,廣東廣州 510080