999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于中位數(shù)回歸模型非壽險(xiǎn)精算中費(fèi)率因子的顯著性判別分析

2013-02-21 05:15:32郭念國(guó)
統(tǒng)計(jì)與決策 2013年8期
關(guān)鍵詞:水平模型

郭念國(guó)

(河南工業(yè)大學(xué) 理學(xué)院,鄭州 450001)

0 引言

在非壽險(xiǎn)精算領(lǐng)域,如何厘定出價(jià)格合理、具有競(jìng)爭(zhēng)性的保險(xiǎn)產(chǎn)品是保險(xiǎn)人關(guān)注的一個(gè)重要問(wèn)題。因?yàn)楫a(chǎn)品的價(jià)格不僅僅關(guān)系到新客戶的加入,還影響到老客戶的去留,而且價(jià)格合理的保險(xiǎn)產(chǎn)品在一定程度上可以避免被保險(xiǎn)人出現(xiàn)道德風(fēng)險(xiǎn)和逆選擇,從而減少保險(xiǎn)人不必要的損失。分類(lèi)費(fèi)率厘定方法作為非壽險(xiǎn)精算中費(fèi)率厘定最重要的方法之一,其基本思想是基于保險(xiǎn)市場(chǎng)中被保險(xiǎn)人的風(fēng)險(xiǎn)水平的不同進(jìn)行分組劃分,對(duì)不同的風(fēng)險(xiǎn)組別分別厘定費(fèi)率,而辨別各個(gè)風(fēng)險(xiǎn)組別之間是否存在顯著性差別,是厘定費(fèi)率的一個(gè)前提條件。廣義線性模型作為分類(lèi)費(fèi)率厘定的一個(gè)重要統(tǒng)計(jì)工具,在非壽險(xiǎn)精算領(lǐng)域取得了大量的研究成果。

分位數(shù)回歸作為線性模型的推廣,可以通過(guò)選取不同的回歸分位,更全面的刻畫(huà)條件分布,而且其具有參數(shù)估計(jì)的穩(wěn)健性和單調(diào)變換不變性等優(yōu)良特性。實(shí)踐證明Koenker[1],在滿足廣義線性模型假設(shè)的條件下,利用分位數(shù)回歸模型估計(jì)的結(jié)果與廣義線性模型的估計(jì)幾乎一致;如果假設(shè)條件不滿足,分位數(shù)回歸估計(jì)的結(jié)果會(huì)更好,從而,使得分位數(shù)回歸的理論和方法在各個(gè)領(lǐng)域的研究應(yīng)用得到迅速發(fā)展。郭念國(guó)和徐昕[2]利用分位數(shù)回歸模型對(duì)非壽險(xiǎn)精算中厘定變量對(duì)損失變量的影響進(jìn)行了整體分析,但利用分位數(shù)回歸模型研究非壽險(xiǎn)精算中問(wèn)題的文獻(xiàn)尚不多見(jiàn)。

本文基于中位數(shù)回歸模型的優(yōu)良性,對(duì)費(fèi)率因子水平的顯著性進(jìn)行判別,并與其他模型進(jìn)行比較。為更好的理解中位數(shù)回歸模型,本文首先介紹了中位數(shù)和中位數(shù)回歸模型的概念及其實(shí)現(xiàn)算法;然后基于中位數(shù)回歸模型的思想和算法,對(duì)中位數(shù)回歸估計(jì)的優(yōu)良性進(jìn)行了說(shuō)明;最后給出實(shí)證分析。

1 中位數(shù)及中位數(shù)回歸模型

中位數(shù)是分位數(shù)的一個(gè)特例,樣本中位數(shù)一般定義為有序集合的中間值,即樣本中位數(shù)把樣本分成數(shù)目相等的兩部分,一部分均大于中位數(shù),另一部分均小于中位數(shù)。通常用樣本中位數(shù)來(lái)估計(jì)總體中位數(shù)m,即如果變量Y代表總體,則

定義1 設(shè)隨機(jī)變量Y的累積分布函數(shù)為F(y)=P(Y≤y),則Y的中位數(shù)為QY(0.5)=min{P(Y≤η)≥0.5}。

由中位數(shù)的定義可以看出,中位數(shù)只與其所在序列的位置有關(guān),從而比均值更具有穩(wěn)定性。如調(diào)查某社區(qū)的家庭收入情況,因?yàn)榭陀^原因,可能只有少數(shù)的家庭收入很高,從而該分布是右偏的,用中位數(shù)代表家庭收入比均值更能反映多數(shù)家庭收入狀況。

定義2 設(shè)(yi,xi)為第i個(gè)觀測(cè)值,其中xi=(xi1,xi2,…,xip)T,i=1,2,…,n,稱(chēng)下式為中位數(shù)回歸模型。

其中β0.5為下式的解

2 中位數(shù)回歸的優(yōu)良性

2.1 穩(wěn)健性

穩(wěn)健性考慮的問(wèn)題是:當(dāng)實(shí)際模型中的分布與假定模型中的分布有微小差異時(shí),統(tǒng)計(jì)方法的性能會(huì)受到怎么樣的影響。基于Hampel[5]提出的影響函數(shù),下面給出中位數(shù)回歸模型具有穩(wěn)健性,而均值模型不具有。

假定式(5)中分母存在且大于零。

2.2 單調(diào)變換的不變性

一個(gè)好的統(tǒng)計(jì)模型,不僅僅具有穩(wěn)健性,而且還應(yīng)該具有變量變換的不變性。如一個(gè)索賠額y(以美元為單位)的統(tǒng)計(jì)模型,若變換索賠額y的度量貨幣,如人民幣,希望這種變化對(duì)模型的估計(jì)結(jié)果沒(méi)有影響;如果對(duì)模型中的因變量作變換,也希望模型中的參數(shù)發(fā)生同步變化,而模型解釋的結(jié)論并不改變,這就是模型的單調(diào)變換的不變性,中位數(shù)回歸模型就具有該性質(zhì)。

假如h(?)是實(shí)數(shù)R上的非減函數(shù),對(duì)于任意的隨機(jī)變量Y,下式成立

稱(chēng)(6)式為分位數(shù)的單調(diào)變換不變性。

式(6)成立是因?yàn)?/p>

由式(6)可知,對(duì)變量Y做h(?)變換后的中位數(shù)等于Y 的中分位數(shù)做 h(?)變換。由式(6)和式(1)知,

其中X為協(xié)變量。從而,中位數(shù)回歸模型對(duì)于變量Y做變換h(?)后的中分位數(shù)的值大小沒(méi)有發(fā)生變化,即模型的結(jié)論沒(méi)有變化,稱(chēng)該性質(zhì)為中位數(shù)回歸模型的單調(diào)變換的不變性。該性質(zhì)對(duì)于線性模型不成立,因?yàn)镋(h(Y))≠h(E(y)),除非 h(?)是妨射變換。

3 實(shí)證分析

本文利用P.de Jong等[6]中分析的車(chē)輛保險(xiǎn)數(shù)據(jù)對(duì)費(fèi)率因子的顯著性進(jìn)行分析,該數(shù)據(jù)是基于2004年或2005年的一年期保單數(shù)據(jù),包含10個(gè)變量,67856份保單,其中有4624份至少發(fā)生一次索賠。設(shè)索賠額變量為y(美元),對(duì)4624份保單索賠額統(tǒng)計(jì)如表1。

由表1可知,索賠額變量y的變異程度非常大,而且中位數(shù)與均值的差別很大,說(shuō)明數(shù)據(jù)存在厚尾現(xiàn)象。對(duì)于存在該現(xiàn)象的數(shù)據(jù),Gamma回歸模型和逆Gaussian回歸模型是兩個(gè)常用方法。故基于分位數(shù)回歸模型的費(fèi)率因子顯著性的判別結(jié)果將與這兩個(gè)模型作比較,為此,分位數(shù)回歸模型需對(duì)對(duì)索賠額變量y進(jìn)行對(duì)數(shù)變換,由性質(zhì)(7)知,該變換對(duì)分位數(shù)回歸模型的估計(jì)結(jié)果沒(méi)有影響。

為與P.de Jong等[6]中的結(jié)論比較,本文討論駕齡類(lèi)別(agecat)、性別(gender)和區(qū)域(area)三個(gè)費(fèi)率因子對(duì)索賠額的影響,它們分別有6、2和6個(gè)水平,取值及基準(zhǔn)水平的選擇如表2。

為分析析各個(gè)費(fèi)率因子水平對(duì)索賠額的顯著性,建立的均值回歸模型和分位數(shù)回歸模型分別為

表1 索賠額的描述性統(tǒng)計(jì)

表2 費(fèi)率因子

表3給出Gamma回歸模型、逆Gaussian回歸模型和中位數(shù)回歸模型中費(fèi)率因子水平參數(shù)的估計(jì)值及其顯著性,其中分位數(shù)回歸模型的估計(jì)是基于Koenker[7]中rq函數(shù),其他兩個(gè)模型是基于R Development Core Team[8]中的glm函數(shù),模型中參數(shù)的估計(jì)方法均為函數(shù)中默認(rèn)的方法。

由表3知截距項(xiàng),即行駛區(qū)域在C、駕齡類(lèi)別為3的男性保單持有人對(duì)索賠額有顯著(本文的顯著性均基于0.05的顯著性水平)影響。數(shù)據(jù)刪除前后,三個(gè)模型給出了相同的結(jié)論。當(dāng)然,對(duì)索賠額影響的大小,在數(shù)據(jù)刪除前后,Gamma回歸模型與逆Gaussian回歸模型給出的估計(jì)值比中位數(shù)回歸模型均大,這與表1中索賠額的描述統(tǒng)計(jì)相符合,同時(shí)也表明數(shù)據(jù)中存在右偏、后尾現(xiàn)象。但數(shù)據(jù)刪除前后截距項(xiàng)估計(jì)值變化,中位數(shù)回歸模型僅有0.087,而Gamma回歸模型與逆Gaussian回歸模型均超過(guò)0.4,是中位數(shù)回歸模型估計(jì)變化的近四倍,這說(shuō)明中位數(shù)回歸模型對(duì)數(shù)據(jù)更具有穩(wěn)健性。

表3 不同統(tǒng)計(jì)模型費(fèi)率因子估計(jì)結(jié)果

對(duì)于駕齡類(lèi)別費(fèi)率因子各個(gè)水平的顯著性,在數(shù)據(jù)刪除前,三個(gè)模型給出了完全相同的結(jié)果,即認(rèn)為駕齡類(lèi)別1的保單持有人發(fā)生的索賠額與基準(zhǔn)水平駕齡類(lèi)別3發(fā)生的索賠額有顯著差異,其他駕齡類(lèi)別的保單持有人與基準(zhǔn)水平發(fā)生的索賠額沒(méi)有顯著差異。在數(shù)據(jù)刪除后,Gamma回歸模型與逆Gaussian回歸模型給出的結(jié)論與沒(méi)有刪除數(shù)據(jù)的結(jié)論相同,即駕齡類(lèi)別1的保單持有人發(fā)生索賠額比基準(zhǔn)水平顯著的高,從而應(yīng)收取更高的保費(fèi)。

對(duì)于性別費(fèi)率因子,在數(shù)據(jù)刪除前后,Gamma回歸模型與逆Gaussian回歸模型給出相反的結(jié)論。數(shù)據(jù)刪除前,這兩個(gè)模型均認(rèn)為,女性保單持有人與基準(zhǔn)水平的男性保單持有人發(fā)生索賠的額度有顯著差別,并認(rèn)為女性保單持有人發(fā)生的索賠額小;但是在數(shù)據(jù)刪除后,則認(rèn)為男性和女性保單持有人發(fā)生的索賠額沒(méi)有顯著差別,即認(rèn)為性別對(duì)索賠額的影響沒(méi)有差異,這說(shuō)明模型不具有穩(wěn)健性。而中位數(shù)回歸模型在數(shù)據(jù)刪除前后均認(rèn)為,性別對(duì)索賠額的影響無(wú)差異,應(yīng)當(dāng)收取相同的保費(fèi)。

對(duì)于區(qū)域費(fèi)率因子各個(gè)水平的顯著性,對(duì)于行駛區(qū)域在A、B、D和E的保單持有人,數(shù)據(jù)刪除前后,三個(gè)模型均認(rèn)為與基準(zhǔn)水平行駛區(qū)域C的保單持有人發(fā)生的索賠額沒(méi)有顯著差異。但對(duì)于行駛區(qū)域在F的保單持有人,在顯著性水平0.05下,數(shù)據(jù)刪除前后,Gamma回歸模型與逆Gaussian回歸模型給出了不同的結(jié)論。數(shù)據(jù)刪除前,這兩個(gè)模型認(rèn)為行駛在該區(qū)域的保單持有人與基準(zhǔn)水平有顯著差異,而且發(fā)生的索賠額較高,相對(duì)于基準(zhǔn)水平風(fēng)險(xiǎn)較大,從而應(yīng)收取較高的保費(fèi)。但在數(shù)據(jù)刪除后,則認(rèn)為區(qū)域F與行駛在其他區(qū)域的保單持有人一樣,風(fēng)險(xiǎn)大小并沒(méi)有顯著性差異。而中位數(shù)回歸模型在數(shù)據(jù)刪除前后,給出相同的結(jié)論,即認(rèn)為行駛在各個(gè)區(qū)域的保單持有人風(fēng)險(xiǎn)大小沒(méi)有顯著差異。這進(jìn)一步表明,中位數(shù)回歸模型的穩(wěn)健性。

為進(jìn)一步說(shuō)明中位數(shù)回歸模型的優(yōu)良性,可以對(duì)Gamma回歸模型與逆Gaussian回歸模型中參數(shù)進(jìn)行Wald檢驗(yàn)Draper和Smith[9],進(jìn)一步比較費(fèi)率因子各水平之間是否具有顯著性差異。假設(shè)行駛在區(qū)域F和區(qū)域E的保單持有人具有相同風(fēng)險(xiǎn),對(duì)此作Wald檢驗(yàn),在數(shù)據(jù)刪除前,Gamma回歸模型的χ2檢驗(yàn)統(tǒng)計(jì)量值為7.2,p=P(χ2>7.2)=0.027 ,在0.05顯著性水平下,拒絕原假設(shè),即認(rèn)為行駛證區(qū)域F的保單持有人確實(shí)與行駛在其他區(qū)域的保單持有人具有不同的風(fēng)險(xiǎn)水平;逆Gaussian回歸模型對(duì)該假設(shè)給出的 χ2檢驗(yàn)統(tǒng)計(jì)量值為4.9,p=P(χ2>4.9)=0.086,從而認(rèn)為行駛證區(qū)域F的保單持有人與行駛在其他區(qū)域的保單持有人具有相同的風(fēng)險(xiǎn),從而兩個(gè)模型在數(shù)據(jù)刪除前就給出了不同的結(jié)論。對(duì)于數(shù)據(jù)刪除后,Gamma回歸模型的χ2檢驗(yàn)統(tǒng)計(jì)量值為2.9,p=P(χ2>2.9)=0.24,從而給出相反的結(jié)論,即認(rèn)為行駛在區(qū)域F和E的保單持有人具有相同的風(fēng)險(xiǎn);逆Gaussian回歸模型對(duì)該假設(shè)給出的 χ2檢驗(yàn)統(tǒng)計(jì)量值為2.6,p=P(χ2>2.6)=0.27,數(shù)據(jù)刪除前后給出了相同的結(jié)論。對(duì)于其他的費(fèi)率因子同樣可以進(jìn)行Wald檢驗(yàn),進(jìn)一步比較費(fèi)率因子各水平之間是否具有顯著差異。

綜上所述,僅僅利用Gamma回歸模型與逆Gaussian回歸模型參數(shù)的顯著性水平往往會(huì)給出錯(cuò)誤的判斷,尤其是數(shù)據(jù)中存在巨額索賠額時(shí),往往會(huì)影響費(fèi)率因子水平的顯著性,而且數(shù)據(jù)刪除與否會(huì)給出不同的結(jié)論,結(jié)合Wald檢驗(yàn)在一定程度上彌補(bǔ)了這兩個(gè)模型的不足。但是中位數(shù)回歸模型則給出了更為準(zhǔn)確的費(fèi)率因子水平的顯著性與否的信息,從而可以為分類(lèi)費(fèi)率厘定方法提供更好的費(fèi)率因子信息。

當(dāng)然,中位數(shù)回歸模型不是絕對(duì)完美,對(duì)于駕齡費(fèi)率因子水平1,數(shù)據(jù)刪除前后,中位數(shù)回歸也給出了相反的結(jié)論。產(chǎn)生這種現(xiàn)象的原因在于刪除數(shù)據(jù)時(shí),駕齡費(fèi)率因子水平1相對(duì)其他水平刪除的觀察數(shù)據(jù)較多所導(dǎo)致的。即使不去深究發(fā)生該現(xiàn)象的原因,相對(duì)于Gamma回歸模型與逆Gaussian回歸模型來(lái)說(shuō),中位數(shù)回歸模型的誤判,至少對(duì)于該組數(shù)據(jù)來(lái)說(shuō)其誤判更低。

4 結(jié)語(yǔ)

分類(lèi)費(fèi)率厘定方法作為非壽險(xiǎn)精算中費(fèi)率厘定最重要的方法之一,通常都是基于損失分布假設(shè)的條件下,通過(guò)檢驗(yàn)?zāi)P椭袇?shù)的顯著性與否進(jìn)行判定,而損失分布模型的選擇往往具有一定的主觀性。中位數(shù)回歸模型不僅具有穩(wěn)健性,而且具有單調(diào)變換的不變性,結(jié)合實(shí)際數(shù)據(jù)進(jìn)行擬合分析表明,中位數(shù)回歸模型比常用的Gamma回歸模型和逆Gaussian回歸模型在費(fèi)率因子的顯著性方面更具有優(yōu)良性。費(fèi)率厘定問(wèn)題作為非壽險(xiǎn)精算中的一個(gè)重要研究?jī)?nèi)容,中位數(shù)回歸模型可以作為廣義線性模型的一個(gè)有益補(bǔ)充。

[1]Koenker,R.Quantile Regression[M].Cambridge:Cambridge University Press,2005.

[2]郭念國(guó),徐昕.分位數(shù)回歸在非壽險(xiǎn)產(chǎn)品費(fèi)率厘定中的應(yīng)用[J].統(tǒng)計(jì)與決策,2010,(24).

[3]Koenker,R.,Bassett G.Regression Quantiles[J].Econometrica,1978,(46).

[4]Hao,L.,Naiman D.Q.Quantile Regressioin[M].Los Angeles:SAGE Publication,2007.

[5]Hampel,F.R.The Influence Curve and its Role in Robust Estimation[J].Journal of the American Statistical Association,1998,(69).

[6]Jong P.D.,Heller G.Z.Generalized Linear Models for Insurance Data[M].Cambridge:Cambridge University Press,2008.

[7]Koenker R.Quantreg:Quantile Regression.R package Version 4.54,[EB/OL].URL http://CRAN.R-project.org/package=quantreg,2011.

[8]RDevelopmentCoreTeam.R:alanguageandEnvironmentforStatistical Computing.R Foundation for Statistical Computing,Vienna,Austria.ISBN3-900051-07-0[EB/OL].URLhttp://www.R-project.org/,2010.

[9]Draper,N.R.,Smith,H.Applied Regression Analysis[M].New York:John Wiley&Sons,Inc.,1998.

猜你喜歡
水平模型
一半模型
張水平作品
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
作家葛水平
火花(2019年12期)2019-12-26 01:00:28
加強(qiáng)上下聯(lián)動(dòng) 提升人大履職水平
3D打印中的模型分割與打包
老虎獻(xiàn)臀
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
做到三到位 提升新水平
主站蜘蛛池模板: 国产系列在线| 国产一区成人| 亚洲另类第一页| 欧美第二区| 日韩国产亚洲一区二区在线观看| 熟女日韩精品2区| 欧美高清视频一区二区三区| 青草免费在线观看| 免费一级毛片在线观看| 国产麻豆精品在线观看| 国产老女人精品免费视频| 日韩在线永久免费播放| 97免费在线观看视频| 免费观看成人久久网免费观看| 午夜成人在线视频| 91人人妻人人做人人爽男同 | 一级毛片免费观看久| 亚洲五月激情网| 欧美日韩导航| 国产成人久久777777| 久久黄色影院| 人妻精品全国免费视频| 国产成人综合在线观看| 中文字幕波多野不卡一区| 五月婷婷亚洲综合| 特级毛片免费视频| 日本国产精品| 麻豆a级片| JIZZ亚洲国产| 91福利国产成人精品导航| 亚洲最大看欧美片网站地址| 久久久久久久蜜桃| 日本成人福利视频| 1024国产在线| 成人午夜亚洲影视在线观看| 久久女人网| 国产精品美女网站| 精品视频福利| 欧美日韩综合网| 亚洲毛片在线看| 伊人久久大香线蕉影院| 三上悠亚在线精品二区| 嫩草在线视频| 午夜激情婷婷| 粗大猛烈进出高潮视频无码| 99999久久久久久亚洲| 人人看人人鲁狠狠高清| 尤物亚洲最大AV无码网站| 中文字幕精品一区二区三区视频| 茄子视频毛片免费观看| 国产区在线观看视频| 久久鸭综合久久国产| 久久久91人妻无码精品蜜桃HD| 欧美激情伊人| 亚洲美女久久| 欧美精品在线视频观看| 国产日韩精品欧美一区灰| 中文字幕无码制服中字| 国产欧美日韩综合在线第一| 国产人碰人摸人爱免费视频| 欧美激情福利| 亚洲高清在线天堂精品| AV天堂资源福利在线观看| 精品国产Av电影无码久久久| 久久99国产精品成人欧美| 国产欧美另类| a级毛片免费网站| 午夜三级在线| 成人国内精品久久久久影院| 影音先锋亚洲无码| 久久人体视频| 国产精品久久久久久搜索| 亚洲视频一区| 精品国产香蕉在线播出| 国产特级毛片aaaaaa| 久久久精品无码一二三区| 97精品伊人久久大香线蕉| 亚洲人在线| 青青操视频在线| 亚洲资源在线视频| 57pao国产成视频免费播放 | 精品国产香蕉伊思人在线|