999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的Lee-Carter模型死亡率預測方法研究

2023-01-11 00:26:34陶祥興季彥颋
人口與經濟 2022年6期
關鍵詞:方法模型

陶祥興,楊 崢,季彥颋

(浙江科技學院 理學院,浙江 杭州 310023)

一、引言

隨著社會經濟的迅速發展和醫療水平的大幅進步,世界人口死亡率逐漸降低,老齡化問題日益嚴重。人口壽命的非預期延長導致養老事業發展滯后于人口老齡化的進程,給養老金機構和人壽保險公司帶來巨大壓力,進而可能影響整個社會經濟的發展。因此,提高死亡率預測精度對于政府制定未來人口政策、經濟政策以及養老政策至關重要。

縱觀學者對死亡率模型的研究,影響力最大的當屬Lee-Carter模型。該模型是由李(Lee)和卡特(Carter)提出的一個對數雙線性模型,首次考慮時間因素和年齡因素對對數中心死亡率的影響,并通過時間序列ARIMA模型來外推預測死亡率[1]。Lee-Carter模型由于其形式簡單、計算方便、參數可解釋性強的特點被各國學者廣泛應用。隨著研究的不斷深入,Lee-Carter模型也暴露出一定缺陷,如模型對參數的假設條件過高等。為了提高預測的精確性,國內外學者從不同方向對經典Lee-Carter模型進行了改進研究,其改進方面主要有:一是放寬了模型的假設條件。在經典Lee-Carter模型中關于死亡率誤差的假設是獨立同分布的,針對這一假設條件過強的情況,勃朗恩斯(Brouhns)等假設死亡人數服從泊松分布,提出泊松對數雙線性模型,并對死亡率進行了預測[2]。二是對經典Lee-Carter模型參數估計方法的改進。經典Lee-Carter模型采用奇異值分解(SVD)法[3-4]進行參數估計,吳曉坤等學者采用加權最小二乘(WLS)法[5-7],極大似然(ML)法[8-9]和貝葉斯馬爾科夫蒙特卡洛(MCMC)法[10]進行參數估計,發現這三種方法在提高參數估計的擬合優度和死亡率預測的精度上都有很好的表現。三是對有限死亡率數據下的預測方法的改進。Lee-Carter模型對死亡率數據的連續性有著較高的要求,大大限制了該模型在有限數據國家的應用。考慮到中國死亡率數據量較小,王曉軍和黃順林通過改進時序中的波動性來提高模型預測的精度[11]。四是對刻畫Lee-Carter模型中的時間項參數kt的改進。傳統的Lee-Carter模型運用ARIMA方法擬合并預測kt的值,但該方法并不能捕捉到死亡率數據中的長記憶性特征,存在一定的缺陷。有學者采用一個帶漂移項的隨機游走模型來刻畫Lee-Carter模型中的時間項kt,并證明該方法同樣適用于稀疏數據[12]。而對于死亡率中存在的跳躍性變化,田夢和鄧穎璐采用雙指數跳躍擴散模型來描述這一特征,并得到了較好的預測效果[13]。

近年來,我國對Lee-Carter模型中的時間項kt的改進研究較少,大多都是單獨利用離散方法或是連續方法對時間項kt進行擬合和預測,很少在此基礎上引入機器學習方法對時間項kt的擬合和預測進行改進。因此本文在Lee-Carter模型預測死亡率的基礎上提出對時間項kt進行擬合和預測的兩種創新方法:第一,引入機器學習中的長短期記憶網絡模型(Long Short-Term Memory,LSTM),在Lee-Carter模型中時間項kt用離散ARIMA模型擬合的基礎上,運用LSTM模型修正其殘差并對死亡率進行短期預測;第二,引入分數布朗運動驅動的O-U過程來刻畫Lee-Carter模型中的時間項kt,通過機器學習中的遺傳算法來估計分數布朗運動驅動的O-U過程中的未知參數并進行死亡率的短期預測。本文通過殘差圖和三種回歸指標將兩種創新方法和ARIMA方法的死亡率預測效果進行對比,確定出一個短期預測精度最高的死亡率預測方法,為政府預測未來死亡率提供了一種新的思路,也為相關機構研究長壽風險提供了一定的依據。

二、基礎模型

1.模型簡述

Lee-Carter模型考慮了年齡因素和時間因素對模型的影響,具體模型表達式如下:

ln(mx,t)=αx+ktβx+εx,t

(1)

由模型可知{αx,βx,kt}是模型的一組解,取任意一個不為0的常數c,將參數變換成{αx,βx/c,ckt}或{αx-cβx,βx,kt+c},都可使得原模型保持不變。因此本文對參數增加以下的約束條件使得模型滿足唯一的參數估計結果:

∑xβx=1,∑tkt=0

(2)

2.參數估計

由于現實中死亡率誤差獨立同分布的假設通常不成立,故本文采用勃朗恩斯等去除了εx,t同方差的假定[2],提出用極大似然法來進行參數估計。該方法假設死亡人數dx,t服從參數為λx,t的泊松分布,即dx,t~Poisson(mx,tEx,t),其中λx,t=mx,tEx,t,mx,t=exp(αx+ktβx),Ex,t表示t時刻年齡為x的暴露人數。傳統Lee-Carter模型的極大似然函數可表達為:

L(αx,βx,kt)=∑x,t[dx,t(αx+ktβx)-Ex,teαx+ktβx]+C

(3)

(4)

(5)

(6)

三、ARIMA方法預測死亡率

1.數據來源與參數估計結果

圖1 1971—2020年中國香港男性死亡率三維圖

本文采用1971—2020年香港男性分年齡組死亡率、死亡人口以及暴露人口的數據,參照簡易生命表和已有文獻的年齡分組,將香港男性數據分為19個年齡組(即0—4歲、5—9歲、……、85—89歲以及90歲及以上),其中每個年齡組的死亡率數據采用5年死亡率數據的算數平均。數據來源于人類死亡率數據庫(Huamn Mortality Database)和香港特別行政區政府統計處。根據這些數據繪制了分年齡組死亡率三維圖,如圖1所示。

從圖1中能夠看出每一個年齡組的死亡率都呈現出普遍下降的趨勢,這符合死亡率正在逐漸降低的社會環境,但降低的程度在每個年齡組都有著差異。接下來將對死亡率模型的參數進行估計、擬合和預測。

選取1971—2018年香港男性完整死亡率數據,采用極大似然法運用R軟件進行參數估計,得到Lee-Carter模型的參數估計值如圖2所示。

圖2 Lee-Carter模型參數的估計值

從圖2可以看出,參數αx表示年齡因素對死亡率的影響,這一影響隨著年齡的增長呈現出了先下降后上升的趨勢;βx隨著年齡的增加而逐漸下降,且低年齡組和高年齡組βx值下降幅度相對較大,表明這兩個年齡段對死亡率時間因子變化的敏感度相對較高;而參數kt的估計值隨著時間的推移表現出顯著的遞減趨勢。

2.死亡率預測

本文利用1971—2018年的香港男性死亡率數據,對模型進行擬合,并根據上述參數估計結果,采用ARIMA(0,1,1)模型預測2019、2020年的kt值(見圖3)。

根據kt的預測值和式(1),可以得到2019—2020年香港男性分年齡組人口的死亡率預測值,結果如表1所示。

四、ARIMA-LSTM方法預測死亡率

1.LSTM模型介紹

圖3 時間項kt的預測值

長短期記憶深度學習神經網絡(Long Short-Term Memory,LSTM)是一種改良過的循環神經網絡,因其能夠有效解決長時間依賴問題,被廣泛應用于時間序列的預測。LSTM神經網絡的數據流向和傳遞過程如圖4所示。

表1 基于ARIMA方法的2019—2020年死亡率預測值

(7)

其中,W表示權重,b表示模型的偏置。

圖4 LSTM神經網絡結構圖

2.建模步驟

本文引用具有長記憶性并且適用于時間序列建模的LSTM神經網絡對ARIMA模型進行修正,具體步驟如下。

(1)對獲得到的kt序列進行平穩性檢驗。首先對kt序列作圖來判斷序列是否平穩,即是否需要經過差分處理。對差分后的序列進行單位根(ADF)檢驗,若通過ADF檢驗表明差分后的序列已經平穩,則不需要進行差分處理,否則需要在此基礎上再進行差分處理。

(3)對殘差序列{eit}進行白噪聲(Ljung-Box)檢驗,若通過白噪聲檢驗說明擬合模型充分提取了原序列中的相關信息。

圖5 流程建模圖

3.死亡率預測

表2 基于ARIMA-LSTM方法的2019—2020年死亡率預測值

五、分數O-U過程對Lee-Carter模型時間項的擬合與預測

1.分數O-U過程

分數O-U過程是由分數布朗運動驅動的O-U過程,對于處理實際問題中的長記憶性有著十分普遍的應用。我們考慮以下形式的分數O-U過程來刻畫Lee-Carter模型中的時間項kt:

(8)

將式(8)離散化得到如下表達式:

(9)

2.參數估計

根據Hurst參數的研究成果[15],本文得到分數布朗運動驅動的分數O-U過程中Hurst參數H的估計:

(10)

利用二次變差法計算出σ2估計量的值:

(11)

利用機器學習方法中的遺傳算法來進行最后一個未知參數λ的估計。遺傳算法(Genetic Algorithm,GA)是一種通過模擬自然進化過程搜索最優解的方法,它克服了傳統極大似然等方法容易陷入局部極值丟失最優解的缺點,其具體步驟如下。

(1)編碼。隨機產生一個種群作為該問題的初始解,并運用合適的編碼方案對種群中的每一個個體進行編碼,如二進制編碼或實值編碼等。本文采用的編碼方式是二進制編碼,其編碼過程簡單易行,相應的交叉算子、變異算子等操作運用位運算即可實現。

(4)交叉與變異。交叉是將隨機配對的兩個個體相互交換本體中的部分基因,其主要的方法有單點交叉、多點交叉等,本文采用多點交叉法,交叉點根據交叉概率隨機選取。變異是指個體上的某些基因發生改變,主要的變異方法有基本位變異、均勻變異等。本文采用基本位變異法,根據變異的概率隨機確定每個個體想要發生變異的基因點位,然后將二進制編碼中的“1”變為“0”,“0”變為“1”。

表3 分數布朗運動驅動的分數O-U過程的參數估計值

表4 基于分數布朗運動驅動的O-U過程的2019—2020年死亡率預測值

(5)參數選擇(交叉概率、變異概率、種群規模、迭代次數)。遺傳算法中,參數的選擇是否合理將直接影響模型的精度和有效性。本文通過多次試驗后,選取交叉概率為0.6,變異概率為0.1,種群規模為50,遺傳算法迭代次數為500。

利用PYTHON實現上述遺傳算法代碼編程,可得分數布朗運動驅動的O-U過程的參數估計值如表3所示。

3.死亡率預測

將分數布朗運動驅動的O-U過程的參數估計值代入其離散表達式(9),可以對2019—2020年的香港分年齡組的死亡率進行預測,預測結果如表4所示。

六、短期預測結果比較

根據上述預測結果,結合2019—2020年真實死亡率數據的對比圖(見圖6)發現,2019年和2020年,80歲以下三種模型預測的死亡率均表現出較好的預測效果,而80歲以上死亡率的預測值與真實值之間存在較小偏差。

圖6 2019—2020年死亡率數值對比圖

為進一步評估三種方法的預測效果,本文選用殘差圖以及三個評價指標對預測值進行綜合比較,并選擇出相對最優的預測方法。

1.殘差圖檢驗

由于三種預測方法得到的死亡率預測值與真實值之間均存在一定的差異,故本文通過考察分年齡組的死亡率殘差圖(見圖7)來初步評估三種方法的預測效果。圖7顯示,60歲以下三種方法的死亡率殘差值均位于0線附近,且并未表現出明顯差異,表明該年齡段內,三種方法的預測效果較為穩定且精度較高;高年齡組的預測殘差值差異較為明顯,整體上ARIMA-LSTM方法的短期預測表現相對最好,傳統的ARIMA方法次之。

圖7 2019—2020年死亡率殘差對比圖

2.評價指標檢驗

為了進一步比較三種方法的預測效果,本文引入平均絕對百分比誤差(MAPE)、均方誤差(MSE)和平均絕對誤差(MAE)三個評價指標來評價模型的預測效果。

(12)

(13)

(14)

表5 三種方法預測精度對比

七、結論

本文采用中國香港1971—2020年男性分年齡組數據,在Lee-Carter模型的基礎上,提出了兩種改進方法對模型中時間項進行擬合和預測。第一種是引入機器學習LSTM模型,在Lee-Carter模型中時間項kt用離散ARIMA模型擬合的基礎上,運用LSTM來修正其殘差并進行死亡率短期預測。第二種是引入分數布朗運動驅動的O-U過程來刻畫Lee-Carter模型中時間項kt,通過遺傳算法來估計分數O-U過程中的未知參數并進行死亡率短期預測。

將本文提出的兩種改進方法與傳統ARIMA方法的預測效果作對比,結合預測殘差圖發現,60歲以下三種方法的死亡率殘差值基本位于0線附近,而高年齡組的殘差值表現出較大差異,整體上ARIMA-LSTM方法的殘差值明顯低于其他兩種方法,表明ARIMA-LSTM方法的短期預測效果相對較好。

最后引入MAPE、MSE和MAE指標進一步考察三種方法的預測效果,結果表明ARIMA-LSTM方法具有較好的短期預測能力。綜合殘差圖和評估指標,本文認為ARIMA-LSTM方法能夠更加精確地描述死亡率的短期變化,表明將機器學習方法應用于死亡率的短期預測中是切實有效的,有助于改善人口老齡化給政府和相關長壽保險機構帶來的負面影響。

在進一步的研究中,將嘗試運用ARIMA-LSTM方法對大陸的死亡率數據進行擬合預測。同時考慮到大陸死亡率數據有限且有缺失,將采用貝葉斯方法進行參數估計,該方法能夠有效減少數據質量不高帶來的不利影響。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 视频在线观看一区二区| 久久婷婷五月综合色一区二区| 欧美在线导航| 欧美午夜精品| 一级一级一片免费| 欧美日韩国产成人在线观看| 欧美啪啪一区| 国产午夜小视频| 欧美yw精品日本国产精品| 欧美精品影院| 欧美啪啪网| 久久婷婷综合色一区二区| 91久久国产综合精品| 色噜噜狠狠色综合网图区| 国产老女人精品免费视频| 国产成人精品三级| 久热99这里只有精品视频6| 国产综合在线观看视频| 欧美色视频在线| 无码网站免费观看| 欧美成人免费午夜全| 黄色网在线| 国产精品自拍合集| 亚洲精品无码日韩国产不卡| 久久无码高潮喷水| 影音先锋丝袜制服| 午夜无码一区二区三区| 一级黄色网站在线免费看| 国产精品第页| 国产日韩欧美成人| 欧美精品xx| 就去色综合| 精品一区二区三区自慰喷水| 国产福利影院在线观看| 日韩欧美国产三级| 国产无码网站在线观看| AV网站中文| www.91在线播放| 最新亚洲人成无码网站欣赏网 | 亚洲最大在线观看| 一级毛片基地| 国产99在线| 五月天综合婷婷| 国产在线观看人成激情视频| 无码AV高清毛片中国一级毛片| 国产精鲁鲁网在线视频| 伊人色在线视频| 久久国产精品夜色| 99视频在线观看免费| 国产手机在线观看| 国产高清免费午夜在线视频| 亚洲第一av网站| 国产呦精品一区二区三区下载| 亚洲一级毛片免费看| 伦伦影院精品一区| 99久久国产综合精品2020| 国产jizz| 久久国产精品77777| 97国产成人无码精品久久久| 中国一级毛片免费观看| 成年片色大黄全免费网站久久| 青青久久91| 欧美a在线视频| 亚洲精品视频网| 欧美日韩国产精品va| 少妇被粗大的猛烈进出免费视频| 亚洲欧洲日韩综合色天使| 91欧洲国产日韩在线人成| 在线一级毛片| 精品91自产拍在线| 一区二区在线视频免费观看| 亚洲综合二区| 色综合激情网| 99精品高清在线播放| 国产99在线| 一级香蕉人体视频| 亚洲午夜片| 国产一级精品毛片基地| 在线国产毛片| 囯产av无码片毛片一级| 亚洲一区二区三区在线视频| 久久久久久尹人网香蕉 |