999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于AE-LSTM 改進(jìn)模型的高齡人口死亡率預(yù)測(cè)

2022-11-05 01:43:22楊剛易艷萍孫超
關(guān)鍵詞:效果模型

楊剛 易艷萍 孫超

(湖南工商大學(xué)理學(xué)院,長(zhǎng)沙,410205)

1 引言

根據(jù)1956 年聯(lián)合國(guó)《人口老齡化及其社會(huì)經(jīng)濟(jì)后果》確定的劃分標(biāo)準(zhǔn),當(dāng)一個(gè)國(guó)家或地區(qū)65歲及以上老年人口數(shù)量占總?cè)丝诒壤^(guò)7%時(shí),則意味著這個(gè)國(guó)家或地區(qū)進(jìn)入老齡化. 1982 年維也納老齡問(wèn)題世界大會(huì),確定60 歲及以上老年人口占總?cè)丝诒壤^(guò)10%,意味著這個(gè)國(guó)家或地區(qū)進(jìn)入嚴(yán)重老齡化. 按照這個(gè)國(guó)際標(biāo)準(zhǔn),我國(guó)早在1999 年就已經(jīng)進(jìn)入老齡化社會(huì). 2020 年第七次全國(guó)人口普查結(jié)果顯示,我國(guó)60 歲及以上人口達(dá)到26402 萬(wàn)人,占總?cè)丝诘?8.70%,說(shuō)明我國(guó)人口老齡化程度很高. 國(guó)務(wù)院預(yù)計(jì)2035 年前后,我國(guó)老年人口占比將超過(guò)30%,意味著我國(guó)將進(jìn)入重度老齡化階段,這將對(duì)經(jīng)濟(jì)運(yùn)行全領(lǐng)域、社會(huì)建設(shè)各環(huán)節(jié)、社會(huì)文化多方面產(chǎn)生深遠(yuǎn)影響.

在2020 年10 月十九屆五中全會(huì)《中共中央關(guān)于制定國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和二〇三五年遠(yuǎn)景目標(biāo)的建議》綱領(lǐng)性文件中,我國(guó)提出要實(shí)施積極應(yīng)對(duì)人口老齡化的國(guó)家戰(zhàn)略.而在應(yīng)對(duì)人口老齡化帶來(lái)的多重挑戰(zhàn)中,最為艱巨的是老齡化社會(huì)面臨的長(zhǎng)壽風(fēng)險(xiǎn). 當(dāng)人口未來(lái)的平均實(shí)際壽命高于預(yù)期壽命時(shí),就會(huì)產(chǎn)生長(zhǎng)壽風(fēng)險(xiǎn),它將給政府的養(yǎng)老金保險(xiǎn),商業(yè)年金的負(fù)債評(píng)估和償付能力管理以及國(guó)家老齡事業(yè)和產(chǎn)業(yè)的發(fā)展帶來(lái)一定的挑戰(zhàn)[1]. 因此,對(duì)人口死亡率尤其是高齡人口死亡率的預(yù)測(cè)分析具有十分重要的理論價(jià)值和現(xiàn)實(shí)意義.

常用的死亡率預(yù)測(cè)模型分為靜態(tài)死亡率預(yù)測(cè)模型和動(dòng)態(tài)死亡率預(yù)測(cè)模型[2]. 靜態(tài)死亡率模型是基于死亡率歷史數(shù)據(jù)和生命表模擬歷史死亡率的變化,對(duì)歷史死亡率進(jìn)行擬合. 該方法只考慮了死亡率和年齡之間的關(guān)系,無(wú)法刻畫(huà)死亡率隨時(shí)間的動(dòng)態(tài)變化,因此難以進(jìn)行死亡率外推預(yù)測(cè). 隨后,國(guó)內(nèi)外學(xué)者相繼在靜態(tài)死亡率模型的基礎(chǔ)上考慮了時(shí)間、出生年和日歷年等因素,建立了以Lee-Carter 模型為代表的動(dòng)態(tài)死亡率預(yù)測(cè)模型. 由于動(dòng)態(tài)死亡率預(yù)測(cè)模型可廣泛應(yīng)用于長(zhǎng)壽風(fēng)險(xiǎn)度量、壽險(xiǎn)產(chǎn)品定價(jià)與長(zhǎng)壽風(fēng)險(xiǎn)管理等領(lǐng)域,因此現(xiàn)在大多數(shù)學(xué)者都采用動(dòng)態(tài)死亡率預(yù)測(cè)模型對(duì)人口死亡率進(jìn)行預(yù)測(cè).

動(dòng)態(tài)死亡率預(yù)測(cè)模型很好地解決了靜態(tài)死亡率模型無(wú)法刻畫(huà)死亡率隨時(shí)間動(dòng)態(tài)改善的缺陷,但其往往基于人口死亡率線性動(dòng)態(tài)變化的假設(shè),通過(guò)在Lee-Carter 模型的基礎(chǔ)上增加影響人口死亡率的因素,或者減少模型的參數(shù)來(lái)進(jìn)行推廣和改進(jìn),因此動(dòng)態(tài)死亡率預(yù)測(cè)模型只能刻畫(huà)影響因素與人口死亡率之間的線性關(guān)系,對(duì)人口死亡率的非線性結(jié)構(gòu)研究還存在一定的限制條件. 而在機(jī)器學(xué)習(xí)算法中,核函數(shù)以及激活函數(shù)的非線性可以實(shí)現(xiàn)數(shù)據(jù)的非線性映射,從而讓機(jī)器學(xué)習(xí)算法具備優(yōu)秀的數(shù)據(jù)非線性學(xué)習(xí)能力. 目前已有應(yīng)用機(jī)器學(xué)習(xí)算法進(jìn)行人口死亡率建模和預(yù)測(cè)的相關(guān)工作,并取得了不錯(cuò)的效果.

機(jī)器學(xué)習(xí)主要通過(guò)間接方式、直接方式兩種途徑應(yīng)用于人口死亡率預(yù)測(cè). 間接方式是以動(dòng)態(tài)死亡率預(yù)測(cè)模型為基礎(chǔ),利用機(jī)器學(xué)習(xí)算法提升人口死亡率的擬合效果和預(yù)測(cè)效果. Deprez 等(2017)[3]首先使用Lee-Carter 和RH 模型擬合瑞士人口死亡率數(shù)據(jù),然后使用回歸樹(shù)算法提升兩個(gè)隨機(jī)死亡率模型的擬合度,并對(duì)各年齡段死因進(jìn)行分析. Susanna 和Virginia(2019)[4]在回歸樹(shù)的基礎(chǔ)上,增加了隨機(jī)森林和梯度提升算法,發(fā)現(xiàn)隨機(jī)森林算法能夠更有效地提升人口死亡率的擬合度. 汪志偉(2021)[5]將長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)(LSTM)算法與其它擬合精度算法進(jìn)行比較,研究表明LSTM 算法擬合效果提升更大. 在此類研究中,機(jī)器學(xué)習(xí)算法雖然能夠在隨機(jī)死亡率模型的基礎(chǔ)上提升人口死亡率擬合效果,但對(duì)人口死亡率的研究依然局限于死亡率線性動(dòng)態(tài)的假設(shè).

而直接方式是利用機(jī)器學(xué)習(xí)算法建立死亡率預(yù)測(cè)模型對(duì)人口死亡率數(shù)據(jù)直接進(jìn)行擬合預(yù)測(cè).Hainaut(2018a)[6],張連增等(2020)[7]用非線性時(shí)變函數(shù)替代隨機(jī)死亡率Lee-Carter 模型中線性交互部分,提出了神經(jīng)網(wǎng)絡(luò)死亡率模型,并通過(guò)帶漂移項(xiàng)的隨機(jī)游走模型進(jìn)行預(yù)測(cè),發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)死亡率模型性能優(yōu)于Lee-Carter 模型. 陳寧(2019)[8]通過(guò)在輸入的人口死亡率數(shù)據(jù)中加入噪聲建立降噪自編碼器,對(duì)我國(guó)人口死亡率數(shù)據(jù)進(jìn)行擬合預(yù)測(cè),研究發(fā)現(xiàn)降噪自編碼器的預(yù)測(cè)結(jié)果整體上優(yōu)于Lee-Carter 模型. 機(jī)器學(xué)習(xí)算法主要通過(guò)提高人口死亡率的擬合優(yōu)度提升人口死亡率模型預(yù)測(cè)的整體性能,但對(duì)時(shí)間因子進(jìn)行預(yù)測(cè)依然停留在傳統(tǒng)的時(shí)間序列模型.

綜上所述,目前針對(duì)人口死亡率的預(yù)測(cè)模型仍可以進(jìn)一步優(yōu)化. 首先,人口死亡率非線性結(jié)構(gòu)的刻畫(huà)仍需進(jìn)一步深化. 目前國(guó)內(nèi)外對(duì)人口死亡率神經(jīng)網(wǎng)絡(luò)算法研究相對(duì)欠缺,且大多數(shù)神經(jīng)網(wǎng)絡(luò)算法基于自編碼器進(jìn)行研究. 機(jī)器學(xué)習(xí)算法發(fā)展迅猛,一些新興的算法目前還沒(méi)有應(yīng)用于人口死亡率預(yù)測(cè)的研究領(lǐng)域. 其次,在神經(jīng)網(wǎng)絡(luò)構(gòu)建中,神經(jīng)元個(gè)數(shù)、網(wǎng)絡(luò)深度、激活函數(shù)以及目標(biāo)函數(shù)等這些超參數(shù)的選擇決定了神經(jīng)網(wǎng)絡(luò)對(duì)人口死亡率的擬合效果,而超參數(shù)選擇的主觀性和隨意性,容易導(dǎo)致研究結(jié)論過(guò)于片面. 針對(duì)人口死亡率神經(jīng)網(wǎng)絡(luò)的超參數(shù)選擇目前還沒(méi)有形成相對(duì)成熟的方法.

由于人口死亡率數(shù)據(jù)屬于多元時(shí)間序列,人口死亡率預(yù)測(cè)為多變量時(shí)間序列預(yù)測(cè). 受許奕杰等(2020)[9]工作的啟發(fā),本文建立一個(gè)AE-LSTM 改進(jìn)模型,利用自編碼器(AE)模型自我學(xué)習(xí)的特性,在AE-LSTM 模型的基礎(chǔ)上增加AE 模型的解碼過(guò)程,使得該模型能夠?qū)崿F(xiàn)從單一變量預(yù)測(cè)到多元時(shí)間序列預(yù)測(cè)的轉(zhuǎn)換. 相對(duì)于全人口死亡率模型,高齡人口死亡率預(yù)測(cè)的研究對(duì)我國(guó)積極應(yīng)對(duì)人口老齡化風(fēng)險(xiǎn)具有更加重要的戰(zhàn)略意義,因此,本文選取我國(guó)大陸1994-2018 年60-89 歲高齡人口總體死亡率作為樣本數(shù)據(jù)進(jìn)行實(shí)證分析.

2 模型建立

2.1 CBD 模型

CBD 模型又稱雙因素死亡率模型,在Lee-Carter 模型中,不同年齡之間的死亡率完全相關(guān),因此Currie 等(2006)[10]提出了CBD 模型彌補(bǔ)這一缺陷,其表達(dá)形式為:

其中,φi為回歸參數(shù),Li表示i階滯后算子,Δdkt表示對(duì)kt作d次一階差分,p為自相關(guān)項(xiàng)數(shù),α是漂移項(xiàng),θi為滑動(dòng)平均參數(shù),q為滑動(dòng)平均項(xiàng)數(shù),μt表示均值為零、方差確定的白噪聲過(guò)程.

2.2 AE-LSTM 改進(jìn)模型

2.2.1 AE-LSTM 模型

Rumelhart 等(1986)[12]提出自動(dòng)編碼器的概念,并將其用于高維復(fù)雜數(shù)據(jù)處理. AE 模型是以輸入信息為學(xué)習(xí)目標(biāo),旨在將輸入信息復(fù)制到輸出,其常用于高維數(shù)據(jù)的非線性降維和特征學(xué)習(xí).AE 模型主要分為編碼和解碼兩個(gè)部分,各層神經(jīng)元通過(guò)權(quán)重和激活函數(shù)連接. 編碼過(guò)程就是通過(guò)兩次非線性轉(zhuǎn)換將原數(shù)據(jù)的維數(shù)減少. 解碼過(guò)程則是通過(guò)兩次非線性轉(zhuǎn)換將低維數(shù)據(jù)映射到原高維數(shù)據(jù),實(shí)現(xiàn)降維數(shù)據(jù)到原數(shù)據(jù)的還原. AE 模型的提出促進(jìn)了人工神經(jīng)網(wǎng)絡(luò)的發(fā)展.

循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一類用來(lái)處理時(shí)間序列的機(jī)器學(xué)習(xí)算法. Hochreiter 等(1997)[13]對(duì)一般RNN 進(jìn)行改進(jìn),提出了LSTM 模型. LSTM 模型的基本單元為記憶模塊,相對(duì)于一般RNN 只有簡(jiǎn)單的tanh 層的重復(fù)模塊,LSTM 包含了四個(gè)神經(jīng)網(wǎng)絡(luò)層,包括細(xì)胞狀態(tài)、忘記門(mén)、輸入門(mén)和輸出門(mén). LSTM 模型的提出解決了一般RNN 存在的長(zhǎng)期依賴問(wèn)題,它可以處理和預(yù)測(cè)事件序列中時(shí)間間隔和延遲比較長(zhǎng)的重要事件,將遠(yuǎn)距離的上下文信息運(yùn)用到當(dāng)前時(shí)刻.

AE-LSTM 模型是一個(gè)混合神經(jīng)網(wǎng)絡(luò),由上述兩部分組成. 第一部分為AE 模型的編碼部分,其主要作用是對(duì)原始數(shù)據(jù)進(jìn)行特征提取. 第二部分為L(zhǎng)STM 模型,其主要作用是對(duì)AE 模型提取的特征數(shù)據(jù)進(jìn)行時(shí)間序列預(yù)測(cè),并通過(guò)在LSTM 網(wǎng)絡(luò)最后一層加入SoftMax 層,實(shí)現(xiàn)分類數(shù)據(jù)的預(yù)測(cè),AE-LSTM 模型的結(jié)構(gòu)如圖1 所示.

圖1 AE-LSTM 模型結(jié)構(gòu)示意圖

設(shè)Xi(t) 表示第i個(gè)屬性在時(shí)間t時(shí)的取值, 則樣本矩陣可以表示為:X(t) =(X1(t),X2(t),··· ,Xn(t))T. AE-LSTM 模型通過(guò)以下步驟實(shí)現(xiàn).

第一步: 將原始數(shù)據(jù)X(t)輸入AE 模型進(jìn)行訓(xùn)練,利用編碼過(guò)程計(jì)算得到編碼數(shù)據(jù):

其中,fdec(·)為解碼函數(shù),fenc(·)為編碼函數(shù), ?X(t)表示AE 模型對(duì)原始數(shù)據(jù)的擬合結(jié)果.

第二步: 將編碼數(shù)據(jù)輸入到LSTM 模型中得到因變量輸出值?y(t):

其中,fLST M(·) 為L(zhǎng)STM 函數(shù), 最終通過(guò)比較模型輸出值?y(t) 和實(shí)際值y(t) 之間的差距, 評(píng)價(jià)AE-LSTM 模型的性能.

2.2.2 AE-LSTM 改進(jìn)模型

在上述的AE-LSTM 模型中,主要利用AE 模型對(duì)多維自變量降維,LSTM 模型實(shí)現(xiàn)對(duì)單一因變量的精準(zhǔn)預(yù)測(cè). 由于在本研究中死亡率數(shù)據(jù)屬于多元時(shí)間序列,自變量和因變量的數(shù)據(jù)集相同,對(duì)人口死亡率的預(yù)測(cè)不再是對(duì)單一因變量預(yù)測(cè),而是對(duì)多變量預(yù)測(cè). 因此,本文提出一個(gè)AE-LSTM改進(jìn)模型,在原AE-LSTM 模型的基礎(chǔ)上,增加AE 模型的解碼過(guò)程,在完成單一時(shí)間序列預(yù)測(cè)的基礎(chǔ)下,實(shí)現(xiàn)多變量預(yù)測(cè). 改進(jìn)后的AE-LSTM 模型具體結(jié)構(gòu)如圖2 所示:

圖2 AE-LSTM 改進(jìn)模型結(jié)構(gòu)示意圖

本文的輸入變量X(t)表示對(duì)數(shù)死亡率,具體形式為:

其中,lnmx,t表示在第t年x歲的人群的對(duì)數(shù)死亡率. AE-LSTM 改進(jìn)模型的實(shí)現(xiàn)步驟如下:

第一步: 與式(2.1)相同,首先輸入歸一化處理之后的對(duì)數(shù)死亡率數(shù)據(jù)對(duì)AE 模型進(jìn)行訓(xùn)練,通過(guò)編碼過(guò)程得到潛在時(shí)間因子K(t).

第二步: 假設(shè)上一步驟得到的潛在時(shí)間因子K(t)滯留時(shí)間步長(zhǎng)為q,將其輸入LSTM 模型中進(jìn)行擬合預(yù)測(cè),得到預(yù)測(cè)值?K(t):

第三步: 將LSTM 的預(yù)測(cè)值?K(t)輸入到第一步AE 模型訓(xùn)練得到的解碼過(guò)程,得到人口死亡率的預(yù)測(cè)值?X(t):

上述改進(jìn)的AE-LSTM 改進(jìn)人口死亡率模型主要具有以下優(yōu)點(diǎn):

①AE 部分是一個(gè)輸入和學(xué)習(xí)目標(biāo)相同的神經(jīng)網(wǎng)絡(luò),這種學(xué)習(xí)特性使得該模型能夠應(yīng)用于多元時(shí)間序列數(shù)據(jù)預(yù)測(cè),即通過(guò)解碼器對(duì)時(shí)間序列模型得到的預(yù)測(cè)值進(jìn)行解碼可以實(shí)現(xiàn)未來(lái)的人口死亡率預(yù)測(cè);

②LSTM 部分能夠處理時(shí)間序列數(shù)據(jù)的長(zhǎng)記憶性,可以對(duì)潛在時(shí)間因子進(jìn)行更加精準(zhǔn)地?cái)M合和外推;

③AE-LSTM 改進(jìn)模型中非線性激活函數(shù)以及神經(jīng)網(wǎng)絡(luò)的多層設(shè)計(jì)可以替代傳統(tǒng)隨機(jī)動(dòng)態(tài)死亡率預(yù)測(cè)模型中的線性交互部分,捕捉到人口死亡率中的非線性部分,同時(shí)又解除隨機(jī)動(dòng)態(tài)死亡率預(yù)測(cè)模型中對(duì)系數(shù)的約束,能夠更多地學(xué)習(xí)到人口死亡率的變化.

2.3 數(shù)據(jù)描述

2.3.1 數(shù)據(jù)來(lái)源

本文選取中國(guó)大陸1994-2018 年60-89 歲高齡人口分年齡總體死亡率數(shù)據(jù)進(jìn)行實(shí)證分析,選取日本1947-2018 年60-89 歲高齡人口分年齡死亡率數(shù)據(jù)對(duì)本文提出的模型進(jìn)行魯棒性檢驗(yàn). 其中中國(guó)大陸人口死亡率數(shù)據(jù)來(lái)源于《中國(guó)人口統(tǒng)計(jì)年鑒》和《中國(guó)人口和就業(yè)統(tǒng)計(jì)年鑒》. 中國(guó)大陸的死亡率數(shù)據(jù)是由人口抽樣得到,其中2000 年和2010 年為普查數(shù)據(jù),2005 年和2015 年為1%人口抽樣調(diào)查,其余各年為1‰人口抽樣調(diào)查. 日本死亡率數(shù)據(jù)來(lái)源于人類死亡率數(shù)據(jù)庫(kù)HMD(Human Mortality Database)1人類死亡數(shù)據(jù)庫(kù)由美國(guó)加州大學(xué)伯克利分校人口系和德國(guó)羅斯托克普朗克人口研究所于2002 年共同建立, 網(wǎng)址https://www.mortality.org.

2.3.2 數(shù)據(jù)處理

針對(duì)中國(guó)大陸1996 年85-89 歲人群的死亡率缺失數(shù)據(jù),本文運(yùn)用鄰近線性插值法對(duì)暴露人數(shù)和死亡率人數(shù)缺失值進(jìn)行數(shù)據(jù)補(bǔ)充,間接獲取死亡率數(shù)據(jù). 考慮到數(shù)據(jù)的可比性,本文通過(guò)對(duì)非普查年份的暴露人數(shù)和死亡人數(shù)進(jìn)行線性變換,暴露人數(shù)的線性變換公式為:

本文對(duì)中國(guó)大陸死亡率數(shù)據(jù)和日本死亡率數(shù)據(jù)進(jìn)行對(duì)數(shù)化處理. 為了提高模型的預(yù)測(cè)精度和收斂速度,對(duì)數(shù)死亡率需要進(jìn)一步歸一化處理,將每一年的對(duì)數(shù)死亡率線性轉(zhuǎn)換至0-1. 對(duì)于每一年t,其歸一化公式為:

2.3.3 描述性分析

本文給出了經(jīng)過(guò)數(shù)據(jù)處理之后的中國(guó)大陸1994-2018 年60-89 歲高齡人口風(fēng)險(xiǎn)暴露人數(shù)、死亡人數(shù)和死亡率分布情況,如圖3 所示.

圖3(a)給出了各個(gè)年齡在不同年份中風(fēng)險(xiǎn)暴露人數(shù)的分布情況. 可以發(fā)現(xiàn),隨著年齡的增加,風(fēng)險(xiǎn)暴露人數(shù)越來(lái)越少,符合社會(huì)人類生存規(guī)律. 對(duì)于同一年齡的風(fēng)險(xiǎn)暴露人數(shù)雖然隨著時(shí)間的變化會(huì)出現(xiàn)不同程度的波動(dòng),但總體趨勢(shì)還是在不斷地增加. 圖3(b)給出了死亡人數(shù)的分布情況. 可以發(fā)現(xiàn),在75 歲左右死亡人數(shù)出現(xiàn)高峰,60 歲到75 歲之前,死亡人數(shù)隨著年齡的增加而增加,75歲之后,死亡人數(shù)隨著年齡的增加而下降,主要原因?yàn)?5 歲以后風(fēng)險(xiǎn)暴露人數(shù)的減少,使得死亡人數(shù)減少. 從時(shí)間維度看,不同年齡的死亡人數(shù)隨著時(shí)間的推移呈現(xiàn)波動(dòng)式增加的趨勢(shì). 圖3(c)展示了死亡率的分布規(guī)律. 可以看到,60-75 歲死亡率波動(dòng)較小,75-89 歲死亡率波動(dòng)較大,其波動(dòng)主要是因?yàn)轱L(fēng)險(xiǎn)暴露人數(shù)的數(shù)量少以及一些不可抗拒的環(huán)境因素發(fā)生等影響,如2003 年SARS 盛行導(dǎo)致人口死亡率出現(xiàn)小高峰. 圖3(d)分別給出了60 歲、70 歲和80 歲老年人死亡率隨時(shí)間推移的變化趨勢(shì). 從圖中可以看出,三個(gè)年齡死亡率都呈現(xiàn)下降的趨勢(shì),其中年齡越高,死亡率下降的速度越快,波動(dòng)性也越大,從中也可以看出對(duì)高年齡段死亡率的預(yù)測(cè)是建立死亡率預(yù)測(cè)模型的重點(diǎn).

圖3 中國(guó)大陸1994-2018 年60-89 歲人口數(shù)據(jù)分布

3 實(shí)證分析

3.1 AE 模型與CBD 模型擬合效果對(duì)比分析

本文樣本數(shù)據(jù)量相對(duì)較少,對(duì)死亡率模型的建立具有一定的挑戰(zhàn)性. 對(duì)于神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)節(jié)點(diǎn)的增加可以增加神經(jīng)網(wǎng)絡(luò)的擬合效果. 就AE 模型而言,網(wǎng)絡(luò)太深使得特征壓縮過(guò)多,會(huì)損失更多的原始信息,且容易出現(xiàn)過(guò)度擬合現(xiàn)象,因此本文借鑒張連增等(2020)[7]的研究成果,建立五層自編碼神經(jīng)網(wǎng)絡(luò)對(duì)中國(guó)高齡死亡率數(shù)據(jù)進(jìn)行擬合. 由于每一年存在30 個(gè)死亡率數(shù)據(jù),所以輸入層神經(jīng)元個(gè)數(shù)為30,輸出層神經(jīng)元個(gè)數(shù)也為30. 設(shè)隱藏層一和隱藏層三的神經(jīng)元個(gè)數(shù)都為15;為與CBD 模型進(jìn)行對(duì)比,隱藏層二的神經(jīng)元個(gè)數(shù)設(shè)為2. 該AE 模型中連接五層神經(jīng)元之間的激活函數(shù)分別設(shè)定為tanh 函數(shù)、linear 函數(shù)、tanh 函數(shù)和sigmoid 函數(shù).

選取1994-2014 年60-89 歲分年齡死亡率數(shù)據(jù)作為訓(xùn)練集對(duì)五層AE 模型進(jìn)行訓(xùn)練, 利用2015-2018 年60-89 歲分年齡死亡率數(shù)據(jù)作為測(cè)試集檢驗(yàn)?zāi)P偷姆€(wěn)定性. 本文借鑒棧式自編碼器訓(xùn)練權(quán)重的方法,首先通過(guò)對(duì)單個(gè)三層AE 模型預(yù)訓(xùn)練獲取各層網(wǎng)絡(luò)的初始權(quán)重,再對(duì)整個(gè)五層AE 模型微調(diào)得到最終最優(yōu)模型. 步驟如下.

第一步: 訓(xùn)練第一個(gè)自編碼器. 首先建立輸入層和輸出層神經(jīng)元個(gè)數(shù)都為30,隱藏層神經(jīng)元個(gè)數(shù)為20 的三層自編碼器. 將對(duì)數(shù)死亡率輸入該模型進(jìn)行訓(xùn)練,通過(guò)觀察訓(xùn)練集和測(cè)試集的模型損失曲線,最終確定當(dāng)樣本數(shù)據(jù)對(duì)模型訓(xùn)練次數(shù)epoch=5000 時(shí),訓(xùn)練集和測(cè)試集的擬合效果最佳,同時(shí)將得到的各層之間權(quán)重作為輸入層到隱藏層一和隱藏層四到隱藏層五之間的初始權(quán)重;

第二步: 訓(xùn)練第二個(gè)自編碼器. 將步驟一的降維結(jié)果輸入到輸入層和輸出層神經(jīng)元個(gè)數(shù)都為20,隱藏層神經(jīng)元個(gè)數(shù)為2 的三層自編碼器,對(duì)其訓(xùn)練5000 次,得到隱藏層二到隱藏層三和隱藏層三到隱藏層四之間的初始權(quán)重.

第三步: 微調(diào). 利用前兩個(gè)步驟得到的初始權(quán)重代入五層AE 模型訓(xùn)練500 次,得到最終訓(xùn)練完成的五層AE 模型.

此次訓(xùn)練均將均方誤差(MSE) 作為評(píng)價(jià)模型損失的關(guān)鍵指標(biāo). 所用的優(yōu)化算法是結(jié)合AdaGrad 和RMSProp 方法最佳屬性的Adam 算法,通過(guò)python3.7 軟件,在TensorFlow2.1 平臺(tái)實(shí)現(xiàn). 圖4 為微調(diào)過(guò)程中訓(xùn)練集和測(cè)試集的模型損失隨訓(xùn)練次數(shù)增加的變化. 可以看到,訓(xùn)練集和測(cè)試集的損失下降幅度幾乎相同且接近于0. 訓(xùn)練集的損失接近于0,說(shuō)明該自編碼器都能很好地學(xué)習(xí)到我國(guó)高齡人口死亡率的數(shù)據(jù)特征. 測(cè)試集的損失接近于0,說(shuō)明該模型具有很強(qiáng)的魯棒性和泛化性,能夠?qū)λ劳雎蔬M(jìn)行預(yù)測(cè).

圖4 AE 模型損失

CBD 模型是目前應(yīng)用范圍最廣的高齡人口死亡率模型. 本文根據(jù)高齡人口死亡率訓(xùn)練集數(shù)據(jù)建立相應(yīng)的CBD 模型,并用最大似然估計(jì)法對(duì)模型參數(shù)進(jìn)行估計(jì). 圖5 和圖6 分別展示了AE 模型和CBD 模型對(duì)1994-2014 年60 歲、70 歲和80 歲死亡率數(shù)據(jù)的擬合效果. 兩個(gè)模型都可以很好擬合低年齡段的死亡率變化趨勢(shì). 隨著年齡的升高,死亡率波動(dòng)越來(lái)越頻繁,擬合效果越來(lái)越不理想. 對(duì)比兩個(gè)模型的擬合效果發(fā)現(xiàn)AE 模型相對(duì)于CBD 模型能夠反應(yīng)死亡率隨時(shí)間的波動(dòng),CBD模型則能夠較好地反應(yīng)死亡率的平均趨勢(shì).

圖5 CBD 模型擬合圖

圖6 AE 模型擬合圖

表1 展示了對(duì)兩個(gè)模型判斷擬合效果的絕對(duì)評(píng)價(jià)指標(biāo)MSE 和相對(duì)評(píng)價(jià)指標(biāo)平均百分比誤差(MAPE)的比較結(jié)果. 可以看出,兩個(gè)模型都具有較好的擬合效果,但無(wú)論從MSE 還是MAPE 的結(jié)果都可以發(fā)現(xiàn),AE 模型的兩個(gè)評(píng)價(jià)指標(biāo)都小于CBD 模型對(duì)應(yīng)的評(píng)價(jià)指標(biāo),說(shuō)明AE 模型的擬合效果相對(duì)較優(yōu).

表1 CBD 模型和AE 模型擬合指標(biāo)

3.2 LSTM 模型與ARIMA 模型預(yù)測(cè)效果對(duì)比分析

在前人的研究中,大多數(shù)學(xué)者使用隨機(jī)游走過(guò)程對(duì)時(shí)間因子進(jìn)行擬合和外推,以達(dá)到對(duì)未來(lái)死亡率進(jìn)行預(yù)測(cè)的目的. 在機(jī)器學(xué)習(xí)算法中,循環(huán)神經(jīng)網(wǎng)絡(luò)也常用于處理時(shí)間序列數(shù)據(jù). 本文建立LSTM 模型對(duì)時(shí)間因子進(jìn)行擬合和預(yù)測(cè).

本文使用三層LSTM 模型對(duì)死亡率進(jìn)行預(yù)測(cè),其中隱藏神經(jīng)元個(gè)數(shù)分別為20,50,30. 第一層的輸出作為第二層神經(jīng)網(wǎng)絡(luò)的輸入,第二層神經(jīng)網(wǎng)絡(luò)的輸出作為第三層網(wǎng)絡(luò)的輸入,各層激活函數(shù)分別使用linear 函數(shù)、sigmoid 函數(shù)以及tanh 函數(shù),模型損失使用MSE 衡量,優(yōu)化算法使用Adam算法.

通過(guò)AE 模型的編碼過(guò)程可以得到兩個(gè)潛在時(shí)間因子的訓(xùn)練集和測(cè)試集. 在利用LSTM 模型分別對(duì)時(shí)間因子進(jìn)行預(yù)測(cè)之前,先對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行整理. 由于整體數(shù)據(jù)量較少,因此,本文設(shè)定時(shí)間因子滯留時(shí)間步長(zhǎng)q= 2,即利用前兩個(gè)數(shù)據(jù)來(lái)預(yù)測(cè)第三個(gè)數(shù)據(jù)的數(shù)值,其K1(t)劃分結(jié)構(gòu)如表2 所示,K2(t)劃分結(jié)構(gòu)與K1(t)相同.

表2 時(shí)間因子樣本劃分

為得到LSTM 模型的初始權(quán)重,本文先對(duì)LSTM 模型進(jìn)行預(yù)訓(xùn)練,選出預(yù)訓(xùn)練損失最小的權(quán)重作為模型的初始權(quán)重,最后對(duì)LSTM 模型進(jìn)行微調(diào)得到最終最優(yōu)模型,其步驟如下.

第一步: 確定預(yù)訓(xùn)練參數(shù)epoch. 這里,epoch 為全部樣本數(shù)據(jù)對(duì)模型進(jìn)行完整訓(xùn)練的次數(shù). 因?yàn)長(zhǎng)STM 模型計(jì)算復(fù)雜度較高,耗時(shí)較長(zhǎng),對(duì)其進(jìn)行預(yù)訓(xùn)練時(shí),應(yīng)在保證模型效果的同時(shí)盡量減小epoch 的數(shù)值. 將時(shí)間因子輸入LSTM 模型,通過(guò)觀察訓(xùn)練集的模型損失曲線,發(fā)現(xiàn)訓(xùn)練次數(shù)epoch=10 時(shí),損失曲線最終趨于0 且逐漸平穩(wěn),能夠較好地保證LSTM 模型的擬合效果.

第二步: 獲取最優(yōu)初始權(quán)重. 將時(shí)間因子K1(t)輸入對(duì)LSTM 模型訓(xùn)練重復(fù)500 次,epoch 設(shè)定為步驟一得到的數(shù)值10,選取模型損失最小的權(quán)重作為L(zhǎng)STM 模型的初始權(quán)重.

第三步: 微調(diào). 基于對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練充足,同時(shí)避免過(guò)擬合現(xiàn)象的原則,確定利用步驟二得到的權(quán)重對(duì)LSTM 訓(xùn)練100 次,得到最終LSTM 模型.

對(duì)于時(shí)間因子K2(t)的LSTM 模型采用相同的步驟訓(xùn)練得到. 最終K1(t)和K2(t)模型損失程度隨模型訓(xùn)練次數(shù)變化如圖7 和圖8 所示. 可以看到整體模型的損失越來(lái)越小,且接近于0,說(shuō)明模型能夠很好地?cái)M合數(shù)據(jù).

圖7 K1-LSTM 模型損失

圖8 K2-LSTM 模型損失

本文使用傳統(tǒng)的ARIMA 模型對(duì)相同的訓(xùn)練集和測(cè)試集進(jìn)行擬合和預(yù)測(cè), 使用R 軟件對(duì)兩個(gè)時(shí)間因子分別建立隨機(jī)游走模型,利用MSE 和MAPE 評(píng)價(jià)兩個(gè)模型的擬合和預(yù)測(cè)情況. 對(duì)比結(jié)果如表3 所示. 可以看到,無(wú)論是K1(t)還是K2(t),LSTM 模型各個(gè)擬合效果指標(biāo)都低于傳統(tǒng)的ARIMA 模型相應(yīng)的指標(biāo),說(shuō)明LSTM 模型的擬合精度高于ARIMA 模型. 從預(yù)測(cè)的結(jié)果來(lái)看,LSTM 模型的預(yù)測(cè)誤差依然比ARIMA 模型更小,預(yù)測(cè)結(jié)果更加準(zhǔn)確. 從整體情況來(lái)看,LSTM 模型優(yōu)于ARIMA 模型.

表3 ARIMA 模型和LSTM 模型指標(biāo)對(duì)比

3.3 AE-LSTM 改進(jìn)模型與CBD 模型預(yù)測(cè)效果對(duì)比分析

利用訓(xùn)練后五層AE 模型的解碼器對(duì)LSTM 模型輸出的K1(t)和K2(t)預(yù)測(cè)值進(jìn)行解碼,得到我國(guó)大陸高齡人口死亡率的預(yù)測(cè)值. 同時(shí)本文基于傳統(tǒng)CBD 模型和ARIMA 模型對(duì)我國(guó)大陸高齡人口死亡率進(jìn)行預(yù)測(cè),選取MSE 和MAPE 評(píng)價(jià)指標(biāo)對(duì)比AE-LSTM 改進(jìn)模型與CBD 模型的預(yù)測(cè)效果.

表4 為CBD 模型和AE-LSTM 改進(jìn)模型預(yù)測(cè)效果評(píng)價(jià)指標(biāo)對(duì)比. 可以看到,AE-LSTM 改進(jìn)模型的均方誤差為0.000023,小于CBD 模型的均方誤差0.000184,且AE-LSTM 改進(jìn)模型的平均百分比誤差與CBD 模型相比下降幅度更大,下降了65%,說(shuō)明AE-LSTM 改進(jìn)模型的預(yù)測(cè)效果優(yōu)于CBD 模型.

表4 CBD 模型和AE-LSTM 改進(jìn)模型預(yù)測(cè)效果對(duì)比

圖9 展示了2015-2018 年AE-LSTM 改進(jìn)模型和CBD 模型的預(yù)測(cè)效果. 可以很明顯地看到, CBD 模型預(yù)測(cè)曲線較為平滑, 無(wú)法捕捉到死亡率的波動(dòng), 并高估了高齡人口的死亡率; 而AE-LSTM 改進(jìn)模型可以捕捉死亡率隨時(shí)間變化的波動(dòng), 且更加精準(zhǔn)地預(yù)測(cè)未來(lái)死亡率的數(shù)值.因此: AE-LSTM 改進(jìn)模型較傳統(tǒng)的人口死亡率CBD 模型預(yù)測(cè)精度有顯著提高,說(shuō)明本文建立的AE-LSTM 改進(jìn)模型具有實(shí)際意義.

圖9 CBD 模型和AE-LSTM 改進(jìn)模型預(yù)測(cè)效果對(duì)比圖

3.4 AE-LSTM 改進(jìn)模型魯棒性檢驗(yàn)

本文選取日本1947-2018 年60-89 歲高齡人口分年齡死亡率數(shù)據(jù)對(duì)AE-LSTM 改進(jìn)模型進(jìn)行魯棒性檢驗(yàn),并與CBD 模型的魯棒性進(jìn)行對(duì)比. 將1947-2009 年60-89 歲高齡人口死亡率數(shù)據(jù)作為訓(xùn)練集,2010-2018 年60-89 歲高齡人口死亡率數(shù)據(jù)作為測(cè)試集對(duì)兩個(gè)模型進(jìn)行訓(xùn)練,其中評(píng)價(jià)指標(biāo)差值是基于日本死亡率數(shù)據(jù)集得到的評(píng)價(jià)指標(biāo)與基于中國(guó)大陸死亡率數(shù)據(jù)集的評(píng)價(jià)指標(biāo)之差.

表5 為AE-LSTM 改進(jìn)模型和CBD 模型魯棒性檢驗(yàn)的對(duì)比結(jié)果. 可以看出,無(wú)論是擬合效果還是預(yù)測(cè)效果,AE-LSTM 改進(jìn)模型的MSE 和MAPE 兩個(gè)評(píng)價(jià)指標(biāo)都要低于CBD 模型相應(yīng)的評(píng)價(jià)指標(biāo),表明AE-LSTM 改進(jìn)模型在日本高齡人口死亡率數(shù)據(jù)的基礎(chǔ)上擬合效果和預(yù)測(cè)效果依然優(yōu)于CBD 模型. 與中國(guó)大陸人口死亡率的擬合效果和預(yù)測(cè)效果相比,AE-LSTM 改進(jìn)模型的評(píng)價(jià)指標(biāo)差值皆為負(fù)數(shù),說(shuō)明該模型對(duì)日本高齡人口死亡率數(shù)據(jù)擬合預(yù)測(cè)效果更好,而CBD 模型的評(píng)價(jià)指標(biāo)差值都為正數(shù),說(shuō)明CBD 模型對(duì)日本高齡人口死亡率的適應(yīng)能力相對(duì)較差. 對(duì)比兩個(gè)模型的評(píng)價(jià)指標(biāo)差值的絕對(duì)值,發(fā)現(xiàn)AE-LSTM 改進(jìn)模型的相對(duì)CBD 模型絕對(duì)值相對(duì)較低,擬合和預(yù)測(cè)效果更加穩(wěn)定. 通過(guò)魯棒性檢驗(yàn)結(jié)果可以看出,AE-LSTM 改進(jìn)模型能夠?qū)W習(xí)到不同地區(qū)的數(shù)據(jù)特點(diǎn),并進(jìn)行更加精準(zhǔn)的人口死亡率預(yù)測(cè),且預(yù)測(cè)效果更加穩(wěn)定.

表5 AE-LSTM 改進(jìn)模型和CBD 模型魯棒性檢驗(yàn)對(duì)比結(jié)果

4 結(jié)論

本文基于人口死亡率數(shù)據(jù)的多元時(shí)間序列結(jié)構(gòu),建立了一個(gè)AE-LSTM 改進(jìn)模型,對(duì)高齡人口死亡率進(jìn)行擬合和預(yù)測(cè). 通過(guò)實(shí)證分析發(fā)現(xiàn),AE-LSTM 改進(jìn)模型對(duì)死亡率的擬合和預(yù)測(cè)精度比傳統(tǒng)CBD 模型更高,且魯棒性更強(qiáng). 在人口老齡化背景下,從國(guó)家戰(zhàn)略層面上來(lái)看,本研究可以為政府制定養(yǎng)老金體系改革相關(guān)政策提供一定的決策參考. 從保險(xiǎn)公司運(yùn)營(yíng)層面來(lái)看,本研究有助于保險(xiǎn)公司有效度量和管理長(zhǎng)壽風(fēng)險(xiǎn),推動(dòng)整個(gè)保險(xiǎn)行業(yè)可持續(xù)發(fā)展.

在后期研究中,我們可以進(jìn)一步完善人口死亡率預(yù)測(cè)模型. 首先可以嘗試采用其他類型的機(jī)器學(xué)習(xí)算法探究人口死亡率的非線性結(jié)構(gòu);其次可以嘗試增加收入、就業(yè)、地區(qū)等人口壽命影響因素,提升對(duì)人口死亡率的預(yù)測(cè)效果.

猜你喜歡
效果模型
一半模型
按摩效果確有理論依據(jù)
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
迅速制造慢門(mén)虛化效果
抓住“瞬間性”效果
3D打印中的模型分割與打包
模擬百種唇妝效果
Coco薇(2016年8期)2016-10-09 02:11:50
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
3D—DSA與3D—CTA成像在顱內(nèi)動(dòng)脈瘤早期診斷中的應(yīng)用效果比較
主站蜘蛛池模板: 亚洲精品国产乱码不卡| 亚洲嫩模喷白浆| a毛片在线播放| 日本色综合网| 中国国语毛片免费观看视频| 亚洲伦理一区二区| 日韩精品毛片人妻AV不卡| 国产高清无码麻豆精品| 亚洲国产91人成在线| 国产 在线视频无码| 免费av一区二区三区在线| 尤物视频一区| 久久激情影院| 亚洲国产精品成人久久综合影院| 国产精品无码AV中文| 中文字幕 欧美日韩| 国产丝袜啪啪| 亚洲天堂网在线播放| 国产亚洲欧美另类一区二区| 91网址在线播放| 久视频免费精品6| 欧美在线黄| 在线欧美日韩国产| 国产美女精品在线| 国产视频a| 在线精品欧美日韩| 亚洲精品你懂的| 欧美日韩福利| 四虎免费视频网站| 99精品国产自在现线观看| 97一区二区在线播放| 国产免费a级片| 国产99在线| 四虎综合网| 亚洲欧美在线精品一区二区| 色窝窝免费一区二区三区 | 国产97色在线| 国产亚洲视频免费播放| 91小视频在线| 欧美第一页在线| 18禁不卡免费网站| 国产综合色在线视频播放线视| 福利在线一区| 天天综合网亚洲网站| 久久午夜夜伦鲁鲁片无码免费| 久久精品人人做人人爽电影蜜月| 亚洲天堂高清| 99九九成人免费视频精品| 国产成人一区二区| 91青青视频| 2021国产乱人伦在线播放| 2019年国产精品自拍不卡| 久久久噜噜噜| 午夜小视频在线| 小说区 亚洲 自拍 另类| 九九热视频精品在线| 亚洲精品视频免费观看| 91美女视频在线| 亚洲国产成人在线| 最新日本中文字幕| 九九香蕉视频| 国产第八页| 色综合成人| 91精品专区| 国产亚洲精品自在线| 99re热精品视频国产免费| 日韩123欧美字幕| 国产中文一区二区苍井空| 91免费国产高清观看| 激情午夜婷婷| 9966国产精品视频| 无码人妻免费| 日韩毛片免费| 日韩高清欧美| 国产门事件在线| 人妻丰满熟妇αv无码| 国产一区在线观看无码| 一本一道波多野结衣av黑人在线| 中文字幕免费播放| 在线无码九区| 久久香蕉国产线| 波多野结衣中文字幕久久|