999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于KP-RBF神經網絡的人口平均壽命預測

2018-09-04 07:51:40趙欣彤楊燕綏
統計與決策 2018年15期
關鍵詞:方法

趙欣彤,楊燕綏

(1.中國人民大學 勞動人事學院,北京 100000;2.清華大學 公共管理學院,北京 100084)

0 引言

人口平均預期壽命(以下簡稱“人均壽命”)是反映一個國家、地區的人口狀況,預測人口發展趨勢、分析人口結構、評估人口質量的重要指標,為各國政府所重視。準確、及時的人均壽命預測有助于政府決策部門科學制定養老金、醫療保障、養老服務等社會政策。人均壽命不僅受到人口出生、死亡等狹義人口學因素的影響,還是經濟、衛生、環境、教育、就業、福利等廣義人口學變量綜合作用的結果,具有高度非線性、高噪聲、低精度、低穩健性等特點,預測難度較大。基于國家大規模人口普查的人均壽命預測雖然結果準確,卻存在更新周期長、滯后性嚴重等缺陷,且需要耗費大量的人力和物力[1];傳統的標準生命表法依賴有限參數設定且受制于基礎數據來源的有限性和缺失性,且計算過程較為繁瑣;多元回歸分析法模型較為單一,尤其是當自變量因素較為復雜時,多元回歸分析法的處理難度將大大增加,導致預測精度有限。

神經網絡是常用的數據預測方法之一,具有較好的分類能力、泛化能力和逼近性能,近年來被廣泛應用于函數逼近、模式識別、數據分類等研究中[2]。羅榮桂等[3]利用BP算法實現了長江流域人口數量的預測。黃建元等[4]基于BP算法對我國人口平均壽命進行了預測研究。本文在傳統神經網絡方法的基礎上,提出了一種基于模糊K-Prototypes算法的改進RBF神經網絡方法,提高了對人口預測中復雜自變量因素的處理能力,并將KP-RBF神經網絡預測方法應用于人口平均壽命預測。對比分析了KP-RBF神經網絡與傳統BP神經網絡和CNN神經網絡的性能,發現所設計的KP-RBF方法在預測精度和穩健性方面均優于其他方法。

1 RBF神經網絡原理

經典的RBF神經網絡結構由輸入層、隱藏層和輸出層三部分組成,其本質是一個映射過程:f(x) ∶Rm→Rn,設x∈Rm為輸入向量,Ci∈Rm為基函數第i個中心節點,則每個基函數輸出值為:

其中,‖‖表示歐式距離。通常選用高斯函數作為中心點的激活函數,其函數形式為:

其中,σi為第i個中心點的寬度。RBFNN的第 j個輸出 yj(x)為:

其中,l為RBF網絡節點個數,φi(x)為第 i個輸出偏差,ω(j, i)為第 j個中心點到第i個點的權重。整體的網絡結構如圖1所示。

圖1 RBF神經網絡示意圖

2 基于K-Prototypes算法的改進RBF神經網絡

2.1 K-Prototypes算法

K-Prototypes 算法是由 Huang(1998)提出的聚類方法。傳統的神經網絡方法如RBF神經網絡、BP神經網絡等方法在進行數據預測時,對變量之間不相關或弱耦合的假設會導致樣本信息利用不充分;同時神經網絡基函數中心點選取敏感性較高,使得預測精度和穩健性容易受到影響[5,6];且傳統的聚類分析屬于硬劃分,將每個樣本強制劃分到某一類當中。這種算法并未考慮在實際情況下樣本并沒有嚴格的形態和屬性,而是存在不同程度的中介性。與傳統的聚類算法相比,K-prototypes算法最大的特點在于對非數值型屬性的距離量測改為相異度表示,能夠更好地處理混合型數據集。進一步地,模糊K-Prototypes算法是對K-Prototypes算法的有效擴展[7]。模糊K-Prototypes算法通過隸屬度函數確定聚類中心的核心對象和邊緣對象,對聚類中心進行迭代更新并進行矩陣劃分,使得目標函數最小化,進而得到較好的聚類處理效果。該方法通過擴大捕捉有效信息的方式提高處理類中邊緣對象的估計效度,以此提高模型處理異常值和缺失數據的能力。

模糊K-Prototypes算法的原理為:假定樣本 X=[x1,x2,…,xn],其中 xi=[ ]xi1,xi2,…,xim,m為屬性值個數。在對樣本X進行聚類時,需要將n個對象劃分到K個不同的類別中,聚類準則為使以下目標函數最小:

其中,α為模糊指數。當α>1時該聚類為模糊聚類,當 α=1時該聚類為硬聚類。d(xi, Ck)為數據對象 xi的差異測度,其定義如下:

此時,代價函數的函數形式變為:

進一步地,劃分矩陣的更新方法如下:

同樣地,聚類中心的更新方法如下:

對于屬性Aj( )1≤j≤p :模糊K-Prototypes算法的定義可用如下定義來描述:假定樣本是有m個屬性A1,A2,…,Am描述的一組數據對象X=[x1,x2,…,xn] ,其中 xi=[xi1,xi2,…,xim]表示數據對象xi的m個屬性值。在對xi進行聚類時,使用以下代價函數將n個對象劃分到K個不同的類別中:

上 式 中 ,C=[C1,C2,…,CK] ,其 中 Ck=[ck1,ck2,…,ckm]表示聚類k的以向量形式表示的聚類中心,是 K×n的矩陣,元素 ξki為對象xi劃分到聚類k的隸屬度,滿足以下條件:

其中,α是模糊指數。當α>1時該聚類為模糊聚類,當α=1時該聚類為硬聚類。d(xi, Ck)為數據對象xi的差異測度,其定義如下:

此時,代價函數的函數形式變為:

進一步地,劃分矩陣的更新方法如下:

同樣地,聚類中心的更新方法為:

2.2 劃分矩陣?及聚類中心Ci的確定

由于人口平均壽命預測中所涉及的自變量因素多為社會經濟因素,各變量之間存在強非線性關系。因此,在確定RBF第二層(隱藏層)中各結點的聚類中心Ci及劃分矩陣?時,使用模糊K-Prototypes算法進行聚類運算。具體算法如下:

(1)初始化聚類個數K、聚類中心C0和誤差ε,算出劃分矩陣?0;

(2)確定 Ci+1,若 | F(?t, Ct+1)-F(?t, Ct) |< ε,算法停止,返回 ?i,Ci+1;

(3)確定Ci+1,若 | F(?t+1, Ct+1)-F(?t, Ct+1) |< ε,算法停止,返回 ?i+1,Ci+1;

(4)令 i=i+1,返回第(2)步。

2.3 初始聚類中心C0的確定

在確定初始聚類中心C0時,既有研究的做法是從全樣本中隨機選取K個樣本向量作為然后進行迭代運算。由于使用K-Prototypes算法計算得出的聚類結果對C0的選取較為敏感,在運算過程中可能會導致聚類結果偏離實際[8],為提高算法估計結果的信度,本文使用一種新的挑選方法確定初始聚類中心C0。

(1)將各因素變量按如下方式進行標準化,使它們的取值變為[0 , 1]之間,從而消除不同屬性取值由量綱不同造成的差異:

其中,maxj為第 j個屬性的最大值,minj為第 j個屬性的最小值。

(3)將所有屬性分為K組,每組包含[ ]N K個數據。將剩余數據歸入最后一組中。設定初始聚類中心C0為每組中出現頻次最高的屬性值;結合(2)中得到的初始值,本文得到K個初始聚類中心為

通過上述方法,能夠確保選取的初始聚類中心的選取具有較好代表性,可以有效反映原始樣本的分布情況。

2.4 中心點寬度σi的確定

在確定初始聚類中心C0之后,中心點寬度σi可根據各聚類中心之間的歐氏距離計算確定。第i個中心點的寬度為 σi=κdi,其中,κ 為重疊系數;di=mind(Cj-Ci),其含義為第i個點中心與其他最近的點中心之間的距離。

2.5 權重值W的確定

經上述方法確定RBF各中心點的聚類中心Ci及寬度σi之后,對于任意的輸入值Pi,得到第 j個輸出值yj為:

將其寫成矩陣的形式:

給定 R∈Ru×n以及 T=(T1, T2,…,Tn)T∈ Rs×n,n 為樣本個數,T為目標矩陣,s為RBFNN的輸出維度。則權重值W*應使)達到最小,由線性最小二乘法( )LLS可求得:

其中,RT表示R的轉置,R+=(RTR )-1RT為R的偽逆。

3 實例分析

本文使用KP-RBF神經網絡方法,選取1990年、2000年、2010年我國31個省份的92組數據作為研究樣本進行實證應用。人均壽命數據來自三次全國人口普查。隨著我國經濟的增長、醫療技術的普及、營養水平的提升和公共衛生的發展,廣義的人口學變量,如社會經濟水平、經濟發展的不平衡性、文化教育水平、醫療衛生條件等社會因素,對地區人均壽命具有綜合影響。因此,參考相關研究,遵循目標性、精簡性、系統性和針對性的原則,選取人均GDP、城鄉比、文盲率、千人床位數、老年人口撫養比、性別比作為影響人口平均壽命的主要因素。由于所選數據的采樣時間跨度比較大,各因素方差較大,導致樣本分布比較合理,能夠很好地反映影響人口平均壽命的不同情況,因此所選取的各項指標構成的數據集對于檢驗人口平均壽命預測數據模型是一個很好的示例。

在數據處理時,本文隨機抽取不同組別數據中的2/3作為訓練集、1/3作為檢驗集,對省級人口平均壽命進行了擬合和檢驗。由于訓練集和檢驗集均為真實數據,因此可以認為對方法的檢驗具有較高的信度。表1給出了三種方法的預測結果的平均值對比。圖2給出了檢驗集預測結果對比圖,圖3(見下頁)為檢驗集預測殘差對比圖。從預測結果中可以看出,在相同數據支持下,三種方法的預測精度排序為KP-RBF神經網絡>CNN神經網絡>BP神經網絡,預測誤差排序為CNN神經網絡>BP神經網絡>KP-RBF神經網絡。這說明,與CNN神經網絡和BP神經網絡相比,KP-RBF方法在進行人均壽命預測時,預測精度較高,預測殘差較低。也就是說,KP-RBF的預測結果擬合度和穩健性都最高,在進行人口壽命預測時,比其他方法具有更好的穩健性。

表1 預測結果平均值對比

圖2不同算法預測結果對比圖

圖3預測殘差對比圖

得到檢驗結果并驗證其穩健性之后,本文對2016—2030年全國人口平均壽命進行了預測。自變量變化率采用過去五年平均變化率進行線性估計。基于KP-RBF神經網絡的未來15年人口平均壽命的預測結果表明,中國人口平均壽命將在2030年達到79.2歲。

4 結束語

本文基于模糊K-Prototypes算法提出了改進RBF神經網絡,將其用于人均壽命預測的研究中,并利用中國1990年以來的省級數據進行測算,給出了未來15年中國人口平均預期壽命的趨勢預測,其研究結果對于政府決策部門預測人口平均壽命、提高社會政策有效性和前瞻性具有很好的應用價值。隨著大數據和人工智能在社會科學研究中的深入和推廣,RBF神經網絡算法有望在人口預測等多個交叉學科研究中得到更為廣泛的應用,從而為社會政策的制定和優化提供更加科學的決策支持。

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 国产精品视频系列专区| 美女扒开下面流白浆在线试听| 亚洲国产综合第一精品小说| 亚洲日本中文字幕乱码中文| 国产精品露脸视频| 国产乱子伦无码精品小说| 亚洲欧美日本国产综合在线| 欧美国产菊爆免费观看| 欧美无遮挡国产欧美另类| 日韩中文无码av超清| 激情视频综合网| 国产91视频免费观看| 天堂在线视频精品| 久久国产毛片| 久久久久无码精品| 国产成人欧美| 日本影院一区| a色毛片免费视频| 亚洲无码久久久久| 欧美天堂在线| 国产激爽爽爽大片在线观看| 狠狠色香婷婷久久亚洲精品| 久久综合五月婷婷| 久久99精品久久久久久不卡| 日韩 欧美 小说 综合网 另类| 日本在线国产| 伊人激情综合网| 中文字幕免费在线视频| 中文字幕亚洲另类天堂| 国产精品美女免费视频大全| 99久久精品国产麻豆婷婷| 欧美在线中文字幕| 久久www视频| 欧洲精品视频在线观看| 国产欧美日韩资源在线观看| 岛国精品一区免费视频在线观看| 亚洲小视频网站| 99伊人精品| 无码视频国产精品一区二区| 日韩国产无码一区| 东京热av无码电影一区二区| 中日无码在线观看| 日本三区视频| 日韩精品中文字幕一区三区| 99国产在线视频| 黄色在线不卡| 欧美一级爱操视频| 国产91小视频| 中文字幕久久亚洲一区| 欧美在线三级| 国产欧美另类| 亚洲一区第一页| 老司机精品一区在线视频| 欧美啪啪网| 婷婷色中文网| 伊人国产无码高清视频| 韩国v欧美v亚洲v日本v| 免费一极毛片| 欧美性猛交一区二区三区| 91偷拍一区| 狠狠五月天中文字幕| 亚洲综合欧美在线一区在线播放| 国产免费人成视频网| 97国内精品久久久久不卡| 色偷偷一区| 制服丝袜亚洲| 久久99热66这里只有精品一| 精品伊人久久久大香线蕉欧美| 欧美日韩第三页| 国产一国产一有一级毛片视频| 2019年国产精品自拍不卡| 久久这里只精品国产99热8| 国产成人a在线观看视频| 免费中文字幕在在线不卡| 国产在线自乱拍播放| 久久综合久久鬼| 国产乱人伦AV在线A| 在线欧美日韩国产| 国产成人亚洲毛片| 亚洲成肉网| 国产成人精品18| 91精品伊人久久大香线蕉|