(1.上海理工大學管理學院,上海,200093;2.上海市民政局信息研究中心,上海,200125)
在中國“十一五規劃”過程中上海市率先提出“9073”的養老模式.這一模式受到了許多專家的認可,即90%的老年人由家庭自我照顧、7%享受社區居家養老服務、3%享受機構養老服務.西方發達國家平均有5%-15%的老年人采用機構養老,其中北歐大約為5%-12%,英國大約為10%,美國大約為20%.然而中國只有3%,甚至不足3%.同時中國社會養老服務的需求越來越大,現有的養老設施總量很難滿足日益增長的養老需求,實現社會養老資源的合理分配是亟待解決的問題之一[1-4].
陶卓霖等預測了在自然增長狀態下2020年北京市老齡人口的分布以及利用粒子群方法對養老設施的分布進行優化[5];胡蘇云等針對上海市養老服務業提出了整體的規劃與建議[6];李小云等基于養老需求為導向,預測2020年和2030年南昌市的老人人口以及分布,以及對養老設施的建議等等[8-9].以上各類研究在養老資源分配的研究方面較少.本文針對上海市的養老事業發展現狀,利用時間序列模型預測2019年和2020年上海市及各個市區的老人數,并進一步預測所需的養老床位,尋求更合適的方案實現養老資源的有效合理分配.
指數平滑法通過計算指數平滑值,結合一定的時間序列預測模型進行預測.依據平滑次數不同,可分為一次指數平滑法、二次指數平滑法、三次指數平滑法等[10].
(1)布朗單一參數線性指數平滑模型
布朗單一參數線性指數平滑模型屬于二次指數平滑法,利用平滑值對時間序列的線性趨勢進行修正,進而利用線性平滑模型進行預測[10].該模型適用于線性趨勢的時間序列預測.布朗單一參數線性指數平滑模型的數學表達式為:
(1)
(2)
(3)
(4)
ft+m=αt+btm,
(5)

(2)霍爾特雙參數線性指數平滑模型
霍爾特雙參數線性指數平滑模型屬于二次指數平滑法,該模型適合分析有增長或降低趨勢的、沒有季節性的相加的時間序列模型,并進行短期預測[10].霍爾特指數平滑法分別對時間數列的兩種因素進行平滑,公式如下:
st=αyt+(1-α)(st-1+bt-1),
(6)
bt=β(st-st-1)+(1-β)bt-1,
(7)
Ft+T=st+btT,
(8)
其中,α、β為平滑參數;yt為實際觀察值;T為預測時期數;bt為趨勢值.st為平滑值.
ARIMA模型為自回歸積分滑動平均模型,先將時間序列轉化為平穩的時間序列,然后將因變量對它的滯后值以及隨機誤差項的現值和滯后值進行回歸分析.根據原序列是否平穩以及回歸中所含部分的不同,包括移動平均過程(MA)、自回歸過程(AR)、自回歸移動平均過程(ARMA)以及ARIMA過程.
ARIMA模型的數學形式為:
Y(t)=u+?1y(t-1)+?2y(t-2)+…+?py(t-p)+ε(t)+φ1ε(t-1)+…+φqε(t-q),
(9)
其中:u表示常數項,?1,?2,…,?p為自回歸系數,滿足平穩性條件;φ1,φ2,…,φq為滑動平均系數;ε(t)為白噪聲序列.上式稱為p階自回歸q階滑動平均模型,記為ARIMA(p,d,q),其中d為使時間序列成為平穩時所做的差分次數[10].
(1)R方:用來估計由模型解釋的變異在總變異中的比例.當序列很平穩時,此度量較為有效.R方可以是負無窮大到1范圍中的負值.負值表示考慮中的模型比基線模型差.正值表示考慮中的模型比基線模型好.
(2)RMSE:為均方根誤差,用來度量原始因變量與預測值之間的誤差,用和因變量序列相同的單位表示.
(3)MAPE:平均絕對誤差百分比,度量因變量序列與其模型預測水平的相差程度.它與使用的單位無關,因此可用于比較具有不同單位的序列.
本文研究的數據來源為上海市民政局民政業務數據海,經過整理得到的數據主要為:2004-2018年的上海市與各區的年老人總數、機構養老的年老人總數、上海市可以為每個區提供的年機構養老床位總數3種時序數據.
3.2.1 模型構建步驟
Step 1:數據準備.由于上海市民政局業務數據海的數據已是相對標準的數據,且每組數據內部的差異并不是非常顯著,因此原始數據可不經過任何歸一化、標準化操作即可代入模型.
Step 2:模型及其參數估計.將當前時刻的原始值yt作為目標值,t-i時刻的原始值yt-i(i=1, 2, …)作為自變量,分別代入布朗單一參數線性指數平滑模型、霍爾特雙參數線性指數平滑模型、ARIMA模型中進行擬合,其中指數平滑法及ARIMA模型中的參數或系數均使用最小二乘法進行估計.
Step 3:模型選擇.通過比較R方、均方根誤差擬合效果評價指標,選擇擬合度最好的模型進行下一步分析.
Step 4:預測.利用Step3中所得模型對上海市及各區的年老人總數、養老機構老人總數、機構年總床位數進行預測.
3.2.2 實證分析
以預測2019年和2020年徐匯區老人數量為例進行算例分析.
首先,按如下方法建立布朗單一參數線性指數平滑模型.

(10)
當m=1時,將公式(1)、(2)、(3)、(4)代入(10)中,得到最終的參數優化函數:
(11)


表1 布朗單一參數線性指數平滑模型
然后,建立霍爾特雙參數線性指數平滑模型。

當T=1時,最終優化參數函數可表示為:
(12)
對式(12)應用最小二乘法,求得最優參數α=0.9,β=1.再由式(6)、(7)、(8)得到霍爾特擬合值,如下表2所示.

表2 霍爾特雙參數線性指數平滑模型
在代入ARIMA之前,將徐匯區老人數據進行2次差分運算,得到平穩數據.對平穩后的數據,使用SPSS軟件觀察其所對應的自相關和偏相關圖,得到ARIMA中的模型參數為p=0,d=2,q=0.因此可建立如下的ARIMA(0,2,0)模型:
Y(t)=u+2y(t-1)-y(t-2).
通過最小化預測值與實際值的差異,即min(u+2y(t-1)-y(t-2)-yt)2,獲得二次差分下ARIMA的常數項u的值為0.07.
因此,ARIMA(0,2,0)的最終預測公式為:Y(t)=0.07+2y(t-1)-y(t-2).計算所得擬合值,如表3所示.

表3 ARIMA(0,2,0)模型
對表1,表2,表3中的擬合預測結果,運用R方和RMSE公式計算實際值與擬合值的差異,運算結果分別為0.998與0.175、0.998與0.185、0.998與0.18,因此在徐匯區老人數據下,選擇布朗單一參數線性指數平滑模型.
(1)上海市及其市區的老人數預測模型
以2004-2018年上海市及各個市區老年人數作為樣本,應用SPSS軟件中的專家建模時序方法,專家建模器會從上述3種方法中以R方、最大絕對誤差百分比、均方根誤差、平均誤差百分比等作為評估標準自動選擇每個序列的最佳擬合模型.上海市及各區老人總數適用的最優模型及其對應的評估效果值如下表4所示.

表4 上海市及各個市區的老人數預測模型
在表4中,上海市及其各個市區所用的模型并不相同,其中上海市采用ARIMA(0,2,0)模型,表示ARIMA模型中自回歸項為0,差分次數為2,移動平均項為0.上海市長寧區、普陀區、楊浦區、閔行區、寶山區、嘉定區采用ARIMA(0,2,0)模型,松江區采用二次指數平滑中的霍爾特模型,其他區則采用二次指數平滑中的布朗模型.同時,各組數據在相應最優模型下的R方值均高于95%,其他三種評估指標也很小,表明模型具有較好的擬合效果.
(2)機構養老的老人數預測模型
以2004-2018年上海市各個區機構養老的老年人數作為樣本,應用SPSS進行模型選擇,在這組數據下各個區的機構養老模型選擇結果及其效果評估如下表5所示.

表5 上海市各個市區的機構養老老人數預測模型
其中,上海市黃浦區、徐匯區、長寧區、普陀區、楊浦區、嘉定區、崇明區采用ARIMA(0,1,0)模型,表示ARIMA模型中自回歸項為0,差分次數為1,移動平均項為0;其余各區則采用二次指數平滑中的霍爾特模型.同時,各組數據在相應最優模型下的R方值均高于90%,其他三種評估指標也很小,模型具有較好的擬合效果.
(3)機構養老的床位供給預測模型
以2004-2018年上海市各個區機構年供給的床位總數作為樣本,應用SPSS進行模型選擇,在這組數據下各個區的機構床位供給預測模型選擇結果及其效果評估如下表6所示.

表6 上海市各個市區的機構養老床位供給模型
其中,上海市楊浦區、崇明區采用ARIMA(0,2,0)模型,表示ARIMA模型中自回歸項為0,差分次數為2,移動平均項為0;其余各區則采用二次指數平滑中的布朗模型.同時,各組數據在相應最優模型下的R方值均高于93%,其他三種評估指標相對較小,模型具有較好的擬合效果.
首先預測上海市及其各個市區的老人數,然后依據老人數以及入住機構老人數趨勢,預測入住養老機構的老人數,最后對2019年和2020年上海市各個市區的床位供給分配情況進行預測.
上海市及各個區選擇上述擬合度最佳的時間序列模型,預測2019年上海市老人數達到526.1867萬人,其中上限值為531.8331,下限值為520.5403.2020年預測老人數達到550.3301萬人,其中上限值為562.9558,下限值為537.7044.2018年年末老年人數為503.28萬人,2019年相對于2018年增長了4.55%,2020年相對于2019年增長了4.59%.可見老齡化越來越嚴重,老年人數的增長比率也在慢幅度上升.
2019年上海市各個區的老人數量預測結果如表7所示.由表7可知,浦東新區的2019年老人數預測可能會突破100萬人,上限為107.278萬人.相對于2018年的增長比率除了靜安區,均在3%以上.其中寶山區的增長率達到了7.26%,其次為嘉定區,為5.58%,最低則為靜安區,不足3%.

表7 2019年上海市各個市區的老人數預測(單位:萬人)
2020年上海市各個區的老人數量預測結果如表8所示.由表8可知,浦東新區的2019年老人數預測已超過100萬人,上限為120.7957萬人.相對于2019年的增長比率仍是除了靜安區,均在3%以上.其中寶山區的增長率達到了7.41%,其次則為嘉定區,為5.55%,最低則為靜安區,不足3%.相對于2019年,老人人數仍在上升,但增長比率卻有增有減.長寧區、普陀區、楊浦區、虹口區、寶山區、松江區的增長率增加,其余市區增長率降低,但增減的浮動不大,均小于1%.

表8 2020上海市各個市區的老人數預測(單位:萬人)
結合歷年老人總數與機構養老的老人數的比例趨勢以及機構養老老人數隨著時間的變化趨勢,對2019年和2020年即將可能入住養老機構的老人數量進行預測.2019年、2010年上海市各個區的入住養老機構老人數量預測結果分別如表9、表10所示.2019年以及2020年全市入住養老機構老人數最多的區為浦東新區,青浦區為人數最少區.2020年浦東新區的入住養老機構的老人數會突破2萬人.而青浦區則仍不足2000,這與各個區的老人數有較大關聯.入住機構養老的趨勢仍在增長,故進一步預測床位供給.

表9 2019年上海市各個市區的機構養老老人數預測(單位:人)

表10 2020年上海市各個市區的機構養老老人數預測(單位:人)
2019年、2010年上海市各個區的機構養老床位供給數量結果分別如表11、表12所示,其中入住率為預測得到的入住養老機構的老人數和床位供給數之比.各個區的入住率約在60%到90%之間,其中只有青浦區會低于60%,但相差不超過2%,普陀區的入住率超過了90%.可在以后的研究中考慮市區之間的床位供給協調.既滿足了老人床位的需求,也實現的養老床位充分使用.

表11 2019年上海市各個市區的機構養老床位供給預測(單位:個)

表12 2020年上海市各個市區的機構養老床位供給預測(單位:個)
本文基于預測2019年、2020年上海市及其各個市區的老年人口數量,以及上海市“9073”的養老模式,為3%的老年人提供機構養老的政策目標,選擇擬合程度最佳的時間序列模型,得出上海市各個區在2019年和2020年應提供的機構養老床位數量.養老床位數量與預測得出的入住養老機構的老人數的比率即入住率大都在60%到90%之間,青浦區低一些,普陀區則高一些.研究結果對上海市在進行床位供給的政策制定有一定的參考價值,對其他地區也有一定的借鑒意義.
本文的研究也存在一定的局限性.由于對養老床位的供給預測只考慮了老年人口增長的因素,并未考慮經濟和文化等方面因素,為了尋求更合理的預測方案,需在這些方面進行相應的考慮.此外,存在有的市區入住率過高,而有的區入住率則比較低的現狀,后續可考慮在市區之間床位的分配協調問題進行研究.
本文由上海市民政局科研課題項目支持,部分數據由上海市民政業務數據海提供,特致謝.