劉娛,田茂再,2*
1.新疆財經大學統計與數據科學學院,新疆 烏魯木齊830012;
2.中國人民大學統計學院,北京100872
作為老齡化嚴重的發展中國家之一,中國將關注中老年退休人員的待遇的相關問題提上日程.2020年伊始,全球爆發了傳染規模大、傳播速度快的新型冠狀病毒肺炎(Corona Virus Disease 2019,COVID-19),此次疫情十分嚴峻,截至5 月11 日,中國累計確診已經達到84 450 人,死亡人數總計4 643 人,治愈人數79 533 人,作為易感人群之一的中老年人因其人口基數大、身體健康狀況差成為控制疫情的難題.在爆發這次疫情之前,對于離退休人群的關注主要集中在退休后的心理健康方面,此次疫情之后,關注轉移至生理健康方面.良好的心理狀況和身體狀況都建立在一定的經濟基礎之上,在老齡化日益嚴重的今天,基本養老金收支不平衡問題會嚴重影響到中老年人的生活條件,間接影響其身心健康.針對各省域離退休人員的待遇情況,本文通過研究基本養老保險基金支出相關影響因素的時空差異,分析影響變量的時空差異性得出結論,并且提供有效且針對性的建議.
關于基本養老保險基金支出的問題,有很多學者進行過研究.如李瓊對2007 年~2016 年中國31 省市的數據分析了中國城鎮職工基本養老保險基金區域差異和影響因素.通過研究城鎮職工基本養老保險基金發現累計結余的高值區和次高值區的空間分布在東部地區,而次低和低水平則在西部地區和東北地區[1].姚定俊通過分析老齡化趨勢對城鎮職工養老保險產生的影響,運用精算模型預測出了2017 年~2050 年江蘇省城鎮職工養老保險收支情況[2].
對于時間和空間緯度的差異性研究,常使用時間地理加權模型,其應用主要集中在空氣污染變化趨勢的時空分析和城市擴張時空演變.Wu 針對數據中出現的時空自相關和非平穩性問題提出地理時空加權自回歸模型(GTWAR),并證明GTWAR 模型比其他模型擬合性更優[3]. Wei Qingbin 研究了2015 年~2018 年中國黑龍江省PM2.5與5 項標準空氣污染物(SO2、NO2、PM10、CO、O3)之間的關系,結果發現傳統的OLS 和GWR 不足以描述PM2.5的非平穩性,GTWR 模型更適用于該研究數據[4]. 秦文哲以山東省各地市2014 年~2018 年青少年健康為研究目標,利用GTWR 模型研究得到空間分布模式仍表現為“西高、東低、中部居中”的基本格局[5].
結合學者們對時空地理加權回歸模型的廣泛應用和基本養老保險支出的相關研究,本文在老齡化發展進程加速的背景下,以城鎮職工養老保險支出為研究對象,分析各省域對基本養老保險支出的關注情況,探索教育程度、人口因素、經濟水平這三個方面對基本養老保險基金支出的影響.研究目標是為離退休人員構建和諧穩定的養老環境,推動養老政策的全面實施,并且為其他人口結構提供借鑒.
關于空間的非平穩性以及解釋變量在空間上的影響差異,學者們以GWR 模型作為變量研究空間異質性的重要工具.在實際運用中,GWR 模型也存在一定的缺陷.如該模型只能研究截面數據,缺乏時間維度考慮,相較于面板數據,節點數據具有一定的偶然性,因此分析存在一定的偏差[6].Hung 等考慮到時間維度的變化針對地理加權回歸模缺點,提出了時空地理加權(GTWR)模型,模型的表達式為

式中,yi為N ×1 階因變量矩陣,xik為N × k 階自變量矩陣,(ui,vi,ti)為時空坐標,N 為省份個數.通常,對i,j 的空間距離可采用各個省域的經度和緯度數據來計算.t 為時間距離,εi~N(0,σ2)為隨機誤差,βk(ui,vi,ti)為系數函數,是函數βk(ui,vi,ti)在i 點的值.
使用局部線性估計方法對時空加權回歸模型的進行估計可求得各回歸系數在觀測點i 處的估計值:

權重W(ui,vi,ti)設為觀測點i 到其他觀測點的距離的函數,通常采用高斯距離函數. 除此之外,帶寬對GTWR 模型精度也具有影響,在確認模型的空間帶寬和時間帶寬的時候最常運用的就是交叉確認法,除此之外可按照AIC 準則,即AIC 最小時對應的為最優帶寬.
但是如果單純使用GTWR 模型會缺乏對基本養老金支出差異分位特征的研究.地區間基本養老金差異的低分位點與高分位點會體現社會養老演變過程的兩個極端,如果僅使用均值回歸可能無法全面的展現體征.考慮到分位數回歸能在面板數據因時間和空間差異滿足不了正態性假定時展現穩健的估計,因此本文使用分位回歸模型,結果可反映不同層次中參數的變化狀況,因此可用來研究異質性問題,且在估計中是根據樣本信息按不同分位點分割數據進行估計,有利于歸類分析.
分位數回歸(QR)由Koenker 和Bassett 于1978 年提出,它是傳統均值模型的一個補充與改進.在同方差假設違背的情況下,QR 通過因變量的條件分位數來量化異方差對協變量影響,且提供了因變量分布的綜合信息.此外,當分布存在不對稱和重尾時,樣本的中位數(50 %分位數)對中心的匯總能力會優于均值,因此,相較標準的均值回歸模型,QR 在異常值存在時表現穩健且靈活.本節參考自王天穎(2017)[7].

在建模之前可對數據使用差分處理,目的是消除個體的固定效應,對于固定個體i,可根據相鄰兩期的數據具有相同截距項αi的原理,利用差分運算消除模型中的隨機效應,有以下數學關系:
選擇變量主要根據系統性、可行性、代表性、動態性、可獲得性,科學性等原則和參考李瓊[1]、鄧大松[8]等論文的指標體系的構建以及文獻[9 ~14]的內容框架.考慮到我國基本養老保險基金支出主要受人口因素、經濟水平以及教育程度所影響.本文選擇的指標有城鎮職工基本養老保險基金支出、高等教育機構畢業生數、普通本專科、居民人均可支配收入、離退休率=城鎮職工離退休人員數目/城鎮常住人口數.數據包括2013 年~2018 年間全國31 個省市自治區,主要來源于中國年鑒網絡出版總庫(CNKI)(http://data.cnki.net),中經網統計數據庫(http://tongji.cnki.net/kns55/Dig/MonthData.).

表1 相關變量及統計描述Table 1 Related variables and statistical description
如圖1 所見,在31 個省市中上海市的基本養老保險基金支出位居第一,緊隨其后的是浙江省,與第三名的江蘇省及其他省市拉開了巨大差距.相較于其他地區,地廣人稀的西藏是支出數額最少的區域,其次是青海、寧夏、海南這三個地區的支出也相對較少.老齡化程度嚴重的黑龍江、遼寧、四川這三個省,留守省內的中老年人數目龐大,離退休人員占比數目大,養老金支出數額不容小覷.從時間緯度來看,城鎮職工基本養老保險基金支出從2013 年開始增速緩慢,2015 年增速陡然加快,在2016 年支出到達峰頂后開始下降,2017 年后又恢復上升狀態.

圖1 城鎮職工基本養老保險基金支出均值空間差異圖Fig.1 The spatial difference of the average expenditure of the basic pension insurance fund for urban employees

圖2 城鎮職工基本養老保險基金支出均值時間變化圖Fig.2 Changes of the mean time of urban workers’basic pension fund expenditure
首先需要運用R 語言對指標進行多重共線性檢測,得到各協變量的方差膨脹因子(VIF)值均小于10,證明各個變量中不存在共線性,所以保留全部變量.對變量進行ADF 檢驗,P 值均小于0.05,認為數據是平穩的,故數據不需要差分或者取對數處理.
利用ArcGIS 10.2.2 時空地理加權回歸分析模塊,選擇自動優化設置帶寬,并將時空距離參數比值設置為1.通過對31 個縣域6 年間的面板數據進行時空差異分析,得到影響因素的回歸系數.選取AIC 準則和擬合優度R2作為模型置信度評價指標.表2 為GTWR 模型結果.

表2 影響因素回歸系數統計描述及回歸結果Tab.2 Statistical description of regression coefficients of influencing factors and regression results
對比線性回歸模型的AIC 為243.27,R2為0.861,調整R2為0.859,從表2 看出,(1)GTWR 模型擬合性比線性模型更優,擬合86 %的數據能充分說明數據信息,AIC 值更小;(2)各變量對城鎮職工基本養老保險基金支出的影響不可忽略,其中高等教育畢業生數的影響力最強,居民可支配收入的影響力次之,退休率的影響力最低.
接下來將詳細分析三個影響因子的時空變化.
4.1.1 教育水平影響
高等教育機構畢業生數在2013 年~2018 年間對于全國絕大部分地區都具有正向影響.但是在海南省,2013 年~2015 年間其影響力為負,自2016 年之后影響值轉為正,且影響力度逐步增強.高等教育畢業生在空間上的差異可分為五個梯隊:在西部地區,新疆、西藏兩地影響作用最強,隨著時間的推移一直保持較高的影響水平;緊接著變量作用于甘肅省、青海省、四川省、云南省、寧夏、陜西、重慶這些區域的影響力也相對較高;屬于第三梯隊的省市分別是北京、河北、山西、山東、河南、湖北、湖南、貴州、廣西;而在2013年至2014 年屬于第三梯隊的內蒙古自治區在2015 年移動至第二梯隊與甘肅省等區域作用力相差不大;對于黑龍江、吉林、遼寧、江蘇、安徽、上海、江西、浙江、福建、廣東等地影響力一直保持在低水平等級從屬于第四梯隊;從圖中可清晰地看到海南省的影響值波動范圍大,由負作用逐年轉變為正作用且隨后對基本養老保險支出的影響力與其他省市的影響力拉開巨大差距.
4.1.2 人口因素影響
離退休率的影響力與畢業生數這一指標影響作用相似,僅在海南省的影響力為反作用,在其他各地區的作用均為正,且呈現逐年遞減趨勢.作用最大的區域為新疆、西藏;次之是甘肅、青海、寧夏、四川、云南;接下來是內蒙古、黑龍江、吉林、遼寧、北京、天津、河北、山西、陜西、河南、山東、重慶、貴州;第四梯隊省市有江蘇、上海、浙江、安徽、湖北、湖南、廣西、江西、福建,空間上離退休率影響作用出現集聚特點;自2016年之后黑龍江、吉林、遼寧、北京、天津、河北、山東因影響力減弱掉出第三梯隊轉入第四梯隊,隨后內蒙古也在2017 年影響力減弱成為第四梯隊一員,西藏因其影響力與新疆拉開距離,自2017 年加入第二梯隊.
4.1.3 經濟水平影響
居民可支配收入的影響力變化復雜多變.與前兩個指標的作用不同,居民可支配收入在2013 年對基本養老支出的影響力在海南省地區作用最強;在西部地區如西藏、四川、云南、重慶、貴州、廣西影響力低于海南省;作用在新疆、東北部黑龍江、吉林、遼寧這四個區域的影響力最低;內蒙古、北京、天津、河北、山西、山東、河南、江蘇、安徽、上海、浙江影響值也相對較低;甘肅、青海、寧夏、陜西、湖北、湖南、江西、廣東、福建影響力處于中間水平,總體上體現在西北部地區以及中部地區影響力偏大.2015 年東北三省的影響力下降放緩加入北京等地區,16 年青海省影響力下降速度加快,移至第二梯隊,隨后甘肅、寧夏在2017 也加入第二梯隊;西藏、陜西、河南、山東成為第三梯隊,其他省市不變.除新疆地區影響力一直保持最低以外,居民可支配收入對基本養老金的影響從西北部地區向東南部轉移.在2018 年影響力次于海南地區的省市有云南、貴州、廣西、重慶、湖北、湖南、廣東、安徽、江蘇、上海、江西、福建.居民人均可支配收入的回歸系數與經濟發展差異一致,東北部和東部地區影響系數小于中部地區.地區之間的經濟發展水平差異是造成這種情況的主要原因,地區間的收入水平差異大,經濟高水平地區居民收入高,參保人數增多保障了養老金支出,因此影響力相對較小,經濟相對落后地區,居民可支配收入少導致參保人數的不固定,所以會嚴重影響離退休人數的生活保障.
總結得到,高等教育畢業生數、離退休率以及居民可支配收入對基本養老保險基金支出的影響力總體上是隨著時間的流逝而遞減的,這可能是因為各項政策的出臺使得養老待遇逐漸公平化,經濟、人口、教育等因素的影響得到控制,以全面保證各類生活水平下老年人的生活與健康.空間上變化仍是體現在經濟發達地區與經濟落后地區之間的差異,各因素對基本養老金支出的影響具有集聚性,具體表現在高等教育畢業生與離退休率的影響力在東部地區、中部地區的值小于西部地區;居民可支配收入的影響系數在西部地區及東北部地區的值低于西南與東南地區.
利用R 軟件的rqpd 程序包對31 個省域面板數據進行面板分位數回歸,分別求出0.1、0.25、0.5、0.75、0.9 分位點下各變量的影響系數(表3).
分析其回歸結果,發現高等教育畢業生數、離退休率以及居民可支配收入在各個分位點下對基本養老保險支出是顯著影響的,且回歸系數為正,故表現為正向影響.證明受教育人數越多,參保人數就越多,其基本養老金收入就增加,對于離退休人員的支出就隨之增加;老齡化水平下離退休人數的增加會造成基本養老金支出的增加;經濟因素下,居民可支配收入穩步提高會減少繳費中斷等情況的出現,也保障了基本養老金的支出.高等教育畢業生人數的回歸系數值比其他變量高,說明在這些指標中對于基本養老金的影響作用最強.總體上面板分位數回歸結果與GTWR 模型分析結果一致.

表3 面板分位數回歸結果Tab.3 Panel quantile regression results
基于新冠肺炎背景下,深入研究各省域城鎮職工基本養老保險基金支出差異及分析其影響因素,利用31 個省份2013 年~2018 年間的面板數據,在時間和空間角度多維分析高等教育畢業生數、離退休率、居民人均可支配收入對基本養老金支出的影響,得出以下結論:
(1)城鎮職工基本養老基金支出在空間分布上差異明顯. 大部分高值區分布在沿海地區,例如上海市、江蘇省、浙江省、遼寧省、山東省以及中部地區四川省.次于高值區的省域主要分布在中部地區例如廣東省、黑龍江省、河南省.低值區主要分布在西北地區以及西南地區,如寧夏回族自治區、甘肅省、青海省、西藏自治區、貴州省.針對基本養老金支出分布特點,要確保養老保險覆蓋率,實現統籌養老,做到“老有所養”,鼓勵離退休人員開展豐富的退休生活,做到“老有所樂”.
(2)結合GTWR 模型和面板分位數回歸模型,能夠證實人口因素、經濟支持、教育水平對基本養老金支出具有正向影響,時空差異表現為高等教育畢業生數、離退休率、居民可支配收入影響力逐年下降,體現了各地區養老待遇的差距逐年減少,但是老齡化嚴重的東北部地區以及經濟發展落后的西北部地區影響力還是較東部地區深遠,需要進一步因地制宜.
(3)導致時空差異最關鍵的因素就是經濟發展水平的不同,參考李瓊的研究可知在職人員和企業是養老保險收入的主體,當教育水平越高代表工資越高,那么基本養老保險基金的收入也就越多,基金累計結余規模越大,城市環境保護與醫療水平越高離退休人員生活水平越優越[1]. 研究結論與現實情況相吻合,為解決這一問題,關注點在于抓根本原因,解決經濟發展不平衡,地區之間收入差異的問題.