李 輝,石 龍
計量經濟學在保險領域的應用十分廣泛,尤以保險行業的宏觀研究為甚,國內外許多學者對此樂此不疲,建立各種計量經濟學回歸模型,期望從中找出影響保險業發展的因素,并以此進行定量分析和預測,從而給大眾、政府和企業決策提供參考意見。然而進入21世紀,金融業數據信息交換十分頻繁,人們已經不滿足于年度預測模型,進而期望建立頻率更快的月度模型甚至是日度和分時模型,將其運用于金融產品交易和套利、保險理財產品設計、保費現金流量管理和保費收入預測。
建立模型的前提需要有相應的數據,考慮當下我國統計數據的可得性,還難以建立全面的保費收入月度計量模型,如在2003年國家統計局GDP數據核算方法改革后就不對外公布月度GDP數據,宏觀數據方面除了匯率、價格指數外及消費品零售總額之外,其他數據基本不可得,建立保險月度計量回歸分析模型暫時還不可行。因此,如何建立有效的月度預測模型就擺在人們面前。本文將嘗試運用保費收入的月度數據建立中國保費月度預測模型。建立模型的思路是:首先將采用當今最為熱門的X12-ARIMA加法模型對保費月度數據進行季節調整,得到經調整后的時間序列和季節調整因子;其次在假設季節調整因子短期內不發生變化的條件下,采用三種“非典型計量回歸分析”模型估計方法建立經調整后的時間序列模型,從而建立中國保費收入月度數據短期預測模型。
一般地,我們需要進行季節調整,一是出于數據的可比性;二是從統計學而言,季節調整后的數值可以進行年率化的測算;三是各保險企業為制定銷售計劃和控制存量,從而更好地預測保險企業現金流;四是為了能夠從總量中消除季節變化,從而更清晰地解釋其他類型的變動,更好地反映經濟周期的運動規律。
一般而言,我們可以將季節性數據分解為趨勢因素、循環因素、季節因素和不規則因素。根據時間序列各組成成分之間的不同依存關系,可以建立不同的分解模型,典型的常用分解模型有加法模型(additivemodel)和乘法模型(multiplicative model)。本文將選擇X12-ARIMA加法模型。
本文所用數據主要有四個:1990年1月到2011年8月名義總保費收入月度數據(Y)、財產險(PI)、人身險(包含壽險、意外險、健康險,LI)和相應的居民消費價格指數(CPI),前三者來源于保監會網站,CPI來源于BVD-EIU Country Data數據庫。值得說明的是,居民消費價格指數是以2005年1月為基準的定基月度數據,處理后可得到以1999年1月為基準的月度CPI。

表1 我國保費收入月度數據 (單位:億元)
數據處理步驟:第一,用得到的名義保費收入除以相應CPI數據,得到當月實際保費(YR,PIR,LIR);第二,對實際保費數據取自然對數以平滑時間序列,得到LYR,LPIR,LLIR;第三,我們使用Census X-12加法模型進行調整,得到經季節調整后的實際保費數據(序列名_SA),趨勢循環數據(序列名_TC),季節因子(序列名_SF),不規則因子(序列名_IR)。圖1為平滑后實際總保費收入季節調整序列圖。
(1)Census X-12加法模型分解結果。如圖1所示,LYR總體呈向上波動趨勢;LYR_TC是除去季節波動后的趨勢循環項,較LYR序列相比,趨勢性更加明顯;在加法模型下,經季節調整后的LYR_SA序列等于LYR_TC加上不規則變動序列LYR_IR;季節調整因子LYR_SF呈現出較為規律的季節波動;不規則變動序列LYR_IR頭幾年較為劇烈,除了2005年年初之外在接下來的若干年表現都較為平穩,平穩的不規則變動因子將對我們接下來的模型構建極為有利。
(2)季節因子(序列名_SF)。如圖2所示,以1990年為基期,雖然我國保險收入呈現出較為“凌亂”的走勢,規律性并不十分突出,但仔細觀察,我們可以清晰地看到,每年的第一、三、六月季節因子最高,其中一月走高的可能是保險公司在完成去年保費任務后,將上年末的保單暫時留下作為來年一月的“開門紅”;三月則包含中國春節因素的影響,由于二月春節保費過低而積累的需求在三月得到釋放;六月則可能是半年報因素和業務競賽的結果,各保險企業為完成半年任務,加大了優惠和促銷力度以招攬客戶,良好業績源于營銷力度,從而也透支了接下來七八月份的保險需求,并且結合財務因素(如半年報因素等),從而顯示出超強的“六月風”,財產險和人身險均顯示出類似規律,但是人身險季節性較財產險更加明顯,且人身險透露出“二月低谷”現象。除了這三個月份較為特殊,其他月份則顯示出較為平均的波動規律,顯然,作為保險企業而言,容易利用此類信息預測各自的現金流并提高保費資金的利用率。

圖1 經X12-ARIMA加法模型分解后各序列
(3)如表2所示,通過對總保費、財產險、人身險最終季節因子進行相關系數矩陣分析,保費總收入與人身險收入季節因子相關性更強,達到0.97,而與財產險的相關性則更低,僅為0.77。說明我國保險業總體保費收入的季節性波動受人身險季節性波動較強;此外人身險和財險之間相關性相對較弱,僅為0.63。

表2 保費總收入,財產險,人身險最終季節因子相關系數矩陣
(4)由于Census X-12不能對趨勢循環影響分離,Hodrick-Prescott型濾波不但有消除非線性隨即趨勢的能力而且相位不變的特點(陳昆亭等,2004)。本文利用Hodrick-Prescott濾波法對總保費趨勢循環序列LYR_TC進行分解,得到趨勢項HPTREND和循環HPCYCLE,從圖中可知,保費增長趨勢十分明顯且近似線性增長;就周期循環而言,1999~2001年為下降期,可能受1997年亞洲金融危機影響;隨后逐漸遞減,2003~2005年的下降可能受非典影響較大,2008年則是受國際金融海嘯的影響較大;而且就保險業而言,2011年初以來的下降顯示保險業目前正經歷“兩次探底”的過程。

圖2 每年相同月份總保費、財險、人身險最終季節因子圖

圖3 經HP濾波法分解后的趨勢序列和循環序列
由X12-ARIMA加法模型,有LYR==LYR_TC+LYR_IR+LYR_SF(季節因子)=LYR_SA(經季節調整后序列)+LYR_SF(季節因子)。因此我們首先對中國保費收入LYR序列進行分解,得到經季節調整后序列(LYR_SA)和季節因子(LYR_SF)序列;其次,應用灰色預測、Logistic和季節ARIMA(SARIMA)三種非經典計量經濟學模型,建立關于經季節調整序列LYR_SA的預測模型;再次,根據季節因子序列規律性波動的特點,尤其在后期表現更為明顯,我們利用季節因子數據(LYR_SF)2010年1月到2010年8月的歷史數據;最后得到的LYR2011年1月到8月的預測值,并對其進行評價。以下運用序列LYR_SA進行模型構建。
2.1.1 模型介紹
設X為經季節調整后的時機保費收入序列LYR_SA,構造各期保險保費收入的原始數據序列為:

生 成數據 x(1)=[x(1)(1),x(1)(2),…,x(1)(k)],其 中,
2.1.2 模型建立

其中:

則灰色預測模型的時間響應函數為:

2.1.3 模型的求解
運用1999年1月~2010年12月144個經季節調整后的實際保費數據LYR_SA求解模型,剩下的2011年1月~8月的數據留待稍后驗證時使用。代入數據得:

發展系數a=0.0026<0.3,根據鄧聚龍教授的分析,此時的GM(1,1)不僅適合短期預測,還可用于中長期預測。
2.2.1 Logistic增長曲線介紹
增長曲線模型描述經濟變量隨時間變化的規律性,從已經發生的經濟活動中尋找這種規律性,并用于未來的經濟預測。但是,實踐并不是經濟活動變化的原因,所以增長曲線模型不屬于因果關系模型。而邏輯增長曲線模型是其中的一種,俗稱“S曲線”,由Verhulst于1845年提出,當時主要目的是模擬人口的增長。其一般形式為:

其中,φ(t)=α0+α1+α2t2+…+aktk。后來經過逐步簡化,目前最常見的形式是:

式(5)也稱為狹義的邏輯增長曲線模型。
2.2.2 邏輯曲線的估計——“三和法”
所謂“三和法”是增長曲線模型參數的一種代數估計方法。當t=1,2,…,n時,可以將樣本分成3段,分別為t=1,2,…r;t=r+1,r+2,…,2r;t=2r+1,2r+2,…,n。分別計算每段中的和:

設 D1=S1-S2, ??D1=S2-S3,得到:

將上述得到的結果作為初值,用非線性最小二乘法進行估計。
2.2.3 模型的求解
下面將用“三和法”進行建模,與前面一樣,利用1991年1月~2010年12月季節調整后的實際保費收入數據(LYR_TC),將其分為三段:

得到:S1=9.4848 ,S2=8.1439,S3=7.3066,D1=1.3408,D2=0.8374;由此算出b=0.0098,a=0.7608,K=8.1167。
將上述值作為非線性最小二乘法的初值,得到最后的非線性方程為:

所以模型估計的飽和值為K=8.2843,a=0.7837,b=0.0093。
2.3.1 SARIMA模型介紹
季節時間序列模型(seasonal ARIMA model),用SARIMA表示,較早的文獻也稱其為乘積季節模型。設季節性序列變化周期為s,即時間間隔為s的觀測值有相似之處,首先用季節差分的方法消除周期性變化,季節差分算子定義為:

若季節性時間序列用表示,則一次季節差分表示為:

對于非平穩季節性時間序列,有時需要進行D次季節差分后才能轉換為平穩的序列。在此基礎上可以建立關于周期為s的P階自回歸Q階移動平均時間序列模型(注意P、Q等于2是,滯后算子應為L2S)。

對于上述模型,相當于假定ut是平穩的、非自相關的。
當ut非平穩且存在ARMA成分時,則可以把ut描述為

其中,為白噪聲過程,p、q分別表示非季節自回歸、移動平均算子的最大階數,d表示ut的一階(非季節)差分次數。由上式可得

把(9)式代入(7)式,得到季節時間序列模型的一般表達式

2.3.2 模型的估計
首先,對LYR_SA進行ADF檢驗,t統計量為-2.222,對應的概率值(P值)為0.1994,故LYR_SA序列非平穩,對其進行一階差分,得到DLYR_SA,再次對DLYR_SA進行ADF檢驗。此時,t統計量為-17.40,對應的概率值(P值)為0.0000,因此對平穩序列DLYR_SA建立SARIMA模型。
其次,對差分平穩后的DLYR_SA序列建立模型,同樣地,樣本區間仍然為1990年1月~2010年12月,通過DLYR_SA的相關圖和偏相關圖決定采用何種形式的
SARIMA,經過多次嘗試,對DLYR_SA進行方程估計:

Dependent Variable:DLYR_SA Method:Least Squares Date:10/21/11 Time:23:10 Sample(adjusted):2000M03 2010M12 Included observations:130 after adjustments Convergenceachieved after 7 iterations AR(1)SAR(11)SAR(12)Coefficient-0.450009 0.201476 0.337046 Std.Error 0.079319 0.071501 0.072398 t-Statistic-5.673424 2.817811 4.655489 Prob.0.0000 0.0056 0.0000


最后,用建立的方程對2011年1月到8月進行預測,得到LYR_SAF,回代預測值得到預測的。
運用多建立的三種模型預測2011年至2011年8月的保費值,結果如表3。

表3 中國保費收入月度數據預測結果和誤差檢驗
表3表明,模型的RMSE均較小,MAPE處于可接受范圍。可見我們所運用的三種模型對我國保費收入月度數據進行了相對良好的擬合,也間接體現了X12-ARIMA分解時間序列數據的有效性。具體而言:
(1)從RMSE而言,三個模型的RMSE值都非常低,其中SARIMA模型最低,Logistic模型次之,說明模型良好的穩定性。
(2)從MAPE的絕對值而言,SARIMA最低,GM(1,1)次之,Logistic模型略高于10%,從MAPE的發展趨勢而言,GM(1,1)先低后高,SARIMA先高后低,Logistic較為平均。因此,GM(1,1)可能更適合中國保費月度數據的短期估計;而SARIMA可能更適合較長時間段的估計;Logistic曲線模型較其它兩個模型相對差一些。但考慮到Logistic模型反應更多的是長期趨勢,并且又是月度數據,偏離長期趨勢曲線的可能性較大,因此我們認為中國保費收入長期趨勢仍是符合Logistic增長曲線。
(3)綜合來看,SARIMA模型在模型中國保費月度數據時表現最為良好;GM(1,1)適合超短期預測,比如當保險企業想要預測下個月保費收入情況時;若中國保費增長的長期趨勢符合Logistic增長軌跡,則可以為我們勾畫出中國保險業未來長期的發展軌跡。
在對我國保費收入月度原始數據進行X12-ARIMA季節調整之后得到的結論有:
(1)不規則變動因子LYR_SF接近預測期的若干年表現十分穩定,對我們模型的構建極為有利,也說明這幾年我國保險業的發展季節性較為平穩。
(2)每年的第1、3、6月季節因子最高,其中1月走高的可能是保險公司在完成去年保費任務后,將上年末的保單暫時留下作為來年1月的“開門紅”;3月則包含中國春節因素的影響,由于2月春節保費過低而積累的需求在3月得到釋放;6月則可能是半年報因素和業務競賽的結果,各保險企業為完成半年任務,加大了優惠和促銷力度以招攬客戶,良好業績源于營銷力度,從而也透支了接下來7、8月份的保險需求,并且結合財務因素(如半年報因素等),從而顯示出超強的“6月風”,財產險和人身險均顯示出類似規律,但是人身險季節性較財產險更加明顯,且人身險透露出“2月低谷”現象。除了這3個月份較為特殊,其他月份則顯示出較為平均的波動規律,顯然,作為保險企業而言,容易利用此類信息預測各自的現金流并提高保費資金的利用率。
(3)通過對總保費、財產險、人身險最終季節因子進行相關系數矩陣分析,保費總收入與人身險收入季節因子相關性更強,而與財產險的相關性則更低,說明我國保險業總體保費收入的季節性波動受人身險季節性波動較強;此外人身險和財險之間相關性相對較弱。
(4)對趨勢循環數據進行HP過濾法分解之后,保費增長趨勢十分明顯且近似線性增長;周期循環方面,1999~2001年為下降期,可能受1997年亞洲金融危機影響,隨后逐漸遞減,2003~2005年的下降受非典影響的可能性較大;2008年則是受國際金融海嘯的影響,而且就保險業單個行業而言,2011年初以來的下降顯示保險業目前似乎正經歷“兩次探底”的過程。
通過GM(1,1)、Logistic、SARIMA模型對經季節調整后的序列LYR_SA擬合之后,得到:
(1)三個模型的穩定性非常好。
(2)通過平均絕對百分比誤差指標可以知道,GM(1,1)可能更適合中國保費月度數據的短期估計,而SARIMA可能更適合較長時間段的估計;再考慮Logistic模型反應更多的是長期趨勢并且又是月度數據的條件下,我們認為中國保費收入長期趨勢仍是符合Logistic增長曲線。
(3)根據GM(1,1)預測模型,得到的發展系數a為0.0026小于0.3,根據鄧聚龍教授的分析,此時的GM(1,1)不僅適合短期預測,還可用于中長期預測。
(4)根據Logistic增長曲線模型,得到的飽和值K為8.2843,加上2011年1月到8月平均季節調整因子0.072621,則對應的保費飽和值為4259.56億元,是2011年8月保費收入1015.30億元的4.2倍,因此我國保險業發展潛力仍十分巨大。
(5)綜合來看,SARIMA模型在模型中國保費月度數據時表現最為良好;GM(1,1)適合超短期預測,但在發展系數較小時,也可用于中長期預測;Logistic增長軌跡刻畫中國保險業未來長期的發展軌跡。
[1]范維,張磊,石剛.季節調整方法綜述及比較[J].統計研究,2006,(2).
[2]馬永偉,施岳群.當代中國保險[M].北京:中國當代出版社,1996.
[3]欒存存.我國保險業增長分析[J].經濟研究,2004,(1).
[4]孫祁祥,鄭偉,肖志光.經濟周期與保險周期—中國案例與國際比較[J].數量經濟技術經濟研究,2011,(3).
[5]陳昆亭,周炎,龔六堂.中國經濟周期波動特征分析[J].濾波方法的應用,世界經濟,2004,(10).
[6]席友.金融危機對我國保險業影響實證分析.保險職業學院學報[J].2010,(4).
[7]黃榮哲,農麗娜.中國保險市場宏觀需求對物價波動的非對稱響應——基于2000~2010年季度數據的實證研究[J].華北金融,2011,(6).
[8]鄧聚龍.灰色預測與灰決策[M].武漢:華中理工大學出版社,2002.
[9]張曉峒.計量經濟分析(修訂版)[M].北京:經濟科學出版社,2003.
[10]中國人民銀行調查統計司.X-12-ARIMA季節調整—原理與方法[M].北京:中國金融出版社,2006.
[11]Damian Ward,Ralf Zurbruegg.Does Insurance Promote Economic Growth[J].Thejournal of Risk and Insurance,2000,67(4).
[12]Beck,T.,I.Webb.Economic,Demographic,and Institutional Determinants of Life Insurance Consumption across Countries[J].World Bank Economic Review,2003,17(1).
[13]Beenstock,M.,Dickinson,G.,S.Khajuria.The Relationship between Property-Liability Insurance Premiums and Income:An International Analysis of Life Insurance Demand[J].Journal of Risk and Insurance,1998,l60(4).