張春月 陳威 李詩 羅璐璐



?摘 要 統計預測是一種運用統計方法對事物未來發展變化進行預測的方法。單項模型預測時容易受到一些偶然因素的影響并存在系統誤差。基于此,本文借助R語言軟件,對某省2020-2022年GDP進行預測,結果進一步驗證了組合預測模型在考慮問題時更加系統全面,吸收了各單項模型預測的優點,集中了更多的統計信息與預測技巧[1],預測精度更高,能夠大大提高預測工作的科學性和系統性,可以為高層決策者提供一定的決策參考。
關鍵詞 GDP 組合預測 預測精度
中圖分類號:F201;F224 文獻標識碼:A 文章編號:1007-0745(2022)05-0061-03
1 問題提出
國內生產總值(GDP)通常用于衡量一個國家或地區的宏觀經濟發展狀況與水平[2],是國民經濟核算體系的核心指標,為國家制定正確的經濟發展戰略和政策提供有力的理論支撐。
GDP預測是一個復雜的系統工程,通常會受到很多種因素的影響,同時各因素間還存在著錯綜復雜的影響關系,這為GDP的預測增加了難度,無法保證預測的精度[3]。
2 基本原理
各種不同的定性或定量預測模型之間的關系并非有好壞之分,而是著手的角度不同,若加以結合,那么看待問題便會更加全面,取長補短,從而挖掘到更加具有代表性的信息,相應地最后的預測結果也會更加有信度和效度。換句話說,如果在預測時,發現某個單項預測方法得到誤差較大的結果,便棄之不用,就可能使有用的信息從手中丟失,那當然會使預測精度受到影響。
在上面思想的推動之下,組合模型誕生了,它即是將多個模型的結果進行組合,以便充分利用各個模型的信息,從而有效提高預測精度。設有k種方法,yit表示第i種方法在第t期的預測值,相關資料顯示,存在以下兩種計算第t期組合預測值的方法:
(1)Yt=∑ki=1yitωi,i=1,2,……,k。
(2)Yt=,i=1,2,……,k。
對于其中ωi的確定方法,常見的權重確定方法有六種,包括:等權重法、優勢矩陣法、方差倒數法、殘差倒數法、簡單加權法、標準差法等[4]。
1.等權重法:即對每一種預測方法獲得的權重是相同的,這種方法雖然簡單易于操作,可是它的實用性卻大打折扣,缺點在于它是對全部模型不分主次,平均對待,預測效果不理想。
2.優勢矩陣法:假設兩個模型對應的權重分別為ω1和ω2,次數n1和n2表示這兩個模型比真實值有更好的預測效果。那么,這兩個模型分別對應的權重不難算出。
公式為:ω1=;ω2=。
3.方差倒數法:通過誤差平方和的大小來確定權重,即將高權重賦予誤差平方和小的模型,另一種說法為預測誤差平方和倒數法。預測精度經常用預測誤差平方和進行度量,受到多種因素影響,通常來說單項預測模型的預測精度不盡相同。預測誤差平方和越大導致該項預測模型的預測精度越低,毫無疑問,它在組合預測中的重要性就隨之降低。這時,為了保證預測效果,就要在組合預測模型的組合預測中賦予較大的加權系數。
公式為:ωi=,其中Qi即預測值與真實值之間差的平方和。
4.殘差倒數法:與上述方法不同,當某單項預測模型的誤差平方和越大的時候,相應地,它在組合預測中的加權系數就越小。
公式為:ωi=,其中,si是對平方和Qi進行開方。特別注意的是,當數據的差均為正數時等同于方差倒數法;兩種方法只有當數據差有正負之分時才會區別對待。
5.簡單加權法:它是一種非等權平均方法之一。降序排序的對象是各單項預測模型預測誤差的平方和,再根據各單項預測模型預測誤差的平方和與權系數成反比的基本原理來安排權重,在組合預測中的加權系數越小意味著單項預測模型排序越靠前。
公式為:ωi==,i=1,2,……,k,式中按誤差平方和Qi降序后排列k個模型,將高權重賦予誤差平方和小的模型。
6.標準差法。
公式為:ωi=(1-),i=1,2,……,k,其中Si表示第i個模型的標準差。
3 實證分析
用以上幾種權重確定方法和模型組合方法,對指數曲線預測模型、二次曲線指數平滑法、線性二次移動平均模型、灰色GM(1,1)四個單項預測模型進行兩種方法的組合預測,比較12種組合模型,得出相對最優組合模型。
3.1 數據來源
數據來自國家統計局2020年統計年鑒[5],以1978- 2016年為訓練集,2017-2019年為測試集,旨在選擇一種合適的模型預測2020-2022年GDP指標。
3.2 模型判斷
3.2.1 圖形識別法
借助R檢驗GDP序列平穩性與純隨機性,代碼如下:
Box-Pierce test
data: ?GDP
X-squared = 116.52, df = 6, p-value < 2.2e-16
> adf. test (GDP)
Augmented Dickey-Fuller Test
data: ?GDP
Dickey-Fuller = -2.0431,Lag order = 3,p-value = 0.5565
alternative hypothesis: stationary
由GDP時序圖與相關圖可得:GDP序列的時序圖有明顯的遞增趨勢,自相關系數遞減到零的速度相當緩慢,因此該序列是非平穩的。純隨機檢驗的結果顯示,在各階延遲下LB檢驗統計量的P值都非常小(<0.05),因此可判定該序列為非白噪聲序列。4EF8FED1-257B-49E3-A289-A25E6C5A67BA
3.2.2 差分法
對GDP序列做二階差分,對差分后的序列(GDP_diff)再次進行平穩性和純隨機性檢驗,代碼如下:
Box-Pierce test
data: ?GDP_diff
X-squared = 6.8371, df = 6,p-value = 0.3362
Box-Pierce test
data: ?GDP diff
X-squared = 8.3332, df = 12,p-value = 0.7586
由差分后GDP時序圖可得出,二階差分后,GDP序列雖趨于平穩,但卻為白噪聲序列,即無法再提取有效信息,屬隨機游走序列,因此無法用ARIMA模型對其進行建模。觀察GDP序列時序圖,可觀察出該序列不具有明顯的季節成分,具有非線性趨勢。
3.3 確定
采用指數曲線預測模型、二次曲線指數平滑法、線性二次移動平均模型、灰色GM(1,1)四種單一預測方法和組合預測模型,得到結果如下:
通過計算各種組合預測模型的誤差指標值SDE(預測誤差平方),MDE(絕對誤差),MAPE(相對誤差),比較得出最優組合預測模型,即權數為:ω1=0.046,ω2=0.499,ω3=0.401,ω4=0.054,運用Yt=,i=1,2,……,k的組合預測模型。
3.4 精度比較
通過以上模型各誤差評價指標以及序列測試集精度的比較可知:組合預測模型的MAD、MAPE、SDE均相對最小,且在2017-2019年測試集上預測精度均在90%以上,效果良好。因此可得出:單項模型的預測效果不及組合模型的預測效果,應采用組合預測模型進行預測。
3.5 預測
通過以上各模型比較,采用組合預測模型對2020- 2022年GDP數據進行預測,結果為:2020年為28198.70億元,2021年為30514.33億元,2022年為32976.53億元。
4 總結
當下,國內經濟形勢發展已步入新常態階段,GDP增速整體是呈下行的發展趨勢。那么如何精確分析GDP增長呈現何種形式,如何準確判斷十四五期間乃至未來十幾年,經濟走勢是下行或是步入新的增長周期顯得尤為重要。因此,本文提出GDP新組合預測模型,旨在提升GDP的預測精度,為準確判斷經濟走勢,為相關部門制定正確的經濟發展戰略和政策都有重要的現實意義。
參考文獻:
[1] 徐國祥.統計預測和決策(第五版)[M].上海:上海財經大學出版社,2018.
[2] 劉寧.幾種浙江省GDP的預測方法及其比較[D].濟南:山東師范大學碩士學位論文,2019.
[3] 陳齊海.GDP組合預測模型的構建及應用研究[D].南昌:南昌大學碩士學位論文,2018.
[4] 雷振興.煤礦安全事故的分類和預測研究[D].西安:西安理工大學碩士學位論文,2010.
[5] 國家統計局2020年統計年鑒[EB/OL].https://data.stats.gov.cn/easyquery.htm?cn=E0103 2021.4EF8FED1-257B-49E3-A289-A25E6C5A67BA