楊忠裕 ,薛紫玥
(1.蘭州大學 數學與統計學院,甘肅 蘭州 730013;2.蘭州大學 管理學院,甘肅 蘭州 730013)
GDP是指在特定時間內某個國家或區域的社會主義國民經濟中所制造出來的所有最終商品和勞動力的價格,反映了該國家或者地區的經濟實力和市場規模。筆者認為,GDP的本質含義是判斷在一個國家地理邊界內一年時間里全部經濟活動的活躍程度的一個宏觀指標。根據GDP的定義,它還包括了占有相當大比例和具有重要作用的投資和政府開銷。對于商品生產和銷售活動來說這很容易理解,因為這些都是典型的直接的經濟活動。而投資則是為將來的經濟活動做準備,政府開銷則是對經濟活動進行不可或缺的適當形式輔助管理所必要的開支,屬于間接的經濟活動。GDP則是一定空間內、一定時間段內衡量以國家為單位所有的人所從事的全部經濟活動總的活躍程度。研究甘肅省經濟發展水平,也就是研究甘肅省全部經濟活動總的活躍程度,也就可從側面得知甘肅省的經濟發展是否健康,是否向著良性發展等情況。所以,若能對甘肅省未來GDP作出準確的預測,就能夠為宏觀經濟的健康發展起到一定的導向性作用,有利于作出更好的決策,也有利于甘肅省GDP持續增長。
時間序列,主要是指使用過去和現在的歷史數據對未來數據做出預估的一個方式。時間序列經過變換后,能夠以3項相加的形式進行表示。由一個時間序列獲得信息并劃分出趨勢項、周期項和隨機誤差項。時間序列的ARIMA模型是基于歷史數據的相關性分析,得出當前期與滯后期之間的相關系數,并利用最小二乘法建立時間序列中當前項和滯后項之間的線性關系。在使用過程中,雖然ARIMA模型對于預計短期內結果的效果較好,但隨著預測時期增長會使得模型偏差逐漸變大。
文章將基于ARIMA模型對甘肅省GDP進行分析與預測,在建模的過程中,對不平穩的數據進行了差分處理,使其變得更加平穩,通過ADF 檢驗,再由偏(自相關分析)圖估算其p、q值,從而確立甘肅省GDP的ARIMA模型,并對未來兩年GDP進行預測,可為甘肅省的決策部門提供參考,有利于其做出更好的決策。文章還選用了甘肅省省內城市近三十年的GDP數據作為研究對象,對其建立ARIMA模型分析與預測,分析出不同城市的年增長率與預測未來的年增長率,也有利于甘肅省的決策部門得到更好的宏觀視角,有利于政策得到更好的落實。
近年來,我國經濟受到新冠肺炎疫情、宏觀經濟產業結構調整等多方面影響,使得GDP的增長速度相對減慢,這顯然增加了GDP的預測難度。
GDP受資源、資本、人口等眾多因素影響,且各因素之間往往都會存在多重共線性,不同因素之間的相關關系十分復雜。傳統的因素解釋模型很難對 GDP 進行準確有效的預測,且其擬合精確度較低,而如果使用建立時間序列ARIMA模型的方式,就能獲得有較好的模型擬合精確度和估計準確度的新模型。文章中選擇了甘肅省1992—2021年GDP歷史數據,并構建了ARIMA模型,用歷史數據對模型進行了擬合和試驗,最后確定擬合ARIMA(0,2,1)模型。
華鵬等根據廣東省1978—2008年的GDP進行ARIMA建模,對廣東省GDP作出短期估計;熊志斌通過ARIMA建模技術和由神經網絡集成的時間序列預測算法,對中國1978—2009年的GDP統計實現了模型擬合;張強等根據C-D生產函數和ARIMA模式建立了GDP的總體預估模式,預測了2016—2050年的GDP;王佳佳基于安徽省1978—2019年的GDP進行分析,建立ARIMA模型對安徽省2020—2021年的GDP進行預測;安博文等基于西藏地區1978—2018年的GDP建立ARIMA模型,對未來十年西藏地區GDP進行預測。
ARIMA(p,d,q)模型結構如下:
(1)
Φ(B)=1-φ1B-φ2B2-…-φpBp
(2)
Θ(B)=1-θ1B-θ2B2-…-θqBq
(3)
式中:B代表的是延遲算子的意義;式(2)中代表的是階數為p的自回歸系數多項式;式(3)中代表的是階數為q的移動平均系數多項式。p,d,q依次代表了自回歸階次、差分滯后階次和移動均值階次。當d=0時,就是ARMA模型,當p=0時,可簡記為IMA(d,q)模型,當q=0時,ARIMA(p,d,q)模型可簡記為ARI(p,d)模型。
(1)對數據進行ADF檢驗,識別序列的平穩性。
(2)查看差分前后數據對比圖,判斷其是否平穩,同時對時間序列進行偏自相關性分析,根據截尾情況估算其p、q值。
(3)查看模型檢驗表,根據Q統計量的p值對模型白噪聲進行檢驗,也可以結合信息準則AIC和BIC值進行分析(越低越好)。
(4)根據模型參數表,得出模型公式。
(5)結合時間序列分析圖進行綜合分析,得出向后預測的階數結果。
文中選擇了甘肅省1992—2021年GDP為研究對象,并建立了ARIMA(0,2,1)模型。所有數據均來自國家統計局。
觀察自相關與偏自相關圖均為拖尾,即可定出為ARIMA(0,2,1)模型。

表1 ADF檢驗
基于字段GDP,并基于AIC與BIC信息準則,自動尋找最優參數,得出基于2階差分數據的ARIMA(0,2,1)模型檢驗表,得出模型公式:
y(t)=24.746-0.998×ε(t-1)
(4)
在檢驗ARIMA模型(0,2,1)的模型參數表中,Df Residuals為26,Q統計量:Q6,Q12,Q18,Q24的p值分別為0.247(0.619)、4.383(0.625)、8.691(0.729)、10.801(0.903),AIC值為387.027,BIC值為391.024,模型擬合優度R2為0.995。
雖然Q在水平上并不呈現明顯性,也不能否定模型的殘余誤差為白噪聲序列的假設,但由于模型擬合優度R2為0.995,因此模型仍相當優秀且模型基本滿足上述要求。

表2 時間預測
從擬合結果來看,ARIMA模型短期預測效果較好,且能較好地結合長期趨勢和短期波動的情況,來反映甘肅省GDP的整體走勢,但受新冠肺炎疫情影響,能否達到此預測值,還有待結合實際驗證。

表3 甘肅省省內城市GDP分析

圖1 時間預測
由圖1可知,甘肅省省內全部城市都處于良好發展階段,在構建的ARIMA模型中,都呈現出了良性發展,但省內不同城市間的GDP相差較大,期望相關部門可以落實“先富帶動后富”政策,讓蘭州推動省內其余城市的經濟發展。
(1)對于不同的地區經濟增長趨勢結合不同的地域特色,可選擇不同的影響要素;但隨著不同地區經濟發展過程中會有不確定變化,不同地區會做出不同的決策選擇。但無論相應地區采取什么經濟政策或者發展戰略都可以采用ARIMA模型對其進行數據預測。
(2)ARIMA模式并不需要借助于任何的外生變數,而只要求內生變量。
(3)雖然ARIMA模型在實質上只是捕捉線性關系,并沒有捕捉非線性關系。但實際上,大部分序列之間都具有非線性關聯。若ARIMA模型序列變量的未來取值并不符合先前觀察值和隨機誤差間的線性函數關系,則就不可以構建ARIMA模型。顯然,ARIMA 模型是有局限性的。
(4)在建模過程中,首先要求模型數據處理結果必須符合均衡性的要求,如果數據處理結果不符合均衡性檢驗,則可用選差分和取對數等方法使之通過檢測。
(5)使用ARIMA模型預測時間序列數據,其模型數據要求范圍必須是固定的,而如果數據的范圍不固定的話,則是無法捕捉到數據的變化規律的。建模數據的穩定性可以使用ADF檢驗,并且使用差分分析對數據進行穩定性處理。
文章選擇了差分方式來確定建模數據的均衡性,再根據所繪制出來的ACF圖和PACF圖,可得出較適合甘肅省GDP的模型為ARIMA(0,2,1),接著對模型進行參數的顯著性檢測和殘差值的白噪聲檢測,使之更具有可靠性,而預測值與實際值間的比較,也證實了建模的可行性。
在對比2020年的預測值與實際值的過程中,發現時間序列與ARIMA模式間的誤差是不可被忽視的,這與2020年新冠肺炎疫情對我國宏觀經濟的巨大影響息息相關,是在ARIMA模式中所無法反映出的宏觀經濟影響。可見,利用時間序列的ARIMA模型可對研究對象作出效果不錯的短期內的預報,但這結果僅能起到參考作用。最終預測結果表明,未來兩年甘肅省GDP會呈平緩持續的增長,在不遭遇特殊事件下,甘肅省GDP預計不會出現劇烈波動的情況。結合中國新冠肺炎疫情的不確定性以及國際形勢多變性,再加上我國目前也處在經濟社會發展轉型的關鍵時期,與甘肅經濟相關的政府部門的當前宏觀經濟發展戰略計劃也須適時地調整與完善,以保持甘肅省GDP的平穩上升。在疫情大環境時代,如何能把疫情帶來的影響降到最低,找出新的發展策略,促進新的產業轉型量升級,從而得到高質量發展,也是解決甘肅未來經濟發展的重要課題。