安博文 李春玉 劉紅衛
(1.新疆財經大學統計與數據科學學院,新疆 烏魯木齊 830012;2.西藏大學理學院,西藏 拉薩 850000)
國內生產總值(GDP)是經濟社會(國家或地區)在一定時期內運用生產要素所生產的全部最終產品的市場價值,是衡量一個國家或地區經濟發展水平的重要指標。精確預測未來十年西藏地區GDP 的增長和增長速度,可以為政府作出經濟發展方面的規劃提供理論指導。有關GDP的趨勢預測方法,國內外學者都進行了廣泛研究。從預測模型來看,主要有自回歸滑動平均模型(ARMA 模型)、灰色系統模型(GM(1,1)模型)以及一些其他模型。
ARMA 模型是以隨機理論為基礎的時間序列分析模型,該模型既包含時間趨勢的自回歸因素,又考慮了時間序列的移動平均因素。因此,在分析GDP的趨勢擬合預測上具有獨特優勢,相關的成果主要有:華鵬和趙學民(2010)針對廣東省1978—2008 的GDP發展狀況采用ARIMA 模型進行擬合,實證結果發現ARIMA(1,1,0)擬合效果最優,并基于該模型對廣東省GDP進行短期預測[1];熊志斌(2011)采用ARIMA 模型與神經網絡集成的時間序列預測算法,對我國1978—2009 年的GDP 數據進行擬合,實證結果顯示,集成模型預測結果精度要優于單一模型的預測精度[2];尹靜和何躍(2011)基于四川省2000—2009 年GDP 的季度數據,采用ARIMA-GMDH 組合模型進行擬合,進一步證實了組合模型的預測效果要好于ARIMA 和GMDH單一模型的預測效果[3];何黎和何躍(2012)對我國GDP 的季度數據分別用GMDH 模型和ARIMA 模型進行預測,在引入PMI 指標后采用ARCH 模型進行預測,實證結果顯示,ARCH模型的預測結果要優于GMDH 和ARIMA 模型[4];張淑紅等(2014)基于河南省1978—2010 年人均GDP 指數的時間序列數據,采用AR 模型進行回歸預測,研究發現:“十二五”期間人均GDP 增速呈現先慢后快的增長趨勢[5];張靜(2017、2018)將貝葉斯先驗的統計思想融入時間序列,針對甘肅省1953—2010 年人均GDP 給出了兩種先驗分布下的貝葉斯算法,并采用穩健的貝葉斯時序模型預測了“十三五”時期人均GDP[6-7];張強等(2019)基于C-D生產函數和ARIMA 模型構建了GDP 綜合預測模型,并充分考慮社會外部環境對模型參數進行調整,對2016—2050 年的GDP 水平進行預測,發現未來區域間發展不均衡的趨勢將得到緩解[8]。
GM(1,1)模型是通過建立連續的微分方程,充分利用預測變量的已知信息,弱化未知信息,對灰色系統進行預測分析。大多數學者也將該模型應用到GDP數據的擬合預測上,相關成果主要有:張和平和陳齊海(2017)基于拓展的非線性GM(1,1)冪模型,并結合最新信息優先原則構建了等維新息遞補的GM(1,1)模型,對我國“十三五”期間的GDP 總量進行預測[9];李凱和張濤(2017)采用對初始值進行數據轉換和對背景值改進的GM(1,1)模型預測上海市2017—2020年的GDP,發現改進的GM(1,1)模型更適合用于GDP 預測,實證結果顯示,未來幾年上海市經濟水平將保持7%平穩增長[10];田梓辰和劉淼(2018)采用改進的拉格朗日插值對GM(1,1)模型進行重構,消除了傳統拉格朗日插值造成的弊端,并用新疆2006—2015 年的GDP數據進行實證,結果顯示,改進的GM(1,1)模型預測精度有所提升[11];祖培福等(2018)也采用背景值優化的GM(1,1)模型,對牡丹江GDP 進行了預測,發現背景值優化GM(1,1)模型的預測誤差要小于傳統GM(1,1)模型[12];龍會典和嚴廣樂(2017)基于GM(1,1)模型和Markov 鏈模型建立了動態GM(1,1)-Markov 鏈組合預測模型,用Taylor 展式近似該模型的數值結果,并對1991—2014 年廣東省的單位GDP 能耗數據進行擬合預測[13];張和平和解曉龍(2019)基于數據維度、初始值和原始數據三個維度建立了等維信息GM(1,1)模型、初始改進GM(1,1)模型和擬合模型,并對這3 個模型的權重加以設置得到組合預測模型,通過江西省2004—2015 年的GDP 數據進行實證,結果發現組合優化模型明顯提高了預測精度[14];張敏和黨耀國(2018)采用GM(1,1)與AR 相結合的模型對GDP 進行預測,對南京市2000—2015 年GDP 進行小波變換,把原始數據分類,對高頻信息用AR 模型擬合,對低頻信息用GM(1,1)模型進行擬合,將二者組合得到“十三五”期間南京市GDP的預測情況[15]。
此外,還有部分學者采用其他計量模型對GDP數據進行擬合預測研究。王鑫和肖枝洪(2012)采用干預模型和BP 神經網絡集成的時間序列預測模型,對我國1978—2004 年GDP 時間數據進行擬合,實證結果顯示,所建立的集成模型對于處理外部事件具有較強的有效性[16];喻勝華和鄧娟(2011)采用主成分分析和貝葉斯正則化的BP 神經網絡擬合預測我國1985—2008 年的GDP 數據,研究發現,該組合模型可以簡化網絡結構,提高模型的泛化能力,預測結果較優[17];耿鵬和齊紅倩(2012)針對高頻數據信息損失現象,采用了M-MIDAS-DL 模型對我國1992—2010年的GDP季度數據進行擬合預測,發現該模型在經濟趨勢分析中具有較好的預測作用[18];郭秋艷和何躍(2014)基于DFA 計算出的GDP 標度指數,采用BP 神經網絡對我國1990—2010 年的數據進行擬合預測,實證發現,該模型適用于非線性、時變性和不確定性的數據[19];蔣鐵軍和張懷強(2014)針對我國1952—2010 年的GDP時間序列數據進行相空間重構,采用核主成分回歸模型擬合預測,并進一步利用粒子群優化算法提高模型的普適性[20];索澤輝和冼軍(2015)基于Lomb-Scargle周期圖法提出GDP指數擬合增長波動率周期、建立指數預測模型,并對1978—2004 年的GDP 數據進行實證分析,發現擬合效果較高、有效性較強[21];張鵬(2018)基于變權函數和定權函數分別建立線性組合模型,并通過我國1978—2016 年的GDP 數據進行擬合預測,發現權值具有時效性,說明變權組合預測模型更適合時間序列數據[22];桂文林等(2018)基于奇異譜分析法估計了我國1992—2016 年GDP 產出缺口的季度數據,并通過比較通貨膨脹預測性和估計穩定性等方面,發現奇異譜分析法的預測結果要明顯優于HP、CF 和BW 等傳統濾波方法[23];馮金平等(2019)將非線性跟蹤-微分器采用Taylor 展式加以修正,并通過我國1952—2016 年的GDP 進行實證研究發現,該預測結果要優于依賴模型方法的預測結果[24]。
考慮到西藏地區GDP受到三類產業增加值、政府財政收支、地區進出口貿易、社會消費品零售額和固定資產投資等方面的影響,西藏地區GDP的變動趨勢既呈現出影響因素的隨機性、又包含時間的波動性,既存在時間上的滯后性、又具有相依性。因此,本文采用ARMA 模型,以1978—2018 年的西藏GDP 數據進行擬合,對未來十年的GDP 發展趨勢作出預測,并在預測結果的基礎上進行增長速度的分析,認為西藏地區在經濟發展的同時還要考慮諸如環境、資源等方面的問題,最終得出未來十年西藏經濟將穩步緩慢增長,走向經濟增長新常態之路。
ARMA 模型廣泛應用于時間序列數據,在短期預測方面效果明顯。該模型是由Box G 和Jenkins G(1970)首次提出的[25],ARMA(p,q)模型的具體形式為

其中:

B表示延遲算子,且φp≠0,θq≠0。
平穩性檢驗是時間序列數據預測的基礎,當時間序列數據處于非平穩狀態時,可通過取對數或差分進行處理。平穩性檢驗的方法有兩種,一種是通過作時序圖和自相關圖進行檢驗;另一種是采用單位根檢驗。
時序圖是一個平面二維坐標圖,橫軸表示時間,縱軸表示序列取值,可以用來直觀分析序列的一些基本分布特征。若時序圖顯示出該序列始終在一個常數值附近隨機波動而且波動的范圍有界,則該序列是平穩序列;若時序圖顯示出該序列有明顯的趨勢或周期,則該序列不是平穩序列。自相關圖(或偏自相關圖)是一個平面二維坐標懸垂線圖,橫軸表示自相關系數(或偏自相關系數),縱軸表示延遲時期數。平穩序列具有短期相關性,即自相關系數隨延遲期數的增加,平穩序列的自相關系數會很快衰減向零;非平穩序列的自相關系數衰減向零的速度比較慢。
單位根檢驗是檢驗序列平穩性的標準方法,這里采用ADF檢驗,即建立高階自回歸過程平穩性檢驗的方程為:

為了保證建模結果的穩健性,需要對GDP序列進行純隨機性檢驗,構造的檢驗統計量為:

據此提出的原假設為:對?m ≥1,ρ1=ρ2=···=ρm=0,即延遲期數小于或等于m 期的序列值之間相互獨立;備擇假設為:對?m ≥1,?k ≤m,使ρk=0,即延遲期數小于或等于m期的序列值之間有相關性。
對于ARMA(p,q)模型的估計,從式(1)可以看出,該模型共含有p+q+2 個未知參數,分別為:φ1,…,φp,θ1,…,θq,μ 和。其中μ 是時間序列數據的均值,采用矩估計法有:

下面采用極大似然法估計余下的p+q+1 個參數,即φ1,…,φ,θ1,…,θq,和,得到的估計結果為:

其中:


最后,采用最小信息量準則(AIC 準則)選取所有擬合模型中的相對最優模型。該準則可以從兩個方面考察擬合模型的優劣:一方面是考慮了擬合程度的似然函數值;另一方面是模型中未知參數的個數,因此AIC準則就是擬合精度和參數個數的加權函數,即

使AIC 函數達到最小的模型被認為是最優模型。從而,當同一個序列可以構造出多個顯著有效的擬合模型時,可以根據AIC準則選取相對最優模型。
本文樣本數據來源于《2019年西藏統計年鑒》,將1978—2018 年西藏地區GDP 的時間序列數據定義為GDPt(t=1978,1979,···,2018),單位為億元。圖1和圖2 分別展示了1978—2018 年西藏地區GDP 的定基增長速度與環比增長速度。

圖1 西藏地區GDP定基增長速度
由圖1 可以看出,西藏地區GDP 的定基發展速度出現了指數增長的趨勢;由圖2 可以看出,西藏地區GDP 的環比增長速度波動較大,1982 年和1986 年出現了環比負增長。由于定基增長速度呈現出明顯的指數增長趨勢,說明原始的GDP 序列屬于非平穩序列,并且具有較強的指數增長趨勢,因此對原始GDP序列取對數處理,得到:

圖2 西藏地區GDP環比增長速度

圖3 和圖4 依次作出了LGDP 序列的時序圖和自相關偏自相關圖。LGDP 具有明顯的直線上升趨勢,圖4 中LGDP 的自相關系數遞減到零的速度緩慢,在較長的延遲期里,自相關系數一直為正,隨后一直為負,自相關圖中也呈現出了明顯的三角對稱形,說明該序列是具有單調趨勢的非平穩序列。

圖3 LGDP的時序圖

圖4 LGDP的自相關和偏自相關圖
為消除LGDP 序列的線性趨勢性,這里考慮對此作一階差分處理,即有:

其中:△表示差分算子。從圖5 可以發現,△LGDP序列的自相關系數除延遲2 期外都控制在2 個標準差范圍以內,說明該序列是一個隨機性很強的平穩序列。考慮到時序圖檢驗和自相關偏自相關圖檢驗得出的平穩性結論較為主觀,下面采用ADF單位根檢驗考察△LGDP序列的平穩性。

圖5 △LGDP的自相關和偏自相關圖
根據式(2),可以得到有常數均值但無趨勢項類型的ADF 檢驗結果。表1 的計算結果顯示,常數項、滯后一期的LGDP 以及滯后一期的△LGDP 的t 統計量值均在1%水平下顯著,ADF檢驗對應的t統計量值也在1%水平下顯著,說明△LGDP 序列屬于平穩序列。因此,采用ARMA 模型對該時間序列數據建模得到的估計結果可靠。

表1 △LGDP的單位根檢驗結果
這里對△LGDP 序列進行純隨機性分析。根據式(3)計算出延遲2~12 期的Q 統計量值,如表2 所示。當延遲期數為2~5 期時,Q 統計量值在1%水平下顯著;當延遲期數為6~12期時,Q統計量值在5%水平下顯著。因此,可以顯著拒絕原假設,說明△LGDP序列具有很強的前后相關性,即認為該序列趨勢有統計規律可循,具備統計建模價值。

表2 △LGDP的純隨機性檢驗結果
估計ARMA 模型的一大關鍵在于模型的定階問題。從圖5 的自相關和偏自相關圖可以看出,自相關系數在2 階處出現了截尾,可以選用MA(2)模型;偏自相關系數也呈現出了2階截尾,因此可以采用AR(2)模型;綜合考慮自相關系數和偏自相關系數的截尾現象,可以選取ARMA(2,2)模型;自相關系數在延遲4 期處靠近兩個標準差的位置,此時考慮用AR(4)模型;同理也可選用ARMA(4,2)模型。因此,下面分別選用AR(2)、MA(2)、ARMA(2,2)、AR(4)以及ARMA(4,2)對△LGDP序列進行擬合,根據式(4)和式(5)計算得到表3。

表3 ARMA模型的估計結果
MA(2)模型、AR(2)模型、AR(4)模型以及ARMA(4,2)模型的參數估計結果均在5%水平下顯著,說明這4個模型回歸結果的可靠性較強,ARMA(2,2)模型中2階移動平均項系數的回歸結果并不顯著,說明該模型的可靠性較差,因此舍去該擬合模型。從表3 可以進一步看出,擬合的模型1,即AR(2)模型為:

經過化簡得到:

擬合的模型2,即AR(4)模型為:

經過化簡得到:

擬合的模型3,即MA(2)模型為:

經過化簡得到:

擬合的模型5,即ARMA(4,2)模型為:

經過化簡得到:

從擬合優度來看,ARMA(4,2)模型要優于AR(2)模型,而AR(2)模型又優于MA(2)模型,AR(4)模型的擬合效果較差;再考慮DW 檢驗結果,AR(2)模型和MA(2)模型的DW 檢驗值分別為1.7902 和1.7083,超出了1.8~2.2 的經驗范圍,故排除這兩個模型;對于AR(4)模型與ARMA(4,2)模型,這里同時采用AIC 準則和SBC 準則,ARMA(4,2)模型的AIC 數值和SBC 數值都要小于AR(4)模型的,說明ARMA(4,2)模型要明顯優于AR(4)模型。綜合以上原因,本文選取ARMA(4,2)模型擬合△LGDP序列,即采用ARIMA(4,1,2)模型擬合LGDP序列。
由于估計式(5)時采用了極大似然法,而極大似然估計的前提為假設△LGDP 序列服從正態分布。從圖6 可以看出,△LGDP 序列大體上服從正態分布,即符合極大似然估計的前提假設。

圖6 △LGDP的分布直方圖
本文最終選定ARIMA(4,1,2)模型擬合LGDP 序列,下面就對殘差序列進行純隨機性檢驗,據此判斷ARIMA(4,1,2)模型對LGDP 序列的信息提取是否充分,即判斷是否需要對該序列進行再一步挖掘。
從圖7和圖8可以看出,殘差序列符合正態分布的基本假設,下面再對殘差序列進行白噪聲檢驗(表4)。

圖7 殘差序列的分布直方圖

圖8 殘差序列的正態Q-Q圖

表4 殘差的白噪聲檢驗結果
從表4 可以看出,P 值明顯大于顯著性水平0.05,所以殘差序列不能拒絕純隨機的原假設,即認為該序列是純隨機序列。
上述檢驗結果顯示,△LGDP 序列服從正態分布的基本假設,殘差序列也通過了正態性檢驗和白噪聲檢驗,說明采用ARIMA(4,1,2)對LGDP 序列建模,其估計結果是十分穩健的。
下面采用ARIMA(4,1,2)對西藏地區未來十年的GDP 情況進行預測,將式(7)和式(8)代入式(12)中,得到預測方程為:

根據式(13)計算出對未來十年西藏地區GDP 的發展情況為:
依據表5 的預測結果,作出西藏未來GDP 的定基增長速度圖和環比增長速度圖,如圖9和圖10。

表5 來十年西藏GDP預測結果

圖9 未來十年西藏GDP定基增長速度
從圖9 可以看出,未來十年西藏地區GDP 仍處于增長趨勢,但定基增長速度已經從圖1 的指數增長趨勢變得較為平緩,甚至接近于一條直線,說明西藏地區GDP 的增速減緩了。再從圖10 可以看出,未來十年西藏地區GDP的環比增長速度雖然呈現上升趨勢,但出現了不同程度的波動情況,由2020 年到2021 年的環比增長下降了近0.5個百分點。

圖10 未來十年西藏GDP環比增長速度
本文基于西藏地區1978—2018 年的GDP 時間序列數據,建立ARIMA(4,1,2)擬合預測模型。首先,對非平穩GDP 序列進行取對數、作差分的平穩性處理,得到平穩的且具有時期相關性的△LGDP序列;其次,采用ARMA 對△LGDP序列進行擬合,并通過擬合優度、DW 檢驗、AIC 準則和SBC 準則等統計指標對擬合的模型綜合比較,發現ARIMA(4,1,2)對LGDP 序列的擬合效果最好;最后,通過△LGDP序列的正態性檢驗以及殘差序列的正態性檢驗和白噪聲檢驗,證明了估計結果的穩健性,并對西藏地區未來十年GDP的發展情況進行預測。
實證結果顯示,在未來十年西藏地區的經濟發展中,西藏GDP定基增長速度呈現出較為平緩的直線增長趨勢,環比增長速度也出現了不同程度的下調,從側面說明了,未來十年西藏地區在經濟發展同時,還要考慮到諸如環境、資源等方面的問題,要堅持走經濟增長新常態之路。