王丹俊 張占陽 王奉偉
摘要:基于1992-2022年GDP數據,文章分析了我國近30年經濟增長及各產業分量情況,并利用時間序列模型和高斯過程進行建模預測,研究各產業在GDP總量中的占比。分析結果發現我國GDP在1992-2019年增長較為平穩,受國際復雜形勢等影響,2020年第一季度GDP總量增速減緩,其中第二和第三產業受影響較大,而第一產業受影響相對較小。利用1992-2019年數據預測了2020-2022年的GDP,結果顯示,二次多項式時間序列模型預測結果明顯優于高斯過程模型。
關鍵詞:GDP;經濟分析;預測
一、引言
近30年來,我國經濟發展迅速,GDP總量從1992年的27194.5億元增長至2022年的1210207.0億元。1992-2011年GDP以7.7%~14.2%的速度快速增長,隨著國家經濟結構調整政策的出臺,2012-2019年期間GDP以6.1%~7.9%的速度平穩增長。近三年來,學者們深入全面地研究評估了國際復雜形勢對全國及區域GDP的影響。例如,韓愛華等分析了我國經濟韌性測度及相關影響因素,發現各省份存在差異。朱啟榮等研究分析了國際復雜形勢等因素對我國經濟產生的沖擊。李守璽和昝文嬌使用我國的季度GDP數據定量研究預測了我國GDP總量。此外諸多研究還探究了疫情等因素對世界各國GDP的影響路徑,并對各國制定的經濟刺激政策的效用進行了評估。
以上研究主要從定量或定性的角度針對不同國家或地區分析預測了GDP總量,如何優選建立適合的預測模型提高預測精度成為關鍵問題之一。當前主流的預測方法有多元線性回歸、時間序列模型、灰色理論和高斯過程等。其中,高斯過程機器學習技術因其處理小樣本和非線性數據方面的優勢而被廣泛應用于各個領域。鑒于各個國家或地區經濟產業結構不同,因此,受疫情影響程度亦不盡相同。考慮到我國GDP數據序列呈二次曲線增長模式,本文對我國1992-2022年年度和季度GDP數據進行深入分析,通過使用1992-2019年GDP數據,利用高斯過程和二次多項式時間序列模型進行擬合,預測2020-2022年期間我國GDP數據,從年度GDP總量和第一、二和三產業層面預測我國GDP總量及各產業分量,探究適合的GDP預測模型。
二、研究方法
(一)基于二次多項式的時間序列預測模型
由圖1中可以發現,我國年度GDP序列呈現二次曲線特性,因此本文利用二次多項式模型對1992-2019年GDP序列建模,以預測2020-2022年GDP數值。具體如下:
y=at2+bt+c(1)
式中a,b,c為模型系數。
(二)高斯過程預測模型
高斯過程機器學習技術,在處理非線性小樣本數據方面具有明顯優勢,由協方差和均值函數定義。首先回歸模型可表示如下:
y=f(x)+ε(2)
其中y表示觀測值,x為輸入向量,噪聲ε~N(0,σ? )。根據貝葉斯概率公式可推導出預測值y′的期望和方差。
μ =C(x′,X)[C(X,X)+σ? In]-1y(3)
σ? =C(x′,x′)-C(x′,X)[C(X,X)+σ? In]-1C(X,x′)(4)
高斯過程機器學習方法的協方差函數表示如下:
C(xi,xj)=σ? exp[- (xi,xj)TM(xi,xj)]+σ? σij(5)
其中σij為克洛內克爾符號,l為方差尺度,M=diag(l-2)為超參數對角陣,σ? 為協方差函數信號方差,利用對數函數極大似然法解算超參數θ={M,σ? ,σ? },具體原理見參考文獻。
三、實驗分析
(一)我國年度GDP數據分析
本文采用的數據為1992-2022年中國GDP年度和季度數據,共31年,總計124個季度數據,數據來自國家統計局。年度GDP序列總體上呈現穩定上升的趨勢,1992-2008年上升幅度較小,而自2008年之后增速明顯。如圖1所示,1992-2012年,GDP總量由第二產業和第三產業主導,第一產業占比最少。2013年以后,我國GDP逐漸形成以第三產業為首,第二產業為輔,第一產業為補的新型經濟結構形式,隨著經濟結構的進一步優化,到2022年,第一、二、三產業分別占年度GDP總量的7.30%、39.92%和52.78%。從圖1可以看出,2020年GDP總量增速減緩,第二產業(制造業等)和第三產業(服務業等)GDP分量增速減緩,由國際復雜形勢等因素導致,而第一產業(農林牧漁業等)保持穩定。圖2給出了1992-2022年中國季度GDP總量和各產業分量對比情況。從季度時間尺度層面可以看出,2020年第一季度GDP出現了短期下滑,但隨著我國政府采取高效的疫情防控措施,其在第三季度開始基本恢復到歷史趨勢水平。
(二)我國年度GDP數據預測
綜合考慮現有GDP預測方法和GDP數據序列特性,本文選取二次多項式時間序列模型和高斯過程兩種預測方法對我國年度GDP總量進行擬合并比較分析(其中高斯過程算法均值函數采用MeanZero,協方差函數選擇covPoly核函數),以{X=(ti,Xi),i=1992,1993,…,2019}為高斯過程GP訓練樣本,{X=(ti,Xi),i=2020,2021,2022}作為檢驗樣本。同時利用兩種預測模型來預測2020、2021和2022年的GDP總量,對相應的實際值進行驗證,并計算MAE=(∑|e|)/n和MAPE=(∑(|e|/y))/n作為評價指標,e為殘差值,n為數據個數。
具體建模結果見表1,結果發現高斯過程預測模型的擬合精度與二次多項式時間序列模型的擬合精度較為接近,其擬合平均絕對百分比誤差為11.60%和14.56%。對于2020-2022年我國GDP的預測,二次多項式預測模型的預測平均絕對誤差為26788.8億元,而平均絕對百分比誤差僅為2.50%;明顯小于高斯過程模型的51931.6億元和4.71%。綜上所述,與高斯過程預測模型相比,基于二次多項式的時間序列模型更適合用于預測我國未來GDP總量變化。由此可以得出,與高斯過程相比,基于時間序列預測模型預測的2020-2022年我國GDP總量更接近于實際數據,平均絕對誤差和相對誤差分別為26788.8億元和2.50%。特別說明,李守璽等(2022)預測的2020年第一季度至2022年第四季度GDP預測值換算成年度GDP,預測結果明顯差于本文結果,具體相關結果見表1。
(三)我國不同產業GDP分量預測
在前述分析基礎上,本小節將分別對第一、二和三產業GDP序列進行分析預測。考慮到二次多項式時間序列模型在GDP預測上的優越性和適用性,下文僅采用時間序列模型對三個產業分量進行預測。各產業GDP分量擬合和預測值與實際值對比情況,相關數據統計見表2。結果顯示,從長期趨勢層面來看,疫情等國際復雜形勢對于第一產業影響較小;第二產業在2020年雖受到一定影響,但在2021年和2022年已恢復到歷史趨勢預測水平。
四、結語
本文深入分析了我國1992-2022年年度和季度GDP數據,利用高斯過程和時間序列模型兩種預測算法從長期趨勢角度預測了我國GDP總量增長,結果發現二次多項式擬合和預測GDP的精度較高,明顯優于高斯過程和現有相關研究文獻。此外,從各產業預測結果可以斷定,2022年第一和第二產業已恢復到歷史GDP變化趨勢預測水平。
參考文獻:
[1]裴凱欣,楊曉丹.新冠疫情對我國經濟影響的研究[J].產業與科技論壇,2021,20(18):52-54.
[2]陳勇鳴.新冠肺炎疫情對上海經濟的影響及應對思考[J].上海企業,2022(06):76-82.
[3]鄧陽,董洪光.新冠疫情對江蘇省經濟發展的影響研究[J].中國商論,2022(24):18-20.
[4]韓愛華,李夢蓮,高子桓.疫情沖擊下經濟韌性測度及影響因素分析[J].統計與決策,2021,37(18):85-89.
[5]朱啟榮,孫明松,楊偉東.新冠肺炎疫情對我國經濟影響的評估:基于GTAP模型的實證[J].統計與決策,2020,36(21):91-96.
[6]李守璽,昝文嬌.新冠肺炎疫情對我國GDP影響的實證分析[J].河北企業,2022(05):24-26.
[7]趙晨曦.疫情對各國GDP的沖擊路徑分析及經濟刺激政策效用評估[J].商展經濟,2022(06):31-33.
[8]蘇國韶.基于高斯過程機器學習的沖擊地壓危險性預測[J].遼寧工程技術大學學報:自然科學報,2009,28(5):762-765.
[9]趙嫻,戶天舒.新冠肺炎疫情對我國第三產業影響實證分析[J].中國市場,2021(14):78-79.
[10]王建豐,王偉麗.后疫情時期新冠肺炎疫情對我國經濟影響的量化模擬分析[J].工業技術經濟,2022,41(01):86-93.
(作者單位:王丹俊,上海財經大學金融學院;張占陽,內蒙古呼和浩特供電分公司科技城園區供電公司;王奉偉,同濟大學測繪與地理信息學院。王奉偉為通信作者)