□朱天福 趙 靜 張 琦 張 鵬 張崇輝 陳思超 陳思博
國內生產總值(Gross Domestic Product,簡稱GDP)是一個國家(或地區)所有常住單位在一定時期內生產活動的最終成果。它是衡量一國或地區經濟狀況、發展水平的重要指標(李寶瑜和張靖,2012)。目前各國政府的統計部門均把其作為描述經濟發展最重要的宏觀指標。GDP 不僅是制定經濟發展戰略和宏觀經濟政策的重要工具和參考依據。同時,它還能夠對宏觀經濟政策進行檢驗,是反映政策科學性、合理性和有效性的重要手段。
隨著經濟發展,特別是經濟發展的不確定性因素大大增加,如國際形勢變化、貿易摩擦增加、大宗商品價格波動、新冠肺炎疫情影響等,需要對經濟形勢及時作出研究判斷,以便及時制定經濟干預政策,保障經濟發展處于合理區間。因此,非常有必要對GDP 未來走勢進行建模預測,提升預測預警和戰略目標管理能力,為推進高質量發展建設共同富裕示范區提供統計支撐。
整理相關文獻可知,目前學術界就GDP 預測展開的大量研究,主要基于混頻預測模型、時間序列模型和機器學習模型等展開。例如,張勁帆等(2018)構建了混頻向量自回歸模型,利用貝葉斯預測方法,對中國的宏觀經濟進行預測,結果表明房地產行業對中國宏觀經濟具有重要作用;仝冰等(2009)采用VAR 模型對宏觀經濟變量進行預測,并將之與朗潤預測進行對比,發現貨幣無法預測未來經濟活動;葉鈺城(2021)討論了技術創新與經濟增長之間的關系,通過專利數據來衡量國家創新能力,并對各國人均GDP 的增長率進行預測。此外,何強等(2020)和熊志斌(2011)均采用機器學習模型對GDP 進行預測,并取得較高的預測效果。
但是,現有關于GDP 的預測研究大多基于單一視角開展,且使用的模型均具有限制性。例如,時間序列模型采用單指標的自回歸,適用于經濟發展較有規律且相對平穩的情況,對于出現新冠肺炎疫情等特殊事件后的預測結果不甚理想;機器學習模型的預測過程類似“黑匣子”,無法對預測結果進行合理解釋;混頻預測模型需要統計部門并不掌握的每日高頻數據,數據獲得性存在問題。事實上,GDP 作為一種宏觀經濟生產活動,其本質上還是一種基于要素投入的經濟產出現象。因此,通過對GDP 的投入要素進行建模,能夠較為準確地捕捉經濟生產活動規律。此外,從GDP 核算的角度來說,統計部門在核算GDP 時往往會側重于對GDP 產生重要影響的行業或者指標,故對GDP影響因素建模也能較為準確地反映地區經濟形勢。
本文基于投入產出和影響因素雙重視角,采用C-D 生產函數模型和GDP 影響因素模型對浙江省GDP當季總量進行建模,通過對兩個模型預測結果的相互驗證以證明本文思路的有效性。而后在測算GDP 增幅時,假定預測期和最近季度的價格波動及產業結構基本相同,并結合GDP 當季現價總量預測值以及最近季度GDP 核算的縮減指數,即可推算得到GDP 同比增幅(考慮到GDP 數據的敏感性,本文僅作理論及思路探索,隱去具體模型及預測結果)。進一步地,通過對比本文提出的這兩個模型與其他時間序列模型的預測結果,突出本文的模型不僅有較高準確性和可解釋性,同時在突發情況下的預測效果更佳。
一是采用統計部門便于掌握的基礎數據建模。指標選擇上更有方向性地選取了占GDP 比重較大的行業且易獲得的相關指標,如基準化后的GDP 季度總量、規模以上(以下簡稱規上)工業和規上服務業等從業人員數、規上工業總產值等。二是充分利用GDP 核算實踐經驗,部分借鑒GDP 季度核算方案。如在數據處理上,交通運輸周轉量采用季度GDP 核算方案中的權重加權旅客運輸量和貨物運輸量。三是先預測當季GDP 總量再根據最近季度的價格縮減指數推算GDP 增幅,預測GDP 增幅準確性更高,更加貼近經濟運行實際。
1.模型構建。作為最典型的生產函數,柯布-道格拉斯(Cobb-Douglas)生產函數(簡稱C-D 生產函數)對于測算技術進步,分析規模經濟、最佳投入結構等問題具有重要作用。其基本形式如下所示:

式中,A 是技術進步水平,具體包括生產技術、工藝設備、人工能力和管理水平等因素。K 是資本要素,可以是投入的資金額或投入的設備等固定資產數額。L 是勞動要素,即所投入的勞動量。α 是資本K 的產出彈性,β 是勞動L 的產出彈性,μ 為隨機干擾項。Q 是產出量,可以為實物形式的產出量,也可以作為價值形式的產出量。
2.指標選擇。根據宏觀經濟投入產出的思想,國民經濟生產活動產出要素的主要表現形式為GDP,而投入要素主要包括人力(勞動力)、物力、財力(資本)、技術等(表1)。

表1 C-D 生產函數模型的變量及解釋
其中,勞動力指從事增加商品價值的有用勞動能力,是蘊藏在人體中的腦力和體力的總和。根據數據的準確性以及可獲得性,本文選擇規上第二產業從業人員(包括規上工業、規上建筑業從業人員)、規上(限上)第三產業從業人員(包括限上批發零售業、限上住宿餐飲業、限上房地產開發業、規上服務業從業人員)等指標作為勞動力投入要素的備選指標。
物力包括可供使用的企業用地等經濟資源,還包括樹木、水資源、用電等自然資源。這些要素中,企業用地一經獲取便基本不再變動,而宏觀經濟則呈周期性波動,甚至于在某些特定行業(如數字經濟行業),企業不需要土地或者僅需要小部分土地,便可創造出巨大的社會價值。由此,難以通過企業土地捕捉宏觀經濟的變化規律;樹木、水資源等要素則相對集中于資源密集型行業,不具備典型性;與全社會用電量相比,工業用電與工業生產直接相關,與宏觀經濟走勢擬合度更高。因此,本文選擇工業用電作為物力投入。此外,供應鏈物流已成為影響國民經濟效率的重要因素,本文選擇運輸量(包括鐵路、公路、水路)、周轉量(包括鐵路、公路、水路)等能反映供應鏈運轉能力的指標作為物力投入的補充要素。
資本指在宏觀經濟生產過程中所需的資金投入,本文選擇本外幣存款余額和本外幣貸款余額(包括境內貸款和境外貸款)指標。
技術投入要素中,R&D 研發投入能較好地反映一個國家或地區用于投入技術研發的水平。
1.模型構建。多元線性回歸模型是影響因素分析方法中最常見的一種方法,多元線性回歸模型是指在相關變量中將一個變量視為因變量,其他一個或多個變量視為自變量,建立多個變量之間線性或非線性數學模型數量關系式,并利用樣本數據進行分析的統計分析方法。多元線性回歸模型的形式如下:

其中,y 為因變量,xi為自變量,即影響因變量的因素。βi為影響系數,α0為截距項。
2.指標選擇。根據浙江現有GDP 行業結構,規上工業增加值是影響GDP 最重要的指標,但是規上工業增加值和GDP 存在高度共線性。因此,本文采用規上工業總產值進行代替(表2)。

表2 影響因素模型的變量及解釋
規上服務業營業收入包括交通、信息傳輸、租賃和商務服務業、科學研究、水利、居民服務、教育、衛生、文化體育和娛樂業9 個門類,物業管理、房地產中介服務、房地產租賃經營和其他房地產業4 個中類的營業收入,所涉行業增加值占GDP 比重在25%左右,營業收入能較好地反映服務業發展趨勢。
批發和零售業增加值占全省GDP 比重在12%左右,占比較大,一般用月度的限上批發和零售業銷售額(全部批發和零售業銷售額只有季度統計,并且需由國家統計局核定)來反映發展整個行業的發展態勢。
建筑業增加值占全省GDP 比重約6%,用建筑安裝投資能較好反映建筑業發展。
規上工業出口交貨值和進出口總額作為衡量進出口規模的重要指標,反映企業通過生產經營實現的海外經濟效益。但進出口總額不僅包含本地區企業創造的經濟價值,還包含其他地區企業的產品,經由本地區售往海外而實現的經濟價值,涵蓋范圍較廣。而規上工業出口交貨值則僅反映本地區規上工業企業產品銷往海外所創造的最終價值,統計口徑較為準確。綜合考慮GDP的影響因素,本文將這兩個指標也納入建模范疇。
其他行業,如金融業,占GDP比重雖較大(8%左右),但主要指標本外幣存貸款變化不大;公共管理業、農業相對穩定;住宿餐飲業增加值占GDP 比重不到2%,可忽略不計。
進一步地,為了突出本文的C-D生產函數模型和影響因素模型,本文將其與基于時間序列的3 個預測模型進行對比。
1.ARMA+GM 組合模型:是指基于ARMA 和灰色GM(1,1)的組合模型。根據表X 的結果,可得季節性序列和剝離季節項的GDP 序列。對于季節序列,經檢驗發現其滿足平穩性過程,經過自相關和偏自相關檢驗后,發現序列滿足3 階拖尾和3 階截尾,故采用ARMA(3,3)模型對季節序列進行擬合;對于剔除季節效應后的GDP 序列,考慮到其為遞增序列,故采用灰色GM(1,1)模型進行擬合,并預測各期的GDP 值。
2.ARMA+Holt 組合模型:是基于ARMA 和Holt 指數平滑的組合模型。由于Holt 指數平滑模型適用于對含趨勢項的時間序列數據進行預測,所以ARMA+Holt 組合模型的處理思路與ARMA+GM 組合模型類似,只是將ARMA+GM 組合模型中的灰色GM(1,1)方法替換成Holt指數平滑法即可。
3.Holt-Winters 平滑模型:是基于Holt-Winters 的指數平滑模型。該方法是一種經典的對含有季節項和趨勢項的時間序列數據集進行平滑預測的單變量時間序列模型,如GDP 序列等。
圖2 為各個模型從2014 年一季度到2022 年一季度全省GDP 當季總量的擬合結果,可以發現5 個模型的平均預測誤差均在5%以內,具有較好的擬合效果。但是C-D 生產函數模型和影響因素模型在2021年一季度(受新冠肺炎疫情影響)的預測誤差分別為4.19%和-0.5%,較時間序列模型而言具有較大的優勢,表明這兩個模型在突發事件下也具備了較好的擬合效果。

圖1 GDP 序列及其分解結果

圖2 各個模型的擬合結果對比
另外,從模型本身的特征來看,ARMA+GM 模型、ARMA+Holt 模型、Holt-Winters 模型屬于單變量預測模型,其優點是結構簡單,在常規狀態下具有較好的擬合效果,但不足之處在于可解釋性較差,且對突發事件的預測效果不佳;C-D生產函數模型是以投入產出要素作為變量,對GDP 進行擬合,是一種線性關系的模型;影響因素模型也是基于GDP 影響因素構建的線性模型。這兩個模型的優點是模型簡單、解釋性較強、較為直觀,相較時間序列模型而言對突發事件具有較好的擬合效果。因此,在綜合考慮后,本文選擇C-D 生產函數模型和影響因素模型作為浙江省GDP 預測的主要模型。
本文基于投入產出和影響因素雙重視角,采用C-D 生產函數模型和GDP 影響因素模型對浙江省GDP總量進行建模,通過對兩個模型預測結果的相互驗證以證明本文思路的有效性。進一步地,通過對比C-D生產函數模型和GDP 影響因素模型這兩個模型與其他時間序列模型的預測結果與實際差距情況,突出本文構建的模型不僅有較高準確性和可解釋性,同時在突發情況下的預測效果更佳且兼具統計特色。
本文的研究仍存在不少不足之處,主要在于:第一,GDP 影響因素眾多且相互關系錯綜復雜,本文中選擇的指標大致能反映經濟發展的趨勢,但并不能涵蓋所有的經濟活動,無法完全準確地反映GDP 的具體核算結果;第二,GDP 預測模型中的主要相關指標預測采用單指標的時間序列模型,受限于時間及精力,預測方式相對簡單,存在一定程度上的準確性問題;第三,根據規定,GDP 采用統一核算方式,當各省匯總的GDP 總量、增幅與全國GDP 存在較大差異時,國家統計局還將按照GDP 統一核算方案,以全國數據為準,對各省初步核算的GDP 數據進行銜接處理。根據模型測算出來的GDP 總量及增幅無法考慮GDP 統一核算因素,肯定會與實際值存在差異;第四,實際情況中,較難完全滿足本文先預測GDP 當季現價總量,再根據最近季度GDP 核算的縮減指數推算GDP 增幅所隱含的假設,即預測期和最近季度的價格波動及產業結構基本相同。
為進一步完善GDP 預測模型,不斷提高預測結果的準確性,有以下建議:
1.對GDP 影響因素模型中涉及的主要相關指標進行深度研究,選擇采用更為精準的預測模型。
2.擴大基礎資料來源,充分挖掘銀聯消費、港口貨運量、機場客運量、網絡購物等高頻大數據,以及其他部門未公開的內部數據,構建靈敏度更高的混頻預測模型。
3.嘗試采用C-D 生產函數模型和GDP 影響因素模型同步預測全省和各設區市的GDP 情況,通過積累一段時間的預測數據及偏差情況,逐步完善預測模型。
4.預測期和最近季度的價格波動和產業結構可能存在一定偏差時,還需對最近季度的價格縮減指數評估后再用于預測模型。