李 穎 譚 廣
2020年以來,受新冠肺炎疫情持續蔓延影響,我國當年前三季度GDP同比增速分別為-6.8%,3.2%,4.8%,出現了自1992年季度GDP核算以來的首次負值。此次新冠疫情致病性強、傳播范圍廣、持續時間長、影響層次深、不確定性大。我國GDP增速不僅面臨國內經濟結構轉型壓力,還受到中美貿易摩擦博弈明顯的影響,在國內外雙重壓力共振下,新冠疫情的持續存在,讓我國經濟環境盤根錯節。
所得數據均以均數±標準差表示,采用SPSS 24.0軟件進行統計學分析,組間比較采用單因素方差分析,兩兩比較采用LSD-t法,P<0.05為差異有統計學意義。
歷年以來,SARS、H1N1、埃博拉疫情等突發性公共衛生事件對經濟的影響持續受到學界廣泛關注。新冠肺炎疫情發生后,陳林等基于文獻回顧視角,梳理重大傳染病疫情大規模傳播原因。周新輝等選用貝葉斯嶺回歸模型估測在三種情景下,中國中小服務型企業所受疫情沖擊的數值。周梅芳、張文斗、吳婷婷等從供給側、需求側、區域經濟與行業經濟、產業鏈及供應鏈等方面探討新冠疫情對我國經濟造成的負面沖擊。
通過梳理相關文獻發現,現有研究多側重于從微觀角度分析疫情對某一經濟產業或行為主體的影響,未能量化評估新冠疫情對我國宏觀經濟的影響。而GDP作為宏觀經濟的基礎性指標,探究疫情對GDP增速的影響,可為我國找尋疫情損失提供理論依據。基于機器學習算法無需對數據作出假定要求,以及結果可用交叉驗證判斷的特點,本文利用開源的Python語言,通過機器學習不同回歸算法模型對歷史數據進行建模測算,再選取最優預測模型估測未發生新冠疫情情況下,2020年第一季度至第三季度的GDP增速,定量分析在現有防控體系下新冠肺炎疫情對我國GDP增速的影響。
經測算:按稅后利潤由高到低排序為:貿易融資、其他零售、住房按揭、大公司授信、信用證、貼現;按RAROC由高到低排序為:住房按揭、貿易融資、其他零售(貼現并列)、信用證、大公司授信;按考核得分由高到低排序為:貿易融資、住房按揭、其他零售、大公司授信、信用證、貼現。
GDP季度增速的預測指標體系已有多篇文獻進行討論,結合我國經濟發展的階段性特征,并參考肖爭艷做法,綜合選取反映消費水平、國內外貿易水平、重點產業、投資及能源、金融及財政等方面的指標,構成14個變量(見表1)以預測GDP季度增速。
接下來進一步利用上述前五種效果較佳的回歸模型對被解釋變量GDP增速進行預測,得到2018Q1-2019Q4預測結果見圖1。從圖1可以明顯看出,梯度提升回歸樹(GBRT)模型的預測值與實際值的擬合度最高,預測效果最好。XGBoost、ElasticNet、BayesianRidge、Bagging這四個模型的預測穩定性相對較差,階段性預測結果偏高或偏低情況明顯。
對3種預處理方法處理的枸杞子原料的外觀、粉碎后粉末流動性、作業難度、設備損耗、工作效率等進行比較,為選擇合理的干燥方法提供參考依據。經過預處理后的枸杞子顆粒,粉碎后僅少量粉末黏附在粉碎設備內部,樣品損失較少,具體情況見表2。

收集并處理好相關數據后,利用Python工具以及機器學習庫(Skearn)對數據進行建模分析。具體地,劃分樣本數據的60%作為訓練集,20%作為驗證集,20%作為測試集,再把訓練集導入到不同的回歸模型中進行建模訓練,然后用驗證集對模型進行參數調整以達到該模型最優效果,再將訓練集和驗證集數據所訓練出的模型作為最終模型。最后用測試集對模型效果進行評估,比較得到泛化誤差最小的優化回歸模型。為了合理評估模型的泛化能力,選取更優的預測模型,選取擬合優度(R2)、解釋方差(Evar)、均方誤差(MSE)、平均絕對誤差(MAE)四個評估指標對13種模型結果進行檢驗。檢驗效果如表2所示。
本文采用的經典機器學習方法有bagging回歸、Adaboost回歸、XGboost回歸、隨機森林回歸(RF)、梯度提升回歸樹(GBRT)、彈性網絡回歸(ElasticNet)、貝葉斯嶺回歸(BayesianRidge)、決策樹回歸(DecisionTree)、支持向量機回歸(SVR)、K最近鄰回歸(KNNRegressor),其中前7種屬于集成學習,是將多個弱學習器組合成的強學習器。同時還輔以傳統預測方法:線性回歸(LR)、lasso回歸、嶺回歸(Ridge)。將這13種方法的預測結果進行比較,優選出梯度提升回歸樹(GBRT)算法模型進行2020年第一季度至第三季度的GDP增速預測。
指標的獲取來源主要為國家統計局官網(http://www.stats.gov.cn)和中經網統計數據庫(https://db.cei.cn)。月度數據選取時間為1997年1月至2020年9月,季度數據的選取時間為1997年第一季度至2020年第二季度,缺失值用Python中的interpolate()進行插值處理。指標解釋及處理方式如表1所示。

表1 指標解釋及處理方式

表2 13種回歸模型的評估指標結果比較
對兩組患者的PLT(血小板)、WBC(白細胞)、中性粒細胞、淋巴細胞等血常規指標,以及TBIL(總膽紅素)、ALT(谷丙轉氨酶)、ALB(白蛋白)、A/G(肝功能白球比例)等生活指標水平進行觀察與記錄。
由上述分析得知,梯度提升回歸樹(GBRT)模型的預測效果最好,接下來將主要采用該模型來估測未發生疫情情況下,我國2020年第一季度至第三季度的GDP增速。
其次,計算負梯度rti及回歸樹每個葉子節點區域Rtm的輸出值ctm, 并更新強學習器:
根據上述評估指標結果(表2),可以看出梯度提升回歸樹(GBRT)模型相較于其他回歸模型有較穩定的表現,預測精度較好;而XGBoost、BayesianRidge、ElasticNet、Bagging等集成學習回歸模型效果也相對不錯;剩余回歸模型效果相對較弱。
運用梯度提升回歸模型進行建模分析時,重點對模型參數中的學習率(learning_rate)以及回歸樹數量(n_estimators)進行調參。基于模型參數的特征,最終采取網格搜索的方法進行模型參數設定,以此得到最優模型參數。

表3 備特征向量的重要程度
由于特征向量中不同的變量對預測結果有著不同的影響,遂通過GBRT模型輸出各解釋變量對最終預測結果的重要性比重。表3給出了各解釋變量對于預測結果的重要程度排序,其中工業增加值同比增速、第三產業增加值同比增速、發電量同比增速、出口額同比增速對于預測結果的貢獻度最大,這與實際情況比較符合。
由圖2可以看出,未受疫情影響下,2020年一、二、三季度GDP增速預測值分別為6.74%、6.43%、6.46%。與發生疫情后的GDP真實值對比發現,2020年第一季度GDP增速損失13.51%,第二季度GDP增速損失3.23%,第三季度GDP增速損失1.56%。結果表明,此次疫情對我國GDP增速帶來短期巨大沖擊,但由于率先控制住疫情,且系列恢復經濟的舉措加快推進,刺激消費的措施不斷出臺,我國GDP增速在第三季度達到較好效果。
《中共中央關于全面推進依法治國若干重大問題的決定》指出,法律是治國之重器,良法是善治之前提。中國海外投資保險法律制度是中國促進、管理和保護海外投資的基本法律制度,應當國家立法化,走良法善治之路。美國在 1961 年的《對外援助法》中詳細規定了海外投資保險制度,1981 年還制定了《美國海外私人投資公司修正法》。德國在《聯邦預算法》、日本在《出口保險法》、英國在《出口和投資保證法》中對海外投資保險事項作出詳細規定。上述國家的成功經驗表明,以國家立法方式,建立和實施完善的海外投資保險法律制度,防范和補救海外投資安全風險損失,是一國發展海外投資,樹立國際地位的重要法律途徑。
為了定量估測新冠疫情對我國GDP增速的影響,構建了GDP增速預測指標體系,擇優選出梯度提升回歸模型(GBRT)對未發生疫情情況下2020年第一季度至第三季度GDP增速進行預測,并得出以下結論:一是在GDP增速預測中,以梯度提升回歸模型為代表的集成學習,比一般機器學習具有更優良的泛化能力;二是工業增加值同比增速、第三產業增加值同比增速、發電量同比增速、出口額當期同比增速對GDP增速預測的貢獻度相對較大;三是新冠疫情的暴發導致我國2020年第一季度至第三季度GDP增速分別損失13.51%、3.23%、1.56%。