王蘭平
【摘 要】GDP增速一直是一個地區乃至一個國家經濟發展狀況的最直接衡量指標。研究GDP增長的影響因素對決策者提供政策指導、國家經濟的健康快速發展具有重要意義。本文通過描述性統計分析和多元回歸分析分析發現固定資產投資增速和第三產業增加指數對GDP增速最為顯著。
【關鍵詞】GDP增速;描述性統計分析;多元統計分析
一、數據來源
GDP 一直以來都是熱門研究話題,現有的文獻大多研究 GDP 總量或者人均 GDP 的影響因素。比如劉麗華[1]劉麗華基于回歸分析方法對人均 GDP 的影響因素做了研究,劉花璐[2]運用灰色系統理論中的GM(1,1) 預測模型預測湖北省未來的 GDP 走勢。在本文中,主要對 GDP 增長率的影響因素做深入研究, 這或許更能把握 GDP 的決定因素。
本文所用數據均來自于國家統計局官方網站[3]。共選取 GDP 增長率(y)、專利數增率(x1)、技術市場成交額增率(x2)、第一產業增速(x3)、第二產業增速(x4)、第三產業增速(x5)、固定資產投資增速(x6)、房地產投資增長率(x7)、城鎮登記失業率(x8)共 9 個分析指標。其中 GDP 增長率、第一產業增速、第二產業增速、第三產業增速、城鎮登記失業率為官方提供的數據。專利數增率、技術市場成交額增率、固定資產投資增速、房地產投資增長率為通過官方年度數據算得。選取的年份為 2016 年,相關數據參見 2016年國家統計局網站數據3。
二、描述性統計分析
可以看到,GDP 增長率主要集中在 8%附近。極少數在 10%以上。只有一個樣本點小于 0%。而從第一產業、第二產業、第三產業增長率的箱線圖來看, 第三產業整體發展迅速主要集中在 9%附近,高于第二產業的 7.5%和第一產業的 3.5%。而對于固定資產投資增速、房地產投資增長率、專利數增率、技術市場成交額增率來說,波動幅度都比較大。城鎮登記失業率波動幅度很小,基本集中在 2%-4%。
變量的矩陣分布散點圖如圖 2:
從圖上可以看到,GDP 增長率和第二產業增加值增速、第三產業增加值增速、固定資產投資增速、房地產投資增長率的相關性很高。而與專利數增率、技術市場成交額增速、第一產業增加值增速、城鎮登記失業率相關性比較弱。
三、多元回歸分析
回歸分析研究的主要對象是客觀事物變量間的統計關系,它是建立在對客觀事物進行大量試驗和觀察的基礎之上,用來尋找隱藏在哪些看上去是不確定的現象中的統計規律性的研究方法?;貧w分析方法是通過建立統計模型研究變量間相互關系的密切程度、結構狀態及進行模型預測的一種有效的工具。[4]
回歸分析根據自變量的個數可以分為一元線性回歸和多元線性回歸。一元回歸分析提出的主要背景在于我們經常需要研究某一現象與影響它的最主要因素之間的關系,比如糧食產量與施肥量質檢的關系如何。此時,一元回歸分析更能得到精確的答案。
但是更多情況下,現象之間的相關關系并不是那么簡單。比如上面提到的糧食產量,它可能不僅僅與施肥量有關,還與降水量、光照強度乃至土地管理投入等密切相關。這時候就需要將多個變量的影響考慮進來。
在本文中,主要用多元回歸分析來分析 GDP 的影響因素。
1.逐步剔除法建模
逐步剔除法建立模型,是指先用全部變量建立模型,根據模型中各個變量的顯著性逐步剔除不顯著的變量直到最后模型中所有變量都顯著的方法。
首先,考慮利用所有變量建立多元回歸模型。由于 GDP 增長率與第一產業、第二產業、第三產業增速存在完全的線性關系,所以這里只選取代表傳統行業的第一產業增速和代表新興行業的第三產業增速作為變量加入模型。調整后的R 方達到了0.88, 模型 F 檢驗高度顯著。而且德賓-沃森統計量為 1.888,接近于 2。所以可以基本判斷模型隨機誤差項不存在自相關問題。
不過從回歸系數圖這張表格中可以看到,在 0.05 的顯著性水平下面,只有第三產業增速、固定資產投資增長率這兩個變量是高度顯著的。其余的變量是不顯著的。所以直接利用第三產業增速、固定資產投資增長率這兩個變量建立回歸模型,模型結果如圖 3 :
從上面的回歸結果可以看到,當只用第三產業增速、固定資產投資增長率這兩個變量來預測 GDP 增長率時,回歸模型調整后 R 方達到了 0.890,F 統計量達到 122.361 是高度顯著,而且,固定資產投資增速和第三產業增速的 t 檢驗結果分別達到 5.674 和 4.389,在 0.05 的顯著性水平下面,都是高度顯著的。不過需要注意的是德賓-沃森統計量降到了 1.679。不過從 DW 檢驗上下界表5中可以看到,在 0.05 的顯著性水平下面,當 k=2,n=31 時,dl 和 du 分別為 1.36 和 1.50。
由此可知,模型殘差項不存在自相關。此外,通過變量的 VIF 統計量可以看到,相比于全量模型,選模型變量的 VIF 統計量分別有所降低。第三產業增速從 3.009 降到了 2.691,而固定資產投資增速也從 3.973 降到了 2.691。這說明相比于全量模型,選模型在變量多重共線性方面得到了很大改善。
建立的模型為:
y = 34.894+0.577*x5+0.089*x6
模型的預測結果如下:
2.逐步回歸
相比于逐步剔除變量的方法,逐步回歸方法要更加靈活得多。逐步回歸法的基本思想是有進有出。具體方法是將變量一個一個引入,每引入一個變量后,對已選入的變量要進行逐個檢驗,當原引入的變量由于后面變量的引入而變得不再顯著時,要將其剔除。這樣能夠確保模型中只包含顯著的自變量。在既沒有顯著的變量選入模型,也沒有不限制的變量需要從模型當中剔除時,跌倒停止。
SPSS 中可以直接進行逐步回歸。用我們的數據進行逐步回歸,建模過程及結果如圖5:
從建模結果可以看到,建模過程相當利索,首先將固定資產投資增速引入模型,然后再將第三產業投資增速引入模型。迭代過程便停止了。最終模型與逐步剔除法得到的模型一致。
模型方程為:
y = 34.894+0.577*x5+0.089*x6
四、模型結論
通過建立回歸模型發現,第三產業增速和固定資產投資增速這兩個變量對GDP 的增長率影響最大。而專利數增率、技術市場成交額增率、第一產業增速、房地產投資增長率、城鎮登記失業率等對 GDP 增速的決定作用不是那么明顯。
第三產業增速和固定資產投資對 GDP 增速影響很大,這個很符合預期。對于產業變革來說,第三產業是朝陽產業,是最具可持續發展機制的產業。第三產業做得很好的省份,往往經濟的可持續發展也越能得到源源不斷的動力。而由于中國還是處于社會主義初級階段。固定資產的投入也能直接的影響到經濟的發展。所以為了保持經濟的高速增長,相關政府應該加大固定資產投資,同時出臺相關政策扶持第三產業的發展的相關政策。
模型還是有不太符合預期的地方,創新是近幾年一直強調的重點。科學技術是第一生產力的口號深入人心。但是從此模型看來,專利數增率、技術市場成交額增率對 GDP 的增長卻沒有顯著的決定作用,還有待進一步的研究。
【參考文獻】
[1]劉麗華.基于回歸分析的人均 GDP 影響因素研究[J]. 經濟研究導刊,2013,189: 9-10.
[2]湖北省 GDP 預測的數學模型及其影響因素分析[J]. 劉花璐,湯濤. 數學的實踐與認識. 2015(05).
[3]國家統計局官網:http://www.stats.gov.cn/.
[4]應用回歸分析,何曉群、劉文卿,中國人民大學出版社 P285.