摘要:通過一個實例詳細介紹了建立經濟計量模型的過程和步驟,旨在引入用多元線性回歸分析的方法來分析實際問題的思想。由定性分析選取與大名縣貨運總量有較強的相關性的幾個影響因素,以其作為解釋變量,建立與貨運總量的線性模型。
關鍵詞:貨運總量 多元線性回歸 模型
中圖分類號:F207 文獻標志碼:A文章編號:1673-291X(2011)26-0055-02
多元線性回歸模型是由一組獨立解釋變量值來預測一個或多個被解釋變量的一種統計工具。本文主要從工業總產值、農業總產值、居民非商品支出等經濟指標出發,建立與大名縣年貨運總量的多元線性回歸模型,進行貨運總量的預測和分析。
一、提出因變量與自變量
把貨運總量(億元)作為因變量Y,以工業總產值(億元)為X1、農業總產值(億元)X2、居民非商品支出(億元)X3為解釋變量。1991—2000年大名縣貨運總量與工業總產值、農業總產值、居民非商品支出的數據統計見表1。
二、作相關分析,設定理論模型
用SPSS軟件計算增廣相關陣,并通過變量間的相關性分析可以進行多元回歸分析,由定性分析可知,X1,X2,X3都與變量Y有較強的相關性,設回歸模型為:
Y=β0+β1X1+β2X2+β3X3+ut
三、計算結果
用SPSS軟件計算,其中Y表示貨運總量(億元),X1表示工業總產值(億元)、X2表示農業總產值(億元)、X3表示居民非商品支出(億元)。輸出結果如表2和表3所示。
由上述數據可知:β0=-348.28β1=3.754β2=7.101 β3=12.447
則回歸方程為:
y=-348.28+3.754X1+7.101X2+12.447X3
四、多元線性回歸模型的檢驗
(一)擬合優度檢驗
多元回歸可決系數R2=0.805 5,修正的多重可決系數R2=0.708 3,兩者均小于0.85,說明模型的擬合程度一般,但可以基本擬合。
(二)對回歸方程的顯著性檢驗
提出假設:H0:β1=β2=β3=0;H1:β1、β2、β3不全為0
取顯著性水平α=0.05,F臨界值Fα(k-1,n-k)即F0.05(3,6)=4.76
由上表可知F=8.283 2>F0.05(3,6)=4.76
所以拒絕原假設H0,接受備擇假設H1,所以回歸方程十分顯著,即可以以95%的概率斷言自變量X1,X2,X3全體對因變量Y產生顯著影響。
(三)回歸參數的顯著性檢驗(t檢驗)
提出假設:對于任意參數βi(i=1,2,3),則有
H0:βi=0;H1:βi≠0
由上表可知,t1=1.942,t2=2.465,t3=1.178
給定顯著性水平α=0.05,自由度為(n-k)的tα/2(n-k) 當n=10,k=4,可知t0.025 6=2.4469
因為|t1|=1.942<tα/2(n-k)=2.446 9,所以t1未通過檢驗
因為|t2|=2.465>tα/2(n-k)=2.446 9,所以t2通過檢驗
因為|t3|=1.178<tα/2(n-k)=2.446 9,所以t3未通過檢驗
(四)修改回歸模型
剔除對Y影響不顯著的變量(每次只能剔除一個變量)
首先剔除ti(i=1,2,3)中最小的變量X3,并建立新的回歸方程
利用spss軟件對此模型的剩余參數進行估計,重新得到數據:
β0=-459.624 β1=4.676 β2=8.971
五、對新的多元線性回歸模型進行檢驗
(一)擬合優度檢驗
多元回歸可決系數R2=0.761,修正的多重可決系數R2=0.692,兩者均小于0.85,說明模型的擬合程度一般,但可以基本擬合。
(二)對回歸方程的顯著性檢驗
提出假設。
H0:β1=β2=0;H1:β1、β2不全為零
取顯著性水平α=0.05, F臨界值Fα(k-1,n-k)即F0.05(2,7)=4.74
由上表可知F=11.117>F0.05(2,7)=4.74
所以拒絕原假設H0,接受備擇假設H1,因此回歸方程十分顯著,即可以以95%的概率斷言自變量X1,X2全體對因變量Y產生顯著影響。
(三)回歸參數的顯著性檢驗(t檢驗)
提出假設。對于任意參數βi(i=1,2),有:
H0:βi=0;H1:βi≠0
由上表可知,t1=2.575,t2=3.634
給定顯著性水平α=0.05,自由度為(n-k)的tα/2(n-k)。當n=10,k=3,可知t0.025 7=2.364 6
因為|t1|=2.575>tα/2(n-k)=2.364 6,所以t1通過檢驗
因為|t2|=3.634>tα/2(n-k)=2.364 6,所以t2通過檢驗
(四)做出多元回歸方程的線性擬合圖
根據以上的分析結果,最終得到貨運總量與工業總產值、農業總產值之間的多元線性回歸方程為:
y=-459.624+4.676X1+8.971X2
六、所建多元線性回歸模型的意義
由回歸方程的結構來看,具有明顯的經濟意義。β1的符號為正,說明工業總產值增加貨運總量也增加,因為工業總產值增加了,貨物需求量也就增加了,所以貨運總量也就增加了,符合經濟意義;β1=4.676,表明當其他因素不變時,工業總產值增加一個單位,貨運總量平均增加4.676個單位;β2的符號也為正,說明農業總產值增加貨運總量也增加,因為農業總產值的增加,意味著農產品的增加,必然帶動農產品貨運的增加,因而貨運總量也就增加,符合經濟意義;β2=8.971,表明當其他因素不變時,農業總產值增加一個單位時,貨運總量平均增加8.971個單位。這個回歸方程比較簡明地描述了貨運總量的結構和增長成因。
由上面這個回歸方程的建立過程,我們看到,貨運總量受著多種因素的影響。但我們最終得到的回歸模型只引進了兩個因素,即工業總產值、農業總產值,這說明這兩個變量是影響大名縣貨運總量的主要因素。
收稿日期:2011-06-16
作者簡介:楊風杰(1982-),男,河北邯鄲人,碩士研究生,從事區域經濟與規劃研究。
參考文獻:
[1] 盛驟,謝式千.概率論與數理統計[M].北京:高等教育出版社,2004.
[2] 薛薇.統計分析與SPSS的應用[M].北京:中國人民大學出版社,2001.
[3] 袁衛,龐皓.統計學[M].北京:高等教育出版社,2000.
[責任編輯柯 黎]