申玉偉 曹曉祎
摘要
20世紀80年代以來我國用電量快速增長,為了研究我國用電量的影響因素,本文收集1995年2014年的電力消費量相關數據,并對其建立多元線性回歸模型,對回歸模型進行檢驗,合理預測我國電力需求量。
【關鍵詞】用電量 多元回歸 模型檢驗
1引言
電力工業己成為我國國民經濟發展的基礎產業。改革開放以來,我國的電力消耗量也保持快速增長。本文主要研究影響我國用電力量的因素,并建立預測我國用電量的多元回歸模型。
2模型介紹
2.1模型基本假設
構建模型的基本假設如下:
(1)解釋變量是確定性變量;
(2)隨機誤差項具有0均值和等方差;
(3)正態分布的假定條件為s~n(o,δ2),i=l,2,3,…;ε1,ε2,ε3,…相互獨立。
2. 2模型的建立
多元線性回歸模型記為:
Y=Xβ+ε
式中,因變量Y為n維向量;自變量x為n×p階矩陣;誤差項ε為n維向量。這意味著一共有n個觀測值,有一個由向量Y代表的因變量及由X代表的p個自變量。
2.3模型的檢驗
在多元線性回歸的標準輸出中,對系數的t檢驗和方差分析的F檢驗是必不可少的。方程的顯著性檢驗(F檢驗),旨在對模型中因變量與自變量之間的線性關系在總體上是否顯著成立作出推斷。方程的總體線性關系顯著并不等同于每個自變量都對因變量的影響都顯著,因此,必須對每個自變量進行顯著性檢驗,以決定是否作為自變量被保留在模型中。這一檢驗是由對變量的t檢驗完成的。
3數據分析
3.1選取指標和收集數據
本文收集了1995-2014年共20年的相關數據,共選取9個指標。包括因變量y:每年電力消費量(億千瓦小時);自變量(Xl-XS)人口自然增長率(%。)、國內生產總值(億元)、第一產業產值(億元)、工業產值(億元)、建筑業產值(億元)、第三產業產值(億元)、人均國內生產總值(元)、能源消費總量(萬噸標準煤)。
3.2變量相關分析
用R軟件進行相關性數據分析,找出影響我國用電量的主要因素。因變量y與自變量xl,x2,X3,X4,x5,x6,X7,xs的相關系數分別為-0.7798、0.9941、0.9905、0.9967、0.9846、0.9905、0.9946、0.9866,用電量與各個自變量之間關系很密切,可以認為存在線性相關關系。
3.3多元線性回歸模型的建立與檢驗
由變量相關分析可知所選取的指標都與電力消費量存在線性關系,利用R軟件對各指標數據建立多元回歸模型,得出回歸方程:y= -791.56081-137.10546x1-18.50722x2+1 8.15517x3 +18.11310 X4+17.96437x5 +18.41074x6 +3.51930x7+0 08423X8
在方差分析結果中,模型的F值為238,p<0.05,說明此模型有意義。t檢驗結果中偏回歸系數b2,b3,b4,b5,b6,b8的p值都小于0.01,可認為解釋變量X2, X3,X4,x5,X6,xs顯著;Xl,X7的p值大于0.4,不能否定對β1=0,β7=0的假設,可認為xl,x7對y沒有顯著的影響。然而xl和x2所對應的偏回歸系數都為負,這與經濟現實是不相符的。出現這種結果的原因可能是這些解釋變量之間存在高度的共線性。由數據散點圖可知,x1與y的關系,可能是最偏離線性的。
3.4模型優化
3.4.1變量選擇與模型建立
選用逐步回歸法對變量進行選擇。最終選擇的變量為:x2,x3,X4 X5, X6和x8。對其進行多元線性回歸分析。從方差分析表中,由F統計量的值可知回歸方程是有意義的,且p<0.05,所以回歸模型是有意義的。
3.4.2模型檢驗
優化后的多元線性回歸方程為:
y= 388.20142 -17.85936x2 +17.69274x3+17.7932X4+17.39365Xs +18.00755x6+ 0.08218x8
由t檢驗結果可知,b2, b3, b4,b5,b6,b8的p值均小于0.05,所以這6個偏回歸系數是有意義的,因此方程的各個系數也是具有統計意義的。
而且根據該線性回歸模型計算所得出的電力需求量和實際電力消費量作出的折線圖(圖1),可以看到擬合效果不錯。同時,標準殘差和杠桿值圖(圖2)中絕大部分位于-2與2之間,并且關于0隨機波動。
4結論
從本文所建的多元回歸模型來看,能源結構持續優化調整,能源消費總量,國內生產總值,能效水平持續提高是影響我國電力消費量的主要因素。由參數估計結果可知,該模型在統計與經濟意義上的可信度較強,同時回歸模型擬合優度較好,能較好的預測未來我國電力消耗量。
參考文獻
[1]徐麗娜.中國用電量需求模型的建立及需求預測[J].山西大同大學學報,2 01 3,2 9 (01):18-19.
[2]王斌會.多元統計分析及R語言建模[M].暨南大學出版社,2016: 68-80.