【摘要】本文以2001~2010年蘭州市商品房價格的相關數據為基礎,應用多元線性回歸方法建立了蘭州市商品房價格的回歸模型,并對其進行分析和檢驗。結果表明:該模型的校正可決系數2=0.9914,即模型與數據的擬合度很高;又運用方差分析和數據模擬檢驗方法對該模型進行了實際檢驗,結果顯示,該模型的精確度達到了95.447%,可用于蘭州市商品房價格的預測。
【關鍵詞】價格 多元回歸分析 校正可決系數 方差分析
一、引言
隨著近些年來國家一系列調控房價政策的相繼出臺,我國的商品房價格尤其是一、二線城市的商品房價格產生了較大幅度的振蕩[1]。蘭州市的商品房價格也隨之產生了較大波動,和2009年以前整體上漲,部分區域暴漲的趨勢不同,2010年之后,蘭州市的樓市進入一個新的階段,即房地產市場整體上呈現下行、且存在明顯分化的趨勢。并且樓市的主要矛盾已經發生明顯變化,從過去增供應、抑制過熱轉為促進消化,市場需要升溫的新階段。房地產是我國宏觀經濟的支柱產業,任何大的動蕩,都會造成經濟的不穩定,在此背景下,加大市場調研,及時的掌握商品房價格的動態趨勢,是非常有必要的。本文將從影響商品房價格的眾多因素中選取當地人均收入、當地人口數量、商品房平均投資成本以及一年期定期存款利率等4個重要因素組成評價指標體系,對蘭州市商品房價格進行多元回歸分析和預測。
二、多元線性回歸分析模型
假設隨機變量Y和p個普通變量x1,x2,…,xp(p>1)有關,對于自變量x1,x2,…,xp的一組確定的值,Y有它的分布,如果Y的數學期望E(Y)存在,它一定是x1,x2,…,xp的函數,記為μ(x1,x2,…,xp),求的問題就是多元回歸問題。若Y與x1,x2,…,xp有線性關系Y=b0+b1x1+…+bpxp+ε,ε~N(0,σ2),其中b0,b1,…+bp,σ2都是與x1,x2,…,xp無關的未知參數。
設(x11,x12,…,x1p,y1),…(xn1,xn2,…,xnp,yn)是一個樣本,則有Y=XB+εε~N(1,σ2In),其中ε=(ε1,ε2,…,εn)T,且ε1,ε2,…,εn相互獨立都服從N(0,σ2)分布,Y=(y1,y2,…,yn)T,
對未知參數B的求解運用最大似然估計法,即可得到:
三、商品房價格多元回歸模型的建立及求解
(一)變量的選擇和符號的說明
在影響商品房價格的各類因素中,我們以當地人均收入、當地人口數量、商品房平均投資成本、一年期定期存款利率等4個重要影響因素作為自變量。因變量商品房價格和4個自變量的符號見表1。
表1 符號說明
(二)數據的收集和處理
查閱相關資料,收集蘭州市2001~2010年間內生變量、因變量原始數據[3],即可得建模數據,見表2。
表2 蘭州市2001~2010年商品房價格與4個指標的關系
(三)回歸方程
將表2中的數據代入(1)式,利用MATLAB軟件計算出的值,即可得商品房價格的回歸方程[4]:
y=94+0.044x1+0.606x2+0.428x3-0.091x4. (2)
四、模型的分析及檢驗
(一)方差分析
模型(2)有沒有實用價值,我們需要做一下假設檢驗才能確定。
H0:b1=b2=…=bp=0,H1:bi≠0,至少有一個i。
取顯著性水平為α=0.05。方差分析計算結果見表3。
表3 方差分析結果
從表3可以看出F>F0.05(6,4),所以拒絕H0,接受H1,即模型(2)的回歸效果非常顯著,模型(2)是有意義的。
(二)方差擬合結果
在對多元線性回歸模型的檢驗中,可決系數R2和校正可決系數2都可用來衡量回歸方程對樣本觀測值的擬合程度。但校正可決系數2隨模型中解釋變量的個數而校正,其定義為:
其中(n-k-1)為殘差平方和的自由度,(n-1)為總離差平方和的自由度。
(三)模擬數據擬合檢驗
利用模型(2)對2001~2010年蘭州商品房價格進行模擬預測,其結果見表5。
表5 模擬數據檢驗結果
從表5可以計算出,預測值的平均相對誤差為0.04553,即模型(2)的精確度達到了95.44%,這說明用此模型進行預測分析是有效的。
五、結束
本文通過收集相關數據,建立了蘭州市商品房價格的多元線性回歸模型,對其進行了回歸分析和數據模擬檢驗,檢驗結果顯示:模型(2)的校正系數2=0.9914,說明模型與數據的擬合度很高;模型(2)模擬精度達到95.447%,即模擬精確度非常高,所以此模型可用于蘭州市商品房價格的預測。
參考文獻
[1]席強敏.天津市商品住宅價格變動實證分析[J].經濟師,2009,26(7):265-266.
[2]王振友,陳莉娥.多元線性回歸統計預測模型的應用[J].統計與決策,2008,11(5):46-47.
[3]甘肅發展年鑒編委會.甘肅發展年鑒2010[M].北京:中國統計出版社,2010.
[4]余錦華,楊維權.多元統計分析與應用[M].廣州:中山大學出版社,2006.
基金項目:本課題得到甘肅省自然科學基金(GS(2010)GXZ008)項目資助.
作者簡介:李生彪(1981-),男,甘肅會寧人,碩士,現任蘭州文理學院講師,主要從事數理統計、數學建模等方面的教學與科研工作。