何 飛
(上海理工大學 管理學院,上海 200093)
二手房是已經在房地產交易中心備過案、完成初始登記和總登記的、再次上市進行交易的房產。二手房市場作為房地產市場的一個重要組成部分,在緩解城市土地市場和住房壓力方面有著不可或缺的作用。二手房市場的發展,不僅有利于住宅一級市場的繁榮、縮短新建商品住宅的銷售周期,而且可以滿足居民住宅升級和提升住房消費層次的需求,補充和保障中低收入家庭的住房需求。
1999年國家停止實物分房,并出臺《已購公有住宅和經濟適用住宅上市出售管理暫行管理辦法》《已購公有住宅和經濟適用住宅上市出售土地出讓金和受益分配管理的若干規定》兩個文件,指明了二手房市場的發展方向。上海市政府也積極推行各項政策,如簡化二手房貸款事宜辦理流程,提高二手房貸款比例以及提高二手房貸款期限等措施,使得海市二手房平均價格步步攀升,于2015年突破五萬大關。二手房市場量價齊升,交易越發火爆,已成為市場交易的主力,中低收入家庭的住房問題得到進一步解決。
隨著國家和上海市政府政策的引導,二手房價格過快增長的態勢得到有效遏制,上海市二手房市場得到進一步的發展。如國家貸款利率上調、二手房交易營業稅由“滿五免征”調整至“滿二免征”、降低二套房首付比例等。上海市政府著力構建信息暢通的房地產交易平臺,消除政策壁壘,通過稅收杠桿,間接為低收入住房消費者提供補貼等措施成功實現房地產二、三級市場聯動,擴大了住房消費主體,使得二手房市場平均價格逐年穩步升高,良性發展,上海市二手房市場得到進一步發展。
這樣的背景下,上海市政府、開發商、學者以及上海市都對未來上海市二手房價格趨勢和走向非常關注,普遍集中討論房價是否合理、房價漲幅是否過快。隨著房地產業的、房地產管理要求的提高、房地產市場的發育,房價預測必將日趨重要和活躍發展。目前上海市二手房價格的影響因素有很多,諸如區域因素、市場因素和房屋自身因素等。利用傳統的分析方法,在預測二手房價格時遇到了很大的挑戰,科學地對上海市二手房價格進行預測已經成為一個十分緊迫的課題。
在研究房地產市場方面Eugenio Cerutti等以50個國家的住宅金融政策和房價為樣本,分析了家庭信貸和房價熱潮之間的動態關系。
在研究二手房價格方面,劉斌等借鑒美國Csae-Shiller房價指數的編制方法,構建了上海Csae-Shiller二手房價格指數,一定程度上克服了國家統計局70個大中城市房屋銷售價格指數存在的缺陷,分析發現,房價指數與宏觀經濟指標有較高的聯系。繆格在對二手房價格的研究中,以地鐵、樓齡、配套設施等為特征價格變量,通過構建特征價格模型,利用多元回歸法探索了二者之間有一定的內在聯系。張紅以實際二手房交易的特點為基礎,通過經濟學實驗,模擬在預期房價上漲條件下,二手房的交易過程,研究發現二手房市場經常出現的逆向選擇現象是由信息不對稱造成的。曾昭法在評估二手房價格中,根據模糊數學理論,利用建筑特征、鄰里特征和區位特征等綜合評估因素,建立了二手房價格模糊綜合評估模型,并結合實例,驗證了模型的可靠性。阮連法在衡量二手房價格中,利用特征價格理論和支持向量機理論,建立特征價格模型對二手房價格進行預測,根據模型驗證結果顯示,在訓練樣本和測試集樣本具有相似特征時SVM擬合效果良好。祁神軍通過對Hedonic模型的研究,建立廈門市二手房特征價格模型,并應用到廈門市二手房價格指數中,較為準確地反映了市場的供求關系。潘志安利用武漢市2010—2012年各季度商品房價格建立BP神經網絡模型,對模型進行訓練與測試,證明該模型在房地產價格預測方面具有較好的效果,具有誤差小、效率高等優點。
在以往對二手房價格的文獻研究中,大多以微觀因素為考察對象,分析微觀變量的不同及對價格的影響,諸如住宅面積、朝向、交通和配套設施等。但在實際中,諸如央行基準利率和地區GDP等宏觀因素的變動同樣會引起二手房價格的波動。神經網絡能在短期預測中取得良好的結果,但以往文獻大多以年平均價格為研究對象,雖然取得良好的擬合效果,但預測效果不可避免地會大打折扣。因此,本文以上海市二手房季度平均成交價格為研究對象,通過建立BP神經網絡模型,從宏觀角度考察宏觀因素對二手房價格的影響。
人工神經網絡是對生物神經網絡的抽象、簡化和模擬,作為一種非線性統計性數據建模工具,人工神經網絡的應用范圍相當廣泛,模型種類也很多。BP神經網絡(Back Propagation Network)是應用最為廣泛的一種人工神經網絡。網絡結構圖(如圖1所示)。
模型共三層,輸入樣本信號從輸入層輸入,通過逐層計算,傳到隱層,再傳到輸出層,最后得到輸出層的實際輸出值。若輸出層實際輸出值與期望輸出值誤差符合要求,則學習結束。否則將進行誤差的反向傳播,反向通過網絡誤差來調整網絡權值和閾值,使誤差信號趨于最小。兩個過程反復交替,直到算法達到收斂為止。
圖1 三層BP神經網絡模型結構圖
輸入變量的選取原則為,選取對輸出變量影響大且數據易搜集的變量,同時各輸入變量之間相關性較小。考慮到上海市具體情況與數據的易收集性,本文分別從供需關系角度、金融貨幣角度和政策影響三個角度對影響因素進行了選擇和分析。
反映房地產市場供需關系的因素包括上海市固定資產投資額、上海市房地產開發投資額、上海市房屋施工面積、上海市房屋新開工面積、上海市房屋竣工面積、上海市新建商品住宅銷售面積、上海市新建商品住宅銷售額、上海市房屋出租面積、上海市常住人口數和上海市戶籍人口遷移各項數據指標等。為避免神經網絡模型中各輸入變量冗余重復,以上海市房地產開發投資額代表各項投資額數據變量,以上海市新建商品住宅銷售面積代表上海市各項房屋面積指標,以上海市常住人口數作為上海市各項人口指標的代表。因此,從供需關系角度共選取了上海市房地產開發投資額、上海市新建商品住宅銷售面積和上海市常住人口數3個數據變量。
反映房地產市場金融貨幣類影響因素包括上海市地區生產總值、五年以上中長期貸款的央行基準利率、上海市居民消費價格指數、固定資產投資價格指數和居民人均可支配收入及消費支出等。其中,上海市居民消費價格指數、固定資產投資價格指數和居民人均可支配收入及消費支出三項指標都是對上海市價格水平的反映,選擇上海市居民消費價格指數作為三項指標的代表。因此,從金融貨幣角度選擇了上海市地區生產總值、五年以上中長期貸款的央行基準利率和上海市居民消費價格指數3個對房地產市場產生較大影響的數據變量。
二手房市場經常受相關政策影響,所以從政策影響角度選取了1個變量,即經濟政策不確定性指數。
通過對上海統計局、上海統計年鑒和EPU指數等各數據源進行搜集羅列,匯總出各項數據(見下頁表1)。
表1 上海市二手房季度平均價格及影響因素
將收集的變量數據進行尺度歸一化處理,由于選取的變量數據分別表示不同的意義和量綱,通過歸一化處理,可以將數據轉換成在[-1,1]之間變化,使輸入變量地位同等。另外,也可以避免由于數據過大導致輸出飽和。
適當的節點數可以提高網絡逼近能力。確定最佳節點數有以下兩個經驗公式:
式中,m為隱層節點數,n為輸入層節點數,l為輸出層節點數,α為1—10間的常數。本文通過試驗確定最佳隱層節點數為5。
BP神經網絡包括輸入層,隱層和輸出層,本文輸入層七個節點,隱層只有一層且5個節點,輸出層1個節點。本文網絡結構圖(如圖2所示)。
圖2 網絡模型結構圖
用xi表示神經網絡的輸入,本文共有7個輸入變量,分別為上海市房地產開發投資額、上海市新建商品住宅銷售面積、上海市常住人口數、上海市地區生產總值、五年以上中長期貸款的央行基準利率、上海市居民消費價格指數和經濟政策不確定性指數;yk表示神經網絡的輸出,即上海市二手房季度平均價格;dk表示神經網絡的期望輸出;Wijk表示第i層第j個神經元到第i+1層第k個神經元間的權值;Oij表示第i層第j個神經元的輸出;θij表示第i層第j個神經元的閾值;用netij表示第i層第j個神經元的輸入;Ni表示第i層神經元節點數。
在信息的正向傳播過程中需計算各神經元的輸入與輸出,主要計算公式如下:
如果網絡的實際輸出與期望輸出間的誤差在允許的范圍內,則網絡訓練完成,否則將進行誤差的反向傳播,修改各權值與閾值,主要計算公式如下:
誤差定義:ek=dk-yk
其中,ek為誤差。
網絡的權值沿E函數梯度下降的方向調整,即ΔWijk=為學習效率),經推導得出權值與閾值調整公式如下:
其中,對于第i層神經元:
利用Matlab中的newff函數創建1個三層BP網絡,其中輸出層7個節點,隱層5個節點,輸出層1個節點。隱層節點激活函數使用雙曲正切S型sigmoid函數,輸出節點激活函數使用雙曲正切S型sigmoid函數,訓練函數為trainglm。最大訓練次數100次,誤差設定值為0.01。
為提高BP神經網絡模型訓練及預測效果,將收集的2011—2018年共29組季度數據打亂并分成兩部分,分別是測試集與訓練集。測試集樣本占20%,隨機抽取其中5組作為測試集。其余80%的樣本,共24組數據作為訓練集。利用Matlab對設定好的BP網絡進行訓練,從網絡性能圖可以發現,在經過4次訓練后,網絡誤差達到目標要求,停止訓練。
圖3 網絡性能圖
保存網絡,利用預先準備好的測試集對訓練好的BP網絡進行驗證,通過預測結果與實際結果的對比發現網絡預測效果較好,誤差較小,訓練好的BP網絡在一定程度上可以對未來房價走勢做出大體判斷。
圖4 預測結果與實際結果對比
表2 預測結果與實際結果對比
利用指數平滑法預測出下一季度的輸入值,即房地產投資額、地區生產總值、央行基準利率、住宅銷售面積、居民消費價格指數、地區人口數和經濟政策不確定性指數。再運用已建立的BP神經網絡模型進行預測,得到下一季度上海市二手房的預測價格為50 447.8萬元/平方米。
本文通過分析選取了七個對上海市二手房價有較大影響的宏觀因素,建立了三層BP神經網絡模型,通過對測試集的實際輸出與期望輸出間的誤差進行對比分析,驗證了模型的有效性,并預測出下一季度的上海市二手房價格,具有一定可信度。本文研究填補了上海市二手房價格研究方面的空白,為政府制定宏觀調控政策提供一定的參考,同時也為房地產開發企業制定公司發展戰略提供一定借鑒。
由于房價的影響因素諸多,除了上述七個宏觀因素外還有其他的宏觀微觀因素都會對房價產生影響,這些因素對BP神經網絡二手房價的預測結果或多或少會產生一定程度的影響。BP神經網絡在短期預測中能取得較好的結果,不適用與長期預測,在現實運用中應結合實際考慮到其他因素的影響。