張漢中+張倩+王斌+周小平+黃繼風
[摘 要]近些年,上海市商品住宅的價格增長迅速,成為拉動內需、帶動經濟增長的支柱性產業。但是,若任其發展,將在一定程度上影響房地產市場健康發展的持續穩定,影響宏觀經濟和社會穩定。雖然政府相關部門出臺了一系列調控措施,如房產稅、戶口限制等,但“購房熱”“買房難”依然是持續影響百姓生活的重大問題。也正因為多數新房價格昂貴,大多數人會選擇購買二手房,那么,二手房的房價走勢是一個很值得研究的問題。文章主要通過對數量指標進行數據整理與清洗,并運用動態聚類法完成多元線性回歸模型的構建。通過構造合理準確的多元線性回歸模型來預測出較為客觀的上海市二手房房價走勢。
[關鍵詞]商品住宅價格;線性回歸模型;房價預測;二手房
[DOI]10.13939/j.cnki.zgsc.2018.02.042
1 引 言
在我國文化觀念的影響下,房地產業是每位我國國民幾乎都會進行消費的重要產業,是推動國民經濟增長的關鍵組成部分,[1]但由于房價泡沫等一系列因素導致房價陷入持續性飆升的“怪圈”。這種奇怪現象說明了對房地產業的研究和房屋價格走勢預測刻不容緩。[2]由圖1可知,上海的商品住房價格走勢一直呈現上升態勢。隨著更多的流動人口進入上海,住房的需求會越來越大。然而,在房價居高不下致使大多數人買不起房的情況下,房價依舊持續走高,不但加重了居民購房的負擔,還可能造成諸多經濟、社會問題,[3]所以,住房問題日漸成為我國的政治問題,引起中央與地方政府的高度關注。雖然國家出臺了一系列宏觀調控政策,但是效果并不是特別明顯。[4]上海作為國家經濟發展的重要城市,對上海市商品房價格走勢的預測,有著一定的現實意義。
2012年,張小富、侯綱發表題為“基于多元線性回歸模型的西安住宅價格泡沫研究”的文章,其中通過構建多元線性回歸方程分析多種因素對房價的影響。2013年,盧小濤對上海房地產業與區域經濟相關性研究,發現房地產業發展對其區域經濟的帶動作用更為顯著。2015年,Lisi G和Iacobini M通過對意大利房產數據進行分析,構建數學模型進而對房地產進行較為合理的估價,此模型對世界各地房地產普遍適用。本文中,筆者將通過對變量進行處理,構造多元回歸線性模型,運用更為準確的方式分析上海市二手房價格的變動因素及發展趨勢。[5]見圖1。
2 數據的獲取與分析
2.1 數據的獲取
本文主要以鏈家網為例通過python編寫代碼獲取相應的已成交二手房信息。[6]其中所需的有效信息為上海各個區域下每套二手房的所在區域、小區名稱、戶型、面積、成交日期、售價、樓層(分區)、朝向、單價及建造日期。(注:獲取的成交數據建造日期存在部分,通過與未成交數據匹配可以盡量彌補所缺少的建造日期),獲取數據整理成如圖2所示的格式(共24036套)。
2.2 數據的整理與分析
2.2.1 上海各地區二手房的均價
各區近期房價如圖3所示,上海二手房價格最高的三個地區為:靜安、黃浦和徐匯,均價都在7萬元以上,房價較低的三個區為:金山、崇明和奉賢,均價都在2萬元左右。
2.2.2 二手房的戶型和檔次的分布
從圖4中不難看出,戶型分布數據的長尾向右延伸,屬于嚴重的正偏態分布。所以,考慮將600套以下的戶型統統歸為一類,以此減輕長尾現象。如圖5所示。
2.2.3 二手房的面積和成交價格的正態性檢驗
核密度估計是對直方圖的一個自然拓展。
QQ圖是由標準正態分布的分位數為縱坐標,樣本值為橫坐標的散點圖,利用QQ圖可以判斷數據是否近似符合正態分布,只需看QQ圖上的點是否近似地在一條直線附近,該直線的斜率為標準差,截距為均值。
PP圖是根據變量的累積比例與指定分布的累積比例之間的關系所繪制的圖形。利用PP圖可以判斷數據是否符合正態分布。當數據符合正態分布時,PP圖中各點近似呈一條直線。[7]
顯然,獲取到的數據的面積和成交價格均不滿足正態分布,那么就無法直接對數據進行方差分析或構建線性回歸模型。通過上述方法檢驗發現,二手房的面積和成交價格均不符合正態分布。詳見圖6和圖7。
3 多元線性模型的構建
3.1 相關分析
動態聚類法又稱逐步聚類法,其基本思路為,起初進行粗略分類,然后依據最優原則將原本不合理的分類進行調整,進而形成最終聚類。此方法較為簡便,占用計算機內存較少,所以更適用于大樣本的聚類分析。其中最常用的為kmeans函數。由于獲取到的數據屬于大樣本范疇,本文將采用此算法進行聚類。[8]
第一,用房子的單價(danjia)和面積(mianji)這兩個變量對樓盤進行聚類分析,用K均值聚類,分成四類,進行顯組間比較,結果差異顯著,有統計學意義。[9]聚類數量分布表——每個聚類中的個案數量見表1,方差分析表—ANOVA見表2。
第二,根據每個類別的單價,面積的平均值,以及各個類別在區域、朝向、戶型的分布情況。[10]四個樓盤的類別是以下幾類。
第一類:大戶型,樓盤的面積最大,價格最高,數量最少。相對的戶型是5室以上。以靜安為代表,一般朝西。
第二類:徘徊型。價格第二高,面積適中,數量一般,相對的戶型是4室或3室2廳的,集中在黃浦、長寧、徐匯一帶。主要以朝東南、朝西南為主。
第三類:大眾型,價格最低,數量比較多,主要是2室1廳、3室1廳。集中在崇明、金山、奉賢一帶。朝向是南北為主。
第四類:地段型,價格適中,面積小,數量最多,主要是沒有廳的戶型,集中在閘北、楊浦、普陀一帶。朝向以東南、朝南為主。
第三,四種樓盤分類如圖8所示。
第四,以單價(danjia)為因變量,區域(are)、戶型(tye)、學區(xuequ)、面積(mianji)、看房量(kanfan),朝向(P)、容積(rongji)、綠化(lvhua)為自變量做方差分析如下:從表3中可知朝向的P值大于0.05,沒有統計學意義,因此可以考慮把朝向剔除。endprint
第五,剔除朝向后的方差分析如下:區域、戶型、學區、面積、看房量、朝向、容積、綠化率均有統計學意義。在單變量方差分析中,SSA 代表A因素產生的組間變異, SSE是組內變異。公式分母是組內變異SSE 和A因素的組間變異的和,偏eta方的公式為n2p=SSASSA+SSE。偏eta方能說明某個因素與誤差的關系,[11]因此從偏Eta平方可以看出區域、學區房對單價的影響比較大。見表4。
3.2 數學模型的構建
基于上述分析,我們可以給出上海住宅的多元線性回歸模型。
因變量單價:
Danjia=46852.6+26422.9are1+15252are2-25304are3+8328tye1+1881.5tye2+2059.74tye3-6863.77xuequ+17.3mianji+214.22kanfan+5351.3rongji+25624.34lvhua.(1)
式(1)中,Danjia表示前三類房屋單價,are1表示第1類樓盤的區域,are2表示第2類樓盤的區域,are3表示第3類樓盤的區域,tye1表示第1類樓盤的戶型,tye2表示第2類樓盤的戶型,tye3表示第3類樓盤的戶型,xuequ表示學區,mianji表示面積,kanfan表示看房量,rongji表示容積率,lvhua表示綠化率。
當是第4類的樓盤、學區房時。相對應的樓盤單價方程為:
Danjia=46852.6+17.3mianji+214.22kanfan+5351.3rongji+25624.34lvhua(2)
式(2)中,Danjia表示第4類房屋單價,mianji表示面積,kanfan表示看房量,rongji表示容積率,lvhua表示綠化率。
表5可以得出各種類型的房價預測,學區房比非學區房的房價要貴。以第4類樓盤為參照水平。
通過LSD法比較各個戶型樓盤單價的高低情況,[12]得出tye1>tye2>tye4.tye1>tye3>tye4。tye2和tye3 P值大于0.05,沒有顯著性差異。見表6。
通過LSD法比較各個區域樓盤單價的高低情況,得出are1>are2>are4>are3。見表7。
從殘差圖圖9來看,整體的波動不大,因此模型的擬合效果比較好[13]。
4 結 論
本文通過構建線性回歸方程建立起上海二手房價格的評估模型,并對具體數據進行房產價格的評估,分析得到,樓盤的單價減去預測值,如果為正則樓盤有升值空間,如果為負則樓盤為泡沫存在。從以圖10可以看到,存在泡沫的主要是第三類大眾型和第四類地段型樓盤。圖10為結論圖。
參考文獻:
[1] 許艷榮.房地產業對相關產業的帶動效應研究[J].中國經貿, 2013(18):22.
[2] 劉其華.試論影響我國房地產價格持續上漲的主要因素及其原因——以上海為例[J].經濟師, 2011(4):236-238.
[3] 張元姣.基于主成分回歸分析的上海房價影響因素研究[J].江蘇商論, 2013(27):125-126.
[4] 任晨瑩.上海樓市主線政策大回顧[J].上海房地, 2017(4):19-23.
[5] Lisi G, Iacobini M.Estimating the Housing Price with a Search-and-matching Model[J].Journal of European Real Estate Research, 2015, 8(2):196-216.
[6] 王藎梓, 賴雯潔.基于房產交易網站的數據獲取與在線工具開發[J].計算機技術與發展, 2017, 27(5):154-159.
[7] 張小富, 侯綱.基于多元線性回歸模型的西安住宅價格泡沫研究[J].價格月刊, 2012(11):41-44.
[8] 丁飛.上海與重慶房地產價格決定因素對比分析[J].知識經濟, 2011(13):96.
[9] Berna Keskin.HedonicAnalysis of Price in the Istanbul Housing Market[J].International Journal of Strategic Property Management, 2008, 12(2):125-138.
[10] 丁軍.北京、上海、深圳房地產價格的影響因素比較研究[J].中國房地產, 2016(36):28-35.
[11]劉紀輝.基于多元線性回歸分析房地產價格的影響因素[J].湖北工業大學學報, 2008, 23(4):87-90.
[12] Tsai I C, Peng C W.Linear and Nonlinear Dynamic Relationships between Housing Prices and Trading Volumes[J].North American Journal of Economics & Finance, 2016(38):172-184.
[13] Francke M K.Repeat Sales Index for Thin Markets[J].Journal of Real Estate Finance & Economics, 2010, 41(1):24-52.endprint