999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹的住房租賃價格微觀影響因素研究

2017-06-21 23:58:51范雅靜黃笛
中國市場 2017年17期

范雅靜+黃笛

[摘要]隨著我國經濟水平飛速增長,城市間人口流動日益頻繁,房屋租賃市場日趨繁榮,房屋的租金也受到越來越多的關注。而由于互聯網的發(fā)展,房東與租戶通常會在網絡上發(fā)布并獲取信息,因此租房網站中包含豐富的租房信息。文章利用網絡爬蟲技術從租房網站收集了北京市各區(qū)域共計三千余條租房信息,并將住房租賃價格作為被解釋變量,并選擇6個微觀因素作為解釋變量,基于特征價格理論建立決策樹模型,分析影響租房價格的關鍵因素,并為住房租賃價格定價及預測提供新的思路。

[關鍵詞]住房租賃價格;微觀影響因素;決策樹

[DOI]1013939/jcnkizgsc201717037

1引言

作為房地產市場體系兩個必不可少的重要組成部分,租賃市場與買賣市場,與北京市房地產市場的健康平穩(wěn)運行有著密切的關系。持續(xù)提高的城鎮(zhèn)化水平意味著將有相當數量的農村剩余勞動力及人口轉移到城市。北京地區(qū)的高房價客觀上也使購買商品房需要大量的資金。因此,越來越多的人選擇暫時放棄購房需求,并將目光由買賣市場轉向租賃市場,借助租賃市場將自身的住房需求解決。在此背景下,住房租賃價格由哪些因素確定成為了學者關注的問題。

目前,已有大量學者對此進行了研究。Marks(1984)用特征價格指數對溫哥華租賃住宅數據進行研究,結果發(fā)現停車位提供、自動洗衣店等相關變量均顯著影響住宅租金。Guntermannn(1987)的研究表明,游泳池、健身房的存在對租金有著顯著影響。此外,許多學者將研究重心放在配套設施對住宅的影響。George(1985)、Sirmans(1990)等則對住房內的配套設施,如電視、洗衣機等對租金有正方向的影響作用。然而,住宅由于其私密性等問題,傳統(tǒng)的入戶調查方法成本較高且難以獲得較大數據。從國內文獻看,學者大多集中在微觀因素對寫字樓等商用房屋租賃價格影響的研究。聶沖(2009)研究發(fā)現區(qū)位、建筑、商鋪和租約特征都是購物中心商鋪租金的重要決定因素,但相對而言,區(qū)位特征最為重要。梁艷(2011)選取深圳市場上能獲得數據的四類20個解釋變量進入租金模型。采用特征模型,對深圳市114棟寫字樓的要價租金均價進行回歸分析,并發(fā)現大部分特征因素對寫字樓租金有顯著影響。全百松(2013)通過構建寫字樓特征價格模型,發(fā)現不同城市發(fā)展水平下的寫字樓租金影響因素在顯著性及影響系數兩方而表現不同。

然而,由于住宅私密性等問題,傳統(tǒng)的入戶調查方法成本較高且難以獲得較大數據,若要避免入戶問題則只能對寫字樓等開放區(qū)域進行調查。為彌補此缺陷,本文通過網絡爬蟲技術獲取到北京市住房租賃價格相關數據,可以在較短時間內獲得豐富的租房微觀數據。此外,本文通過建立決策樹模型對北京市住房租賃價格進行分析,可利用決策樹的優(yōu)勢對住房租賃價格的微觀影響因素進行深入分析,從而使各類租房人群能結合自身對房屋的需求,借助模型估算參考價格,同時對當地房地產中介機構合理評估住房租賃價格有一定的參考借鑒意義。

2理論基礎

21特征價格模型理論

特征價格模型來源于特征價格理論。A T Court(1939)首次對汽車價格進行了研究,認為汽車價格是由汽車本身特征決定,并構建了汽車價格指數。隨后,Lancaster(1966)提出消費者偏好理論,認為消費者購買一個產品,是由于產品的特征符合消費者的需求。Rosen(1974)則完善了Lancaster偏好理論,理論上構建了特征價格供需特征模型,為特征價格模型奠定了基礎。該理論認為,住房價格是由住房特征帶給人們的效用決定的,由于住宅特征的數量及組合方式不同,使得房地產的價格存在差異。因此,本文根據特征價格理論對住宅租賃價格的影響因素分解,分析各因素對房租的影響。

22決策樹理論

本文主要采用決策樹方法進行建模。決策樹是一種監(jiān)督式的學習方法,產生一種類似流程圖的樹結構。決策樹對數據進行處理是利用歸納算法產生分類規(guī)則和決策樹,再對新數據進行預測分析。樹的終端節(jié)點——葉節(jié)點(leaf nodes),表示分類結果的類別(class),每個內部節(jié)點表示一個變量的測試,分枝(branch)為測試輸出,代表變量的一個可能數值。為達到分類目的,變量值在數據上測試,每一條路徑代表一個分類規(guī)則。

在樹的每個節(jié)點上,使用信息增益選擇測試的變量,信息增益是用來衡量給定變量區(qū)分訓練樣本的能力,選擇最高信息增益或最大熵(entropy)簡化的變量,將之視為當前節(jié)點的分割變量,該變量促使需要分類的樣本信息量最小,而且反映了最小隨機性或不純性(impurity)(Han和Kamber,2001)。若某一事件發(fā)生的概率是p,令此事件發(fā)生后所得的信息量為I(p),若p=1,則I(p)=0,因為某一事件一定會發(fā)生,因此該事件發(fā)生不能提供任何信息。反之,如果某一事件發(fā)生的概率愈小,不確定性愈大,則該事件發(fā)生帶來的信息愈多,因此I(p)為遞減函數,并定義I(p)=-log(p)。給定數據集S,假設類別變量A有m個不同的類別(c1, …, ci, …, cm)。利用變量A將數據集分為m個子集(s1, s2, …, sm),其中si表示在S中包含數值ci中的樣本。對應的m種可能發(fā)生概率為(p1, …, pi, …, pm),因此第i種結果的信息量為-log(pi),則稱該給定樣本分類所得的平均信息為熵,熵是測量一個隨機變量不確定性的測量標準,可以用來測量訓練數據集內純度(purity)的標準。熵的函數表示如下式:

I(s1, s2, …, sm)=-[DD(]m[]i=1[DD)]pilog2(pi)

其中pi是任意樣本屬于ci的概率,對數函數以2為底,因為信息用二進制編碼。變量分類訓練數據集的能力,可以利用信息增益來測量。算法計算每個變量的信息增益,具有最高信息增益的變量選為給定集合S的分割變量,產生一個節(jié)點,同時以該變量為標記,對每個變量值產生分枝,以此劃分樣本。再根據變量的不同值建立樹的分枝,每個分枝子集中重復建樹的下層結果和分枝的過程,一直到完成建立整株決策樹。

3數據說明、預處理與變量選擇

31數據說明

本文所使用的數據來源于58同城網站。58同城(http://58com)作為覆蓋全領域的生活服務平臺,業(yè)務覆蓋招聘、房產、汽車、金融、二手及本地生活服務等各個領域。其網站內含有海量的房產信息,也包括北京市的房屋出租信息。本研究采用C#語言并基于Net框架,建立一個租房信息采集程序,依據所設定的采集方案與規(guī)則,成功地實現了一定數量的租房信息自動采集,同時將所采集到租房數據持續(xù)地添加到SQL Server數據庫中。

本文隨機抓取了2015年期間發(fā)布的3606條北京市住房招租信息,并將數據導入至Excel表格文件中,原始數據主要包括城市、標題、租賃價格、戶型、面積、裝修程度、所在樓層、原有設施種類、地址等。

32數據預處理

原始數據中數據格式比較特殊,多為對房屋進行描述的語句。因此,本研究首先使用了R中的stringr以及jiebaR包,將每個樣本所在的城區(qū)、樓層、朝向、原有設施、裝修程度等關鍵詞一并提取。其次,由于租房信息中不能準確描述樓層信息,通常用樓層范圍來表示,如“2層/6層”表示2~6層,因此本研究采用平均數估算其樓層;此外,由于房間數量也是影響房租的一個重要因素,因此對形如“3室2廳2衛(wèi)”的住宅類型數據,提取“室”的數量作為房間數量指標;最后,租房信息中還對住宅內配套設施加以描述,包括電視、洗衣機、冰箱等,由于設施種類較多,因此將設施種類數量作為單一指標。

33變量選擇

基于特征價格模型理論,本文將住房租賃價格作為被解釋變量,將不同類別的微觀因素共19個指標作為解釋變量,建立機器學習模型進行預測。下表報告了選取的被解釋變量與解釋變量的詳細說明。

4實證分析

通過建立決策樹模型,得到結果如下圖所示。決策樹共有一個根節(jié)點、四個中間節(jié)點以及六個葉節(jié)點。每個節(jié)點上方的數值表示平均價格,下方百分比表示樣本所占比例,連接線上表示該節(jié)點的條件,節(jié)點顏色由淺到深表示該子樣本平均價格由低至高。由下圖可以看出,影響房租價格最主要的因素為所在城區(qū)。決策樹第一層將城區(qū)分為昌平、大興、房山、門頭溝、密云、平谷、順義、通州、西城區(qū)和朝陽、東城、豐臺、海淀、石景山,其中前者價格較低,此外,房山、密云的租房價格也比昌平、大興、門頭溝、順義、通州更低。除西城區(qū)外,其結果也較符合城區(qū)離北京市中心距離越遠租房價格越低的實際情況。對于朝陽、東城、豐臺、海淀、石景山區(qū),決定房租價格的關鍵因素為住宅類型,如果是公寓類則價格較低,別墅、精裝修、平房、普通住宅、商住兩用類的平均價格較高。對于后者,其價格還取決于朝向,其中朝北的住宅價格較高,這也體現了居民對房屋風水朝向的要求。由結果可以看出,平均價格最低的為房山、密云的住宅,最高的為朝陽、東城、豐臺、海淀、石景山朝向北的中高檔住宅。

5結論

本文利用從58同城網站抓取的北京市住房租賃數據,將決策樹模型引入到租賃價格的分析、預測工作中,并分析影響住房租賃價格的微觀因素。北京的研究經驗表明,影響房租最關鍵的因素為所在城區(qū),其次為住房類別及朝向。未來,在對房租微觀影響因素進行研究時,為了提高分析的準確度以及因素覆蓋范圍,應結合其他領域技術提取更多的解釋變量,例如根據地址提取距地鐵站距離、距商圈距離等地理位置相關信息;同時,還可利用其余學習方法,如神經網絡等進行分析預測,以更全面地分析房地產價格的圍觀影響因素。對

主站蜘蛛池模板: 啪啪国产视频| 欧美啪啪网| 狠狠色噜噜狠狠狠狠色综合久| 美女被狂躁www在线观看| 2021国产精品自产拍在线| 91香蕉国产亚洲一二三区 | 亚洲一级毛片| 无码专区国产精品第一页| 狠狠操夜夜爽| 欧美中文字幕在线二区| 欧美日韩国产综合视频在线观看| 青青热久免费精品视频6| 玖玖精品视频在线观看| 亚洲国产成人麻豆精品| 亚洲色图欧美视频| 亚洲制服丝袜第一页| 免费高清毛片| 伊人无码视屏| 91啪在线| AV天堂资源福利在线观看| 最近最新中文字幕在线第一页| 久久人搡人人玩人妻精品| 成年午夜精品久久精品| 在线中文字幕网| 女人天堂av免费| 国产亚洲欧美在线人成aaaa| 国产欧美日韩一区二区视频在线| 国内精品九九久久久精品| 99视频在线看| 中文字幕在线观| 91久久国产综合精品| 国产a v无码专区亚洲av| 免费观看成人久久网免费观看| 99在线视频精品| 欧美一区二区人人喊爽| 极品性荡少妇一区二区色欲| 9cao视频精品| 中文字幕佐山爱一区二区免费| 影音先锋丝袜制服| 三上悠亚精品二区在线观看| 亚洲精品福利网站| 日韩色图区| 尤物成AV人片在线观看| 久久黄色免费电影| 色天堂无毒不卡| 久久精品66| 日韩AV手机在线观看蜜芽| 亚洲爱婷婷色69堂| 亚洲综合久久一本伊一区| 国产精品美女网站| 91色在线视频| 98精品全国免费观看视频| 亚洲国产系列| 国产视频自拍一区| 国产91久久久久久| 日韩免费无码人妻系列| 综合亚洲网| 欧美中文字幕在线播放| 综合亚洲网| 国产在线精品人成导航| 中文字幕伦视频| 亚洲国产看片基地久久1024| 亚洲av无码片一区二区三区| 国产在线精品网址你懂的| 亚洲码在线中文在线观看| 99这里只有精品免费视频| 亚洲第一页在线观看| 97视频精品全国在线观看| 97在线观看视频免费| 丁香亚洲综合五月天婷婷| 亚洲Aⅴ无码专区在线观看q| 九九这里只有精品视频| 成人亚洲天堂| 91久久夜色精品| 性欧美精品xxxx| 国产91蝌蚪窝| 国产第一页屁屁影院| 中文精品久久久久国产网址| 色婷婷亚洲综合五月| 免费观看男人免费桶女人视频| 无码精品国产dvd在线观看9久| 成人亚洲国产|