999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

稀疏BP神經網絡對房租價格影響因素的探究
——以長沙市中心城區為例

2022-05-15 08:14:26
北方經貿 2022年4期
關鍵詞:影響模型

姚 菲

(廣西師范大學數學與統計學院,廣西 桂林 541006)

一、引言

隨著網絡技術的快速發展,高維數據出現在了生活中的各個領域,但并不是所有變量都是有價值的,這時變量選擇成為了高維數據建模必不可少的一部分,如何去選擇變量一直以來都是人們討論的焦點。

Tibshirani在1996年提出了一種變量選擇的方法LASSO,對模型系數施加L1懲罰,使不重要變量的系數壓縮到0,完成變量選擇;帶L1懲罰的稀疏神經網絡方法已被廣泛的應用和證明;將變量選擇的方法運用到實例中,李春林等利用LASSO回歸和XGboost模型分析了影響石家莊市房租價格的重要因素;田坤瑞在對北京市房租價格影響因素建立普通線性回歸模型的基礎上,考慮空間的非平穩性添加空間權重,建立地理加權回歸模型,效果比普通線性回歸模型更好;郭茹夢探究了北京市合租房價格的影響因素,將隨機森林和XGboost模型的預測性能進行了比較,XGboost模型的預測效果更好,并對變量重要性進行了排序;張英婕等將房屋的基本信息、GIS數據和周邊環境的POI數據相結合,建立多元線性回歸模型探究房租價格的影響因素;范雅靜等對北京市房租價格影響因素建立廣義線性模型進行研究;李英冰等基于武漢市二手房的區位特征、建筑特征和鄰里特征構建BP神經網絡模型,預測二手房價格效果良好;劉洋用BP神經網絡預測北京市二手房價時,在房屋基本信息的基礎上增加了百度地圖API的信息,得出預測的準確性有所提高。

房價一直居高不下,許多年輕人因為買不起房,而選擇了租房這一生活方式。長沙市作為湖南省省會,有大批的年輕人來到這里尋求工作崗位,租房需求量較大,探究房租價格的影響因素,有利于政府對租房市場更好的管控,提高人民的幸福感。在已有的研究成果中,對房租價格影響因素的研究非常少,大多數構建的都是線性模型,而影響房租價格的因素錯綜復雜,房租價格可能呈現非線性變化,這時傳統的線性模型擬合出來的效果可能不佳,而BP神經網絡具有極強的非線性逼近能力,對模型的要求不高,是目前最常用的神經網絡模型之一。本文建立稀疏BP神經網絡模型,探究影響長沙市中心城區房租價格的重要因素。

二、稀疏BP神經網絡模型

房租價格的影響因素眾多,并不是所有的因素都對其有重要作用,本節將介紹稀疏BP神經網絡模型,該方法能對候選指標進行變量選擇。BP神經網絡是一種按誤差逆傳播算法訓練的多層前饋網絡,它由輸入層、隱藏層和輸出層構成,三層BP神經網絡如圖1所示。當學習樣本輸入后,信息經由各層向輸出層傳遞。之后根據減少目標輸出與實際輸出誤差的原則,從輸出層反向經過各層至輸入層,逐級修正各連接的權值。m層神經網絡公式如1式所示。

圖1 三層BP神經網絡

在數據是高維的情況下,如果把所有變量都引入到模型中,參數過多,模型過于復雜容易造成過擬合,變量選擇是建模過程中非常重要的一步。對神經元權重施加L1懲罰,如2式所示,梯度下降是近似求解使得權重壓縮不到0,但可以將不重要變量的權重壓縮至很小,從而起到變量選擇的作用。

定義輸入層自變量集合x=(x,x,x…x),提取輸入層到隱藏層的所有權重,進行如3式所示的計算,得到各自變量的權重相加值,多次模擬后設置一個閾值p,如果a<p,k∈(1,2,3…s)視為將其壓縮至0,剔除自變量x,完成變量選擇。

三、正態數據模擬

模擬生成服從標準正態分布的樣本數據集,樣本數為10000,變量個數為1000,假定真實模型為:

其中,ε~N(0,1)與x相互獨立,一般來說神經網絡模型越復雜,結果準確度越高,但增加了訓練時間,容易導致過擬合現象的出現。將稀疏BP神經網絡的層數設置為三層,包含一層隱藏層,構建一個1000-3-1的稀疏BP神經網絡,激活函數均選擇tanh函數。設置迭代次數epochs為100,每500個樣本進行一次權重更新,loss函數采用均方誤差,L1正則化的學習率設置為0.1。

將數據集打亂,對其按8:1:1的比例劃分為訓練集、驗證集和測試集。構建稀疏BP神經網絡模型,進行100次訓練,完成如3式所示的計算,設置閾值為0.01,變量的權重相加值小于閾值,視為將其壓縮至0,剔除該變量完成訓練。其訓練集和驗證集的損失函數值如圖2所示,可見訓練集和驗證集的損失函數值接近重合,并且在不斷減小,最后趨于平穩,稀疏BP神經網絡達到一個比較良好的訓練性能。

圖2 訓練集驗證集損失函數值

結果如表1所示,錯誤選擇率和負選擇率的值均為0,說明稀疏BP神經網絡模型具有良好的變量選擇性能,均方預測誤差和均方擬合誤差都較小,說明其預測和擬合效果也非常不錯。

表1 模型性能結果表

四、房租價格影響因素探究

(一)數據來源與處理

貝殼找房網是一個為消費者提供包括二手房、新房、租賃和家裝等全方位居住服務的平臺。利用python對貝殼找房網上長沙市中心城區的租房信息進行爬取,由于網站只顯示100頁,所以分別對雨花區、岳麓區、天心區、開福區、芙蓉區的租房基本信息進行爬取,周邊環境如1km以內的地鐵醫院數量等信息通過百度地圖API獲得,返回的結果最大為10,但實際數量可能比10更多,共爬取到9267條數據。比對以往的文獻資料,結合貝殼找房網上顯示的信息,房租價格作為因變量,選出以下18個指標作為自變量進行研究。

由于爬取出來的數據存在缺失、重復和未知的現象,為了更好地進行后續研究,對原始數據進行如下處理:對重復的租房信息進行刪除處理;對指標存在大量缺失的租房信息進行刪除處理;存在16條租賃方式未知的租房信息,房租都在2500元以上判斷為整租;用水用電燃氣情況存在大量暫無數據的租房信息,直接刪除會導致數據分布發生偏差影響結果的準確性,故將暫無數據記為0。最后整理出7943條租房信息。

表2 候選指標說明

如圖3所示,房租價格大多集中在1000-4000元之間,2000-3000元附近分布最為密集,呈現偏態分布。對其進行對數化處理,使數據更加平穩,消除異方差性便于計算。

圖3 房租價格頻數柱形圖

數據集中不同屬性的變量量綱不一致,會影響結果的準確性,利用6式對數據集進行歸一化處理,將數據范圍控制在[0,1]之間,盡可能消除外界因素對結果的影響。將數據集打亂,對其按8:1:1的比例劃分為訓練集、驗證集和測試集。

(二)參數設定

將稀疏BP神經網絡的層數設置為三層,輸入層的節點數應與自變量個數相匹配即為18,輸出層的節點數應與因變量的個數相匹配即為1,確定隱藏層節點數的經驗公式如7式所示。其中a為輸入層節點個數,b為輸出層節點個數,c為常數,取值范圍在1-10之間,則隱藏層節點數取值范圍應在5-14之間。

對含不同隱藏層節點數的稀疏BP神經網絡分別進行10次測試,訓練誤差取10次的均值比較其結果,如表3所示,節點數為8時,平均訓練誤差最小,則設置隱藏層節點數為8個。激活函數均選擇relu函數。

表3 訓練誤差比較表

(三)稀疏BP神經網絡的訓練

設定好以上參數后,每次訓練進行100次迭代,每500個樣本進行一次權重更新,loss函數采用均方誤差,L1正則化的學習率設置為0.01。完成稀疏BP神經網絡的訓練之后,進行3式所示的計算,得到18個自變量的權重相加值,進行100次模擬,設置閾值為0.01,變量權重相加值小于閾值視為壓縮至0,剔除該變量。權重相加值小于閾值的變量,即被剔除的變量如下表所示,可以看出所屬地區、樓層、朝向、用水情況、用電情況、1km以內小學數量、1km以內中學數量這7個變量的權重相加值每次都小于閾值,故將這7個變量剔除。

對于剩下的11個自變量,將權重相加值進行從大到小排序,分別為租賃方式、衛生間數量、臥室數量、客廳數量、面積、是否精裝修、有無電梯、1km以內地鐵數量、1k m以內醫院數量、1k m以內商場數量、有無燃氣。

表4 100次模擬被剔除變量

可見房屋屬性的指標對房租價格的影響最大,人們在租房的時候首要考慮的還是房屋本身的構造;配套設施影響最大的是有無電梯,電梯是高樓層的必備,后期的維護也需要一定的費用;周邊環境影響最大的是1k m以內地鐵數量,地鐵快捷方便不會擁堵,是大城市中人們出行的主要方式之一,租房時交通是否便利是人們非常關注的方面。

五、結論

本文基于稀疏B P神經網絡探究了長沙市中心城區房租價格的影響因素,找出了影響房租價格的重要指標。首先利用模擬生成的標準正態數據,從錯誤選擇率、負選擇率、均方預測誤差和均方擬合誤差這幾個指標說明了該模型在變量選擇、預測和擬合性能方面的優良性。將該模型引入到實例應用中,探究影響長沙市中心城區房租價格的重要因素。

在房屋屬性方面,租賃方式、房屋戶型、面積和是否精裝修對房租價格有著重要影響,而租房不同于買房,能夠隨時變動自由性大,所以房屋的樓層和朝向是人們較少關注的,房東在進行住房改造的時候可以著重考慮這幾點,加快房屋的出租速度;在配套設施方面,有無電梯和燃氣對房租的影響更大,用電用水情況對房租影響較小;在周邊環境方面,1k m以內的地鐵醫院商場數量對房租價格影響更大,地鐵越多說明交通越便利,商場越密集說明人流量越大,醫院也是生活中必不可少的一部分,政府可以加強城市郊區的房屋周邊配套設施建設,改善租戶的居住環境,大部分租房的群體都是沒有孩子的年輕人,對教育的需求不大,所以1k m以內的中小學數量對房租價格的影響很小。隨著越來越多的人涌入大城市,租房需求量不斷增加,政府應該出臺更多的政策規范租房市場,抑制房租的快速上漲,提高人民的生活滿意度。

本文研究還存在相應的不足:變量選擇的方法還有S CA D、Elastic Net等,可以將這些方法引入到B P神經網絡中進行變量選擇;房租會受到時間的影響,例如畢業季租房的需求量大增,而數據僅來源于2021年11月的某段時間存在局限性,可以加大時間的跨度;本文只研究了18個指標對房租價格的影響,租金的影響因素還有很多,在未來可以加入更多的指標進行研究。

猜你喜歡
影響模型
一半模型
是什么影響了滑動摩擦力的大小
哪些顧慮影響擔當?
當代陜西(2021年2期)2021-03-29 07:41:24
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
沒錯,痛經有時也會影響懷孕
媽媽寶寶(2017年3期)2017-02-21 01:22:28
3D打印中的模型分割與打包
擴鏈劑聯用對PETG擴鏈反應與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
基于Simulink的跟蹤干擾對跳頻通信的影響
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 美女被操黄色视频网站| 精品久久久久久成人AV| AV熟女乱| 久久大香伊蕉在人线观看热2| 久久免费视频6| 亚洲一道AV无码午夜福利| 亚洲高清在线天堂精品| 宅男噜噜噜66国产在线观看| 亚洲精品大秀视频| 国产va欧美va在线观看| 在线观看国产黄色| 一级爆乳无码av| 国产精品不卡片视频免费观看| 久青草免费在线视频| 五月激情综合网| 91一级片| 欧美性爱精品一区二区三区 | 午夜福利免费视频| 99久久精品国产麻豆婷婷| 久无码久无码av无码| 亚洲久悠悠色悠在线播放| 日本a∨在线观看| 国产黑人在线| 日日摸夜夜爽无码| 精品久久777| 国产欧美综合在线观看第七页| 国产不卡一级毛片视频| 日本91视频| 亚洲,国产,日韩,综合一区 | 不卡国产视频第一页| 欧美精品1区2区| 美女视频黄又黄又免费高清| 日韩欧美视频第一区在线观看| 亚洲欧洲日产无码AV| 国产成人精品第一区二区| 99国产精品免费观看视频| 美女无遮挡免费网站| 在线免费观看AV| 激情综合网激情综合| 久久久久无码精品| 亚洲无码A视频在线| 91偷拍一区| aa级毛片毛片免费观看久| 欧美精品亚洲精品日韩专| 亚洲无码久久久久| 国产在线拍偷自揄拍精品| 亚洲最大福利网站| 亚洲人精品亚洲人成在线| 国产精品浪潮Av| 久久综合色视频| 色偷偷一区二区三区| 欧美色亚洲| 免费AV在线播放观看18禁强制| 91午夜福利在线观看精品| 亚洲人成影视在线观看| 黄色在线网| 免费一级无码在线网站| 人妻中文字幕无码久久一区| 91福利在线看| 99视频精品全国免费品| 亚洲男女天堂| 亚洲区欧美区| 欧美精品xx| 六月婷婷精品视频在线观看 | 欧美在线观看不卡| 亚洲国产精品日韩欧美一区| 久久精品最新免费国产成人| 国产精品一区二区久久精品无码| 欧美成人一级| 亚洲成人77777| 人妻丰满熟妇啪啪| 欧美a级完整在线观看| 999国内精品久久免费视频| 天堂va亚洲va欧美va国产 | 日韩国产亚洲一区二区在线观看| www.亚洲一区| 91亚洲视频下载| 国产成人免费手机在线观看视频| 全部毛片免费看| 国产精品亚洲一区二区三区z| 伊人色综合久久天天| 直接黄91麻豆网站|