999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LRF方法的在線短租房源價格特征選擇研究

2020-09-02 06:31:23張浩朱晨龍
軟件導刊 2020年8期

張浩 朱晨龍

摘 要:為解決單一特征選擇方法的局限性問題,提出Lasso-RF(LRF)混合特征選擇方法,并應用于在線短租房源價格問題研究。基于Airbnb房源數據,實驗首先通過Lasso回歸進行特征選擇,處理特征之間的多重共線性;然后采用隨機森林算法精選剩余特征,最終得到35個重要特征,并帶入4個預測模型中進行比較。結果表明,特征之間的多重共線性會影響隨機森林算法對特征重要度的度量;LRF-RF預測模型與RF-RF預測模型相比,評價指標R2和MSE分別提高了0.005、0.006,同時運行時間縮短0.267秒,表明LRF混合特征選擇方法優于單一的RF特征選擇方法。

關鍵詞:特征選擇;Lasso;隨機森林;在線短租;房源價格

DOI:10. 11907/rjdk. 192596 開放科學(資源服務)標識碼(OSID):

中圖分類號:TP301文獻標識碼:A 文章編號:1672-7800(2020)008-0001-05

Abstract: To solve the problem of the limitation of single feature selection method, a mixed feature selection method for Lasso-RF (LRF) is proposed, and is applied to the listings price of home-sharing accommodation. Based on the data of Airbnb, the experiment does the feature selection by Lasso regression firstly, dealing with the multicollinearity between features. Then the experiment selects the residual features by Random forest. Finally, 35 important features are selected out and used in four prediction models in order to evaluate and compare the results. The results show that the multicollinearity between the features will affect the measurement of the importance of the random forest to the features. Comparison between LRF-RF prediction model and RF-RF prediction model shows that evaluation indexes R2 and MSE was increased by 0.005 and 0.006 respectively, and the running time was reduced by 0.267 seconds. The evaluation result show that LRF hybrid feature selection method is better than single RF feature selection method.

Key Words: feature selection; Lasso; random forest; home-sharing accommodation; listings price

0 引言

分享經濟的核心是通過協作和分享的方式與他人分享商品、服務的使用權[1]。近年來,隨著通訊技術的廣泛應用,人們可以通過在線平臺分享并交換有形和無形資產[2]。在線短租基于分享經濟模式,通過在線平臺把需出租閑置資產的房東和需臨時住宿的旅客聯系起來[3]。這種商業模式風靡全球,中外學者針對在線短租房源價格進行了研究。如Ikkala等[4]用定性研究的方法探討了在線短租房源聲譽資本與房源價格的關系,發現房東可把積累的聲譽資本轉換為房源價格;Gibbs等[5]通過多元回歸方法,發現房源特征、房東特征顯著影響房源價格,但有趣的是評論數越多,表現出的卻是房源價格越低;Wang等[6]根據33個城市在線房源數據,應用OLS和分位數回歸方法,研究了房東特征、房源特征、配套設施及服務、租賃規則、在線評論評級5大類特征對房源價格的影響;吳曉雋等[7]在已有研究基礎上,針對中國市場,加入信任度與社交度兩大類特征,同樣應用OLS和分位數回歸方法對房源價格影響因素作進一步分析。結果表明,不同城市房東關注的房源價格影響因素有所不同。現有研究主要運用傳統回歸分析方法,探索房源價格和其影響因素的關系,然而在線短租房源價格影響因素眾多,數據集中常包含大量文本信息,傳統研究方法無法有效處理高維且含文本信息的數據,如果直接刪除,必將損失大量有價值信息。所以,如何從高維數據中選取合適的特征,將其運用于房源價格影響因素研究和價格預測,成為在線房源價格研究的關鍵。

隨機森林算法(Random Forest,RF)是一種優秀的非線性建模工具,泛化能力強,準確性高,而且隨機森林算法還可測量特征重要度,在特征選擇方面應用較多[8]。但是,隨機森林算法并不能解決特征之間的多重共線性,當數據中存在大量特征,這些特征之間的多重共線性很可能影響隨機森林對特征重要度的度量,影響模型預測結果。所以本文提出Lasso-RF(LRF)混合特征選擇方法解決高維數據中存在特征多重共線性的問題,并應用于在線房源價格研究。首先,本文確定初始特征,帶入Lasso回歸中進行第一次特征選擇,解決特征之間的多重共線性;然后,利用隨機森林對第一次選擇的特征進行特征重要度測量,并在隨機森林預測模型中對特征進行精選;最后,將得到的最佳特征子集應用于房源價格預測模型,對不同預測模型結果進行比較,證明本文提出的LRF混合特征選擇方法具有更好的特征選擇效果。技術流程如圖1所示。

2.3.3 預測結果比較

實驗建立4個房源價格預測模型,其中RF模型表示直接進行隨機森林預測,RF-RF表示經RF特征選擇的隨機森林預測,LRF-RF表示經Lasso-RF特征選擇的隨機森林預測,LRF-XGb表示經Lasso-RF特征選擇的XGBoost預測。實驗中,RF和LRF特征選擇均選取前35個重要特征,評價結果如表3所示。從表3可以看出,經特征選擇的預測模型運行效率明顯優于不經特征選擇的預測模型;LRF-RF模型中,R2為0.736,MSE為0.278,運行時間等于1.810 s,3個指標均優于RF-RF模型,說明LRF-RF不僅具有較高的預測精度,而且學習效率更高;LRF-XGboost模型預測也取得了較好預測結果,說明基于LRF特征選擇方法比較穩定,適用性強。

3 結語

隨機森林是一種非線性建模工具,對數據具有較高的容忍度,在數據挖掘領域應用廣泛,但對于特征之間的多重共線性是否會對RF產生影響,目前很少有研究進行實驗論證。本文基于Airbnb房源數據,進行在線短租房源價格特征選擇,對照實驗LRF特征選擇和RF特征選擇的前15個重要特征排序存在的明顯差異,證明特征之間的多重共線性確實會影響隨機森林建模工具。與此同時,本文還建立了4個房源價格預測模型,評價結果顯示LRF混合特征選擇方法優于RF特征選擇方法,LRF混合特征選擇應用于預測模型中具有更高的預測精度和學習效率。最終,基于Airbnb房源數據,應用LRF混合特征選擇方法,從輸入數據的127個特征中提取了35個重要的房源價格特征,并在預測模型上取得了較好的預測結果。本文方法為在線短租管理和房源定價提供了參考。本文研究思路是基于機器學習的數據挖掘方法,在大量數據中尋找規律,但并不能說明特征和目標之間的因果關系。后續研究可將機器學習方法同傳統回歸分析相結合,完善機器學習方法的不足。

參考文獻:

[1] 雷切爾·博茨曼, 路·羅杰斯. 共享經濟時代: 互聯網思維下的協同消費商業模式[M]. 上海: 上海交通大學出版社, 2015.

[2] NETTER S,PEDERSEN E R G,LüDEKE-FREUND F. Sharing economy revisited: towards a new framework for understanding sharing models[J]. Journal of Cleaner Production, 2019(221): 224-233.

[3] 王曉雪. 共享經濟背景下商業模式的變革與創新——基于三大典型案例的啟示[J]. 商業經濟研究,2018(30): 30-32.

[4] IKKALA T,LAMPINEN A. Defining the price of hospitality: networked hospitality exchange via airbnb[C]. Proceedings of the Companion Publication of the 17th ACM Conference on Computer Supported Cooperative Work & Social Computing. ACM, 2014: 173-176.

[5] GIBBS C,GUTTENTAG D,GRETZEL U, et al. Pricing in the sharing economy: a hedonic pricing model applied to airbnb listings[J]. Journal of Travel & Tourism Marketing, 2018, 35(1): 46-56.

[6] WANG DAN,NICOLAU J L. Price determinants of sharing economy based accommodation rental: a study of listings from 33 cities on airbnb.com[J]. International Journal of Hospitality Management, 2017(62): 120-131.

[7] 吳曉雋,裘佳璐. 愛彼迎房源價格影響因素研究—基于中國36個城市的數據[J]. 旅游學刊,2019,34(4): 13-28.

[8] 劉忻梅,唐俊,段翀. AUCRF算法在信用風險評價中的特征選擇研究[J]. 計算機應用與軟件,2018, 35(4): 299-301+315.

[9] 沈學華,周志華,吳建鑫,等. Boosting和Bagging綜述[J]. 計算機工程與應用,2000,36(12): 31-33.

[10] 方匡南,吳見彬,朱建平,等. 隨機森林方法研究綜述[J]. 統計與信息論壇,2011,26(3): 32-38.

[11] 富越. 網紅微博中商品鏈接點擊量影響因素研究[D]. 武漢:武漢大學,2017.

[12] 崔晨,鄧趙紅,王士同. 基于Lasso稀疏學習的徑向基函數神經網絡模型[J]. 計算機工程,2019, 45(2): 173-177.

[13] 邱南南. 基于Lasso改進的一般因果關系檢驗[J].統計與信息論壇,2008,23(2): 18-22.

[14] TIBSHIRANI R. Regression shrinkage and selection via the lasso[J]. Journal of the Royal Statistical Society,1996,58(1): 267-288.

[15] 趙松山. 對擬合優度R2的影響因素分析與評價[J]. 東北財經大學學報,2003,(3): 56-58.

[16] 侍建國,張亦飛. 拉依達準則在處理區域水文數據異常值中的應用[J]. 海河水利,2016, (5): 49-51.

[17] 梁杰, 陳嘉豪, 張雪芹,等. 基于獨熱編碼和卷積神經網絡的異常檢測[J]. 清華大學學報,2018(25): 1-7.

(責任編輯:江 艷)

主站蜘蛛池模板: 久久福利片| 老司机aⅴ在线精品导航| AV色爱天堂网| 国产一区二区三区在线无码| 亚洲熟女偷拍| 欧美日在线观看| 亚洲欧美日韩高清综合678| 午夜国产精品视频| 欧美特级AAAAAA视频免费观看| 一级一级特黄女人精品毛片| 久久久久国产一级毛片高清板| 手机成人午夜在线视频| 亚洲国产天堂久久综合226114| 国产精品永久免费嫩草研究院| 小蝌蚪亚洲精品国产| 婷婷色中文网| 中文字幕无线码一区| 亚洲Va中文字幕久久一区 | 伦伦影院精品一区| 国产一级无码不卡视频| 欧美在线网| 色婷婷成人| 国产爽歪歪免费视频在线观看| 91精品最新国内在线播放| 免费中文字幕在在线不卡| 青青热久麻豆精品视频在线观看| 日韩欧美一区在线观看| 亚洲国产日韩一区| 免费A∨中文乱码专区| 国产成人免费| 五月激激激综合网色播免费| 午夜福利网址| 亚洲精品制服丝袜二区| 欧美一区中文字幕| 国产免费好大好硬视频| 日本亚洲欧美在线| 日韩精品一区二区三区swag| 国产综合网站| 中文字幕无码中文字幕有码在线| 国产性猛交XXXX免费看| 国产理论一区| 9966国产精品视频| 国产69精品久久久久孕妇大杂乱 | 欧美日韩一区二区在线播放| 啪啪啪亚洲无码| 亚洲床戏一区| 99热这里都是国产精品| 亚洲伊人电影| 国产精品久久久久婷婷五月| 精品欧美一区二区三区久久久| 污视频日本| 免费在线一区| 精品国产污污免费网站| 欧美三级不卡在线观看视频| 色呦呦手机在线精品| 国产午夜人做人免费视频中文| 人人妻人人澡人人爽欧美一区| 亚亚洲乱码一二三四区| 亚洲福利视频一区二区| 老司机aⅴ在线精品导航| 精品一区二区久久久久网站| 国产区福利小视频在线观看尤物| 久久久久国产精品嫩草影院| 91福利在线观看视频| 亚洲AⅤ波多系列中文字幕| 国产一区自拍视频| 久久久精品国产SM调教网站| 亚洲精品自在线拍| 欧美成人手机在线观看网址| 中文纯内无码H| 久久国产精品嫖妓| 久久婷婷五月综合色一区二区| 天堂在线视频精品| 久久综合色天堂av| 日本免费一区视频| 国产精品欧美激情| 国产精品永久免费嫩草研究院| 国产又黄又硬又粗| 婷婷伊人五月| 乱人伦99久久| www.国产福利| 久久精品波多野结衣|