999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類和決策樹對上海景點評論分析

2018-08-18 11:06:32張小妹梁佩
科學與財富 2018年22期

張小妹 梁佩

摘 要:本文爬取了大眾點評網2017 年6 月份的上海周邊游景點評論數據,篩選出四個變量,運用R及其它統計軟件對其進行分析,分別采用"最長距離法"、"類平均法"、"重心法"、"Ward法"對總分、環境評分、服務評分三個變量進行聚類分析,分析結果與該景點星級進行比較,探究聚類后的數據與星級之間分類有無一致性。最后利用決策樹進行分類,得到景點星級,總分評分,服務評分的分類,分析了游客最關注的景點指標,得到景點的旅游建議和改進措施。

關鍵詞:上海景點評論、聚類分析;決策樹

一、模型建立與分析

本文選取了上海周邊游數據集中的score、enrironment、service這三個變量,其中的缺失值用樣本均值代替,首先利用歐式距離生成三個變量的距離函數,然后用最長距離法,類平均法,重心法和Ward法分別繪出繪出譜系圖和聚類情況,對四種方法進行對比,選擇一種輸出它的分類結果,最后利用決策樹建立了一個關于上海周邊游景點的游客選擇模型。

二、聚類分析

通過上面四幅圖發現,最長距離法和Ward法聚類產生的分類比較均勻,分別輸出他們的分類情況如下:

最長距離法的分類情況:

group

1 2 3 4

157 537 52 4

Ward法的分類情況:

group

1 2 3 4

59 180 170 341

在實際數據中,上海五星級景點數為79個,準五星景點數為114個,四星級景點數為239個,準四星級景點數為318個,通過對比發現用Ward法分類產生的聚類與我們的實際數據更相符,因此選用Ward法分類輸出具體的分類情況。

第1類星級

> max(第1類星級)

[1] 5

> min(第1類星級)

[1] 3.5

結果顯示,第一類含有59個景點,他們的星級為3.5-5;

第2類星級

> max(第2類星級)

[1] 5

> min(第2類星級)

[1] 3.5

結果顯示,第二類含有180個景點,他們的星級為3.5-5;

第3類星級

> max(第3類星級)

[1] 5

> min(第3類星級)

[1] 3.5

結果顯示,第三類含有170個景點,他們的星級為3.5-5;

第4類星級

> max(第4類星級)

[1] 5

> min(第4類星級)

[1] 3.5

結果顯示,第四類含有341個景點,他們的星級為3.5-5。

最后發現用Ward法分類產生四個類的星級都在3.5-5之間,說明依據score、environment、service來評價上海景點的星級是不太合理的。

三、利用決策樹建立游客選擇模型

通過決策樹發現,第一層是依據score變量來劃分,第二層是依據service變量來劃分,第三層是依據star變量來劃分,對于score<8分,service>=6.8分并且star為3.5分的占了51%,對于score<7分,service>=5.8分并且star為3.5分的占了8%,對于service<7分,score <5.8分并且star為4分的占了17%,對于service<6.8分,service>=7分并且star為4分的占了10%,對于service>8分,score<8.9分,并且star為4.5分的占了10%,對于service>8分,score>=8.9分,并且star為5分的占了4%,對于總分又高,星級又高的景點,建議游客去旅游,但這類景點數量比較可觀。

四、結論與建議

通過對上海總評評分,環境評分,服務評分進行聚類,發現星級分類與聚類產生的類別所包含的景點數不太一致,說明星級高的景點不一定各變量評分高,各變量評分高的景點不一定星級高,故在選擇景點進行旅游時,不應該只看星級、總評評分、環境評分、服務評分,而應該關注評論的具體內容來選擇適合的景點進行旅游。

通過對星級、總評評分、服務評分進行決策樹分類發現,對于總分和星級都高的景點,建議游客去旅游。

參考文獻:

[1]崔雷.專題文獻高頻主題詞的公司聚類分析[J].情報哦理論與實踐,1996,19(4):49—51.

[2] Metha M, Rissanen J, Agrawal R. SLIQ: A Fast Sealable Classifier for Data Mining[C]//Proc. of EDBT96. Avignon, France: [s. n.], 1996.

[3] 楊學兵,張俊.決策樹算法及其核心技術[J].計算機應用與發展,2007.17:43-45.

[4]馮少榮,尚文俊.基于樣本選取的決策樹改進算法[J].西南交通大學學報,2009,44(5):643-647.

主站蜘蛛池模板: 亚洲女人在线| 国产18在线| 综合网久久| 国产区91| 91亚洲免费| 天天躁夜夜躁狠狠躁图片| 亚洲精品福利网站| 97超碰精品成人国产| 久久精品中文字幕免费| 日本人又色又爽的视频| 老司机午夜精品网站在线观看| 色综合成人| AV色爱天堂网| 国产人成乱码视频免费观看| 激情无码字幕综合| 亚洲最新地址| 日本91视频| 老司机久久99久久精品播放| 亚洲国产成人综合精品2020| 久久频这里精品99香蕉久网址| 欧美亚洲国产日韩电影在线| 四虎在线观看视频高清无码 | 91麻豆精品国产高清在线| 伊人蕉久影院| 亚洲综合在线网| 国产日韩欧美精品区性色| 无码综合天天久久综合网| 婷婷色婷婷| 国产特一级毛片| 国产精品自在自线免费观看| 呦女精品网站| 国产一级毛片yw| 五月激情综合网| 亚洲成人免费看| 亚洲综合第一页| 欧美成人综合视频| 极品国产在线| 青青草国产精品久久久久| 国产人前露出系列视频| 亚洲一区波多野结衣二区三区| 国内精品视频| 国产成人亚洲综合A∨在线播放 | 国产日韩精品欧美一区喷| 亚洲开心婷婷中文字幕| 国产精品污污在线观看网站| 久久 午夜福利 张柏芝| 国产新AV天堂| 亚洲无码精彩视频在线观看| 国产欧美日韩综合在线第一| 久热这里只有精品6| 日韩成人免费网站| 国产精品亚洲五月天高清| 欧美成人免费一区在线播放| 在线免费观看AV| 一区二区影院| 欧美成人一区午夜福利在线| 国产91小视频在线观看| 日韩乱码免费一区二区三区| 中国一级特黄大片在线观看| 国产精品无码翘臀在线看纯欲| 国内精品久久久久鸭| 2024av在线无码中文最新| 亚洲黄色网站视频| 欧美精品啪啪| 在线免费不卡视频| 露脸国产精品自产在线播| 亚洲欧美在线综合一区二区三区 | 亚洲二区视频| 在线看片免费人成视久网下载| 久久99国产综合精品1| 国产丝袜无码精品| 热这里只有精品国产热门精品| 波多野结衣无码视频在线观看| 亚洲成人在线免费观看| 久久久久人妻一区精品| 亚洲欧美日韩色图| 亚洲AⅤ综合在线欧美一区| 亚洲成人在线网| 国产精品无码AV片在线观看播放| 日本午夜视频在线观看| 亚洲精品亚洲人成在线| 大香网伊人久久综合网2020|