999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類和決策樹對上海景點評論分析

2018-08-18 11:06:32張小妹梁佩
科學與財富 2018年22期

張小妹 梁佩

摘 要:本文爬取了大眾點評網2017 年6 月份的上海周邊游景點評論數據,篩選出四個變量,運用R及其它統計軟件對其進行分析,分別采用"最長距離法"、"類平均法"、"重心法"、"Ward法"對總分、環境評分、服務評分三個變量進行聚類分析,分析結果與該景點星級進行比較,探究聚類后的數據與星級之間分類有無一致性。最后利用決策樹進行分類,得到景點星級,總分評分,服務評分的分類,分析了游客最關注的景點指標,得到景點的旅游建議和改進措施。

關鍵詞:上海景點評論、聚類分析;決策樹

一、模型建立與分析

本文選取了上海周邊游數據集中的score、enrironment、service這三個變量,其中的缺失值用樣本均值代替,首先利用歐式距離生成三個變量的距離函數,然后用最長距離法,類平均法,重心法和Ward法分別繪出繪出譜系圖和聚類情況,對四種方法進行對比,選擇一種輸出它的分類結果,最后利用決策樹建立了一個關于上海周邊游景點的游客選擇模型。

二、聚類分析

通過上面四幅圖發現,最長距離法和Ward法聚類產生的分類比較均勻,分別輸出他們的分類情況如下:

最長距離法的分類情況:

group

1 2 3 4

157 537 52 4

Ward法的分類情況:

group

1 2 3 4

59 180 170 341

在實際數據中,上海五星級景點數為79個,準五星景點數為114個,四星級景點數為239個,準四星級景點數為318個,通過對比發現用Ward法分類產生的聚類與我們的實際數據更相符,因此選用Ward法分類輸出具體的分類情況。

第1類星級

> max(第1類星級)

[1] 5

> min(第1類星級)

[1] 3.5

結果顯示,第一類含有59個景點,他們的星級為3.5-5;

第2類星級

> max(第2類星級)

[1] 5

> min(第2類星級)

[1] 3.5

結果顯示,第二類含有180個景點,他們的星級為3.5-5;

第3類星級

> max(第3類星級)

[1] 5

> min(第3類星級)

[1] 3.5

結果顯示,第三類含有170個景點,他們的星級為3.5-5;

第4類星級

> max(第4類星級)

[1] 5

> min(第4類星級)

[1] 3.5

結果顯示,第四類含有341個景點,他們的星級為3.5-5。

最后發現用Ward法分類產生四個類的星級都在3.5-5之間,說明依據score、environment、service來評價上海景點的星級是不太合理的。

三、利用決策樹建立游客選擇模型

通過決策樹發現,第一層是依據score變量來劃分,第二層是依據service變量來劃分,第三層是依據star變量來劃分,對于score<8分,service>=6.8分并且star為3.5分的占了51%,對于score<7分,service>=5.8分并且star為3.5分的占了8%,對于service<7分,score <5.8分并且star為4分的占了17%,對于service<6.8分,service>=7分并且star為4分的占了10%,對于service>8分,score<8.9分,并且star為4.5分的占了10%,對于service>8分,score>=8.9分,并且star為5分的占了4%,對于總分又高,星級又高的景點,建議游客去旅游,但這類景點數量比較可觀。

四、結論與建議

通過對上海總評評分,環境評分,服務評分進行聚類,發現星級分類與聚類產生的類別所包含的景點數不太一致,說明星級高的景點不一定各變量評分高,各變量評分高的景點不一定星級高,故在選擇景點進行旅游時,不應該只看星級、總評評分、環境評分、服務評分,而應該關注評論的具體內容來選擇適合的景點進行旅游。

通過對星級、總評評分、服務評分進行決策樹分類發現,對于總分和星級都高的景點,建議游客去旅游。

參考文獻:

[1]崔雷.專題文獻高頻主題詞的公司聚類分析[J].情報哦理論與實踐,1996,19(4):49—51.

[2] Metha M, Rissanen J, Agrawal R. SLIQ: A Fast Sealable Classifier for Data Mining[C]//Proc. of EDBT96. Avignon, France: [s. n.], 1996.

[3] 楊學兵,張俊.決策樹算法及其核心技術[J].計算機應用與發展,2007.17:43-45.

[4]馮少榮,尚文俊.基于樣本選取的決策樹改進算法[J].西南交通大學學報,2009,44(5):643-647.

主站蜘蛛池模板: 欧美日韩激情在线| 青草精品视频| 亚洲乱伦视频| 色亚洲激情综合精品无码视频 | 2024av在线无码中文最新| 99尹人香蕉国产免费天天拍| 国产欧美日韩免费| 一级爆乳无码av| 久久精品国产91久久综合麻豆自制| 成人精品区| 无码国产伊人| 日韩 欧美 小说 综合网 另类| 欧美亚洲欧美| 99久久亚洲综合精品TS| 精品人妻系列无码专区久久| 91精品国产福利| 国产美女精品在线| 国产精品无码久久久久久| 不卡国产视频第一页| 久久精品无码国产一区二区三区| 亚洲成网777777国产精品| 国产精品lululu在线观看| 精品福利视频导航| 高清无码一本到东京热| 九月婷婷亚洲综合在线| 一本一道波多野结衣av黑人在线| 久久精品国产91久久综合麻豆自制| 国产欧美日韩精品综合在线| 亚洲天堂视频网| 国产精品久久久久无码网站| 中文字幕第4页| 色婷婷成人| 国产91在线免费视频| 麻豆精品视频在线原创| 亚洲成a人片在线观看88| 国产97视频在线| 无码粉嫩虎白一线天在线观看| 特级欧美视频aaaaaa| 亚洲国产成人麻豆精品| 97亚洲色综久久精品| 在线观看亚洲精品福利片| 91美女在线| 精品色综合| 国产女人在线视频| 亚洲中字无码AV电影在线观看| 欧美啪啪一区| 亚洲精品免费网站| 国产精品成人一区二区不卡 | 免费在线播放毛片| 久久久久亚洲av成人网人人软件| 欧美19综合中文字幕| 国产成人精品一区二区秒拍1o| 亚洲综合第一页| 天堂中文在线资源| 福利小视频在线播放| 国产亚洲欧美在线视频| 亚洲香蕉久久| 国产精品久久久久久久久kt| 国产乱人伦AV在线A| 55夜色66夜色国产精品视频| 中文字幕自拍偷拍| 亚洲第一黄色网址| 久久久久国产精品熟女影院| 中文字幕一区二区视频| 麻豆国产精品| 欧美a级完整在线观看| 欧美午夜在线视频| 精品国产美女福到在线直播| 99re热精品视频国产免费| 日韩中文无码av超清 | 亚洲黄色网站视频| 激情成人综合网| 亚洲一区二区无码视频| 国产欧美日韩va另类在线播放| 亚洲人成人无码www| 国产毛片片精品天天看视频| a级毛片免费在线观看| 国产丝袜第一页| 伊人色综合久久天天| 毛片国产精品完整版| 国产无码性爱一区二区三区| 热re99久久精品国99热|