999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類和決策樹對上海景點評論分析

2018-08-18 11:06:32張小妹梁佩
科學與財富 2018年22期

張小妹 梁佩

摘 要:本文爬取了大眾點評網2017 年6 月份的上海周邊游景點評論數據,篩選出四個變量,運用R及其它統計軟件對其進行分析,分別采用"最長距離法"、"類平均法"、"重心法"、"Ward法"對總分、環境評分、服務評分三個變量進行聚類分析,分析結果與該景點星級進行比較,探究聚類后的數據與星級之間分類有無一致性。最后利用決策樹進行分類,得到景點星級,總分評分,服務評分的分類,分析了游客最關注的景點指標,得到景點的旅游建議和改進措施。

關鍵詞:上海景點評論、聚類分析;決策樹

一、模型建立與分析

本文選取了上海周邊游數據集中的score、enrironment、service這三個變量,其中的缺失值用樣本均值代替,首先利用歐式距離生成三個變量的距離函數,然后用最長距離法,類平均法,重心法和Ward法分別繪出繪出譜系圖和聚類情況,對四種方法進行對比,選擇一種輸出它的分類結果,最后利用決策樹建立了一個關于上海周邊游景點的游客選擇模型。

二、聚類分析

通過上面四幅圖發現,最長距離法和Ward法聚類產生的分類比較均勻,分別輸出他們的分類情況如下:

最長距離法的分類情況:

group

1 2 3 4

157 537 52 4

Ward法的分類情況:

group

1 2 3 4

59 180 170 341

在實際數據中,上海五星級景點數為79個,準五星景點數為114個,四星級景點數為239個,準四星級景點數為318個,通過對比發現用Ward法分類產生的聚類與我們的實際數據更相符,因此選用Ward法分類輸出具體的分類情況。

第1類星級

> max(第1類星級)

[1] 5

> min(第1類星級)

[1] 3.5

結果顯示,第一類含有59個景點,他們的星級為3.5-5;

第2類星級

> max(第2類星級)

[1] 5

> min(第2類星級)

[1] 3.5

結果顯示,第二類含有180個景點,他們的星級為3.5-5;

第3類星級

> max(第3類星級)

[1] 5

> min(第3類星級)

[1] 3.5

結果顯示,第三類含有170個景點,他們的星級為3.5-5;

第4類星級

> max(第4類星級)

[1] 5

> min(第4類星級)

[1] 3.5

結果顯示,第四類含有341個景點,他們的星級為3.5-5。

最后發現用Ward法分類產生四個類的星級都在3.5-5之間,說明依據score、environment、service來評價上海景點的星級是不太合理的。

三、利用決策樹建立游客選擇模型

通過決策樹發現,第一層是依據score變量來劃分,第二層是依據service變量來劃分,第三層是依據star變量來劃分,對于score<8分,service>=6.8分并且star為3.5分的占了51%,對于score<7分,service>=5.8分并且star為3.5分的占了8%,對于service<7分,score <5.8分并且star為4分的占了17%,對于service<6.8分,service>=7分并且star為4分的占了10%,對于service>8分,score<8.9分,并且star為4.5分的占了10%,對于service>8分,score>=8.9分,并且star為5分的占了4%,對于總分又高,星級又高的景點,建議游客去旅游,但這類景點數量比較可觀。

四、結論與建議

通過對上海總評評分,環境評分,服務評分進行聚類,發現星級分類與聚類產生的類別所包含的景點數不太一致,說明星級高的景點不一定各變量評分高,各變量評分高的景點不一定星級高,故在選擇景點進行旅游時,不應該只看星級、總評評分、環境評分、服務評分,而應該關注評論的具體內容來選擇適合的景點進行旅游。

通過對星級、總評評分、服務評分進行決策樹分類發現,對于總分和星級都高的景點,建議游客去旅游。

參考文獻:

[1]崔雷.專題文獻高頻主題詞的公司聚類分析[J].情報哦理論與實踐,1996,19(4):49—51.

[2] Metha M, Rissanen J, Agrawal R. SLIQ: A Fast Sealable Classifier for Data Mining[C]//Proc. of EDBT96. Avignon, France: [s. n.], 1996.

[3] 楊學兵,張俊.決策樹算法及其核心技術[J].計算機應用與發展,2007.17:43-45.

[4]馮少榮,尚文俊.基于樣本選取的決策樹改進算法[J].西南交通大學學報,2009,44(5):643-647.

主站蜘蛛池模板: 国产人碰人摸人爱免费视频| 亚洲视频在线观看免费视频| 熟女视频91| 国产精品欧美日本韩免费一区二区三区不卡 | 日韩成人在线一区二区| a级毛片视频免费观看| 国产精品手机在线观看你懂的| 色亚洲成人| 久久精品国产电影| 激情五月婷婷综合网| 中文无码日韩精品| 97超碰精品成人国产| 精品亚洲国产成人AV| 凹凸国产熟女精品视频| 国产一级妓女av网站| 美女高潮全身流白浆福利区| 国产一级一级毛片永久| 色天堂无毒不卡| 97国产在线视频| 丁香婷婷激情网| 国产一级精品毛片基地| 国产午夜精品鲁丝片| 女高中生自慰污污网站| AV片亚洲国产男人的天堂| 草逼视频国产| 国产成人精彩在线视频50| 99久久国产综合精品女同 | 99re精彩视频| 中文字幕久久精品波多野结| 亚洲天堂日韩在线| 国产自在线拍| 992tv国产人成在线观看| 色视频国产| 五月激情婷婷综合| 日韩高清一区 | 少妇被粗大的猛烈进出免费视频| 欧美一道本| 久久人搡人人玩人妻精品一| 国产日本欧美亚洲精品视| 幺女国产一级毛片| 亚洲精品成人片在线观看| yy6080理论大片一级久久| 91精品人妻互换| 99国产精品一区二区| 中文字幕免费视频| 久久精品国产精品一区二区| 欧美日韩一区二区三| 91丝袜美腿高跟国产极品老师| 欧美 国产 人人视频| a毛片在线播放| 久久精品国产精品青草app| 99性视频| 亚洲欧美极品| 一本二本三本不卡无码| 97在线免费| 日韩国产一区二区三区无码| 丁香婷婷综合激情| 国产精品第5页| 亚洲国产精品VA在线看黑人| 91无码国产视频| 中文字幕1区2区| 亚洲乱码视频| 欧美福利在线观看| 亚洲福利网址| 精品久久蜜桃| 亚洲AV永久无码精品古装片| 亚洲第一色视频| 久久国产精品麻豆系列| 456亚洲人成高清在线| 精品久久久无码专区中文字幕| 国产精品亚洲αv天堂无码| 亚洲视频无码| 亚洲欧美日本国产专区一区| 4虎影视国产在线观看精品| 高清欧美性猛交XXXX黑人猛交 | 国产黄在线观看| 成人精品区| 欧美一级夜夜爽| 亚洲三级a| 欧美一区二区人人喊爽| 国产jizzjizz视频| 亚洲精品在线91|