999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于旅游用戶數據和評論的推薦系統的設計

2019-12-19 02:07:13周家昊李民
軟件 2019年11期
關鍵詞:數據挖掘

周家昊 李民

摘? 要: 隨著國民生活水平的提高,旅游業蓬勃發展,旅游業與互聯網的結合促進了在線旅游業的形成,也就是當代所說的“智慧旅游”。用戶可以通過互聯網了解各種各樣的旅游信息,但是,日趨嚴重的過載旅游數據現象讓旅游商們難以準確的挖掘出符合用戶興趣的個性化旅游信息,推薦出一個智慧的旅游路線更是如同大海撈針,而旅游推薦系統是解決這一問題的關鍵技術。本文基于個性化推薦算法的研究,將用戶信息,用戶評論,用戶行為,用戶歷史訂單,用戶未來訂單等多項數據作為算法的訓練測試集,對功能性需求進行分析,開發了基于用戶數據的推薦系統。

關鍵詞: 旅游數據;推薦算法;數據挖掘

【Abstract】: With the improvement of the living standards of the people and the booming tourism industry, the combination of tourism and the Internet has promoted the formation of online tourism, which is also known as “smart tourism”. Users can learn a variety of travel information through the Internet. However, the increasingly serious phenomenon of overloaded travel data makes it difficult for travellers to accurately mine personalized travel information that suits their interests. It is more like recommending a smart travel route. A needle in a haystack, and a travel recommendation system is the key technology to solve this problem. Based on the research of personalized recommendation algorithm, this paper uses user data, user comments, user behavior, user history orders, user future orders and other data as the training test set of the algorithm, analyzes the functional requirements, and studies the system summary design.

【Key words】: Travel data; Recommendation algorithm; Data mining

0? 引言

伴隨著旅游產業收入快速增長,行業互聯網化逐漸加深,在線旅游市場也快速增長。據Analysys監測數據,2008-2017年,中國在線旅游交易規模逐年遞增,2017年交易規模達8923.3億元;2018年前三季度中國在線旅游交易規模為7342.62億元,逼近中國2016年全年在線度假旅游交易規模。此外,2018年全年中國在線旅游交易規模將達9900萬億元,萬億規模指日可待。從2009-2018年在線旅行預訂用戶規模變化情況看,用戶規模逐年遞增,通過線上渠道進行旅游預訂的用戶數量越來越多;截至2018年6月,在線旅行預訂用戶規模達到3.93億,較2017年末增長1707萬人,增長率為4.50%;約一半的網民會通過在線業務進行旅行預訂。

旅游推薦系統利用數據挖掘技術實現一個模擬用戶與旅行社交流的平臺,通過獲取并分析用戶的旅游需求、偏好等信息,主動為用戶推薦盡可能符合其需求的旅游信息或產品(包括單個旅游產品,如景點、酒店等;旅行包以及旅游線路),為用戶制定各套更加智慧的,符合興趣的旅游方案和產品。

對于旅游路線的推薦技術研究,在國內外已有一些基于旅游資訊,結合景點信息進行推薦。張晗等[1]人使用MD_Apriori算法對已有數據信息進行挖掘,設計出旅游服務智能推薦系統。王顯飛等[2]人以會話的形式與用戶進行交互,在不斷的交流中提取出用戶的興趣點,結合用戶的興趣設計出基于約束的旅游推薦系統。朱全[3]設計的利用加權關聯規則進行數據挖掘的智慧旅游推薦系統。呂紅亮等[4]人提出基于PageRank的一種改進算法來提供個性化旅游路線推薦服務,是以用戶,景點,線路三者為頂點,相互關聯為邊來表達用戶與物品間的偏好關系,計算出其頂點相對推薦用戶頂點的相關度,并對其進行排名,最后將名次靠前的旅游路線推薦給目標用戶。國外學者Krumm[5]于2004年提出利用地理信息系統對旅游信息進行分析和推薦的系統服務,運用最短徑算法向用戶推薦個性化旅游路線。HUANG.Y和Bian.L[6]在2009年,提議使用異構在線信息分析來推薦目標用戶的旅行路線,該研究主要使用貝葉斯網絡技術,還涉及旅游和旅游興趣的信息指標。Chodhury等[7]人于2010年以Web Albums為數據支撐,對Web Albums進行分析,提取相關信息數據,系統根據提取出的信息自動向用戶推薦旅游線路。當前的各種研究對旅游路線推薦系統的發展作出了很大的貢獻,但是依然有一些問題或者某些領域上的困難需要我們去攻克,例如將用戶個人信息作為興趣點的一個參考因素,以及對于新的旅游路線的出現等冷啟動問題。

1? 個性化推薦算法介紹

1.1? 基于內容的推薦算法

基于內容的推薦根據用戶過去喜歡的物品,為用戶推薦和這些物品內容相似的其它物品。該方法在文本類推薦領域(如新聞、文檔、網頁、書籍等)得到了廣泛應用。在本文中通過對用戶歷史訂單評論文本數據的提取,對未來訂單的預測。

1.2? 基于協同過濾的推薦算法

協同過濾推薦是構建推薦系統最常用的一項技術,它可以直接通過用戶過去的行為(如用戶對訂單的評分)來預測用戶的偏好,它默認用戶未來的興趣愛好是和過去的興趣愛好一致的,這項技術不需要其他任何領域知識作為參考。現有的協同過濾可分為基于模型(Model based)與基于記憶(Memory based)兩種。其中,基于模型的協同過濾的目標就是從可觀測評分數據中找到一些潛在的影響因子,利用數據挖掘與機器學習技術從訓練數據中找到模式(patterns),利用產生的這些模式去計算用戶對商品的評分。

基于記憶的協同過濾又可分為基于用戶與基于物品兩種:

第一種是基于用戶(User-based)的協同過濾是推薦系統中最古老的算法[8]。其主要思想就是找到與目標用戶偏好相似的鄰近用戶,并利用其鄰近用戶對目標物品的評分來預測目標用戶對目標物品的評分。其具體步驟如下:

(3)推薦階段:在預測目標用戶對所有未評分物品的評分后,也可采取Top-K方法,將評分值最高的K個物品推薦給目標用戶。

2? 系統需求分析

2.1? 應用場景介紹

(1)推薦結果的展示

前端的頁面將會展示多種基于各種算法下對旅游用戶數據的挖掘結果,這些挖掘結果將以訂單服務的形式供用戶瀏覽以及查詢,此類典型的頁面場景即“猜你喜歡”、“您是不是在找”。

(2)業務員用戶的后臺管理

業務員主要分析每一個用戶的歷史行為數據以及個人信息,包括點擊、瀏覽、搜索、評論、交易等,挖掘用戶的興趣偏好數據,包括偏好列表、物品類別、物品標簽等。另外,利用分類和聚類等機器學習方法對用戶群體進行細分,以進行更精準的推薦,最終得到每個用戶全方位的精準畫像。使用多種推薦算法,得到待推薦的物品列表,使用機器學習的方法進行重新排序,得到最終的推薦物品集合,快速響應用戶復雜行為操作,綜合各種維度的分析挖掘結果呈現給用戶。

(3)管理員用戶的用戶管理

管理員用戶可以對任務和權限進行分配,普通用戶只能進行瀏覽推薦內容,而業務員可以執行算法部分。

2.2? 系統實現目標

系統實現的目標有:

(1)旅游用戶可以查詢推薦結果。

(2)系統業務員可以執行數據爬取、協同過濾、主客觀分析、情感分析等綜合算法模塊,將相關結果導入數據庫中并查看各階段的執行進度。

(3)管理員可以對用戶信息進行編輯、查看、增加以及刪除。

2.3? 系統性能需求

緩解評分矩陣稀疏性問題。雖然目前旅游業迅猛發展,產生了很大的在線旅游數據,但是這些數據集中表現為用戶的信息數據以及瀏覽數據,因為某項旅游服務難以有大量的訂單,或者說用戶在享受完某項特定訂單服務之后沒有產生評論,也就是文本數據的缺失,因此本系統可以引導和收集用戶的文本數據,并有效的緩解數據稀疏所帶來的預測模型難以建立問題。

改善新的旅游訂單服務和新的用戶冷啟動問題。在服務-用戶兩個端都可能出現新的單位,由此產生的歷史數據的缺失,本系統會優化改善冷啟動問題。

基于興趣的時效性推薦。雖說人的興趣在短期類不會發生改變,但是“說走就走的旅行”反應了用戶在一定時間內的未來可能性訂單是緊緊依附的它時下所產生的旅游數據的,如果系統的響應時間比較長,就會給用戶造成不好的體驗,因此要在短時間內抓住用戶的胃口,也就是保證在推薦上的時效性。

3? 系統概要設計與實現

本論文基于用戶歷史數據及用戶評論的推薦系統主要采用MVC模式,結合Struts和Hibernate框架進行開發。

MVC是三個單詞首字母縮寫,它們是Model(模型)、View(試圖)和Controller(控制)。這個模式認為,程序不論簡單還是復雜,從結構上看,都可以分為三層。最上面的一層,是直接面向最終用戶的“視圖層”(View)。它是提供給用戶的操作界面,是程序的外殼。最底下的一層是核心的“數據層”(Model),也就是程序需要操作的數據或信息。中間的一層,就是“控制層”(Controller),它負責根據用戶從“視圖層”輸入的指令,選取“數據層”中的數據,然后對其進行相應的操作,產生最終結果。這三層是緊密聯系在一起的,但有時相互獨立的,每一層內部的比那花不影響其他層。每一層都對外提供接口(Interface),供上一層進行調用。這樣一來,軟件就可以實現模塊化,修改外觀或者變更數據都不用修改其他層,大大方便了維護的和升級。在本基于旅游用戶歷史數據及評論的推薦系統中,采用Struts實現View層和Controller層的交互,Hibernate則用于數據持久化。使用JSP頁面來制作前臺頁面,后臺系統代碼使用JAVA,使用python腳本來寫算法部分代碼,而數據庫使用My SQL進行信息的存儲。另外,服務器采用tomcat。

3.1? 功能模塊設計

本論文結合用戶需求,將基于用戶歷史數據和用戶評論的推薦系統劃分為登陸注冊模塊,查詢推薦結果模塊,算法執行模塊,管理用戶模塊等。總框架圖如圖1。

3.2? 算法執行模塊的實現

在前面章節已經介紹了基于協同過濾推薦算法的原理,主要是根據過往評分記錄計算用戶與用戶之間的相似度和訂單與訂單間的相似度來預測用戶對商品可能的評分。

基于用戶的協同過濾相關代碼如圖2。

4? 結語

基于用戶旅游數據的推薦系統能夠為旅行商開發一個信息化以及智能化的旅游APP,這是智慧旅游的一個重要體現。本論文研究了基于用戶信息數據,用戶評論,用戶歷史訂單數據等相關數據的挖掘,也運用了情感分析,協同過濾等多種算法,從設計實驗的預期效果來看系統基本上實現了預期需求,能夠為用戶提供相似度較高的旅游服務,但同時也存在不足。例如對于情感表達不明確的評論數據無法進行情感詞的抽取,這對數據分析的準確性有一點折扣。總體而言,本系統的設計研究為智慧旅游,從旅行商角度,在給用戶提供更加個性化和人性化的旅游線路獲取了關鍵思路了關鍵思路,另一方面,旅游用戶能獲取一種接近理想化的旅游? ?線路。

參考文獻

[1]張晗, 潘正運, 張燕玲. 旅游服務智能推薦系統的研究與設計[J]. 微計算機信息, 2006, 22(5-3): 170-171.

[2]王顯飛, 陳梅, 李小天. 基于約束的旅游推薦系統的研究與設計[J]. 計算機技術與發展, 2012, 22(2): 141-145.

[3]朱全. 基于加權關聯規則挖掘的智慧旅游推薦系統的設計與實現[D]. 湖北: 武漢科技大學, 2004.

[4]呂紅亮, 王勁林, 鄧峰. 一種個性化旅游推薦算法[J]. 網絡新媒體技術, 2015. 5, 1(3).

[5]Krumm J Where will they turn: predicting turn propor-tions at intersections. Pers Ubiquit Comput. 2010, (14): 591-599.

[6]Huang Y, Bian L A Bayesian network and analytic hier-archy process based personalized recommendations for tourist attractions over the Internet. Expert Syst Appl. 2009, (36): 933-943.

[7]Chodhury MD, Feldman M, Amer-Yahia S, Golbandi N, Lempel R, Yu C Automatic construction of travel itineraries using social breadcrumbs. In: Proceedings of HT 2010, pp35-44.

[8]項亮. 推薦系統實踐[M]. 北京: 人民郵電出版社, 2012.

[9]Tang J L, Hu X, Liu H. Social recommendation: a review[J]. Social Network Analysis and Mining, 2013, 3(4): 1113-1133.

[10]Jannach D, Zanker M, Felfernig A, et al. Recommender systems: an introduction[M]. Cambridge University Press, 2010.

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 久久一级电影| 人妻丰满熟妇αv无码| 国产乱码精品一区二区三区中文| 色网站在线免费观看| 精品国产网站| 国产在线97| av在线无码浏览| 视频二区中文无码| 无码专区国产精品第一页| 久无码久无码av无码| 真实国产乱子伦高清| www.youjizz.com久久| 玩两个丰满老熟女久久网| 人妻精品全国免费视频| 爽爽影院十八禁在线观看| 国产成人综合亚洲网址| av在线手机播放| 久久香蕉国产线看观| 国产成人亚洲无吗淙合青草| 亚洲国产成人超福利久久精品| 91美女视频在线观看| 啦啦啦网站在线观看a毛片| 成人一区专区在线观看| 亚洲午夜综合网| 99精品高清在线播放| 伊人色婷婷| 91精选国产大片| 精品国产中文一级毛片在线看 | 亚洲日韩图片专区第1页| 精品视频福利| 日本精品影院| 免费高清自慰一区二区三区| 国产精品熟女亚洲AV麻豆| 国产真实乱子伦视频播放| 嫩草在线视频| 婷婷亚洲视频| 亚洲国产精品一区二区高清无码久久| 亚洲国产精品不卡在线| 亚洲成人在线网| 制服丝袜亚洲| 天堂中文在线资源| 青青草综合网| 99在线视频精品| 亚洲欧洲免费视频| 久久综合亚洲色一区二区三区| 国内熟女少妇一线天| 国产大片喷水在线在线视频| 国产精品流白浆在线观看| 国产美女91视频| 日韩欧美综合在线制服| 国产黑丝一区| 99久久99视频| 日韩小视频网站hq| 香蕉久久国产精品免| 激情乱人伦| 天天躁夜夜躁狠狠躁躁88| 国产成人91精品免费网址在线| 亚卅精品无码久久毛片乌克兰| 久久成人免费| 全部毛片免费看| a天堂视频| 新SSS无码手机在线观看| 播五月综合| 99999久久久久久亚洲| 欧美日韩动态图| 国产sm重味一区二区三区| 亚洲成人免费看| 亚洲三级电影在线播放| 欧美精品啪啪一区二区三区| 国产网站黄| 8090成人午夜精品| 99九九成人免费视频精品| 中国国产A一级毛片| 成年人免费国产视频| 国产美女精品一区二区| 另类重口100页在线播放| 午夜无码一区二区三区| 国产精品尤物在线| 一本色道久久88| 午夜欧美理论2019理论| 国产小视频免费| 毛片在线看网站|