??崱〈拗覀ァ≮w晨潔 王永金 吳戀
摘 要:該文首先分析了個性化旅游推薦系統的數據來源,并介紹了用戶行為數據、用戶標簽數據、上下文信息和基于社交網絡數據等推薦技術近年來的研究進展。其次,分析了能提升推薦性能的混合推薦技術以及滿足多約束場景的基于約束的推薦技術,介紹了相關領域的最新研究成果。最后,展望了個性化旅游推薦技術研發的發展方向。
關鍵詞:個性化旅游;推薦系統;協同過濾;混合推薦;標簽數據;多約束場景
中圖分類號:TP316文獻標識碼:A文章編號:2095-1302(2020)03-00-03
0 引 言
隨著信息技術的迅猛發展,旅游行業與信息技術深度融合的需求越發強烈。在信息過載(Information Overload)的大數據時代,用戶經常會感到無法快速獲取自己所感興趣的信息。因此,根據用戶的偏好,向用戶推薦其感興趣的個性化旅游推薦技術孕育而生。
個性化旅游推薦技術就是將推薦系統融入旅游行業,通過個性化的推薦,可以向用戶提供輔助決策,更高效、更精準地向用戶推薦其感興趣的旅游產品[1-2],因此,具有廣闊的應用空間和研究價值。
1 推薦系統及相關技術
推薦系統(Recommender System)在分析用戶行為數據的基礎上,建立對應的興趣模型(Interest Model),基于模型向用戶推薦滿足其興趣的偏好信息。
推薦技術可以按數據來源進行分類,這些數據包括:用戶行為數據、用戶標簽數據、上下文信息和社交網絡數據等。近年來,為進一步提升推薦系統技術的性能、滿足多約束場景下的應用,眾多研究人員分別提出了混合推薦技術[2-6]和基于約束的推薦技術[7-9]。
2 利用用戶行為數據的推薦技術
網站等平臺在運行過程中會記錄大量的日志(Log)數據,這些日志數據包含的用戶行為數據,包括:頁面瀏覽、購買、點擊、評分和評論等。利用用戶行為數據的推薦技術正是借助用戶行為數據實現推薦的一種推薦技術,可分為基于鄰域(Neighborhood-Based)的推薦技術、基于隱語義模型(Latent Factor Model)的推薦技術以及基于混合模型(Hybrid Model)的推薦技術等。
2.1 基于鄰域的推薦技術
基于鄰域推薦的核心是協同過濾(Collaborative Filtering,CF)。單純的CF受限于其性能,較少應用于旅游推薦。
文獻[10]為解決傳統協同過濾中存在的數據稀疏性、冷啟動等問題,提出了面向旅游產品推薦的基于不確定近鄰(Uncertain Neighbors)的協同過濾算法(IUNCF)。IUNCF算法首先利用K-means聚類技術實現用戶信息的動態分類篩選并分配推薦權重,然后結合內容信息,實現協同過濾推薦。實驗結果顯示,IUNCF算法能夠更有效地實現旅游產品推薦,其推薦準確度也相應提升。
2.2 基于隱語義模型的推薦技術
基于隱語義模型的推薦技術由于性能良好,源自文本挖掘領域的、旨在抽取文字中隱含語義的模型成為主要的推薦技術之一。
文獻[11]改進了經典Apriori算法,提出了融合矩陣聚類(Matrix Cluster)的MC-Apriori算法,同時,對用戶行為進行頻繁集挖掘,最終實現符合用戶搜索偏好的推薦。通過分析實驗結果,驗證了MC-Apriori算法的準確性高于Apriori算法。
孫彥鵬等提出了基于多重隱語義的MLSTR-RM模型用以表達旅游路線[12]。借助MLSTR-RM模型提取上下文的隱語義數據,采用負采樣方式將來自隱語義數據的訓練集數據用于模型參數的訓練,并設計個性化景點推薦算法。經過在真實數據集上的測試,驗證了MLSTR-RM模型的有效性。
朱桂祥等提出面向旅游產品推薦的基于主題序列模式的SECT引擎[13]。SECT引擎首先挖掘日志的主題以發現用戶行為范式,然后構建序列模式數據庫。最后,用Markov N-gram模型完成點擊流與序列模式數據庫的匹配。經過真實旅游數據集的測試,SECT引擎較之傳統算法,其性能更優越。針對冷啟動用戶,SECT引擎的推薦率和準確率也更高。
文獻[1]以眾源地理數據集合為對象,研發了面向熱門路線推薦的路線可視化平臺。其技術路線是,首先,借助標簽化技術實現路線數據的剪枝和篩選;然后,以Apriori算法挖掘數據集中的頻繁景點序列;其次,利用協同過濾尋找相似度高的路線;最后,根據頻繁序列項的綜合收益進行推薦排序。實驗數據顯示,該平臺能提升F-Measure、召回率和準確率等性能指標。
2.3 基于混合模型的推薦技術
混合模型即采用兩種及以上的模型來設計推薦算法,由于其性能優良,近年來已成為研究熱點。
文獻[3]利用在線評論數據設計出一種景點個性化推薦算法。該算法通過對用戶景點評論進行情感偏好分析,并運用領域本體構建技術,計算用戶的需求和滿意度,結合群體智慧,向用戶推薦符合其偏好的個性化旅游策略。
針對標記數據不足影響推薦效果的問題,文獻[4]提出一種基于域適應的個性化景點推薦算法。該算法使用域適應技術,并將標記數據設置為輔助數據,運用訓練數據來訓練推薦模型。實驗結果表明,該算法能較好地解決標記數據不足的問題。
陳君同等提出一種協同過濾與用戶偏好相融合的旅游組推薦算法[5]。該算法將相似性影響和關聯性兩種因子加入到協同過濾中用以評分預測,結合均值和最小痛苦兩種策略提出綜合組內局部和整體兩種滿意度的滿意度平衡策略。從實驗結果來看,該算法能提升推薦的準確率。
文獻[2]提出一種基于混合推薦策略的旅游推薦系統。首先,建立基于用戶靜態和動態兩種信息的混合用戶興趣模型,模型包含短期興趣和長期興趣兩種模型;然后,設計啟發式旅游行程規劃算法,該算法是基于多維度景點評分的;最后,通過實驗驗證了旅游行程規劃算法的有效性,并在服務器端和iOS端部署了系統。
Fenza等改進了協同過濾,并提出一種上下文感知推薦算法[6]。該算法利用游客和景點構建模糊分類器,通過分類器對新游客進行分類,然后利用上下文信息對比用戶感興趣的景點并生成類別匹配結果,最終對同一類別中的景點進行推薦排序。
3 利用用戶標簽數據的推薦技術
借助物品和用戶的特征(Feature)或標簽實現推薦也是重要的推薦技術,常見的標簽是普通用戶賦予物品和用戶的,稱為用戶生成的內容(User Generated Content,UGC)標簽。
文獻[14]將深度學習(Deep Learning)技術應用于旅游服務推薦系統。首先,在預處理階段,利用詞嵌入法對評論等數據進行處理,以實現詞匯的低維和稠密表示,同時,詞匯中還融入了語義;其次,采用CNN網絡和DNN網絡對用戶在線評論信息進行處理并提取其特征;再次,采用因子分解機技術構建共同作用層來連接三個網絡,以提升特征的提取精度,降低數據稀疏的影響;最后,通過實驗結果證實,提出的旅游服務推薦系統比傳統推薦技術更為有效。
基于深度挖掘出的用戶畫像(Users'Demographic)是抽象的標簽化畫像,能有效反映用戶行為特征。因此,用戶畫像已成為提升推薦算法性能的重要依據之一。文獻[15]提出一種旅游情境化推薦模型,該模型是基于用戶畫像的。通過構建的測試系統對旅游情境化推薦模型進行測試,結果表明,該推薦模型的推薦性能更優。
4 利用上下文信息的推薦技術
常見的上下文(Context)信息(前述技術沒有采用)包括:用戶的訪問時間、所在地點、情感等,而這些上下文對于提升推薦系統性能來說是至關重要的。
常用的基于位置的推薦主要涉及三個方面的內容,包括:數據集、評價方法及評價指標。文獻[16]在發現特殊評價方法及指標的基礎上,提出一種面向移動推薦系統的四層評價體系,該體系能有機結合基于位置的移動推薦的模型、數據集和評價要素,有助于提升評價的效用。
文獻[17]在抽取融合多源數據建立知識圖譜和挖掘游記的基礎上,創建旅游路線數據庫,結合數據庫、游客類型和頻繁序列挖掘算法產生大量候選路線。最終,利用多維度路線搜索算法及評分機制向用戶推薦旅游個性化路線。綜合考慮旅行天數、用戶類型及偏好,上述推薦能有效提升用戶體驗。
沈記全等提出一種融合情景上下文和用戶信任關系的景點推薦算法[18]。該算法在協同過濾中引入用戶信任度而非相似度以緩解數據稀疏的問題,并融合情景上下文來表征不同用戶的不同需求,以此建設景點推薦模型和算法。通過在模擬數據集上的對比,相比傳統方法,該景點推薦算法表現最優。
5 基于社交網絡數據的推薦技術
Facebook、微信以及新浪微博等社交網絡平臺發展迅猛,積累了數十億計的用戶,社交網絡越來越多地融入眾多游客的生活中。因此,在基于地理位置服務的社交網絡(Location Based Social Networks,LBSNs)[19]中發現用戶的興趣點(Point of Interest,POI)已經成為優化推薦算法的重要研究領域。
文獻[20]提出一種基于LBSNs的景點知識發現與推薦算法。在該算法中,設計了POI關系網絡的構建模型以提取POI的特征,并建立跨LBSN的POI特征聯合學習方法以便融合和推理多維信息,建構基于時間特征的POI推薦模式。
文獻[21]提出一種基于LBSN的多目標個性化POI序列推薦框架。在該框架中,選擇游客的簽到數據作為提取其偏好的依據,綜合考慮游客偏好、POI流行度和時空信息等因素,并利用多目標優化算法挖掘POI以形成個性化POI序列(即個性化線路)。實驗結果表明,該框架能提升推薦的命中率,滿足多樣性需求。
6 基于約束的推薦技術
由于現實條件的限制,游客的選擇無法做到隨心所欲,通常受到空間和時間等因素的約束,因此,基于約束條件的推薦技術更符合現實的應用場景需求。
文獻[8]提出了一種基于時空約束的旅游路徑推薦算法。該算法從地理學的視域,分析游客空間行為和時間行為約束條件,包括:時間距離和個人偏好等,并改進最短路徑算法,構建決策行為個性化應用場景下的高評分景點集合并規劃相對應的旅游路徑。通過在實驗區域的模擬測試,驗證了該算法在約束條件下的有效性。
由于節假日大量游客的集中涌入,導致游客滿意度的大幅下降,將基于事件社會網絡(Event-based Social Networks,EBSN)及其推薦策略引入到個性化旅游推薦中,是一個值得關注的新領域。文獻[9]提出在EBSN中的一種考慮約束的全局推薦策略。該策略的全局推薦優化目標是,在滿足事件接納用戶容量和時間沖突等約束的基礎上,使得不滿意度最小化,并建立約束對應的單一目標函數,借助二進制粒子群優化算法BPSO提升推薦優化的性能。文中的策略可以有效地應用于旅游推薦技術中。
7 結 語
個性化旅游推薦技術已成為學術界和產業界的研究熱點,本文分析了典型的推薦技術,包括:利用用戶行為數據、用戶標簽數據、上下文信息和基于社交網絡數據等,并介紹了近年來的研究進展。同時,介紹了能提升性能效果的混合推薦技術和滿足多約束應用場景的基于約束的推薦技術,研究了相關領域的最新成果。
總的來說,個性化旅游推薦技術的研究趨勢大致如下:
(1)用戶數據是研究的基礎。如何從多源的、大量的、龐雜的數據中提取有效數據,如何從數據中提取出相關的上下文信息,發現偏好特征,已成為推薦技術的共性問題之一;
(2)融合多種推薦技術的混合推薦技術是進一步的研究方向之一;
(3)基于游客空間行為約束、時間行為約束和EBSN約束等的推薦技術更符合實際應用需求,是值得深入研究的領域。
參 考 文 獻
[1]陳旭.基于眾源地理數據的熱門旅游路線推薦算法及實證研究
[D].上海:上海師范大學,2018.
[2]李多加. 基于混合推薦算法的旅游推薦系統的設計與實現[D].杭州:浙江大學,2018.
[3]王少兵,吳升.采用在線評論的景點個性化推薦[J].華僑大學學報(自然科學版),2018,39(3):467-472.
[4]鄭恩讓,韓國鋒,劉晨.基于域適應的旅游景點個性化推薦算法研究[J].陜西科技大學學報,2019,37(1):135-139.
[5]陳君同,古天龍,常亮,等.融合協同過濾與用戶偏好的旅游組推薦方法[J].智能系統學報,2018,13(6):999-1005.
[6] FENZA G ,FISCHETTI E ,FURNO D ,et al. A hybrid context aware system for tourist guidance based on collaborative filtering [C]// FUZZ-IEEE 2011,IEEE International Conference on Fuzzy Systems. [S.l.]:IEEE,2011: 27-30.
[7]王顯飛,陳梅,李小天.基于約束的旅游推薦系統的研究與設計
[J].計算機技術與發展,2012,22(2):141-145.
[8]陳媛,吳勝潔,董春玲.旅游者個人時空間行為約束下的旅游線路推薦[J].綠色科技,2018(21):229-232.
[9]廖國瓊,黃志偉.基于事件社會網絡中考慮約束全局推薦策略[J].南京大學學報(自然科學版),2018,54(1):11-22.
[10]趙雅楠,王育清.基于不確定近鄰的旅游產品協同過濾推薦算法研究[J].數據分析與知識發現,2018,2(7):63-71.
[11]徐宏,陳焰,支艷利,等.基于Apriori改進算法的旅游個性化推薦[J].微型電腦應用,2018,34(1):74-79.
[12]孫彥鵬,古天龍,賓辰忠,等.基于多重隱語義表示模型的旅游路線挖掘[J].模式識別與人工智能,2018,31(5):462-469.
[13]朱桂祥,曹杰.基于主題序列模式的旅游產品推薦引擎[J].計算機研究與發展,2018,55(5):920-932.
[14]鄧旭明. 基于深度學習的旅游服務推薦系統研究[D].西安:西北大學,2018.
[15]劉海鷗,孫晶晶,蘇妍嫄,等.基于用戶畫像的旅游情境化推薦服務研究[J].情報理論與實踐,2018,41(10):87-92.
[16]孟祥武,梁弼,杜雨露,等.基于位置的移動推薦系統效用評價研究[J].計算機學報,2019(2):1-24.
[17]孫文平,常亮,賓辰忠,等.基于知識圖譜和頻繁序列挖掘的旅游路線推薦[J].計算機科學,2019,46(2):56-61.
[18]沈記全,王磊,侯占偉,等.基于情景上下文與信任關系的旅游景點推薦算法[J].計算機應用研究,2018,35(12):3640-3643.
[19] BAO J ,ZHENG Y ,WILKIE D ,et al. Recommendations in location-based social networks: a survey [J]. GeoInformatica,2015,19(3):525-565.
[20]徐向陽.基于LBSNs的城市景點知識發現與推薦優化[D].成都:電子科技大學,2018.
[21]李迎. 基于LBSN的個性化多目標旅游路線推薦[D].長沙:湖南大學,2018.
[22] HAO Q,CAI R,WANG C,et al. Equip tourists with knowledge mined from travelogues [C]// Proceedings of the 19th International Conference on World Wide Web. Raleigh,North Carolina: IEEE,2010:26-30.
[23]孟祥武,李瑞昌,張玉潔,等.基于用戶軌跡數據的移動推薦系統研究[J].軟件學報,2018,29(10):3111-3133.
[24] YING J C,LEE W C,TSENG V S. Mining geographic-temporal-semantic patterns in trajectories for location prediction [J]. ACM transactions on intelligent systems and technology,2013,5(1): 1-33.
[25] NILASHI M,BIN LBRAHIM O,LTHNIN N,et al. A multi-criteria collaborative filtering recommender system for the tourism domain using Expectation Maximization(EM)and PCA-ANFIS [J]. Electronic commerce research and applications,2015,14(6): 126-140.