999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于情境聚類擴展用戶畫像的旅游景點推薦方法

2023-06-21 08:31:18王忠群
關鍵詞:關聯規則情境

班 航,王忠群

(安徽工程大學 經濟與管理學院,安徽 蕪湖 241000)

隨著消費者對旅游產品的要求越來越高,滿足其個性化需求旅游產品的精準推薦逐漸成為趨勢。基于數據分析的用戶畫像能夠充分反映用戶的特征和個性化需求,使得基于用戶畫像的個性化推薦方法在多個領域得到了廣泛應用。徐海玲等[1]以豆瓣電影網為例,構建了用戶畫像模型和資源畫像模型來實施資源聚合。李曉敏等[2]基于用戶自然屬性、社交屬性和興趣屬性構建讀者用戶畫像,將相似讀者推薦和相似圖書推薦的結果加權整合并進行圖書的個性化推薦。Lerouge等[3]為滿足老年慢性病患者的需求,構建老年慢性病患者畫像并研發面向老年慢性病患者的應用程序和健康信息推薦系統。劉海鷗等[4]通過提取游客用戶特征標簽來構建了游客的用戶畫像,結合協同過濾推薦算法實現了個性化景點推薦。

從以上文獻可看出,國內外學者對基于用戶畫像的推薦研究已經取得較多成果,但也存在一些問題,如大量用戶數據需求與用戶隱私間的矛盾[5]會導致用戶數據稀缺,從而使得用戶畫像刻畫不夠完整。而游客用戶公開的游記數據使得通過數據聚類能夠擴展群體用戶的畫像,在一定程度上緩解了數據稀缺的問題。為此,本文提出了一種基于用戶情境聚類擴展用戶畫像的旅游景點推薦方法。即運用用戶情境信息聚類擴展群體用戶畫像,并融合用戶畫像特征于關聯規則和相似度計算,從而實施個性化的精準推薦。

1 基于聚類擴展的用戶畫像模型

1.1 用戶畫像

用戶畫像的概念最早由Cooper[6]提出,其解釋為真實用戶的虛擬代表,是指建立在一系列真實數據之上的用戶模型。隨著大數據、云計算等技術的應用和發展,用戶畫像也衍生出了新的內涵,指根據用戶的基本信息、社會屬性、行為習慣等描述用戶屬性及特征的標簽集合[7]。用戶畫像的構建首先要收集用戶數據,再提取用戶特征并予以標簽化,最后基于標簽構建用戶畫像。

1.2 情境的K-means聚類

聚類具有無需訓練集、可改進和處理速度快等優勢,本文采用K-means聚類算法對游客的情境信息進行聚類分析。旅游情境對游客旅游決策有著不可忽視的影響,通過對用戶的情境信息進行聚類,獲取具有不同類別情境偏好的用戶群體[8]。游客用戶的主要情境要素有地點、天氣、季節、游伴、出游天數和旅游費用等,用六元組Cu表示,具體描述如下,

其中,位置集合由0和1這兩個元素組成,0表示用戶居住地和旅游地不是同一個城市,1表示同一個城市。天氣集合由晴天、陰天、下雨和下雪4 種天氣組成。季節集合由4 個季節組成,分別對應著春、夏、秋、冬。游伴集合由5種類別,分別是單獨一個人、夫妻或情侶、帶孩子、和朋友、家庭出游。出游天數集合由5個時間段組成,分別對應著0~1天、2~3天、4~5天、6~7天、7天以上。出游費用集合由5個區間組成,分別是1~100元、101~1 000元、1 001~3 000元、3 001~6 000元、6 000元以上。

1.3 擴展的用戶畫像模型

本文將游客的情境信息進行K-means聚類來提取游客的特征,再利用形式化的標簽表示方法來構建擴展的用戶畫像概念模型,如圖1所示。根據用戶的居住地和景點地提取長途旅行和短途旅行標簽來擴展用戶畫像。將用戶出行的季節情境進行聚類并挖掘游客的季節偏好。將用戶出游的天氣類型進行聚類提取天氣標簽。出游天數既可以反映用戶假期的長短,又反映著旅行費用的多少,故本文將用戶的出游天數進行聚類,構建用戶時間情境的畫像。和誰一起出游對景點選擇具有重要的影響,近年來許多景點相繼推出親子游、蜜月游等針對不同出游同伴的旅游產品,故本文對游客的游伴情境進行聚類,擴展用戶游伴畫像。旅行費用是影響用戶出游最重要的因素之一,出游前的預算會影響整個出游的計劃,旅途花費也會影響剩余行程的安排,故將旅游費用進行聚類來擴展用戶的消費特征畫像。

圖1 擴展的用戶畫像概念模型

圖2 三種算法的召回率

圖3 三種算法的準確率

圖4 三種算法的F值

2 基于用戶畫像的景點推薦方法

本文提出了一種基于擴展用戶畫像、融合關聯規則和用戶相似度的景點推薦方法。通過聚類擴展群體用戶畫像,根據群體用戶畫像反映的用戶特征,結合情境標簽設置個體用戶情境特征屬性,將其與用戶游玩的景點建立關聯規則進行數據挖掘,以游客情境特征作為前項、景點作為后項來挖掘強關聯規則,依據這些強關聯規則分析游客的情境與選擇的景點之間的相關性。其次,通過計算目標用戶情境與各強關聯規則情境之間的相似度,找出與目標用戶情境相似度較高的強關聯規則,依據相似度將所有強關聯規則進行降序排列。最后,將相似度較高的強關聯規則后項的景點向目標用戶進行推薦。

步驟1:關聯規則挖掘。Apriori算法是關聯規則挖掘的經典算法之一,本文采用Apriori算法進行關聯規則挖掘。基于游客用戶畫像中地點、天氣、季節、出行天數、游伴、費用等情境標簽,對所有游客的情境信息進行離散化和規范化處理來作為前項、景點作為后項,挖掘游客情境特征與景點之間的多維關聯規則,如地點∧天氣∧季節∧出行天數∧游伴∧費用?景點。

步驟2:相似度計算。通過計算目標用戶與強關聯規則在特征空間中的距離來得到兩者之間的情境相似度。首先,計算目標用戶與強關聯規則每個情境間的局部相似度;其次,計算目標用戶與強關聯規則每個情境之間的距離;然后,再根據各情境的權重計算出兩者的距離;最后,計算得到兩者之間的相似度,這里采用歐式距離計算相似度。

假設目標用戶的情境集合為T={X1,X2,X3,…,Xk},在情境k(k=1,2,3,…,t)下的情境取值為Xk=(xk1,xk2,xk3,…,xki);強關聯規則的情境集合為Z={Y1,Y2,Y3,…,Yk},在情境k(k=1,2,3,…,t)下的情境取值為Yk=(yk1,yk2,yk3,…,yki);由于每個情境之間的取值都相互獨立且不存在層次結構[9],所以各情境的局部相似度如公式(2)所示,如果目標用戶與強關聯規則在同一情境下的值相同,則該情境下的局部相似度為1,否則其局部相似度為0。

則目標用戶與強關聯規則在情境k之間的距離計算如公式(3)所示,

則目標用戶與強關聯規則之間的距離如公式(4)所示,其中wk是情境的權重,依據不同情境在所有強關聯規則中出現的頻率計算得出,wk∈(0,1)。

目標用戶與強關聯規則之間的相似度為

步驟3:產生推薦。通過計算目標用戶與所有強關聯規則之間情境的相似度,依據相似度將這些強關聯規則進行降序排列,形成與目標用戶的情境相似度較高的強關聯規則集合,根據相似度從高到低將強關聯規則后項的景點向目標用戶進行推薦,相同景點只選取相似度最高的關聯規則進行推薦,最后為用戶提供個性化的TOP-N景點推薦。

3 案例驗證

3.1 數據收集與預處理

本文利用八爪魚采集器抓取馬蜂窩網站上北京熱門景點為主題的游記,包括故宮、頤和園、圓明園等共計25個景點,1 500條游記信息。由于所采集的數據不包括季節和天氣信息,本文依據游記中用戶出發的時間戳獲得季節信息,并依據景點的位置信息爬取景點當天的天氣信息。抽取數據中有關用戶情境的地點、天氣、季節、出游同伴、出游天數和旅游費用等字段,刪除重復數據和無效數據,清理后有效數據共1 148條,實驗中將所有數據按照80%和20%的比例隨機分為訓練集和測試集。

3.2 基于情境信息的用戶畫像擴展

將預處理后的數據離散化到六元組進行K-means聚類,當k取值為5 時,輪廓系數在局部取得最大值,因此,通過聚類將用戶分為5類。通過對聚類發掘不同用戶群體在各種情境上具有不同的特點,分別對這5類用戶群體進行畫像,如表1所示。群體1居住在北京,情侶或夫妻旅游喜歡在夏季天氣不熱的陰天出游,出游時間較長,旅游費用較多。而群體2不居住在北京,家庭一起長途旅游,游玩時間長,游玩6至7天,旅游花費也較多。群體3居住在北京,單獨一個人旅游,喜歡在秋季天氣不熱的陰天出游,出游時間較短,僅只游玩一天,旅游費用較少。群體4居住在北京,喜歡在秋季和朋友一起出游,只游玩1天,花費在1 000元以內。群體5帶孩子出游,喜歡在夏季陰天出行,游玩2至3天,旅游費用較多,在1 000元至3 000元之間。

表1 群體用戶畫像

3.3 基于多維關聯規則的景點挖掘

根據群體用戶畫像反映的用戶特征和用戶畫像的情境標簽將個體游客的情境信息數據進行規范化和離散化。(1)依據位置情境標簽將居住地和景點分為相同(same)和不同(different)。(2)依據季節情境標簽分為春(spring)、夏(summer)、秋(autumn)、冬(winter)。(3)依據天氣情境標簽將天氣分為4類,晴天(sunny)、下雨(rainy)、陰天(cloudy)、下雪(snowy)。(4)依據用戶情境的出游同伴標簽將游伴分為單獨一個人(alone)、情侶(couple)、和朋友(with friend)、帶孩子(with children)、家庭(family)。(5)依據游玩天數標簽將用戶游玩天數進行離散化,其中,大于7天記為“VL”,6-7天記為“L”,4-5天記為“M”,2-3天記為“S”,游玩1 天的記為“VS”。(6)依據旅游費用標簽將用戶旅游費用離散化,其中,100 元以內的記為“X”,101-1 000元的記為“XL”,1 001-3 000元的記為“XLL”,3 001-6 000元的記為“XLLL”,6 000元以上的記為“VX”。(7)將景點進行劃分并以字母表示,如A故宮、B頤和園、C圓明園等。

根據對游記數據集的劃分和處理,設置最小置信度為20%,最小支持度為1%,挖掘前項為情境后項為景點關聯規則。例如:(1)family∧same∧autumn∧cloudy?M,在秋天多云的天氣,居住在北京的家庭一起出游多數會選擇游玩環球影城等游樂園類景點;(2)with children∧autumn∧XL?H,在秋天帶孩子出游且預算經費較少的用戶多數會選擇去海洋館、科技館等景點。

3.4 用戶游玩景點的推薦

將挖掘的強關聯規則進行整理,通過相似度計算,找到與目標用戶情境相似度較高的強關聯規則集合,將強關聯規則后項的景點向目標用戶進行推薦。例如目標用戶ID90032691,其情境信息為different∧autumn∧sunny∧with friend∧M∧XLL和游玩信息天安門廣場、故宮、景山公園、頤和園、南鑼鼓巷、恭王府,通過相似度計算得到的強關聯規則集合如表2所示。

表2 按相似度降序排列的景點集合

目標用戶實際游玩的景點有天安門廣場、故宮、景山公園、頤和園、南鑼古巷、恭王府,按目標用戶與強關聯規則相似度進行降序排列,最終推薦的景點為天安門廣場、北海公園、恭王府、慕田峪長城、故宮、景山公園。

3.5 實驗結果及分析

為了驗證本文推薦方法的推薦效果,設置最小置信度為20%,以最小支持度為變量,運用本文挖掘的數據集將本文推薦方法與文獻[10]中傳統的關聯規則Apriori 推薦算法和文獻[11]中加權關聯規則Apriori 推薦算法在召回率、準確率和綜合度量F值上進行測試比較。召回率、準確率和F值的數值越大,說明推薦效果越好,計算公式如下:

其中,T(u)表示用戶實際感興趣的所有景點,R(u)表示推薦算法為用戶推薦的所有景點。

測試對比結果如圖2-4所示,本文推薦方法的召回率,準確率和F值都高于其他兩種方法。通過關聯規則挖掘用戶情境特征與景點之間的關聯關系,利用情境相似度尋找與目標用戶具有相似情境的強關聯規則,在用戶情境相似度計算時,根據不同情境在所有強關聯規則中出現頻率的不同,對情境賦予權重,提高了情境相似度計算的準確性,依據情境相似度對強關聯規則進行排序,再利用關聯規則后項的景點為用戶進行推薦,提高了通過用戶多維度情境來推薦景點的質量,使得本文算法的推薦效果要優于加權關聯規則Apriori推薦算法和傳統的關聯規則Apriori推薦算法。綜上所述,本文提出的基于情境聚類擴展用戶畫像的旅游景點推薦方法具有較好的推薦效果,在一定程度上可以為用戶提供個性化的景點推薦,為用戶的旅游決策提供參考。

4 結束語

為了緩解用戶畫像建模所需求的大量數據與隱私保護的矛盾所造成的用戶畫像不完善及推薦效果不佳的問題,本文通過聚類用戶情境以擴展群體用戶畫像,并挖掘游客用戶的特征和情境偏好。根據群體用戶畫像反映的用戶特征,結合情境標簽設置個體用戶情境特征屬性,再與游客用戶游玩的景點進行關聯規則挖掘。結合相似度計算,找到與目標用戶情境相似度較高的強關聯規則集合,最后向目標用戶推薦關聯規則后項的景點,并通過實驗證明本文方法相較于傳統的關聯規則Apriori推薦算法和加權關聯規則Apriori推薦算法具有更好的推薦效果。

猜你喜歡
關聯規則情境
情境引領追問促深
不同情境中的水
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
護患情境會話
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 97人妻精品专区久久久久| 久久a级片| 看你懂的巨臀中文字幕一区二区| 免费无码AV片在线观看中文| 亚洲中文字幕久久精品无码一区| 国产成人三级| 18禁黄无遮挡免费动漫网站 | 亚洲日韩在线满18点击进入| 国产高潮流白浆视频| 久久精品国产亚洲麻豆| 亚洲成AV人手机在线观看网站| 情侣午夜国产在线一区无码| 永久在线精品免费视频观看| 国产国产人成免费视频77777 | 欧美伦理一区| 专干老肥熟女视频网站| 91黄视频在线观看| 波多野结衣无码AV在线| 亚洲第一色网站| 中国国产高清免费AV片| 精品久久久久久久久久久| 久久久久国色AV免费观看性色| 全部毛片免费看| 免费在线看黄网址| 亚洲精品男人天堂| 午夜人性色福利无码视频在线观看| 亚洲福利片无码最新在线播放| 欧洲一区二区三区无码| 波多野结衣在线se| 2021国产精品自产拍在线| 日韩欧美国产成人| 免费一级成人毛片| 波多野结衣中文字幕一区二区| 国产精品大白天新婚身材| 中国一级毛片免费观看| 国产精品视频公开费视频| 亚洲欧洲免费视频| 无码专区第一页| 欧美日韩国产成人高清视频 | 久草青青在线视频| 日韩精品一区二区深田咏美| 欧美日韩国产在线播放| 亚洲国产欧洲精品路线久久| 亚洲精品片911| 国产SUV精品一区二区6| 日韩黄色大片免费看| 午夜视频www| 国产乱肥老妇精品视频| 精品一区二区三区自慰喷水| 色老二精品视频在线观看| 日本道中文字幕久久一区| 久久久久免费看成人影片| 91口爆吞精国产对白第三集| 国产乱子伦精品视频| 国产成人精品无码一区二| 久久久久国色AV免费观看性色| 国产成人91精品免费网址在线| 欧美一级高清片欧美国产欧美| 久久永久视频| 精品国产Av电影无码久久久| 国产精品3p视频| 97国产在线观看| 久久久久无码精品| 欧洲极品无码一区二区三区| 婷婷六月综合网| 国产精品自在线天天看片| 国产自视频| 91偷拍一区| AV不卡在线永久免费观看| 久久国产香蕉| 激情六月丁香婷婷| 韩日免费小视频| 国产精品入口麻豆| 国产福利小视频高清在线观看| 日本人真淫视频一区二区三区| 久久中文字幕av不卡一区二区| 91久久精品国产| 在线观看91香蕉国产免费| 国产一级毛片网站| 国产欧美日韩视频怡春院| 伊人久久大香线蕉成人综合网| 欧美日韩国产系列在线观看|