999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于人性化用戶特征的在線酒店推薦技術研究

2019-04-01 13:11:54王婧虹李銀勝
計算機應用與軟件 2019年2期
關鍵詞:特征用戶信息

王婧虹 李銀勝

(復旦大學軟件學院 上海 201203)

0 引 言

我國的酒店市場空間巨大,尤其是隨著經濟水平和生活質量的不斷提升,人們出行頻率大幅提高,對酒店服務的需求擴大,酒店種類變得豐富且數量激增。因此,為用戶提供精準有效的酒店推薦服務尤為重要。

目前國內外均提出并實施了很多推薦系統,以方便用戶挑選酒店。但已有的推薦系統大多存在數據稀疏、冷啟動以及對用戶行為缺乏理解的缺點,沒有挖掘用戶人性化數據,確定其興趣所在,推薦其真正感興趣的酒店資源。以下結合用戶場景介紹目前酒店推薦存在的問題。

總所周知,李彥宏、馬云、馬化騰分別為BAT創始人,均為中國著名男性企業家,如表1所示,因此對酒店的硬性需求基本一致。

表1 共同特征

若三位到達上海,需入住酒店時,按傳統推薦方法,均會推薦上海萬豪虹橋大酒店,因其離虹橋機場近、地理位置優越、商務風格、環境安靜、設施齊全,較好滿足三位基本要求。酒店特征描述如表2所示。

表2 酒店特征

針對李彥宏,專注保守(性格),崇尚極簡主義(觀念),為其推薦經典的商務酒店即可,上海萬豪虹橋大酒店乃不二之選;但針對馬云,不像其他二位本身家庭條件優渥(環境)且擁有IT技術背景(知識),他創業歷程艱辛坎坷(經歷),且相對年齡較大(生理),年輕時不懈拼搏如今事業有成的他相當注重養生,喜愛太極(觀念)。因此在滿足基本需求的前提下,結合人性化特征,給馬云推薦環境靜謐,擁有可散步健身的大塊草坪的上海西郊賓館更為合適,符合其養生之道;針對馬化騰,典型的廣東潮汕人(環境),鐘愛廣式美食(觀念),對于率性的他(性格),身處外地能很方便地品嘗到家鄉味道,定是人生幸事。因此在滿足基本需求的前提下,結合人性化特征,給馬化騰推薦周邊就有“潮汕食府”的上海虹橋新華聯索菲特大酒店更為合適,符合其飲食文化。上述三位人性化特征如表3所示。傳統推薦與人性化推薦結果對比情況如表4所示。

表3 人性化特征

續表3

表4 推薦對比

由此可見,客戶選擇酒店,其實是選擇一個短期的生活圈[10],僅僅滿足其對硬件設施的需求是遠遠不夠的[13],更需從多方面考慮其人性化特性,讓客戶體會到被推薦的酒店處處都在為其著想,賓至如歸[12]。

因此,本文提出了一種基于人性化用戶特征的在線酒店推薦方法。剖析、獲取用戶人性化特征形成酒店用戶模型,結合特征匹配與協同過濾方法為用戶推薦其感興趣的酒店。并于課題項目“酒店管理營運博弈沙盤”進行實驗,得出準確率、召回率、運行效率等綜合表現最佳的推薦方式,且在一定程度上解決冷啟動和數據稀疏的問題。

1 相關工作

目前大部分酒店推薦系統基于用戶瀏覽和購買歷史進行興趣度分析,著力于采集電子商務網站中的大量注冊、交易、評價等用戶數據,和Web服務器中的日志數據、用戶購物信息,但用戶的人性化特性鮮為關注。

文獻[1]采集用戶已訪問的酒店資源集合以及在線提交的資源要求等信息。根據用戶于酒店網站上的在線行為,抽象出瀏覽用戶特征并構建信息庫,形成用戶模塊。分析用戶興趣特征和產品特征的相似性,利用聚類方法,挖掘出與用戶興趣相關的酒店產品。量化用戶興趣特征和產品特征,匹配算法簡單明了,但產品特征需一一列舉,且不易量化的特性均被忽略。文獻[2-3]采集用戶酒店評論信息,得到用戶偏好和酒店評價數據。根據用戶輸入對酒店的要求(如城市,出游類型等信息,及對房間、食物、位置、服務、設備等的偏好),來構建用戶模型。文獻[2]認為群體用戶的整體評價往往會忽略推薦用戶某方面的特定需求。因此先為評論提取偏好,根據有相同或相似偏好的用戶評價來形成推薦列表。協同過濾的思想,存在冷啟動、數據稀疏問題。文獻[3]提出線下評估方法,線下提取酒店用戶評論并進行處理得到項目特征矩陣,結合協同過濾,加快推薦速度,一定程度上優化冷啟動問題但無法徹底解決,且需要不斷更新離線資源。文獻[4]采集用戶內部數據(如國籍、性別、年齡等)和外部數據(如設備、社交媒體、時間、環境等)。通過對用戶內外部信息數據進行語義特征提取等處理,并進行情感分析、行為分析、偏好分析,來構建用戶模型。文獻[5]采集用戶基本信息和網站操作信息數據,根據用戶基本信息(性別、年齡、職業等)、用戶偏好信息及用戶操作行為(學習記錄、收藏夾等)來構建模型。文獻[6]采集用戶瀏覽網站時的眼動追蹤數據和鼠標追蹤數據,來得到用戶偏好,再做基于內容的推薦。

綜上,目前已有的推薦系統大多存在數據稀疏、冷啟動以及對用戶行為缺乏理解的問題。幾乎沒有挖掘用戶人性化數據,確定其興趣所在,推薦其真正感興趣的酒店資源。因此,本文結合用戶人性化特征,更準確、高效地為用戶推薦酒店。

2 預備知識

2.1 用戶建模與推薦技術

國內外相關研究機構與學者在用戶建模以及推薦技術領域取得了大量的研究成果:目前廣泛采用用戶行為分析觀察法來獲取用戶喜好信息,通過獲取到的用戶喜好信息建立用戶模型[8]。一般通過基于知識的推薦技術來直接啟發用戶主動提供偏好和需求,進而通過用戶偏好結構以及關聯規則和樣例以及評論屬性來建立用戶輪廓模型[9];基于內容的推薦技術主要從用戶表示喜愛或者正面反饋的內容來獲取用戶偏好,進而通過基于關鍵詞的向量空間模型、基于內容的標簽網絡以及潛在的主題模型等技術來構建用戶輪廓模型;基于協同過濾的推薦技術通過獲取到的用戶偏好模型,運用余弦相似度、皮爾遜相似度等方法找到其相似用戶[11],再為其推薦相似用戶喜愛的產品,以取得較高的推薦成效。然而這些方法所采取的用戶數據相對較為單一,往往只是用戶某個維度的體現,從而導致在推薦上的人性化效果不足。

2.2 人性化用戶模型

人性化用戶模型由作者所在課題組李銀勝[22]、沈劍平[19]等人提出,亦稱數字靈魂模型Cyber-Anima。Cyber-Anima模型旨在反映個體的內生特征概念,這些內生特征會對個體行為產生重大影響。該模型對用戶人性化特征進行數字處理,為探索用戶欲望和推理用戶意圖提供了全新的視角。個體內生特征可從用戶輸入、互聯網資源、應用系統、便攜式設備等處獲取的信息進行關聯、相互轉換,不斷更新、完善。因此,Cyber-Anima對于身處網絡世界的個體來說是與生俱來的,在使用過程中無需再收集各種用戶相關數據。所以,若結合人性化用戶模型,可解決傳統協同過濾方法的冷啟動和數據稀疏問題[22]。

表5 六大維度內容

人性化模型采用基于本體的表示法,將六個維度中的屬性作為本體的概念對和關系,從而結構化、語義化地描述用戶[14]。在構建過程中,通過確定本體的頂層概念,即用戶模型的六個維度,然后按照六個維度的具體定義,將其子維度表示成相應的子概念。用戶模型維度可以表示為D∷=C×R,其中C表示概念集,R表示關系集。其中關系是概念之間的聯系,本文在構建人性化個體模型本體時主要運用的幾種關系類型[14]如表6所示。

表6 概念間關系類型

2.3 語義特征提取

構建用戶模型時涉及到語義特征提取技術,用戶信息中往往包含大量文本信息。文本的特征項的選取即為從文本中抽取具有代表性的詞來表示文本信息的特征[19]。文本信息通常使用向量空間模型(VSM)來表示,每個文檔表示為一個特征向量V=(t1w1,t2w2,…,tnwn),其中ti為詞條項,wi為權值。

如果某個詞或短語在一個文本中出現的頻率TF(term-frequency)高,在其他文本中出現的頻率低,則認為該詞或短語具有良好的區別能力[21]。IDF(Inverse Document Frequency)指逆向文件頻率,如果包含詞條t的文檔越少,IDF越大,則說明詞條t具有很好的類別區分能力。

結合TF與IDF,TF-IDF計算方法如下所示:

(1)

式中:tfi為詞i在訓練集中的詞頻,N為訓練集文本數,ni未出現詞i的文本數目。

3 基于人性化用戶特征的酒店推薦

3.1 整體架構

本文依托于所在實驗室提出的私有云瀏覽器“彩云閣”,在這里每個個體都擁有自己的Cyber-Anima模型[22],本文將其應用到酒店推薦領域,提取出與酒店選擇相關的用戶特征,形成人性化酒店用戶模型。綜合用戶特征與酒店特征匹配結果和協同過濾方法所得結果,可得酒店推薦候選集。如圖1所示。

圖1 整體架構

3.2 酒店模型

針對酒店可量化的參數,如星級、房型、房價、設施、設備、服務等,進行歸一化處理,可得酒店特征參數表,如表7所示。

表7 酒店特征參數

酒店特征矩陣如下所示:

H(f)=(H11,H12,…,H1j,H21,…,H2j,…,Hij)

(2)

式中:Hij表示第i家酒店的第j個特征。兩個酒店間相關性可通過余弦相似度得到,如下所示:

(3)

3.3 用戶模型

與酒店特征一一對應,結合用戶基本信息、輸入信息及人性化信息可得用戶偏好矩陣U(f),如下所示:

U(f)=(U1,U2,…,Uj)

(4)

式中:Uj表示用戶u對第j個 特征的偏好。

為了更好地發掘用戶之間的潛在聯系,更進一步解決數據稀疏性問題,本文采用用戶-用戶矩陣對用戶進行建模,并通過余弦相似度計算它們之間的相似度,如下式所示:

(5)

緊接著,用戶u就可以通過n個相似的用戶(u1,u2,…,un)和他們間的相似度(sim_u1,sim_u2,…,sim_un)表示。

3.4 推薦算法

將會影響酒店選擇人性化特征引入到用戶建模過程中,得到人性化酒店用戶模型,再通過協同過濾的思想進行推薦。因此,稱其為基于人性化特征的協同過濾(Collaborative Filtering Based on Humanized Features),簡稱HF-CF。

在為酒店和用戶分別建模后,可計算用戶u對酒店i的期望評分pr(u,i),如下式所示:

pr(u,i)=r(v,j)×sim_u(u,v)×sim_h(i,j)

(6)

式中:r(v,j)表示用戶v對酒店j的評分,sim_u(u,v)為用戶u和用戶v之間的相似度,sim_h(i,j)為酒店i和酒店j之間的相似度。

最后,根據期望評分可篩選出Top-N家酒店作為推薦候選集。

4 實 驗

4.1 評價指標

本文采用針對推薦方法常用的準確率、召回率和F1-Score三個指標來分析推薦效果[20]。其中,準確率是指被推薦的列表中用戶真正感興趣的項目所占比例,反映了準確推薦的能力;召回率是指用戶感興趣的列表中被推薦項目的所占比例,反映了全面推薦的能力;F1-Score綜合準確率和召回率,反映推薦服務的綜合評價。推薦結果的列聯表如表8所示。

表8 列聯表

因此,評價指標準確率、召回率、F1-Score可通過以下公式計算:

(7)

(8)

(9)

以上三大指標的值范圍均0-1,值越大表示推薦效果越好。但準確率和召回率相互影響,一般來說,若要達到高準確率,必須舍棄一些召回率,反之亦然。因此,準確率和召回率需要平衡,即讓F1_Score值達到最佳。

4.2 實驗平臺及數據

本文以“酒店管理營運博弈沙盤”為實驗平臺,該沙盤是由所在實驗室研發并已被數十家酒店管理院校使用的電子學習軟件,旨在幫助學生更形象生動、直觀快速地了解并掌握酒店管理營運知識。根據用戶需求與偏好分配酒店是該軟件核心功能之一,因此,一個準確高效的建模和推薦方法非常重要。

沙盤中酒店數據和用戶數據,初期從各大酒店預訂網站歷史訂單、評價中抓取、處理、分析后所得。在投入使用后,不斷地產生新的訂單數據,且各院校師生會注入當地酒店數據與自身信息及偏好數據。整個數據庫可供所有用戶共享,真實性、有效性較高,并不斷更新、維護。

本文獲取沙盤數據庫中1 382條用戶數據、967條酒店數據和15 377條訂單數據進行實驗。

4.3 基線算法

個性化推薦系統的推薦算法主要有基于內容的推薦、基于協同過濾的推薦、基于知識的推薦、基于效用的推薦和混合推薦等[18]。在酒店推薦領域,由于酒店各項指標十分明確,有不少直接使用特征參數匹配的方法。本文采用特征參數匹配方法與基于協同過濾的推薦方法作為基線算法。

特征參數匹配方法FM(Features Matching):將服務項特征與用戶偏好進行一一匹配,往往可以達到較高的準確率。但前期服務項數據與用戶偏好信息的獲取相當復雜,且數據量達到一定范圍時,計算效率急劇下降,擴展性較差。

基于協同過濾的推薦方法CF(Collaborative Filtering):主要是通過對未評分項進行評分預測來實現,又可分為基于用戶的協同過濾與基于項目的協同過濾[15]。它只依賴用戶行為,不需要對內容進行深入了解,適用范圍廣,可以用來推薦復雜項目,能起到意想不到的推薦結果[16]。但前期需要大量的用戶行為數據,即冷啟動問題[17];且用戶量與項目量常常較為龐大,兩者間存在用戶行為關系的較為有限,即數據稀疏問題。本文運用人性化用戶模型,可較好地解決這兩個問題。

4.4 實驗結果與分析

通過相關數據采集、處理,酒店建模,用戶建模,基于協同過濾計算,可得出推薦結果。其中,用戶模型中用n個相似用戶及相似度表示用戶u。當用戶模型參數n取不同值時,推薦效果如表9所示。

表9 用戶模型參數n不同時推薦效果

當n小于或等于6時,隨著數值增大,各項指標都逐漸升高;n大于6后,各項指標上升空間極為有限。結合推薦效率,取n為6時的推薦效果與基線算法對比。根據三大指標統計結果如表10所示。

表10 實驗結果比較

可以看出,本文提出的方法整體推薦效果良好,召回率和F1-Score值均比兩種基線算法的高。盡管準確率相比特征參數匹配方法較低一點,但可擴展性和推薦效率更為客觀。

5 結 語

本文分析了現有酒店推薦系統的現狀,其主要缺點在于只對用戶表象信息進行提取,缺乏全方面深入挖掘用戶的人性化特征,如知識、性格、觀念等。因此,本文提出一種基于人性化特征的酒店推薦方法,更加精準地分析用戶的真實意圖,提高個性化推薦的效果。以基于協同過濾的推薦算法作為基線算法,結合用戶人性化特征,計算出推薦結果,并通過實驗驗證了該方法的可行性和有效性。

接下來仍有諸多工作需要繼續,更多與酒店相關的業務知識和市場情況有待深入學習并分析,讓研究更符合現實;更多人性化特征需要不斷探索發掘,來完善人性化用戶模型,讓推理和推薦邏輯更嚴謹;此外,可引入更先進的推薦算法,提高準確率和推薦效率。

猜你喜歡
特征用戶信息
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 波多野吉衣一区二区三区av| 亚洲综合精品第一页| 啦啦啦网站在线观看a毛片| 亚洲欧美在线综合图区| 国产手机在线ΑⅤ片无码观看| 中文精品久久久久国产网址| 97综合久久| 欧美日韩中文国产| 国产成年女人特黄特色毛片免| 91亚洲视频下载| 在线无码av一区二区三区| 亚洲欧美另类中文字幕| 亚洲成年人片| 国产自在线播放| av一区二区三区在线观看| 在线无码av一区二区三区| 久久久久亚洲AV成人人电影软件| 一本二本三本不卡无码| 欧美日韩成人在线观看| 免费人成视网站在线不卡| 一本色道久久88亚洲综合| 欧美一级高清视频在线播放| 亚洲天堂网在线播放| 99久久精品国产麻豆婷婷| 亚洲综合色吧| 色悠久久综合| 亚洲 欧美 日韩综合一区| 国产污视频在线观看| 亚洲av无码成人专区| 国产视频a| 精品午夜国产福利观看| AV色爱天堂网| 国产福利在线免费观看| 丁香亚洲综合五月天婷婷| 欧美在线黄| 成人va亚洲va欧美天堂| 欧美精品亚洲精品日韩专区va| 国产毛片高清一级国语| 亚洲成人播放| 免费在线成人网| 日本妇乱子伦视频| 毛片在线播放a| 欧美特级AAAAAA视频免费观看| 黑色丝袜高跟国产在线91| 91精品视频网站| 亚洲国产精品一区二区第一页免| 亚洲成人动漫在线| 国产精品自在拍首页视频8| 国产清纯在线一区二区WWW| 天天综合网在线| 九色在线观看视频| 亚洲精品午夜天堂网页| 中文字幕亚洲第一| 91小视频在线| 18禁高潮出水呻吟娇喘蜜芽| 日韩成人高清无码| 欧美日韩成人在线观看| 另类专区亚洲| 美女无遮挡拍拍拍免费视频| 毛片免费高清免费| 91久久偷偷做嫩草影院免费看| 欧美三级视频网站| 国产亚洲欧美日韩在线一区| 亚洲侵犯无码网址在线观看| 国产性生大片免费观看性欧美| 五月婷婷综合色| 免费一级无码在线网站| 国产成人综合亚洲网址| 狼友视频一区二区三区| 亚洲国产中文欧美在线人成大黄瓜| 亚欧成人无码AV在线播放| 91久久青青草原精品国产| 亚洲一级无毛片无码在线免费视频 | 成人日韩欧美| 亚洲第一网站男人都懂| 免费日韩在线视频| 久久久久久国产精品mv| 狠狠干欧美| 亚洲成A人V欧美综合天堂| 亚洲人成在线免费观看| 国产小视频a在线观看| 伊人网址在线|