陳浩銓,胡瑞玉,王 石
(泰州學(xué)院,江蘇 泰州 225300)
通常,用戶根據(jù)自己的愛好和喜愛程度來選擇旅游地點(diǎn)、制定旅游路線和時(shí)間規(guī)劃。去陌生城市旅游,通常會花費(fèi)大量時(shí)間來規(guī)劃路線、制定旅游方案。相比熟悉的城市,面對陌生城市用戶不知道和自己愛好相匹配的地點(diǎn)、如何規(guī)劃最佳的旅游路線、如何才能在最短的時(shí)間內(nèi)游玩更多景點(diǎn)。國內(nèi),越來越多的人在知乎等社交網(wǎng)站上上傳自己的旅游照片、分享自己的旅游經(jīng)歷,通過分析用戶旅游照片,可以提取出用戶的愛好(比如冒險(xiǎn)刺激、安靜平和、古典園林)和用戶的愛好程度。文章研究的目的在于:(1)根據(jù)大數(shù)據(jù)分析出用戶的愛好和愛好程度。(2)基于愛好程度和景熱度的個(gè)性化旅游推薦算法,根據(jù)用戶的旅游時(shí)間和愛好程度不同來規(guī)劃出最佳、最節(jié)省時(shí)間的方案,定向地為用戶設(shè)計(jì)個(gè)性路線,規(guī)劃出旅游路線的推薦方案。(3)基于知乎等大數(shù)據(jù),結(jié)合文章提出的算法,和傳統(tǒng)的旅游路線推薦算法相比較,該個(gè)性化旅游路線推薦算法的適用性和精確性更高。
要先知道用戶的興趣愛好和愛好程度,才能更合理地去給用戶設(shè)計(jì)更舒適的旅游路線。傳統(tǒng)的旅游推薦算法只會根據(jù)用戶的時(shí)事行為分析推薦旅游路線,而個(gè)性化推薦算法具有更高的準(zhǔn)確性和適用性;傳統(tǒng)的推薦算法會根據(jù)用戶的興趣愛好推薦出喜歡的旅游方案,局限于用戶的旅游時(shí)間和時(shí)間成本。在社交網(wǎng)站上顯示時(shí)間成本大多被浪費(fèi),而個(gè)性化推薦算法在基于用戶的興趣愛好和愛好程度的同時(shí),為用戶推薦出最節(jié)省時(shí)間、效率最高的個(gè)性化旅游路線。
旅游推薦算法中的個(gè)性化推薦并沒有得到足夠的重視。大多數(shù)旅游推薦算法是基于用戶發(fā)的社交網(wǎng)站的標(biāo)題和照片來定義用戶的興趣愛好和愛好程度,缺少用戶旅游所面臨的情景問題,可能用戶旅游只能花費(fèi)3天時(shí)間,但用戶想游玩更多的場景,節(jié)省更多時(shí)間,個(gè)性化推薦算法便是基于用戶情景以及愛好程度來為用戶推薦個(gè)性化的旅游方案。
本體(Ontology)是指在該領(lǐng)域概念下的結(jié)構(gòu)化規(guī)范,定義了領(lǐng)域內(nèi)相關(guān)概念之間的關(guān)系。本體通過對屬性、內(nèi)涵以及本體與本體之間所具有的交叉聯(lián)系,組織成一個(gè)基本的本體體系。
文章主要以各大旅游景點(diǎn)為本體域,以領(lǐng)域本體庫的構(gòu)建為基礎(chǔ),來對旅游景點(diǎn)本體進(jìn)行更深層次的研究。簡單來說,主要研究該本體的多種屬性及其內(nèi)涵,分析不同本體的相同特征,從而推薦出最佳的旅游地點(diǎn)及最佳路線。
領(lǐng)域本體(Domain Ontology)是本體的專業(yè)化,描述的是在特定領(lǐng)域中個(gè)體和個(gè)體之間存在的關(guān)系,提供了某個(gè)專業(yè)學(xué)科領(lǐng)域中概念的詞表以及概念間的關(guān)系,或在該領(lǐng)域里占主導(dǎo)地位的理論。
文章全面考慮旅游本體域間各種屬性的關(guān)系及層次梯度,將所研究的領(lǐng)域本體形式化地表示為Doma={P,Up,R,Ur,L},其中,P代表本體屬性,Up代表用戶偏好與本體屬性之間的相似度,R代表旅游路徑選擇,Ur代表用戶所偏好的旅游的路徑,L代表旅游景點(diǎn)。
可以簡單地將用戶模型建立為一個(gè)類似于結(jié)構(gòu)體的變量:Useraccounts={UserID,University,Name,Sex,UserPreference,Travel experience}。
Useraccounts中的UserPreference指的是用戶愛好;UserPreference={(L0,D0(S),……,Ln,Dn(S)},其中,Li(i=0)代表用戶未曾到過的景點(diǎn),即表示為渴望去的景點(diǎn);Li(1≤i≤n)代表用戶已經(jīng)去過的景點(diǎn)并且對其進(jìn)行的評價(jià)。愛好程度的取值范圍為[-1,1],其中,負(fù)數(shù)表示對景點(diǎn)不感興趣,正數(shù)表示對景點(diǎn)呈正偏好。
用戶在不同階段的偏好會有所改變,也就是說,上述模型是隨時(shí)間而發(fā)生變化的,所以,該模型會不斷更新。
情境的引入使得情境用戶、資源概念節(jié)點(diǎn)類型和節(jié)點(diǎn)關(guān)系更加復(fù)雜多樣,導(dǎo)致Up的結(jié)構(gòu)更加復(fù)雜。目前研究主要關(guān)注概念節(jié)點(diǎn)和節(jié)點(diǎn)關(guān)聯(lián)的識別和描述,但Up的結(jié)構(gòu)日益復(fù)雜會對計(jì)算成本、效率和穩(wěn)定性都會帶來消極影響,因此,要考慮在推薦準(zhǔn)確性、推薦效率魯棒性等方面取得必要的平衡[1]。通過袁靜等[2]、曹天天等[3]學(xué)者對情景的不同分類方式分析,將情景模型分為3個(gè)情景維度,表示為UserSD={StageSD;EmotionSD;SocialSD}。
(1)階段情景(Stage Situational Dimension,StageSD),階段變化與推薦系統(tǒng)的交互可以根據(jù)用戶在各階段的偏好進(jìn)行自適應(yīng),以推薦旅游景點(diǎn)為例:StageSD={Grade 1,Grade 2,Grade 3,Grade 4}。
(2)情緒情景(Emotinonal Situational Dimension,EmotionSD),用戶情緒變化時(shí)與推薦系統(tǒng)進(jìn)行交互的相關(guān)信息,以推薦旅游景點(diǎn)為例:Emoti-onSD={sadness,happiness,peace}。
(3)社會情景(Social Situational Dimension,SocialSD),社會給出的不同反響與推薦系統(tǒng)發(fā)生交互的相關(guān)信息;以推薦旅游景點(diǎn)為例:SocialS-D={assess,advertisement,price}。
偏好度的關(guān)聯(lián)推薦算法指的是基于用戶偏好度與情景維度之間的關(guān)系,可以滿足用戶個(gè)性化旅游需求。文章綜合屬性聯(lián)系與層次聯(lián)系計(jì)算相似度[4]。
若兩個(gè)景點(diǎn)x和y屬于同一個(gè)屬性相似域內(nèi)的實(shí)體,則稱x和y存在屬性相似度關(guān)聯(lián)(Attribute Similarity Association,ASA)。在以旅游景點(diǎn)為實(shí)例的本體域中,不同景點(diǎn)具有相同的屬性,即為屬性相似度關(guān)聯(lián)。
一個(gè)實(shí)例可能具有多個(gè)屬性,導(dǎo)致實(shí)例間的相似度大小存在差異,假設(shè)x實(shí)例包含屬性{α,b,c},y實(shí)例包含屬性{α,c,d,e},則x與y的屬性相似度為1。假設(shè)Similarity(x)和Similarity(y)表示實(shí)例x和y的相似度,通過分析可得出x和y之間的相似度關(guān)聯(lián)表示為:

其中,LCA表示的是實(shí)例x, y的最近共同屬性,depth(x)和depth(y)表示實(shí)例x和y的深度。
若兩個(gè)景點(diǎn)x和y屬于同一個(gè)屬性相似域內(nèi)的實(shí)體,則稱x和y存在屬性相似度關(guān)聯(lián)。在以旅游景點(diǎn)為實(shí)例的本體域中,不同景點(diǎn)具有相同的屬性,即為屬性相似度關(guān)聯(lián)。
在傳統(tǒng)的旅游路線推薦算法的基礎(chǔ)上,文章提出了融合用戶愛好程度和景點(diǎn)熱度的個(gè)性化旅游推薦算法,基于用戶需求及物理基礎(chǔ)情境下向用戶推薦最適合最精確的旅游路線推薦方案。不僅考慮用戶的愛好程度,也考慮用戶旅游的最佳路線,極大地提高了用戶旅游的體驗(yàn)感和旅游效率。結(jié)果表明,融合考慮景點(diǎn)熱度以及用戶愛好,可以更好地滿足用戶需求。