999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶網(wǎng)絡(luò)嵌入的民宿房源推薦方法

2019-12-23 07:19:04劉彤曾誠(chéng)何鵬
計(jì)算機(jī)應(yīng)用 2019年11期

劉彤 曾誠(chéng) 何鵬

摘 要:隨著民宿行業(yè)的迅速發(fā)展,在線民宿訂房系統(tǒng)開(kāi)始流行起來(lái)。讓用戶在海量房源信息中快速找到所需房源是訂房系統(tǒng)中待解決的問(wèn)題。針對(duì)房源推薦中用戶冷啟動(dòng)與數(shù)據(jù)稀疏性的問(wèn)題,提出基于網(wǎng)絡(luò)嵌入法的房源個(gè)性化推薦(UNER)方法。首先通過(guò)用戶在系統(tǒng)中的歷史行為數(shù)據(jù)及標(biāo)簽信息構(gòu)建兩類用戶網(wǎng)絡(luò);然后基于網(wǎng)絡(luò)嵌入法將網(wǎng)絡(luò)映射至低維向量空間中,得到用戶節(jié)點(diǎn)的向量表示并通過(guò)用戶向量計(jì)算用戶相似度矩陣;最后依據(jù)該矩陣為用戶進(jìn)行房源推薦。實(shí)驗(yàn)數(shù)據(jù)來(lái)源于貴州“水東鄉(xiāng)舍”民宿訂房系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,相對(duì)于基于用戶的協(xié)同過(guò)濾算法,所提方法的綜合評(píng)價(jià)指標(biāo)(F1)提升了20個(gè)百分點(diǎn),平均正確率(MAP)提升11個(gè)百分點(diǎn),體現(xiàn)出該方法的優(yōu)越性。

關(guān)鍵詞:網(wǎng)絡(luò)嵌入;房源推薦;協(xié)同過(guò)濾;用戶行為

中圖分類號(hào):TP311.51

文獻(xiàn)標(biāo)志碼:A

Housing recommendation method based on user network embedding

LIU Tong1, ZENG Cheng1,2*, HE Peng1,2

1.School of Computer Science and Information Engineering, Hubei University, Wuhan Hubei 430062, China)

2.Hubei Engineering Research Center for Education Informationization, Wuhan Hubei 430062, China

Abstract:

With the rapid development of the hotel industry, the online hotel reservation system has become popular. How to let users quickly find the housing they need from massive housing information is the problem to be solved in the reservation system. Aiming at the cold start and data sparseness of users in the housing recommendation, the User Network Embedding Recommendation (UNER) method based on the network embedding method was proposed. Firstly, two kinds of user networks were constructed by the users historical behavior data and tag information in the system. Then, the network was mapped into the lowdimensional vector space based on the network embedding method, and the vector representation of the user node was obtained and the user similarity matrix was calculated by the user vector. Finally, according to the matrix, the housing recommendation was performed for the user. The experimental data come from the hotel reservation system of “Shuidongxiangshe” in Guizhou. The experimental results show that compared with the userbased collaborative filtering algorithm, the proposed method has the comprehensive evaluation index (F1) increased by 20 percentage points and the Mean Average Precision (MAP) increased by 11 percentage points, reflecting the superiority of the method.

Key words:

network embedding; housing recommendation; collaborative filtering; user behavior

0?引言

隨著互聯(lián)網(wǎng)越發(fā)普及和成熟,在線訂房系統(tǒng)受到很多人的青睞,為用戶提供個(gè)性化推薦策略也是訂房系統(tǒng)中必不可少的一部分,它可以幫助用戶在海量房源中找到所需房源。推薦系統(tǒng)主要是挖掘用戶潛在需求,幫助用戶進(jìn)行決策[1],推薦效果的好壞直接影響著用戶體驗(yàn)和公司收益。[2]。在民宿房源推薦問(wèn)題中,協(xié)同過(guò)濾推薦方法[3-5]無(wú)法解決用戶冷啟動(dòng)問(wèn)題[6]及數(shù)據(jù)稀疏性問(wèn)題。

針對(duì)上述問(wèn)題,本文通過(guò)用戶在注冊(cè)時(shí)選擇的標(biāo)簽數(shù)據(jù)與用戶行為數(shù)據(jù)構(gòu)建兩類用戶用戶網(wǎng)絡(luò),并使用網(wǎng)絡(luò)嵌入(network embedding)法分別得到兩種網(wǎng)絡(luò)中用戶節(jié)點(diǎn)的向量表示。使用用戶標(biāo)簽數(shù)據(jù)構(gòu)建的網(wǎng)絡(luò)來(lái)解決系統(tǒng)中用戶冷啟動(dòng)問(wèn)題;同時(shí)在構(gòu)建網(wǎng)絡(luò)時(shí)充分考慮網(wǎng)絡(luò)中節(jié)點(diǎn)的一階和二階關(guān)系用來(lái)解決數(shù)據(jù)稀疏問(wèn)題。

1?相關(guān)工作

網(wǎng)絡(luò)結(jié)構(gòu)在現(xiàn)實(shí)生活中處處可見(jiàn), 比如道路將城市之間連接成交通網(wǎng)絡(luò),論文中引用關(guān)系將論文之間構(gòu)成學(xué)術(shù)論文網(wǎng)絡(luò)。對(duì)各種數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行分析時(shí)首先要對(duì)網(wǎng)絡(luò)進(jìn)行表示,常用的方法是用鄰接矩陣表示網(wǎng)絡(luò),最終將節(jié)點(diǎn)用高維稀疏向量表示, 這種方法計(jì)算時(shí)間長(zhǎng)并且消耗大量空間。文獻(xiàn)[7]中將由網(wǎng)絡(luò)表示的鄰接矩陣作為奇異值分解(Singular Value Decomposition, SVD)算法的輸入?yún)?shù),將節(jié)點(diǎn)用低維表示,但是這種表示在數(shù)據(jù)挖掘中性能不理想。文獻(xiàn)[8]中提出的算法將網(wǎng)絡(luò)中的信息擴(kuò)散問(wèn)題轉(zhuǎn)換為低維空間上的信息擴(kuò)散問(wèn)題,并使用低維向量表示節(jié)點(diǎn)信息,但是算法的復(fù)雜度可以達(dá)到立方量級(jí),所以不適合大規(guī)模網(wǎng)絡(luò)分析任務(wù)。

網(wǎng)絡(luò)嵌入法[9]又稱網(wǎng)絡(luò)表示學(xué)習(xí),是表示學(xué)習(xí)技術(shù)的一個(gè)子集。表示學(xué)習(xí)是一種對(duì)數(shù)據(jù)廣義的特征表示,而網(wǎng)絡(luò)嵌入法則更加專注于網(wǎng)絡(luò)的表示,旨在將網(wǎng)絡(luò)中的節(jié)點(diǎn)以更加直觀、更加高效的某種方式盡可能地還原原始空間中節(jié)點(diǎn)的關(guān)系,把網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)映射成為一個(gè)低維稠密實(shí)數(shù)向量,不僅可以降低時(shí)間和空間上的計(jì)算開(kāi)銷,而且可以提高節(jié)點(diǎn)向量在各種網(wǎng)絡(luò)分析任務(wù)中的性能。

Xie等[10-11]將網(wǎng)絡(luò)表示學(xué)習(xí)應(yīng)用于地點(diǎn)推薦領(lǐng)域;Ding等[12]在基于位置的社交網(wǎng)絡(luò)中利用用戶的興趣點(diǎn)來(lái)提供更加準(zhǔn)確的推薦;He等[13]通過(guò)向NCF(Neural Collaborative Filtering)模型中輸入用戶和商品網(wǎng)絡(luò)中邊的信息,同時(shí)使用多層感知機(jī)來(lái)得到用戶和商品間的非線性關(guān)系,最終計(jì)算用戶間相似度來(lái)進(jìn)行推薦;文獻(xiàn)[14]中DeepWalk算法在網(wǎng)絡(luò)中進(jìn)行隨機(jī)游走得到節(jié)點(diǎn)訪問(wèn)序列,然后將其作為skipgram[15]的輸入并得到節(jié)點(diǎn)向量。網(wǎng)絡(luò)嵌入法是近幾年快速發(fā)展的數(shù)據(jù)分析技術(shù),但是它在個(gè)性推薦領(lǐng)域還處于剛起步的階段。

2?解決方案

UNER(User Network Embedding Recommendation)方法的整體解決方案如圖1所示。

1)通過(guò)用戶標(biāo)簽數(shù)據(jù)構(gòu)建用戶用戶網(wǎng)絡(luò),并通過(guò)網(wǎng)絡(luò)嵌入法計(jì)算用戶節(jié)點(diǎn)向量表示形式,通過(guò)該類型網(wǎng)絡(luò)中用戶的向量表示來(lái)解決民宿房源推薦問(wèn)題中用戶冷啟動(dòng)問(wèn)題。

2)使用對(duì)比標(biāo)度權(quán)重法計(jì)算用戶各行為的權(quán)重值,并通過(guò)用戶行為數(shù)據(jù)構(gòu)建用戶用戶網(wǎng)絡(luò)。

3)為解決用戶標(biāo)簽數(shù)據(jù)和用戶行為數(shù)據(jù)稀疏問(wèn)題,本文在計(jì)算網(wǎng)絡(luò)中節(jié)點(diǎn)向量時(shí)不僅考慮節(jié)點(diǎn)間的一階鄰近度,同時(shí)還考慮節(jié)點(diǎn)間的二階鄰近度,即通過(guò)增加節(jié)點(diǎn)的高階鄰居(如鄰居的鄰居)來(lái)拓展網(wǎng)絡(luò)中節(jié)點(diǎn)的鄰居,用以解決用戶數(shù)據(jù)稀少造成的稀疏性問(wèn)題。

4)通過(guò)用戶節(jié)點(diǎn)的特征向量計(jì)算用戶間相似性,使用協(xié)同推薦得到TopN推薦房源列表。

為方便閱讀,介紹算法中用到的結(jié)構(gòu)和定義。

定義1?用戶標(biāo)簽。用戶在注冊(cè)時(shí)選擇興趣標(biāo)簽,對(duì)于用戶u而言,用戶標(biāo)簽集Tu可以表示一個(gè)用戶u自身的標(biāo)簽集合〈u,t〉,數(shù)據(jù)集T={Tu:u∈U}是所有用戶的標(biāo)簽記錄集合。

定義2?用戶行為。用戶在使用民宿訂房系統(tǒng)時(shí),會(huì)產(chǎn)生各種行為,比如瀏覽、收藏、購(gòu)買等。一個(gè)用戶u對(duì)房源h產(chǎn)生的行為b可以用三元組〈u,h,b〉來(lái)表示,將該三元組稱為Bu。數(shù)據(jù)集B是所有用戶對(duì)房源產(chǎn)生的行為數(shù)據(jù)集合。

定義3?用戶共現(xiàn)。當(dāng)兩個(gè)用戶具有相同標(biāo)簽或者對(duì)同一房源都具有行為時(shí),那么就稱為這兩個(gè)用戶共現(xiàn)。

當(dāng)給定用戶標(biāo)簽數(shù)據(jù)集后,需要通過(guò)用戶的標(biāo)簽來(lái)統(tǒng)計(jì)用戶對(duì)之間的共現(xiàn)次數(shù)來(lái)確定兩用戶之間的權(quán)重。若使用用戶行為數(shù)據(jù),則需要計(jì)算用戶各行為的權(quán)重。最終通過(guò)數(shù)據(jù)集T和B,構(gòu)建兩類用戶用戶網(wǎng)絡(luò)。下面介紹用戶用戶網(wǎng)絡(luò)的定義。

定義4?用戶用戶網(wǎng)絡(luò)。用戶用戶網(wǎng)絡(luò)主要是通過(guò)抽取用戶對(duì)之間的共現(xiàn)信息構(gòu)建獲得。可以將用戶用戶網(wǎng)絡(luò)表示成G=(V,E)的加權(quán)無(wú)向圖形式,每一個(gè)節(jié)點(diǎn)代表著一個(gè)用戶,V表示網(wǎng)絡(luò)中的節(jié)點(diǎn)信息。E表示網(wǎng)絡(luò)中節(jié)點(diǎn)和節(jié)點(diǎn)即用戶和用戶之間的無(wú)向邊,代表用戶之間共現(xiàn)信息。節(jié)點(diǎn)Vi和節(jié)點(diǎn)Vj之間邊的權(quán)重Wi, j是由用戶標(biāo)簽集合T和用戶行為集合B中用戶i和用戶j之間的共現(xiàn)次數(shù)。

根據(jù)以上定義,可以通過(guò)用戶標(biāo)簽集合T和用戶行為集合B構(gòu)建出兩類用戶用戶網(wǎng)絡(luò)。圖2是基于用戶標(biāo)簽的用戶用戶網(wǎng)絡(luò)。在通過(guò)用戶標(biāo)簽構(gòu)建用戶用戶網(wǎng)絡(luò)的過(guò)程中,分析用戶標(biāo)簽中每個(gè)用戶和其他用戶是否具有相同的標(biāo)簽,從而獲得用戶用戶網(wǎng)絡(luò)中邊的權(quán)重。在本例中,用戶1和用戶2都有標(biāo)簽1和標(biāo)簽2,因此在用戶用戶網(wǎng)絡(luò)中,用戶1和用戶2對(duì)應(yīng)節(jié)點(diǎn)的邊的權(quán)重為2。

圖3是基于用戶行為的用戶用戶網(wǎng)絡(luò)。在通過(guò)用戶行為構(gòu)建用戶用戶網(wǎng)絡(luò)的過(guò)程中,分析用戶和其他用戶是否對(duì)同一房源產(chǎn)生行為。使用對(duì)比標(biāo)度權(quán)重法計(jì)算各種行為所對(duì)應(yīng)的權(quán)重,網(wǎng)絡(luò)中兩個(gè)用戶節(jié)點(diǎn)間邊的權(quán)重是這兩個(gè)用戶對(duì)同一房源產(chǎn)生的行為權(quán)重相加之和。圖3中user_1和user_2之間邊的權(quán)重為user_1對(duì)h_2和h_3產(chǎn)生行為的權(quán)重加上user_2對(duì)h_2和h_3產(chǎn)生行為的權(quán)重。

最終,構(gòu)建兩類用戶網(wǎng)絡(luò)后,當(dāng)系統(tǒng)判定用戶為新用戶時(shí),則通過(guò)用戶標(biāo)簽信息來(lái)構(gòu)建用戶用戶網(wǎng)絡(luò)并計(jì)算用戶向量,然后計(jì)算用戶相似矩陣,最終完成TopN推薦。基于用戶標(biāo)簽的網(wǎng)絡(luò)主要用于解決用戶冷啟動(dòng)問(wèn)題;如果用戶不是新用戶,那么利用用戶在系統(tǒng)中的行為數(shù)據(jù)來(lái)構(gòu)建網(wǎng)絡(luò),然后計(jì)算用戶相似矩陣,最后為用戶提供TopN推薦。

3?研究方法

3.1?網(wǎng)絡(luò)嵌入法的一階鄰近度和二階鄰近度

一階鄰近度?該模型只適用于無(wú)向圖,對(duì)于用戶用戶網(wǎng)絡(luò)中的一條無(wú)向邊(i, j)定義兩個(gè)節(jié)點(diǎn)vi和vj的共享概率如下:

p1(vi,vj)=11+exp(-uiT,uj)(1)

其中:ui和uj是網(wǎng)絡(luò)中節(jié)點(diǎn)i和j的向量化表示形式,相當(dāng)于從Embedding的角度來(lái)描述節(jié)點(diǎn)之間的親密程度,兩個(gè)節(jié)點(diǎn)親密程度的度量將由網(wǎng)絡(luò)的數(shù)據(jù)結(jié)構(gòu)中獲得。

1(vi,vj)=wijW(2)

其中:wij是節(jié)點(diǎn)i和j間邊的權(quán)值;W是指網(wǎng)絡(luò)中所有邊權(quán)值的和,即W=∑ (i,j)∈Ewij。為保證一階鄰近度的可靠性,p1和1之間的分布差異越小越好,則將目標(biāo)函數(shù)優(yōu)化如下:

O1=d(p1,1)(3)

兩個(gè)概率之間的分布差異由d()函數(shù)來(lái)衡量,本文中選用KL散度,可以將式(3)優(yōu)化為:

O1=-∑ (i,j)∈EWijlogp1(vi,vj)(4)

通過(guò)學(xué)習(xí)訓(xùn)練,我們可以得到每個(gè)用戶節(jié)點(diǎn)的特征向量{ui}i=1,2,…,|U|,并且滿足使式(4)最小化。

二階鄰近度?二階鄰近度是認(rèn)為網(wǎng)絡(luò)中與其他節(jié)點(diǎn)具有相同鄰居節(jié)點(diǎn)的兩個(gè)節(jié)點(diǎn)彼此相似。在該情況下,每個(gè)節(jié)點(diǎn)也被認(rèn)為是一個(gè)特定的“上下文”,并假設(shè)在“上下文”上具有相似分布的節(jié)點(diǎn)是相似的。因此每個(gè)節(jié)點(diǎn)都具有兩種角色:節(jié)點(diǎn)本身和其他節(jié)點(diǎn)的特定“上下文”。引入兩個(gè)向量ui和ui′,當(dāng)vi被處理為節(jié)點(diǎn)時(shí),ui是vi的表示;當(dāng)vi被當(dāng)作“上下文”處理時(shí),ui′是vi的表示。對(duì)于邊(i,j),將節(jié)點(diǎn)vi生成“上下文”vj的概率定義為:

p(vj|vi)=exp(ui′T·ui)∑|V|k=1exp(uK′T·ui)(5)

其中|V|是頂點(diǎn)或“上下文”的數(shù)量。為了保證節(jié)點(diǎn)間二階相似度信息,則應(yīng)該使降維之后上下文的概率p(·|vi)盡可能地接近實(shí)際概率(·|vi)。表示為:

O2=∑ i∈Vaid((·|vi),p(·|vi))(6)

由于網(wǎng)絡(luò)節(jié)點(diǎn)的重要性可能不同,所以式(6)中的ai表示網(wǎng)絡(luò)中節(jié)點(diǎn)i的重要程度。實(shí)際概率定義為(vj|vi)=wij∑ k∈N(i)wik,其中wij是邊(i,j)的權(quán)重,N(i)是節(jié)點(diǎn)vi鄰近的節(jié)點(diǎn)集。這里采用KL散度作為距離函數(shù):

O2=-∑ (i,j)∈EWijlogp2(vj|vi)(7)

通過(guò)模型的學(xué)習(xí)訓(xùn)練,可以得到使式(7)最小化{ui}i=1,2,…,|U|,就能通過(guò)一個(gè)d維的向量的ui′表示每個(gè)頂點(diǎn)ui。最后,每個(gè)用戶節(jié)點(diǎn)ui的嵌入向量表示ui為一級(jí)鄰近度下的向量ui1與二階鄰近度下向量ui2的線性組合,即:

ui=γui1+(1-γ)ui2(8)

3.2?基于用戶網(wǎng)絡(luò)嵌入的推薦

基于用戶網(wǎng)絡(luò)嵌入法的推薦是通過(guò)用戶用戶網(wǎng)絡(luò)得到用戶相似矩陣,使用相似用戶進(jìn)行房源推薦。通過(guò)上述方法計(jì)算,可得到每個(gè)用戶的特征向量ui,本文中采用余弦相似度[16]來(lái)計(jì)算用戶間相似度,并獲得相似用戶集合S(u)。

sim(ui,uj)=cos(ui,uj)(9)

對(duì)于用戶u是否選擇房源h,根據(jù)其相似用戶集中的用戶選擇情況進(jìn)行判斷。對(duì)于房源h,用戶u選擇它的概率的計(jì)算公式如下:

p(u,h)=∑ v∈S(u)∩N(h)sim(u,v)·rvh(10)

其中:rvh表示用戶u的相似用戶v對(duì)房源h的喜歡程度,N(h)是已選擇了房源h的用戶集。最后得到用戶u對(duì)未曾關(guān)注過(guò)的房源感興趣的概率列表,并且將概率大的房源進(jìn)行優(yōu)先推薦。

3.3?對(duì)比標(biāo)度權(quán)重法

民宿訂房系統(tǒng)中的用戶行為包括瀏覽、收藏和購(gòu)買。本文利用對(duì)比標(biāo)度權(quán)重法[17]來(lái)確定不同行為下用戶對(duì)該房源的喜愛(ài)程度。它是指事物與離散變量各類之間有一定的聯(lián)系,所以就可將權(quán)重的概念使用到分類變量上,數(shù)量化賦值的標(biāo)準(zhǔn)將由對(duì)指標(biāo)各分類的不同權(quán)重來(lái)確定。首先按層次分析法的原則將某個(gè)分類變量依據(jù)一定的規(guī)則進(jìn)行賦值,然后根據(jù)各個(gè)類之間的重要程度,最后按照從1~9的標(biāo)度方法,如表1所示,一一對(duì)比標(biāo)度,構(gòu)造如下判斷矩陣:

D1D2?…?Dn

D1D2Dn-1Dnd11d12…d1n

d21d22…d2n

d(n-1)1d(n-1)2…d(n-1)n

dn1dn2…dnn

4?實(shí)驗(yàn)分析

4.1?數(shù)據(jù)獲取

實(shí)驗(yàn)數(shù)據(jù)主要來(lái)自于貴州“水東鄉(xiāng)舍”項(xiàng)目2018年5月—2019年2月 200位用戶的標(biāo)簽數(shù)據(jù)和行為數(shù)據(jù)以及150間民宿房源數(shù)據(jù)。“水東鄉(xiāng)舍”是我們團(tuán)隊(duì)為貴州某公司實(shí)施的精準(zhǔn)扶貧項(xiàng)目,擬在開(kāi)陽(yáng)縣試點(diǎn),成功后在貴陽(yáng)市及貴州省推廣。

1)用戶標(biāo)簽數(shù)據(jù)。民宿訂房系統(tǒng)中的用戶注冊(cè)頁(yè)面設(shè)計(jì)了用戶選擇興趣標(biāo)簽的功能。用戶在注冊(cè)時(shí)選擇的標(biāo)簽數(shù)據(jù)就是用戶標(biāo)簽數(shù)據(jù)集。

2)用戶行為數(shù)據(jù)。民宿訂房系統(tǒng)中定義了三種用戶行為,分別為瀏覽、收藏和購(gòu)買。用戶對(duì)商品的收藏和購(gòu)買行為是在系統(tǒng)中明確產(chǎn)生的行為,很容易獲取。系統(tǒng)中獲取用戶瀏覽房間的記錄主要是通過(guò)頁(yè)面中的JavaScript代碼來(lái)實(shí)現(xiàn)。

4.2?計(jì)算用戶各行為權(quán)重

用戶行為(瀏覽、收藏、購(gòu)買)是用戶對(duì)該房源是否有興趣的體現(xiàn),不同的行為表示了用戶對(duì)該房源的喜好程度。用戶各行為的權(quán)重計(jì)算分為下面三步。

1)根據(jù)表1構(gòu)建判斷矩陣,兩兩行為進(jìn)行對(duì)比,得出行為之間的相對(duì)重要性,如表2所示。

2)計(jì)算特征向量。從表3中的數(shù)值可以計(jì)算瀏覽、收藏和購(gòu)買行為的特征向量值。計(jì)算方法在4.3節(jié)詳細(xì)講述。計(jì)算過(guò)程如下所示:

瀏覽=31×1/5×1/9=0.28;收藏=35×1×1/4=1.08;購(gòu)買=39×4×1=3.30。

3)對(duì)特征向量值作歸一化處理,確定權(quán)重系數(shù)。計(jì)算過(guò)程如下:

瀏覽=0.28/4.66=0.06;收藏=1.08/4.66=0.23;購(gòu)買=3.30/4.66=0.70。通過(guò)計(jì)算,可以得到三種行為的權(quán)重系數(shù)。

4.3?構(gòu)建網(wǎng)絡(luò)

本節(jié)以用戶行為數(shù)據(jù)集為例,構(gòu)建基于用戶行為的用戶用戶網(wǎng)絡(luò)。圖4為用戶行為的部分?jǐn)?shù)據(jù)集,該數(shù)據(jù)集主要由用戶編號(hào)、房源編號(hào)和行為編號(hào)構(gòu)成。

圖5為將圖4中數(shù)據(jù)轉(zhuǎn)換為帶權(quán)無(wú)向圖后的數(shù)據(jù)形式。

將圖5中的數(shù)據(jù)經(jīng)過(guò)網(wǎng)絡(luò)嵌入法計(jì)算其一階與二階鄰近度,并將兩種近鄰度下的用戶特征向量進(jìn)行線性組合就可得到每個(gè)用戶節(jié)點(diǎn)的向量表示形式,如圖6所示。

4.4?參數(shù)影響分析

本文所提算法采用綜合評(píng)價(jià)指標(biāo)(F1值)和平均正確率(Mean Average Precision,MAP)來(lái)衡量。F1計(jì)算公式為:

F1@K=2PRP+R

其中:P為精確率,R為召回率。

MAP的計(jì)算公式為:

MAP@K=∑Nn=1Avep(n)N

其中Avep(n)=∑nq=1(p(q)×rel(q))number of relevant documents;N表示為N個(gè)用戶推薦;對(duì)于已排序好的推薦列表,q代表推薦列表中房源的排名,當(dāng)q為已推薦成功房源時(shí)rel(k)為1,否則為0;p(q)是q前面房源的精確度。

將用戶行為數(shù)據(jù)集隨機(jī)抽出25%的數(shù)據(jù)作為測(cè)試集,剩余數(shù)據(jù)作為訓(xùn)練集。用戶向量維度的設(shè)置為L(zhǎng)INE方法中的默認(rèn)值128維,在優(yōu)化過(guò)程中取負(fù)采用數(shù)為5,學(xué)習(xí)率的初始值設(shè)置為ρ0=0.025,且ρτ=ρ0(1-t/T),其中T為網(wǎng)絡(luò)中邊的數(shù)量。對(duì)于式(8)參數(shù)γ值的確定,采用變量固定措施。保持UNER方法中相似用戶集S(u)=5,參數(shù)γ按照每次增加0.1的方式從0到1變化,分別為用戶推薦4、6和8個(gè)房源,結(jié)果如圖7所示,當(dāng)γ值取0.7時(shí),實(shí)驗(yàn)結(jié)果最佳。

4.5?實(shí)驗(yàn)結(jié)果

為了驗(yàn)證本文實(shí)驗(yàn)的有效性,將UNER方法的推薦結(jié)果與基于用戶的協(xié)同過(guò)濾算法(Userbased Collaborative Filtering,UserCF)的結(jié)果再進(jìn)行對(duì)比。當(dāng)γ=0.7,目標(biāo)用戶的相似數(shù)據(jù)集S(u)長(zhǎng)度取5時(shí),分別推薦6~10個(gè)房源,然后計(jì)算F1值和MAP值,兩種算法得到的結(jié)果,如表3所示。

當(dāng)目標(biāo)用戶的相似數(shù)據(jù)集S(u)長(zhǎng)度取10時(shí),分別推薦6~10個(gè)房源,然后計(jì)算F1值,分別得到兩種算法的F1值和MAP值,如表4所示。

將表4與表5轉(zhuǎn)換為圖表形式,如圖8和圖9所示,可以看出在兩種情況下UNER的綜合評(píng)價(jià)指標(biāo)和平均正確率均比UserCF高,即UNER的推薦結(jié)果比UserCF更優(yōu)。

5?結(jié)語(yǔ)

從實(shí)驗(yàn)結(jié)果中可看出,基于用戶網(wǎng)絡(luò)嵌入法的民宿房源推薦方法要比協(xié)同過(guò)濾算法在綜合評(píng)價(jià)指標(biāo)上更優(yōu)。相對(duì)基于用戶的協(xié)同過(guò)濾算法,UNER方法的推薦綜合評(píng)價(jià)指標(biāo)(F1值)和平均正確率(MAP)均比基于用戶的協(xié)同過(guò)濾算法更優(yōu)。由于本文的研究主要是針對(duì)民宿房源的推薦,所以數(shù)據(jù)集采用貴州“水東鄉(xiāng)舍”項(xiàng)目中的用戶標(biāo)簽數(shù)據(jù)和用戶行為數(shù)據(jù)。

另外,在后期研究中應(yīng)加入用戶的社交網(wǎng)絡(luò)數(shù)據(jù),來(lái)提高推薦的精準(zhǔn)度。同時(shí),應(yīng)結(jié)合更多用戶的隱性行為數(shù)據(jù),比如用戶在頁(yè)面的停留時(shí)間、用戶對(duì)房源的評(píng)價(jià)信息以及用戶行為產(chǎn)生的時(shí)間,并考慮多方面因素確定行為權(quán)重,從而更加精準(zhǔn)為用戶推薦房源信息。

參考文獻(xiàn) (References)

[1]DESHPANDE M, KARRYPIS G. Itembased TopNrecommendation algorithms[J]. ACM Transactions on Information Systems, 2004, 22(1):143-177.

[2]JUNG K Y, HWANG H J, KANG U G. Constructing full matrix through Naive Bayesian for collaborative filtering[C]// Proceedings of the 2006 International Conference on Intelligent Computing, LNCS 4114. Berlin: Springer, 2006:1210-1215.

[3]GOLDBERG D, NICHOLS D, OKI B M, et al. Using collaborative filtering to weave an information tapestry[J]. Communications of the ACM, 1992, 35(12): 61-70.

[4]BREESE B J S, HECKERMAN D, KADIE C. Empirical analysis of predictive algorithms for collaborative filtering[C]// Proceedings of the 4th Conference on Uncertainty in Artificial Intelligence, 1998:43-52.

[5]鄧愛(ài)林,朱揚(yáng)勇,施伯樂(lè). 基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過(guò)濾推薦算法[J]. 軟件學(xué)報(bào), 2003, 14(9):1621-1628. (DENG A L, ZHU Y Y, SHI B L. A collaborative filtering recommendation algorithm based on item rating prediction [J]. Journal of Software, 2003, 14(9): 1621-1628.)

[6]邵煜,謝穎華. 協(xié)同過(guò)濾算法中冷啟動(dòng)問(wèn)題研究[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2019, 28(2):246-252. (SHAO Y, XIE Y H. Research on coldstart problem of collaborative filtering algorithm[J]. Computer Systems & Applications, 2019, 28(2):246-252.)

[7]LE T M V, LAUW H W. Probabilistic latent document network embedding[C]// Proceedings of the 2014 IEEE International Conference on Data Mining. Piscataway: IEEE, 2014: 270-279.

[8]BOURIGAULT S, LAGNIER C, LAMPRIER S, et al. Learning social network embeddings for predicting information diffusion[C]// Proceedings of the 2014 IEEE International Conference on Data Mining. Piscataway: IEEE, 2014: 393-402.

[9]PEROZZI B, ALRFOU R, SKIENA S. DeepWalk: online learning of social representations[C]// Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2014:701-710.

[10]XIE M, YIN H, XU F, et al. Graphbased metric embedding for next POI recommendation[C]// Proceedings of the 2016 International Conference on Web Information Systems Engineering, LNCS 10042. Berlin: Springer, 2016: 207-222.

[11]XIE M, YIN H, WANG H, et al. Learning graphbased POI embedding for locationbased recommendation[C]// Proceedings of the 25th ACM International on Conference on Information and Knowledge Management. New York: ACM, 2016:15-24.

[12]DING R, CHEN Z. RecNet: a deep neural network for personalized POI recommendation in locationbased social networks[J]. International Journal of Geographical Information Science, 2018, 32(8): 1631-1648.

[13]HE X, LIAO L, ZHANG H, et al. Neural collaborative filtering[J]. Proceedings of the 26th International Conference on World Wide Web. Republic and Canton of Geneva, Switzerland: International World Wide Web Conferences Steering Committee, 2017:173-182.

[14]WANG D, CUI P, ZHU W. Structural deep network embedding[C]// Proceedings of the 22nd ACM SIGKDD International Conference. New York: ACM, 2016:1225-1234.

[15]MIKOLOV T, SUTSKEVER I, CHEN K, et al. Distributed representations of words and phrases and their compositionality[C]// Advances in Neural Information Processing Systems 26. Cambridge, MA: MIT Press, 2013:3111-3119.

[16]LUO C, ZHAN J, WANG L, et al. Cosine normalization: using cosine similarity instead of dot product in neural networks[EB/OL]. [2019-03-20]. https://arxiv.org/pdf/1702.05870.pdf.

[17]高陽(yáng),余建偉. 判斷矩陣標(biāo)度擴(kuò)展法在不同標(biāo)度下的比較[J]. 統(tǒng)計(jì)與決策, 2007(20):152-154. (GAO Y, YU J W. Comparison of judgment matrix scale expansion method under different scales[J]. Statistics and Decision, 2007(20):152-154.)

This work is partially supported by the National Natural Science Foundation of China (61902114), the Hubei Province Major Technological Innovation Project (2016CFB309).

LIU Tong, born in 1993, M. S. candidate. His research interests include big data processing, recommendation algorithm.

ZENG Cheng, born in 1976, Ph. D., professor. His research interests include big data processing, domain software engineering, service recommendation.

HE Peng, born in 1988, Ph. D., associate professor. His research interests include big data processing, software metrics, complex network.

主站蜘蛛池模板: 性欧美在线| 国产在线一二三区| 国产精品人成在线播放| 久久久久青草线综合超碰| 精品亚洲国产成人AV| 日韩a在线观看免费观看| 亚洲第一天堂无码专区| 狠狠亚洲婷婷综合色香| 国产原创演绎剧情有字幕的| 免费又爽又刺激高潮网址| 国产小视频在线高清播放| 在线观看国产一区二区三区99| 亚洲人成日本在线观看| 丁香六月激情婷婷| 露脸国产精品自产在线播| 精品久久久久久久久久久| a色毛片免费视频| 亚洲永久色| 91在线国内在线播放老师| 国产福利在线免费| 日韩无码视频播放| 国产成人精品一区二区秒拍1o| 欧美日韩动态图| 日韩精品无码免费专网站| 人妻中文字幕无码久久一区| 日本a∨在线观看| 国产精品自在在线午夜| 青草国产在线视频| 5555国产在线观看| 日韩高清一区 | 亚洲制服丝袜第一页| 一本视频精品中文字幕| 国产一二视频| 一区二区三区在线不卡免费| 久久久久免费看成人影片 | 中文字幕丝袜一区二区| 国产精品视频导航| 亚洲日韩AV无码精品| 一本一道波多野结衣av黑人在线| 亚洲国产中文精品va在线播放| 狂欢视频在线观看不卡| 在线播放精品一区二区啪视频| 天堂在线www网亚洲| 色偷偷综合网| h视频在线播放| 精品国产www| 亚洲国语自产一区第二页| 国产后式a一视频| 免费播放毛片| 亚洲精品第一页不卡| 无套av在线| 99久久精品免费看国产免费软件| 暴力调教一区二区三区| 国产成人亚洲毛片| 亚洲AV一二三区无码AV蜜桃| 黄色一级视频欧美| 国产一区二区精品福利| 国产亚洲高清在线精品99| 亚洲欧美在线综合图区| 91色爱欧美精品www| 国产欧美精品专区一区二区| 日本黄色a视频| 国产一级毛片高清完整视频版| 人妻丰满熟妇AV无码区| 婷婷色狠狠干| 女人天堂av免费| 成人一级免费视频| 国产最新无码专区在线| 国产精品漂亮美女在线观看| 国产视频欧美| 久久国产精品影院| 国产无人区一区二区三区 | 亚洲国产精品日韩av专区| 99精品热视频这里只有精品7| 亚洲国产精品一区二区高清无码久久| 中文字幕 91| 国产亚洲一区二区三区在线| 国产成人亚洲综合a∨婷婷| 亚洲国产天堂久久九九九| 国内精品视频| 欧类av怡春院| 在线五月婷婷|