999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶特征與信任度的協(xié)同過濾推薦算法

2024-12-10 00:00:00李彭
現(xiàn)代信息科技 2024年24期

摘" 要:針對傳統(tǒng)協(xié)同過濾算法的冷啟動(dòng)、推薦精度低等問題,提出基于用戶特征和信任度的推薦算法(Recommendation Algorithm Based on User Characteristics and Trust, RA-UCT)。該算法首先利用用戶的人口統(tǒng)計(jì)學(xué)信息和評分?jǐn)?shù)據(jù)來計(jì)算特征相似度;然后在改進(jìn)的相似度基礎(chǔ)上,構(gòu)建用戶信任網(wǎng)絡(luò),計(jì)算綜合信任度,在特征相似度和綜合信任度兩個(gè)維度上進(jìn)行推薦。在MovieLens公共數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)協(xié)同過濾方法比較,提出的算法能夠有效提高推薦精度,冷啟動(dòng)問題也得到有效緩解。

關(guān)鍵詞:屬性特征;信任度;協(xié)同過濾;冷啟動(dòng)

中圖分類號:TP391.3;TP312 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號:2096-4706(2024)24-0049-05

Collaborative Filtering Recommendation Algorithm Based on User Characteristics and Trust

LI Peng

(Taiyuan Normal University, Jinzhong" 030619, China)

Abstract: Aiming at the problems of cold boot and low recommendation accuracy of the traditional Collaborative Filtering algorithm, a Recommendation Algorithm Based on User Characteristics and Trust (RA-UCT) is proposed. The algorithm firstly uses the user's demographic information and rating data to calculate the feature similarity. Then, based on the improved similarity, it constructs a user trust network, calculates the comprehensive trust, and makes recommendations based on the two dimensions of feature similarity and comprehensive trust. The experimental results on the MovieLens public dataset show that compared with the traditional Collaborative Filtering method, the proposed algorithm can effectively improve the recommendation accuracy and effectively alleviate the cold boot problem.

Keywords: attribute characteristics; trust; Collaborative Filtering; cold boot

0" 引" 言

互聯(lián)網(wǎng)技術(shù)的發(fā)展帶來了數(shù)據(jù)量的急劇膨脹,這讓用戶從海量信息中篩選出有價(jià)值的內(nèi)容變得更加困難。推薦系統(tǒng)(Recommendation System)[1-2]應(yīng)運(yùn)而生,有效緩解了信息超載[3]的問題。協(xié)同過濾推薦算法[4]作為目前最流行且成效顯著的技術(shù)之一,在實(shí)際應(yīng)用中卻面臨著用戶和物品數(shù)量激增帶來的挑戰(zhàn),如冷啟動(dòng)、數(shù)據(jù)稀疏性[5]等問題,這些問題嚴(yán)重制約了算法的推薦效果。為了應(yīng)對這些挑戰(zhàn),本文深入探討了協(xié)同過濾算法,并提出了一種融合用戶特征和信任度的改進(jìn)推薦算法。

1" 相關(guān)工作

在推薦系統(tǒng)的研究領(lǐng)域,冷啟動(dòng)和數(shù)據(jù)稀疏性問題一直是研究者關(guān)注的焦點(diǎn)。為了應(yīng)對這些挑戰(zhàn),近年來,眾多學(xué)者開展了一系列創(chuàng)新性的研究工作。韓立鋒等[6]提出一種融合用戶人口統(tǒng)計(jì)學(xué)信息與項(xiàng)目流行度的推薦算法,該算法首先通過聚類將用戶劃分為不同的簇,然后融合項(xiàng)目流行度進(jìn)行個(gè)性化推薦。申艷梅等[7]提出了一種新的融合推薦算法,通過結(jié)合用戶屬性和項(xiàng)目屬性,在一定程度上解決了冷啟動(dòng)問題。楊超等[8]提出融合人口統(tǒng)計(jì)屬性的協(xié)同過濾推薦算法。該算法通過用戶聚類和物品類內(nèi)流行度的計(jì)算,改進(jìn)了傳統(tǒng)協(xié)同過濾算法中的用戶相似度計(jì)算方法,可以有效提高推薦準(zhǔn)確度。

上述算法雖然在一定程度上緩解了冷啟動(dòng)問題,但它們?nèi)杂懈倪M(jìn)空間,例如,某些算法主要基于用戶間的共同評分項(xiàng)目來評估相似度,這可能忽略了那些沒有共同評分記錄的用戶間的潛在聯(lián)系。此外,一些算法涉及的計(jì)算量較大,這增加了算法的執(zhí)行時(shí)間,從而影響了其時(shí)間效率。

在現(xiàn)有研究成果的基礎(chǔ)上,本文提出了一種改進(jìn)的推薦算法,該算法綜合考慮了用戶的個(gè)性特征和信任網(wǎng)絡(luò)。首先,利用用戶的人口統(tǒng)計(jì)屬性,得到用戶的屬性相似度,將用戶屬性相似度和評分相似度加權(quán)融合,得到用戶特征相似度;其次,挖掘不存在共同評分用戶間的關(guān)系,構(gòu)建用戶信任模型,計(jì)算出直接信任度和間接信任度,最后將用戶的特征相似度與信任度相結(jié)合來提高推薦精度。

2" 基于用戶特征與信任度的推薦算法

2.1" 用戶特征相似度

分別對人口統(tǒng)計(jì)學(xué)信息、用戶評分?jǐn)?shù)據(jù)分析計(jì)算,得到用戶人口統(tǒng)計(jì)學(xué)相似度、評分相似度。將二者賦予適當(dāng)?shù)臋?quán)重,得到了用戶特征相似度。

2.1.1" 人口統(tǒng)計(jì)學(xué)相似度

注冊系統(tǒng)的新用戶,他們對商品的評分和反饋極為有限,甚至可能一片空白。在用戶注冊階段,系統(tǒng)會(huì)收集一些基礎(chǔ)的個(gè)人信息,如年齡、性別、職業(yè)、收入水平、教育背景以及居住地區(qū)等,這些信息有助于構(gòu)建用戶畫像,為個(gè)性化推薦提供初步依據(jù)。相關(guān)研究表明[9],用戶在年齡、性別、職業(yè)等人口統(tǒng)計(jì)學(xué)特征上的相似性往往與他們的興趣愛好有較高的一致性,基于這一理論,本文將用戶的年齡、性別和職業(yè)作為關(guān)鍵指標(biāo),構(gòu)建了一個(gè)綜合考量這三個(gè)維度的用戶相似度評估模型。

用戶群體覆蓋范圍大,從兒童到成年人不等,年齡差異較大。因此,本文采用參考文獻(xiàn)[10]提出的利用負(fù)指數(shù)衰減函數(shù)對年齡差異進(jìn)行相似性轉(zhuǎn)換,兩個(gè)用戶之間的年齡相似性計(jì)算方法如式(1)所示:

(1)

其中,m = 3.8,n = 2。通過歸一化將用戶年齡值進(jìn)行適當(dāng)?shù)恼{(diào)整,確保相似度指標(biāo)取值在0~1之間,具體算式如(2)所示:

(2)

其中,ai表示用戶的實(shí)際年齡,maxa、mina表示用戶集中的最小年齡值和最大年齡值。

在計(jì)算性別和職業(yè)屬性的相似度時(shí),本文將采用重疊測度(簡單匹配測度)進(jìn)行處理,以量化這些非數(shù)值型特征。用0和1分別表示“男”和“女”,用不同的數(shù)字表示不同的職業(yè),如式(3)所示:

(3)

其中,用戶性別相同,則性別相似度gender_sim(u, v) = 1;職業(yè)相同,則職業(yè)相似度occupa_sim(u, v) = 1。

在構(gòu)建用戶相似度模型時(shí),采用了動(dòng)態(tài)權(quán)重分配策略,以反映不同人口統(tǒng)計(jì)學(xué)特征對用戶偏好的影響。具體地,定義了三個(gè)權(quán)重系數(shù):λ、β和γ(其中γ = 1-λ-β),分別對應(yīng)年齡、性別和職業(yè)特征的重要性,如式(4)所示:

(4)

2.1.2" 融入熱門商品懲罰的評分相似度

用戶對項(xiàng)目的評分確實(shí)能夠揭示他們之間的相似性,但這種相似性并不總是準(zhǔn)確的。特別是對于廣泛受歡迎的項(xiàng)目,盡管許多用戶參與了評分,但這并不一定代表他們的偏好是一致的。當(dāng)兩個(gè)用戶共同評分的項(xiàng)目主要是流行項(xiàng)目時(shí),這可能會(huì)誤導(dǎo)相似度的評估。在標(biāo)準(zhǔn)Pearson相似度[11]計(jì)算過程中,所有項(xiàng)目被賦予相等的權(quán)重,這種做法沒有充分考慮項(xiàng)目流行度對相似度評估的影響。為了解決這一問題,對標(biāo)準(zhǔn)的Pearson相似度計(jì)算式修訂為:

(5)

在式(5)中,I表示用戶間共同評分項(xiàng)目集合,和分別表示用戶u和用戶v獲得的平均評分,Ni表示項(xiàng)目i在評分?jǐn)?shù)據(jù)中被評價(jià)的次數(shù)。

最后,結(jié)合用戶屬性相似度dem_sim(u, v)(式(4))與改進(jìn)的Pearson相似度sim(u, v)(式(5)),形成綜合的用戶特征相似度Simd(u, v),如式(6)所示。在這個(gè)過程中,參數(shù)α作為一個(gè)權(quán)重因子,用于調(diào)整用戶特征相似度的貢獻(xiàn)度。

(6)

2.2" 用戶間信任關(guān)系的度量

標(biāo)準(zhǔn)協(xié)同過濾推薦算法主要依賴于用戶間共同評分的項(xiàng)目來評估他們的關(guān)系,這限制了算法對那些沒有共同評分記錄的用戶間潛在聯(lián)系的識(shí)別能力。為了解決這一局限性,本文引入了信任機(jī)制[12]的概念。

2.2.1" 直接信任度

假如用戶之間存在共同評分的項(xiàng)目,則認(rèn)為用戶之間存在直接信任關(guān)系。利用Pearson相似度與Jaccard相似度[11]融合得到直接信任度,計(jì)算式如下所示:

(7)

其中,dT(u, v)表示用戶u對用戶v的直接信任度,simPearson(u, v)表示用戶u和用戶v之間的Pearson相關(guān)系數(shù),simJac(u, v)表示用戶u和用戶v之間的Jaccard相關(guān)系數(shù)。

2.2.2" 間接信任度

考慮那些沒有直接評分交互的用戶,引入了間接信任度的概念,以評估他們之間的信任聯(lián)系。這種評估依賴信任的傳遞性原理,如圖1所示,U1與U2之間存在直接信任關(guān)系,U2與U3之間存在直接信任關(guān)系,而對于不存在直接信任關(guān)系的U1和U3,他們可以通過中間用戶U2傳遞信任。根據(jù)六度分割理論(Six Degrees of Separation)可知,信任傳遞過程中不會(huì)超過6個(gè)中間節(jié)點(diǎn)[13]。

設(shè)用戶u對用戶v之間至少存在一條可傳遞路徑,則可用表示可傳遞路徑集合,每條路徑可表示為,由此可知每條路徑的權(quán)重ωi計(jì)算式如式(8)所示:

(8)

其中,d表示信任可以在用戶間最多傳遞的層級數(shù),其值設(shè)定為不超過6,dpi(u,v)表示第i條傳遞路徑的長度。

則每條路徑的間接信任度計(jì)算式如(9)所示:

(9)

綜合考量了用戶間多條信任傳遞路徑的影響后,定義了用戶u與用戶v之間存在的可傳遞路徑集合,記為S。基于此集合,得到用戶u和用戶v之間的間接信任度idTpi(u,v),計(jì)算式如(10)所示:

(10)

最終可知改進(jìn)的用戶綜合信任度公式:

(11)

其中,Trust(u,v)表示用戶綜合信任度,Iu和Iv表示用戶u和用戶v所評價(jià)過的商品集合。

2.3" RA-UCT算法的預(yù)測評分

為了增強(qiáng)推薦算法的性能,從用戶特征相似度和信任度兩個(gè)關(guān)鍵維度出發(fā),構(gòu)建了一個(gè)綜合的相似度評估框架,用以計(jì)算用戶間的綜合相似度。具體算式如下所示:

根據(jù)用戶綜合相似度Simf (u,v)進(jìn)行評分預(yù)測,預(yù)測評分算式如下所示:

(13)

其中,H表示與用戶u相關(guān)性最高的前n個(gè)近鄰用戶。

綜上所述,RA-UCT算法克服了傳統(tǒng)UBCF算法只依靠用戶評分進(jìn)行推薦的弊端,加入了用戶的注冊信息,將用戶屬性相似度與評分相似度融合,得到用戶的屬性特征,對冷啟動(dòng)問題進(jìn)行了緩解;利用用戶間的共同評分得到用戶間信任關(guān)系,建立信任模型,使推薦結(jié)果更加準(zhǔn)確。圖2展示了算法的具體流程。

輸入:用戶-項(xiàng)目評分信息、用戶特征信息

輸出:用戶預(yù)測評分

步驟:

1)提取人口統(tǒng)計(jì)學(xué)信息并建模,根據(jù)式(1)(3)得到年齡、性別、職業(yè)相似度分別為age_sim(u, v)、gender_sim(u, v)、occupa_sim(u, v)。

2)將構(gòu)造好的age_sim(u, v)、gender_sim(u, v)、occupa_sim(u, v)根據(jù)式(4)融合,得到屬性相似度dem_sim(u, v)。

3)根據(jù)式(5),得到改進(jìn)的評分相似度sim(u, v)。

4)根據(jù)式(6),得到用戶特征相似度Simd(u, v)。

5)結(jié)合Pearson相關(guān)系數(shù)和Jaccard相關(guān)系數(shù),計(jì)算出用戶間直接信任度dT(u,v)。

6)依據(jù)直接信任度計(jì)算用戶間接相似度idTpi(u, v)。

7)將5)與6)結(jié)合得到用戶綜合信任度Trust(u, v)。

8)依據(jù)式(12),得到基于用戶特征與信任度兩個(gè)維度融合的用戶綜合相似度Simf(u, v)。

9)計(jì)算出目標(biāo)用戶的最近鄰用戶集。

10)對項(xiàng)目進(jìn)行預(yù)測評分并推薦。

3" 實(shí)驗(yàn)

3.1" 數(shù)據(jù)集

本文選用了廣為使用的MovieLens 100K作為實(shí)驗(yàn)數(shù)據(jù)集。該數(shù)據(jù)集收錄了高達(dá)100 000條電影評分?jǐn)?shù)據(jù),涵蓋了943位用戶對1 682部不同電影的評分反饋。評分體系按照1至5的分值范圍設(shè)計(jì),其中5分代表用戶對電影的高度喜愛。對于用戶未觀看或未進(jìn)行評價(jià)的電影,數(shù)據(jù)集中相應(yīng)的評分項(xiàng)被標(biāo)記為0,以示區(qū)分。

本文實(shí)驗(yàn)的軟件環(huán)境如下:操作系統(tǒng)為Windows 11,CPU為Intel Core i5-9300H,2.4 GHz,內(nèi)存為16 GB,開發(fā)語言為Python。

3.2" 評價(jià)標(biāo)準(zhǔn)

實(shí)驗(yàn)采用平均絕對值誤差(Mean Absolute Error, MAE)作為衡量標(biāo)準(zhǔn)。MAE指標(biāo)反映了預(yù)測評分與實(shí)際評分之間的接近程度,其數(shù)值越低,意味著預(yù)測的準(zhǔn)確性越高。

(14)

其中N表示預(yù)測的總次數(shù),ru,i表示用戶u對項(xiàng)目i的實(shí)際評分,表示用戶u對項(xiàng)目i的預(yù)測評分。

3.3" 實(shí)驗(yàn)結(jié)果對比分析

3.3.1" 參數(shù)確定

為了驗(yàn)證λ、β、γ對用戶統(tǒng)計(jì)學(xué)相似度影響的差異,采用實(shí)驗(yàn)的手段對權(quán)重λ、β、γ的取值進(jìn)行設(shè)置。從表1可以看出,當(dāng)λ、β、γ的權(quán)重系數(shù)分別為0.3、0.4、0.3時(shí),MAE的值最小。

3.3.2" 用戶屬性相似度與Pearson相似度的參數(shù)調(diào)整

參數(shù)α調(diào)整對MAE值的影響如圖3所示,可知當(dāng)α = 0.6時(shí),MAE值最小。

3.3.3" 本文算法與傳統(tǒng)協(xié)同過濾算法比較

為了驗(yàn)證本文算法的性能,下面將本文提出的RA-UCT算法與傳統(tǒng)的UBCF算法進(jìn)行比較。在UBCF算法中,采用了傳統(tǒng)的用戶相似度度量方法,包括皮爾森相關(guān)系數(shù)、杰卡德相似度和改進(jìn)的余弦相似度,觀察在不同數(shù)量的最近鄰條件下,評價(jià)指標(biāo)MAE的變化。

根據(jù)圖4所示的實(shí)驗(yàn)數(shù)據(jù),可以觀察到四種算法在初始階段,即考慮較少的用戶鄰居時(shí),平均絕對誤差(MAE)相對較高,這表明預(yù)測的準(zhǔn)確性有待提升;隨著用戶鄰居數(shù)量的增加,MAE值逐漸降低并趨于穩(wěn)定,反映了預(yù)測性能的穩(wěn)步提高。此外,不同算法間的性能差異也較為顯著,其中,本文提出的RA-UCF在實(shí)驗(yàn)中效果最好。

4" 結(jié)" 論

本文對傳統(tǒng)的協(xié)同過濾算法進(jìn)行改進(jìn),通過引入年齡、性別、職業(yè)三個(gè)用戶屬性信息,當(dāng)用戶不存在評分?jǐn)?shù)據(jù)時(shí),可以根據(jù)用戶屬性信息進(jìn)行推薦,一定程度上緩解了冷啟動(dòng)問題;通過引入信任機(jī)制,使沒有共同評分的用戶也可以根據(jù)信任機(jī)制計(jì)算相似度,提高了推薦準(zhǔn)確性。在公共數(shù)據(jù)集上的對比,證明了對算法的改進(jìn)是有效的。但是本文還存在一定的不足,本文算法在計(jì)算用戶特征相似度時(shí)只采用年齡、性別、職業(yè)三個(gè)屬性,但是影響用戶特征相似度還存在其他的因素,比如學(xué)歷、地理位置等,在以后的研究中可以考慮將影響推薦效果的其他因素融合,更好地進(jìn)行個(gè)性化推薦。

參考文獻(xiàn):

[1] NILASHI M,IBRAHIM O,BAGHERIFARD K. A Recommender System Based on Collaborative Filtering Using Ontology and Dimensionality Reduction Techniques [J].Expert Systems with Applications,2018,92:507-520.

[2] 李孟浩,趙學(xué)健,余云峰,等.推薦算法研究進(jìn)展 [J].小型微型計(jì)算機(jī)系統(tǒng),2022,43(3):544-554.

[3] SHI C,HU B B,ZHAO W" X,et al. Heterogeneous Information Network Embedding for Recommendation [J].IEEE Transactions on Knowledge and Data Engineering,2019,31(2):357-370.

[4] YE X J,YUAN P S,GUO X Q,et al. Collaborative Filtering Recommendation Algorithm Based on User Interest and Project Cycle [J].Journal of Nanjing University of Science and Technology,2018,42(4):392

[5] 趙俊逸,莊福振,敖翔,等.協(xié)同過濾推薦系統(tǒng)綜述 [J].信息安全學(xué)報(bào),2021,6(5):17-34.

[6] 韓立鋒,陳莉.融合用戶屬性與項(xiàng)目流行度的用戶冷啟動(dòng)推薦模型 [J].計(jì)算機(jī)科學(xué),2021,48(2):114-120.

[7] 申艷梅,李亞平,王巖.基于用戶屬性和項(xiàng)目屬性的融合推薦算法 [J].河南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2022,41(2):131-137.

[8] 楊超,艾聰聰,蔣斌,等.一種融合人口統(tǒng)計(jì)屬性的協(xié)同過濾算法 [J].小型微型計(jì)算機(jī)系統(tǒng),2015,36(4):782-786.

[9] WU Y F,WANG H R. Collaborative Filtering Algorithm Using User Background Information [J].Journal of Computer Applications,2008,28(11):2972-2974.

[10] AL-SHAMRI M Y H. User Profiling Approaches for Demographic Recommender Systems [J].Knowledge-based Systems,2016,100(5):175-187.

[11] 陳功平,王紅.改進(jìn)Pearson相關(guān)系數(shù)的個(gè)性化推薦算法 [J].山東農(nóng)業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2016,47(6):940-944.

[12] YAHYAOUI H,AL-MUTAIRI A. A Feature-based Trust Sequence Classification Algorithm [J].Information Sciences,2016,328:455-484.

[13] 杜淑穎,丁世飛.基于六度分割理論的社交好友推薦算法研究 [J].南京理工大學(xué)學(xué)報(bào),2019,43(4):468-473.

作者簡介:李彭(1995—),男,漢族,河南南陽人,碩士在讀,研究方向:推薦算法。

主站蜘蛛池模板: 香蕉伊思人视频| 天堂av综合网| 日韩毛片在线视频| 国产成人综合在线视频| 宅男噜噜噜66国产在线观看| 97国产在线播放| 亚洲男人的天堂在线观看| 国产成人精品日本亚洲| 国产办公室秘书无码精品| 无码在线激情片| 亚洲V日韩V无码一区二区| 亚洲天堂成人| 在线播放精品一区二区啪视频| 在线高清亚洲精品二区| 呦系列视频一区二区三区| 国产本道久久一区二区三区| 欧美一级黄片一区2区| 亚洲经典在线中文字幕| 国产亚洲欧美日韩在线观看一区二区 | 精品偷拍一区二区| 国产91丝袜在线播放动漫| 88av在线| 欧亚日韩Av| 欧美福利在线观看| 一区二区三区四区日韩| 亚洲人成影院在线观看| 亚洲一区二区成人| 久久青青草原亚洲av无码| 久久精品无码中文字幕| 一级毛片网| 美美女高清毛片视频免费观看| 亚洲欧美国产高清va在线播放| 中文字幕有乳无码| 麻豆国产精品一二三在线观看| 91小视频在线| 91亚洲视频下载| 亚洲日韩日本中文在线| 国产在线自揄拍揄视频网站| 亚洲视频免费在线看| 亚洲av综合网| 午夜国产大片免费观看| 亚洲系列无码专区偷窥无码| 亚洲熟妇AV日韩熟妇在线| 91久久夜色精品国产网站| 精久久久久无码区中文字幕| 亚洲av日韩av制服丝袜| 高清无码手机在线观看| 国产亚洲欧美另类一区二区| 亚洲精品麻豆| 亚洲av无码人妻| 又粗又硬又大又爽免费视频播放| 毛片视频网| 国产精品美女在线| 国产一级一级毛片永久| 国产久草视频| 久久免费看片| 免费高清a毛片| 国产手机在线观看| 亚洲天堂区| 国产无码制服丝袜| 亚洲天堂区| 粗大猛烈进出高潮视频无码| a级毛片在线免费观看| 91国内在线视频| 亚洲美女一区二区三区| 伊人婷婷色香五月综合缴缴情| 亚洲美女一区二区三区| 亚洲人成色77777在线观看| 99视频在线免费观看| 成人国产一区二区三区| 综合天天色| 精品国产成人av免费| 国产精品任我爽爆在线播放6080| 人妖无码第一页| 国产精品任我爽爆在线播放6080| 亚洲男女在线| 久久青草精品一区二区三区| 高清色本在线www| 不卡网亚洲无码| 欧美啪啪网| 在线看国产精品| 欧日韩在线不卡视频|