一種雙向聚類協(xié)同過濾推薦算法研究

2020-06-22 13:15:56范奧哲何利力

軟件導(dǎo)刊 2020年5期

范奧哲何利力

摘要：針對(duì)傳統(tǒng)協(xié)同過濾推薦算法在大數(shù)據(jù)環(huán)境下存在數(shù)據(jù)稀疏性及計(jì)算復(fù)雜性等問題，提出一種雙向聚類協(xié)同過濾推薦算法。該算法首先從用戶維度和項(xiàng)目維度兩個(gè)方向分別進(jìn)行屬性聚類，然后在目標(biāo)用戶和目標(biāo)項(xiàng)目所在類簇中分別使用改進(jìn)后的相似度計(jì)算方法進(jìn)行協(xié)同過濾推薦，最后通過平衡因子綜合預(yù)測(cè)評(píng)分并形成最終推薦列表。在MovieLens公開數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)，結(jié)果表明，該算法（DCF）相比傳統(tǒng)協(xié)同過濾推薦算法（TCF）、基于用戶聚類的協(xié)同過濾推薦算法（UCF）以及基于項(xiàng)目聚類的協(xié)同過濾推薦算法（ICF），在平均絕對(duì)誤差上分別降低了16%、8.1%、7.5%，有效提高了推薦精度。

關(guān)鍵詞：協(xié)同過濾推薦算法;數(shù)據(jù)稀疏性;聚類;推薦系統(tǒng)

DOI：10. 11907/rjdk. 191963 開放科學(xué)（資源服務(wù)）標(biāo)識(shí)碼（OSID）：

中圖分類號(hào)：TP312文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：1672-7800（2020）005-0078-05

0 引言

隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展，各種信息呈爆炸式增長(zhǎng)，人類進(jìn)入信息超載時(shí)代。面對(duì)海量信息，如何從中找到自己想要的內(nèi)容成為一個(gè)亟需解決的問題。目前人們可通過搜索引擎尋找自己感興趣的內(nèi)容，從一定程度上解決了信息超載問題，但搜索引擎仍不能完全滿足人們的個(gè)性化需求，存在較大局限性，因此推薦系統(tǒng)[1]應(yīng)運(yùn)而生。推薦系統(tǒng)作為一種有效的信息過濾手段，是解決信息超載問題及實(shí)現(xiàn)個(gè)性化推薦的重要方式。

推薦系統(tǒng)的核心內(nèi)容是推薦算法，常用推薦算法有基于協(xié)同過濾的推薦算法、基于內(nèi)容的推薦算法與混合推薦算法[2-3]。其中協(xié)同過濾（Collaborative-Filtering，CF）推薦算法應(yīng)用最為廣泛，根據(jù)用戶歷史行為信息即可完成推薦。協(xié)同過濾推薦算法根據(jù)對(duì)象不同可分為兩類：基于用戶或基于項(xiàng)目的協(xié)同過濾[4]。其中，基于用戶的協(xié)同過濾是通過尋找目標(biāo)用戶的相似用戶，將相似用戶的相關(guān)喜好推薦給目標(biāo)用戶;基于項(xiàng)目的協(xié)同過濾是通過計(jì)算項(xiàng)目間的相似度，將相似項(xiàng)目推薦給喜歡當(dāng)前項(xiàng)目的用戶[5]。其共同特點(diǎn)是計(jì)算用戶或項(xiàng)目之間的相似度，因此相似度計(jì)算在協(xié)同過濾推薦中起著至關(guān)重要的作用。但是隨著大數(shù)據(jù)時(shí)代的到來，傳統(tǒng)協(xié)同過濾推薦算法難以解決大數(shù)據(jù)環(huán)境帶來的數(shù)據(jù)稀疏性、計(jì)算復(fù)雜性等問題[6]。

針對(duì)以上問題，研究人員提出了一系列解決方案。例如，胡朝舉[7]、許智宏等[8]將基于用戶的模糊聚類應(yīng)用到協(xié)同過濾推薦算法中，將用戶劃分到不同用戶簇中，使同一簇中用戶相似度最高，并在同一簇中進(jìn)行協(xié)同過濾推薦。聚類的引入降低了數(shù)據(jù)稀疏性和計(jì)算復(fù)雜性，并提高了推薦精度;張林等[9]將基于項(xiàng)目的聚類思想引入?yún)f(xié)同過濾推薦算法中，充分挖掘用戶對(duì)項(xiàng)目類的興趣度以及項(xiàng)目在類中的權(quán)重關(guān)系，提高了推薦效果。然而，以上基于聚類的協(xié)同過濾推薦算法都只考慮了用戶屬性或項(xiàng)目屬性單方面聚類對(duì)推薦的影響，而沒有同時(shí)考慮用戶屬性和項(xiàng)目屬性雙向聚類對(duì)推薦結(jié)果的影響。還有一些學(xué)者為提高推薦精度，將研究方向放在對(duì)相似度的改進(jìn)上。如任看看等[10]對(duì)Jaccard相似性進(jìn)行改進(jìn)，在相似度計(jì)算中充分考慮共同評(píng)分項(xiàng)與所有評(píng)分項(xiàng)之間的關(guān)系，以及用戶評(píng)分差異對(duì)相似度計(jì)算的影響，最終得到較為精確的推薦結(jié)果;孟俊才等[11]在相似度計(jì)算中提出平均分懲罰機(jī)制和共同評(píng)分項(xiàng)懲罰機(jī)制，對(duì)缺失的項(xiàng)目評(píng)分進(jìn)行計(jì)算，提高了推薦準(zhǔn)確性。但在傳統(tǒng)相似度計(jì)算方法中，通常只考慮評(píng)分值或評(píng)分項(xiàng)單方面對(duì)相似度計(jì)算造成的影響，該方式顯然是片面的，無法準(zhǔn)確描述出其之間的相似關(guān)系。因此，本文首先對(duì)用戶屬性和項(xiàng)目屬性分別進(jìn)行聚類分析，然后在相應(yīng)類簇中使用改進(jìn)后的相似度計(jì)算方法對(duì)二者分別進(jìn)行預(yù)測(cè)評(píng)分，最后通過平衡因子綜合預(yù)測(cè)評(píng)分，并形成最終推薦列表。實(shí)驗(yàn)結(jié)果表明，該算法降低了數(shù)據(jù)稀疏性和計(jì)算復(fù)雜性，并提高了推薦精度。

1 傳統(tǒng)協(xié)同過濾推薦算法

傳統(tǒng)協(xié)同過濾推薦算法[12]是指根據(jù)數(shù)據(jù)集構(gòu)建用戶—項(xiàng)目評(píng)分矩陣，計(jì)算目標(biāo)用戶與其他用戶之間的相似度，并根據(jù)相似度尋找最近鄰居集合，最終為目標(biāo)用戶預(yù)測(cè)評(píng)分產(chǎn)生推薦列表的過程。其實(shí)現(xiàn)過程可分為如下3個(gè)步驟：

1.1 用戶—項(xiàng)目評(píng)分矩陣構(gòu)建

根據(jù)用戶對(duì)項(xiàng)目的評(píng)分信息能夠構(gòu)建出用戶—項(xiàng)目評(píng)分矩陣[Rm×n]，如表1所示。其中m行、n列分別表示用戶數(shù)和項(xiàng)目數(shù)，矩陣值[Rm×n]表示某個(gè)用戶對(duì)某項(xiàng)目的評(píng)分值，評(píng)分值通常與評(píng)分項(xiàng)目類別有關(guān)。例如在電影推薦中，評(píng)分值通常用整數(shù)表示，范圍是1～5分，當(dāng)沒有評(píng)分信息時(shí)用0填充。

1.2 尋找最近鄰居

尋找最近鄰居是指通過計(jì)算用戶或項(xiàng)目之間的相似度，選取與目標(biāo)用戶相似度最大的N個(gè)用戶作為目標(biāo)用戶的最近鄰居。其中相似度計(jì)算是協(xié)同過濾算法最核心的內(nèi)容，目前廣泛使用的相似度計(jì)算方法有余弦相似性、Jaccard相似性、Pearson相似性，其中最常用的是Jaccard相似性和Pearson相似性[13]。

Jaccard相似性：Jaccard相似性通常表示為樣本集合中公共部分在所有樣本集合中所占比重，在推薦算法中兩個(gè)用戶的相似度計(jì)算公式如式（1）所示。

1.3 預(yù)測(cè)評(píng)分產(chǎn)生推薦

根據(jù)前面得到鄰居用戶對(duì)目標(biāo)項(xiàng)目的評(píng)分，預(yù)測(cè)目標(biāo)用戶對(duì)該項(xiàng)目的評(píng)分值，產(chǎn)生最終推薦列表。其計(jì)算公式如式（3）所示。

其中，[Pu，i]表示目標(biāo)用戶[u]對(duì)項(xiàng)目[i]的預(yù)測(cè)評(píng)分值，[Ru]、[Rv]表示用戶[u]、[v]對(duì)項(xiàng)目的平均評(píng)分值，[Rv，i]表示目標(biāo)用戶[u]最近鄰居集中用戶[v]對(duì)項(xiàng)目[i]的評(píng)分，[N]表示目標(biāo)用戶最近鄰居的用戶個(gè)數(shù)。

通過以上對(duì)傳統(tǒng)協(xié)同過濾推薦算法的分析可知，相似度計(jì)算在推薦過程中起著至關(guān)重要的作用，并且傳統(tǒng)協(xié)同過濾推薦算法中并沒有考慮用戶屬性和項(xiàng)目屬性聚類對(duì)相似度計(jì)算的影響。因此，本文提出一種基于用戶屬性和項(xiàng)目屬性雙向聚類及改進(jìn)相似度計(jì)算的協(xié)同過濾推薦算法。

2 雙向聚類協(xié)同過濾推薦算法

2.1 基于用戶與項(xiàng)目的屬性聚類

在大數(shù)據(jù)背景下，由于用戶對(duì)項(xiàng)目的評(píng)分?jǐn)?shù)據(jù)過少，導(dǎo)致用戶—項(xiàng)目評(píng)分矩陣過于稀疏，從而影響了用戶或項(xiàng)目相似度計(jì)算的精確度。同時(shí)隨著用戶和項(xiàng)目規(guī)模的不斷擴(kuò)大，其計(jì)算復(fù)雜度也在不斷增加，對(duì)于具有m個(gè)用戶、n個(gè)項(xiàng)目的用戶—項(xiàng)目評(píng)分矩陣而言，傳統(tǒng)協(xié)同過濾推薦算法的時(shí)間復(fù)雜度為[O（n*m*m）][14]。因此，為了降低數(shù)據(jù)稀疏性與計(jì)算復(fù)雜性，利用聚類技術(shù)對(duì)原始數(shù)據(jù)進(jìn)行聚類預(yù)處理是優(yōu)化推薦結(jié)果的常用策略之一。通過聚類技術(shù)將用戶和項(xiàng)目根據(jù)屬性信息分別聚類到若干個(gè)類簇中，使得同一類簇中的用戶或項(xiàng)目相似度最高，而不同類簇中的相似度最低，從而將最近鄰居選擇縮小到對(duì)應(yīng)類簇中，降低相似度計(jì)算的復(fù)雜性。

針對(duì)用戶屬性和項(xiàng)目屬性，在進(jìn)行聚類前，需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。例如在用戶屬性中考慮年齡、性別、職業(yè)等，將年齡定義為數(shù)值類型表示，性別用0或1分別表示女性或男性，職業(yè)定義為標(biāo)稱型數(shù)據(jù)，使用數(shù)值標(biāo)號(hào)的形式進(jìn)行標(biāo)準(zhǔn)化[15]。通過該形式的預(yù)處理，可得到用戶屬性表達(dá)形式為User={23，1，11}，即年齡為23歲從事軟件開發(fā)的男性。同理可得項(xiàng)目屬性標(biāo)準(zhǔn)化處理后的表達(dá)形式。

傳統(tǒng)基于用戶或基于項(xiàng)目聚類的協(xié)同過濾推薦算法，僅從某個(gè)方向進(jìn)行單向聚類，在一定程度上降低了數(shù)據(jù)稀疏性對(duì)相似度計(jì)算的影響，但這種考慮是不夠全面的。為了解決這一問題，本文提出基于雙向的屬性聚類分析，分別從用戶維度和項(xiàng)目維度兩個(gè)方向進(jìn)行屬性聚類，然后分別進(jìn)行協(xié)同過濾推薦，從而進(jìn)一步提高推薦精準(zhǔn)度。本文采用使用廣泛且計(jì)算簡(jiǎn)單的K-means聚類算法，分別從用戶和項(xiàng)目?jī)蓚€(gè)維度進(jìn)行聚類。K-means聚類[15]基本思想是首先在數(shù)據(jù)源中選擇K個(gè)點(diǎn)作為初始聚類中心，然后計(jì)算數(shù)據(jù)源中其它點(diǎn)到所有初始聚類中心的距離，將距離近的用戶劃分到對(duì)應(yīng)簇中，計(jì)算簇中所有元素平均值作為當(dāng)前簇新的聚類中心，如此迭代，直到所有簇的聚類中心不再變化，輸出聚類后的結(jié)果。該算法時(shí)間復(fù)雜度為[O（m*k*t）]，其中m代表數(shù)據(jù)源中的元素個(gè)數(shù)，k代表聚類中心個(gè)數(shù)，t代表迭代次數(shù)[15]。基于用戶的K-means聚類算法流程如圖1所示，同理可得基于項(xiàng)目的K-means聚類。

2.2 相似度計(jì)算方法改進(jìn)

由于相似度計(jì)算在推薦算法中的核心地位，其計(jì)算準(zhǔn)確性將直接影響推薦質(zhì)量。傳統(tǒng)Pearson相似性是根據(jù)兩個(gè)用戶共同評(píng)分項(xiàng)目的集合計(jì)算不同用戶之間的差異[16-17]，在計(jì)算兩個(gè)用戶相似度時(shí)忽略了平均值差異，并且沒有考慮用戶對(duì)一些相同項(xiàng)目評(píng)分所占比重對(duì)相似度計(jì)算的影響，從而影響了最終推薦結(jié)果。例如用戶A、B共同購(gòu)買了10件商品，但他們沒有給出相似評(píng)分，用戶A、C共同購(gòu)買了3件商品，但他們給出了相同或相似評(píng)分。通過Pearson相似性計(jì)算，A、B之間的相似度小于A、C之間的相似度，而事實(shí)上A、B的相似度明顯大于A、C的相似度，在需求比較嚴(yán)謹(jǐn)?shù)那闆r下應(yīng)該避免此類問題產(chǎn)生。傳統(tǒng)Jaccard相似性主要根據(jù)用戶共同評(píng)分項(xiàng)目在所有評(píng)分項(xiàng)目中所占比重計(jì)算相似度，并沒有考慮用戶實(shí)際評(píng)分值對(duì)相似度計(jì)算的影響。

2.3 預(yù)測(cè)評(píng)分產(chǎn)生推薦

通過改進(jìn)相似度計(jì)算，得到目標(biāo)用戶的最近鄰居集合，并據(jù)此預(yù)測(cè)目標(biāo)用戶對(duì)未評(píng)分項(xiàng)的評(píng)分，最后進(jìn)行個(gè)性化推薦。利用上述改進(jìn)的相似度計(jì)算方法，本文將綜合用戶和項(xiàng)目?jī)蓚€(gè)維度的協(xié)同過濾，在兩個(gè)方向進(jìn)行預(yù)測(cè)評(píng)分，然后通過平衡因子綜合預(yù)測(cè)評(píng)分，形成最終推薦列表，如式（6）所示。

其中，[Pu]表示在用戶維度進(jìn)行K-means聚類后的預(yù)測(cè)評(píng)分，[Pi]表示在項(xiàng)目維度進(jìn)行K-means聚類后的預(yù)測(cè)評(píng)分，[λ（0<λ<1）]為平衡因子，通過上式可得到綜合的預(yù)測(cè)評(píng)分[P]。該公式具體含義是從用戶和項(xiàng)目?jī)蓚€(gè)方向進(jìn)行預(yù)測(cè)評(píng)分，然后加權(quán)求和，通過動(dòng)態(tài)調(diào)整[λ]的值，以平衡用戶和項(xiàng)目?jī)蓚€(gè)方向?qū)︻A(yù)測(cè)評(píng)分的影響。通過上式可知，當(dāng)[λ]=1時(shí)，變?yōu)閷?duì)用戶維度單項(xiàng)聚類的協(xié)同過濾推薦，當(dāng)[λ]=0時(shí)，變?yōu)閷?duì)項(xiàng)目維度單項(xiàng)聚類的協(xié)同過濾推薦。實(shí)際應(yīng)用中應(yīng)該動(dòng)態(tài)調(diào)整[λ]的值，同時(shí)考慮兩個(gè)維度的預(yù)測(cè)值，使綜合預(yù)測(cè)評(píng)分獲得最優(yōu)解，最終產(chǎn)生精準(zhǔn)推薦。

2.4 改進(jìn)后算法描述

本文提出一種基于雙向聚類的協(xié)同過濾推薦算法，具體過程如下：首先通過用戶歷史行為數(shù)據(jù)構(gòu)建用戶—項(xiàng)目評(píng)分矩陣，其次從用戶和項(xiàng)目?jī)蓚€(gè)維度分別使用K-means聚類算法進(jìn)行用戶聚類和項(xiàng)目聚類，然后使用改進(jìn)的相似度計(jì)算方法分別計(jì)算兩個(gè)維度的預(yù)測(cè)評(píng)分，最后通過平衡因子動(dòng)態(tài)調(diào)整綜合預(yù)測(cè)評(píng)分，并產(chǎn)生推薦列表。具體推薦流程如圖2所示。

3 實(shí)驗(yàn)與分析

3.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)估指標(biāo)

本文采用美國(guó)明尼蘇達(dá)大學(xué)GroupLens實(shí)驗(yàn)室收集整理的MovieLens公開電影評(píng)分?jǐn)?shù)據(jù)集，該數(shù)據(jù)集包含了用戶屬性信息、電影屬性信息、用戶對(duì)電影評(píng)分信息等。實(shí)驗(yàn)所用評(píng)分信息包含943名用戶對(duì)1 682部電影產(chǎn)生的100 000條評(píng)分記錄，其中每位用戶至少對(duì)其中20部電影進(jìn)行了打分，評(píng)分范圍為1～5分，評(píng)分越高表示用戶對(duì)該電影喜愛程度越高。為驗(yàn)證本文算法的優(yōu)越性，將訓(xùn)練集和測(cè)試集比例設(shè)為4∶1，進(jìn)行交叉重復(fù)實(shí)驗(yàn)，訓(xùn)練集用于訓(xùn)練算法中的相關(guān)參數(shù)，測(cè)試集用于驗(yàn)證算法準(zhǔn)確性。

在推薦系統(tǒng)中評(píng)價(jià)推薦結(jié)果的指標(biāo)有多種，其中廣泛使用的是平均絕對(duì)誤差MAE（Mean AbsoluteError），其是通過計(jì)算預(yù)測(cè)值與實(shí)際值之間的平均絕對(duì)誤差得到的，平均絕對(duì)誤差的值越小，表示推薦結(jié)果越好[18-20]。若用戶預(yù)測(cè)評(píng)分集合為[p={p1，p2，？，pn}]，用戶實(shí)際評(píng)分集合為[q={q1，][q2，？，qn}]，則MAE表達(dá)式如式（7）所示。

3.2 實(shí)驗(yàn)方案與結(jié)果分析

本文通過3個(gè)實(shí)驗(yàn)方案驗(yàn)證提出算法的優(yōu)越性，通過前兩個(gè)實(shí)驗(yàn)動(dòng)態(tài)調(diào)整聚類中心K和平衡因子[λ]，使其達(dá)到最佳推薦效果。在最佳參數(shù)條件下，驗(yàn)證本文算法相比傳統(tǒng)協(xié)同過濾推薦算法的優(yōu)越性。

實(shí)驗(yàn)1：在基于用戶或基于項(xiàng)目的K-means聚類協(xié)同過濾推薦算法中，選用不同K值產(chǎn)生的聚類效果是不一樣的，最終導(dǎo)致推薦結(jié)果也不同。為了驗(yàn)證不同K值對(duì)推薦結(jié)果的影響，本文通過實(shí)驗(yàn)動(dòng)態(tài)調(diào)整K值，選擇最佳參數(shù)。實(shí)驗(yàn)結(jié)果如圖3、圖4所示。

通過實(shí)驗(yàn)可以看出，聚類中心K的選擇對(duì)推薦結(jié)果有著直接影響，過多或過少的聚類數(shù)目都會(huì)引起MAE值升高。從圖中可以看到，當(dāng)K=10時(shí)，基于用戶聚類的協(xié)同過濾推薦達(dá)到最佳效果，當(dāng)K=30時(shí)，基于項(xiàng)目聚類的協(xié)同過濾推薦達(dá)到最佳效果。

實(shí)驗(yàn)2：平衡因子是確定基于用戶和項(xiàng)目雙向聚類預(yù)測(cè)評(píng)分，綜合獲取最終推薦的重要因素。因此，本文選取[λ]為0.1～0.9之間的數(shù)值，通過綜合評(píng)估獲取最佳參數(shù)。實(shí)驗(yàn)中選取的聚類數(shù)目分別為K=10和K=30，最終得到的實(shí)驗(yàn)結(jié)果如圖5所示。

通過以上實(shí)驗(yàn)可以看到，當(dāng)[λ]=0.4時(shí)MAE值最小，此時(shí)協(xié)同過濾推薦達(dá)到最佳效果，因此將[λ]的值設(shè)為0.4。

實(shí)驗(yàn)3：為了驗(yàn)證雙向聚類協(xié)同過濾推薦算法的精準(zhǔn)度，將本文算法命名為DCF，與其它3種算法進(jìn)行對(duì)比實(shí)驗(yàn)。3種算法分別為傳統(tǒng)協(xié)同過濾推薦算法TCF、基于用戶聚類的改進(jìn)相似度協(xié)同過濾推薦算法UCF、基于項(xiàng)目聚類的改進(jìn)相似度協(xié)同過濾推薦算法ICF，實(shí)驗(yàn)結(jié)果如圖6所示。

通過以上實(shí)驗(yàn)可以看出，本文提出算法的MAE值在全局范圍內(nèi)明顯小于其它3種協(xié)同過濾推薦算法，其中傳統(tǒng)協(xié)同過濾推薦算法的MAE值最大，而基于用戶或基于項(xiàng)目聚類的改進(jìn)相似度協(xié)同過濾推薦算法MAE值略小，其兩者之間相差不大。在數(shù)值方面，基于雙向聚類的協(xié)同過濾推薦算法相比傳統(tǒng)協(xié)同過濾推薦算法的平均絕對(duì)誤差降低了16%，相比基于用戶聚類的協(xié)同過濾推薦算法降低了8.1%，相比基于項(xiàng)目聚類的協(xié)同過濾推薦算法降低了7.5%，從而證明了本文提出雙向聚類協(xié)同過濾推薦算法的準(zhǔn)確性。

4 結(jié)語

針對(duì)傳統(tǒng)協(xié)同過濾推薦算法在大數(shù)據(jù)環(huán)境下存在的數(shù)據(jù)稀疏性、計(jì)算復(fù)雜性等問題，提出一種基于雙向聚類的協(xié)同過濾推薦算法。該算法首先從用戶維度和項(xiàng)目維度兩個(gè)方向分別進(jìn)行屬性聚類，然后利用改進(jìn)的相似度計(jì)算方法分別產(chǎn)生各自的預(yù)測(cè)評(píng)分，通過平衡因子綜合預(yù)測(cè)評(píng)分形成最終推薦列表。最后通過實(shí)驗(yàn)得出，本文提出的推薦算法相比傳統(tǒng)協(xié)同過濾推薦算法的平均絕對(duì)誤差降低了16%，提高了推薦精度。然而，該算法雖然在很大程度上提高了推薦精度，但仍然存在一定提升空間，后續(xù)研究還可以考慮其它聚類算法對(duì)推薦結(jié)果的影響等。

參考文獻(xiàn)：

[1] SCHAFER J B，KONSTAN J A，RIEDL J. Recommender systems in E-Commerce[C]. In：ACM Conference on Electronic Commerce（EC99），1999：158-166.

[2] 黃立威，江碧濤，呂守業(yè)，等. 基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 計(jì)算機(jī)學(xué)報(bào)，2018，41（7）：1619-1647.

[3] 孫輝，馬躍，楊海波，等. 一種相似度改進(jìn)的用戶聚類協(xié)同過濾推薦算法[J]. 小型微型計(jì)算機(jī)系統(tǒng)，2014，35（9）：1967-1970.

[4] 王鵬，王晶晶，俞能海. 基于核方法的User-Based協(xié)同過濾推薦算法[J]. 計(jì)算機(jī)研究與發(fā)展，2013，50（7）：1444-1451.

[5] 關(guān)志芳，孟海東. 融合用戶聚類與項(xiàng)目聚類的加權(quán)Slope One算法[J]. 控制工程，2018，25（7）：1297-1302.

[6] 楊豐瑞，鄭云俊，張昌. 結(jié)合概率矩陣分解的混合型推薦算法[J]. 計(jì)算機(jī)應(yīng)用，2018，38（3）：644-649.

[7] 胡朝舉，孫克逆. 基于用戶模糊聚類的個(gè)性化推薦研究[J]. 軟件導(dǎo)刊，2018，17（2）：31-34.

[8] 許智宏，田雨，閆文杰，等. 基于模糊聚類和改進(jìn)混合蛙跳的協(xié)同過濾推薦[J]. 計(jì)算機(jī)應(yīng)用研究，2018，35（10）：2908-2911.

[9] 張林，王曉東，姚宇. 基于項(xiàng)目聚類和時(shí)間因素改進(jìn)的推薦算法[J]. 計(jì)算機(jī)應(yīng)用，2016，36（S2）：235-238.

[10] 任看看，錢雪忠. 協(xié)同過濾算法中的用戶相似性度量方法研究[J]. 計(jì)算機(jī)工程，2015，41（8）：18-22，31.

[11] 孟俊才，李存志. 基于改進(jìn)相似度計(jì)算方法的協(xié)同過濾算法[J]. 電子技術(shù)與軟件工程，2018（24）：151-152.

[12] 王巧，謝穎華，于世彩. 結(jié)合用戶聚類和項(xiàng)目類型的協(xié)同過濾算法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用，2016，25（12）：132-137.

[13] 黃正. 面向數(shù)據(jù)稀疏的協(xié)同過濾推薦算法研究與優(yōu)化[D]. 廣州：華南理工大學(xué)，2012.

[14] 項(xiàng)亮. 推薦系統(tǒng)實(shí)戰(zhàn)[M]. 北京：人民郵電出版社，2012.

[15] 申晉祥，鮑美英. 基于用戶聚類與項(xiàng)目劃分的優(yōu)化推薦算法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用，2019，28（6）：159-164.

[16] 于金霞，臧利明，王俊峰，等. 一種改進(jìn)相似度的協(xié)同過濾算法[J]. 河南理工大學(xué)學(xué)報(bào)：自然科學(xué)版，2019，38（2）：116-121.

[17] 李榮，李明奇，郭文強(qiáng). 基于改進(jìn)相似度的協(xié)同過濾算法研究[J]. ?計(jì)算機(jī)科學(xué)，2016，43（12）： 206-208，240

[18] WEI Z. Optimization collaborative filtering recommendation algorithm based on ratings consistent[C]. The Institute of Electrical and Electronics Engineers，IEEE Beijing，2016：1055-1058.

[19] PAPAGELIS M，PLEXOUSAKIS D. Qualitative analysis of user- based and item-based prediction algorithms for recommendation agents[J]. Engineering Applications of Artificial Intelligence，2005， 18（7）：781-789.

[20] 翁小蘭，王志堅(jiān). 協(xié)同過濾推薦算法研究進(jìn)展[J]. 計(jì)算機(jī)工程與應(yīng)用，2018，54（1）：25-31.

（責(zé)任編輯：黃健）

軟件導(dǎo)刊2020年5期

軟件導(dǎo)刊的其它文章: 教育大數(shù)據(jù)價(jià)值體現(xiàn)、問題反思與發(fā)展路徑; 基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)算法綜述; 局部社區(qū)發(fā)現(xiàn)算法研究綜述; 大學(xué)生計(jì)算思維能力培養(yǎng)水平實(shí)證研究; UML課程案例驅(qū)動(dòng)教學(xué)研究; “使用與滿足理論”視角下教學(xué)微視頻設(shè)計(jì)