999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶聚類的圖書協同推薦算法研究

2020-05-13 14:02:19楊彥榮張瑩
科技資訊 2020年9期

楊彥榮 張瑩

摘? 要:針對協同過濾推薦算法中因圖書評分數據稀疏,導致推薦質量和推薦效率低的問題,提出結合用戶聚類的圖書協同過濾推薦算法。首先將用戶身份特征數據和行為數據進行向量化表示,并利用K-means聚類算法進行用戶聚類成為不同的類別;其次計算目標用戶與各類別的距離,并選擇最近距離的類別作為目標用戶的檢索空間;最后,從檢索空間中通過相似度計算確定目標用戶的最近鄰居,在此基礎上產生推薦列表。實驗結果表明,所提算法能夠有效提高推薦精度,降低推薦所耗時長。

關鍵詞:推薦系統? 協同過濾? 用戶聚類? K-means

中圖分類號:TP391 ? ?文獻標識碼:A 文章編號:1672-3791(2020)03(c)-0198-02

隨著網絡技術的進步和信息化的推進,數字資源得到了迅速發展,高校圖書館的資源數據量呈爆炸式增長,浩瀚如煙的數字資源使得用戶產生了信息迷航。海量文獻數據所造成的“信息過載”使得信息檢索人員尋找對自己有用的文獻變得越發困難。個性化推薦是緩解信息過載問題的最有效的方法之一,此技術能夠對用戶的歷史行為信息進行提取,建立用戶偏好模型,并依此模型向目標用戶推薦符合用戶期望的文獻。

推薦算法是推薦系統中核心部分,決定著推薦系統的性能優劣,目前應用比較多的算法包括基于內容、基于關聯規則、基于協同過濾以及混合推薦等。然而應用最多、最廣的是協同過濾推薦[1-2]。協同過濾算法又可分為基于用戶和基于項目的協同過濾算法。用戶協同合作是基于用戶協同過濾的核心思想,通過用戶相似度計算找到與目標用戶興趣相似的用戶集合,再在這個集合中搜尋用戶喜好的,且目標用戶沒有評分過的物品,通過預測評分將評分高的物品推薦給目標用戶。預測評分依據用戶相似群體的評分產生,用戶評分數據稀疏性是該類數據的一大特點,從而導致以用戶評分數據為依據的協同推薦算法很多時候推薦結果不理想。該文在基于用戶協同過濾的基礎上,將用戶聚類融合到協同推薦的過程中,在協同過濾推薦之前首先使用K-means聚類算法對用戶進行聚類,能夠一定程度上解決圖書用戶評分數據稀疏問題,同時目標用戶的檢索空間也縮小,從而評測評分的計算時間也降低了,進而提高了推薦算法的效率。

1? 基于用戶聚類的協同過濾推薦

1.1 聚類算法

數據挖掘的主要任務之一是聚類分析,它將物理或抽象對象的集合劃分成多個類簇,同一個簇中的對象彼此相似,不同簇中的對象彼此相異。在眾多的聚類算中最常用、最經典的是K-means聚類算法[3]。K-means聚類原理是:依據兩個對象的距離越大,相似度越小的準則,通過最小化誤差函數優化將所有對象劃分為K個簇,K為預先確定的常數。K-means聚類算法具有速度快、質量高、伸縮性好等優點,經常被應用到各種聚類任務中,其主要流程如下。

(1)在包括N個對象的數據集中隨機選擇K個對象作為聚類中心的初始值。

(2)通過距離公式對每個對象到聚類中心的距離進行計算,從中根據最近原則將對象依次分配到距離它最近的聚類中心存在簇中,計算誤差平方和準則函數E的值。

(3)設立新的聚類中心,通過計算各個簇中的所有對象的平均值作為各個簇的聚類中心,以此來得到誤差平方和準則函數E的值。

(4)把步驟(3)的E值同前一次計算E值來對比,假如兩個E值的差的絕對值小于等于之前設定好的閾值,則聚類的準則函數收斂,轉到步驟(5),否則轉到步驟(2)。

(5)輸出K個聚類。

1.2 協同過濾推薦算法

作為當前應用最廣泛的個性化推薦技術之一,協同過濾推薦算法在用戶行為中尋找特定模式,創建用戶特有的推薦內容。協同過濾本算法優點是無需了解領域知識,大多數情況推薦結果令人滿意,但也有結果缺乏解釋性的缺點?;谟脩舻膮f同過濾算法包含以下步驟。

(1)相似度計算構建目標用戶興趣相似的用戶集合,Pearson相關系數常用來計算兩個用戶之間的相似度,在Pearson基礎上引入用戶評分來計算用戶相似度[4]。目標用戶u與用戶v的相似度用Suv來表示,用戶u和v都評分過的共同項目集合用Iuv表示,目標用戶u和用戶v對物品i的評分用rui和rvi表示,表用戶u和用戶v所有評分的平均分用和表示。用戶相似度計算如式(1)所示。

(1)

(2)評分預測計算預測目標用戶對其沒有評價過文獻的評分,基于用戶相似集合通過評分預測來預測評分。

(2)

公式中,Pui是目標用戶u對物品i的評分預測,得出的P評分預測越高,目標用戶U感興趣的程度或者幾率就越高。

(3)最終按照評分的高低可以給予目標用戶TOPN的推薦列表。

1.3 基于用戶聚類的圖書協同過濾推薦

針對圖書用戶評分數據稀疏導致基于用戶協同推薦效率低的問題,在基于用戶協同過濾的基礎上,將用戶聚類融合到協同推薦的過程中,在協同過濾推薦之前首先使用K-means聚類算法對用戶進行聚類,將用戶劃分成不同的類別;然后計算目標用戶與各類別的距離,并選擇最近距離的類別作為目標用戶的檢索空間,與整個用戶空間相比目標用戶搜索空間大大縮減;最后在目標用戶的檢索空間中通過用戶相似度計算確定目標用戶的最近鄰居,在此基礎上產生推薦列表。

2? 實驗及分析

2.1 數據收集及數據預處理

該文實驗中以某高校圖書館圖書借閱數據為基礎,通過選擇借閱圖書數量超過20次的讀者產生的借閱記錄,并經清洗、集成和歸約等預處理形成實驗數據集,總共生成150000條評分的記錄,包含2350個用戶及3700本圖書和150000條評分的記錄作為實驗數據集,將數據集80%為訓練集,20%作為測試集。

用戶數據包括用戶固有特征數據以及用戶的借閱的圖書數據,數據有字符型、數值型,需要標準化預處理,同時為滿足聚類模型,需要用戶數據對進行預處理及向量特征表示過程如下。

(1)用戶身份屬性特征表示。通過數值符號將包括年齡、性別、職業、專業及年齡等用戶身份數據數字化,如將性別數據轉化為0和1,將專業、身份等數據轉化為數字,通過數字符號轉換形成如U1=(46,1,13,5)的用戶屬性向量,其表示為用戶是一個計算機學學院年齡為46歲,從事計算機教學的女教師。

(2)用戶行為特征表示。首先依據圖書的類別將每一本圖書映射成為一個對應類別位置為1,其他為0的向量,由于圖書有22個類別,因而圖書特征有22個維度;其次,將用戶所借閱圖書的向量進行累加,用圖書向量的累加向量表征用戶行為特征。

2.2 評價指標

該文采用推薦算法中常用的平均絕對偏差MAE、準確率和運行時間對預測精準度進行分析。MAE值表示將實際評分與目標用戶的預測評分的平均絕對偏差,MAE的值與推薦質量成反比,值越大表示推薦質量越低。

2.3 結果分析

通過多次實驗當聚類數目K=10時準確率最高,因此在該文的實驗種將用戶聚類數K設置為10,為了驗證文本方法在推薦中的優勢,分別采用推薦中常用的基于內容和基于用戶協同過濾推薦進行試驗,3種不同方法的MAE結果如表1所示。

從表1中可以看出,從實驗的對比結果可知,該文提出的推薦方法在平均絕對偏差和準確率方面都要優于其他兩種算法;同時相比基于用戶協同過濾推薦該文提出的方法運行時間有很大的提升,這是因為通過用戶聚類后,目標用戶的相似用戶搜索空間大大降低,使得推薦效率更高。

3? 結語

該文在分析傳統協同過濾算法的基礎上,針對協同過濾推薦算法中因圖書評分數據稀疏而導致推薦質量和推薦效率低的問題,提出基于用戶聚類的圖書協同過濾推薦算法。該算法結合用戶聚類來緩解評分數據稀疏問題以及縮減目標用戶的檢索空間以提高推薦的效率。首先分別用戶身份屬性數據和行為數據進行特性相量表示,并將兩種相量連接以此作為用戶的特征表示;在此基礎上采用K-means聚類算法對用戶進行類別劃分,將用戶劃分成不同的類別;然后計算目標用戶與各類別的距離,并選擇最近距離的類別作為目標用戶的檢索空間,從而大大縮減搜索空間以及時間;最后在目標用戶的檢索空間中通過用戶相似度計算確定目標用戶的最近鄰居,在此基礎上產生推薦列表。

參考文獻

[1] 郭曉慧.基于改進協同過濾的圖書推薦算法研究[J].情報探索,2018(1):34-36.

[2] 何明,孫望,肖潤,等.一種融合聚類與用戶興趣偏好的協同過濾推薦算法[J].計算機科學,2017,44(S2):391-396.

[3] 熊平,顧霄.基于屬性權重最優化的K-means聚類算法[J].微電子學與計算機,2014,31(4):40-43.

[4] 陳功平,王紅.改進Pearson相關系數的個性化推薦算法[J].山東農業大學學報,2016,47(6):941-942.

主站蜘蛛池模板: 午夜精品福利影院| 91毛片网| 国产午夜人做人免费视频中文| 婷婷五月在线视频| 性喷潮久久久久久久久| 国产精品伦视频观看免费| 日韩黄色大片免费看| 成人午夜免费视频| 精品视频91| 天天综合色网| 国产成人AV男人的天堂| 色综合激情网| 99久久99这里只有免费的精品| 456亚洲人成高清在线| 91小视频在线观看| 麻豆AV网站免费进入| 亚洲区一区| 狠狠色狠狠色综合久久第一次| 色综合中文综合网| 成人综合网址| 亚洲成在人线av品善网好看| 蝌蚪国产精品视频第一页| 性色一区| 久久久久亚洲Av片无码观看| 亚洲有无码中文网| 国产精品性| 日韩激情成人| 99视频在线观看免费| 精品久久人人爽人人玩人人妻| 天堂网亚洲系列亚洲系列| 四虎亚洲国产成人久久精品| 四虎亚洲精品| 免费一级成人毛片| 午夜一级做a爰片久久毛片| 日韩东京热无码人妻| 欧美一区二区人人喊爽| 成人在线欧美| 欧美国产日韩在线观看| 香蕉精品在线| 日本一区二区不卡视频| Jizz国产色系免费| 欧美日韩国产在线播放| 日韩色图区| 午夜日b视频| 制服丝袜在线视频香蕉| A级全黄试看30分钟小视频| 亚洲精品不卡午夜精品| 亚洲免费播放| 欧美综合一区二区三区| 人妻无码中文字幕一区二区三区| 亚洲精品视频免费| 制服丝袜一区| 日韩欧美国产中文| 老色鬼欧美精品| 欧美成人一区午夜福利在线| 亚洲天堂在线免费| 国产99热| 成人国产小视频| 91成人在线免费视频| 午夜影院a级片| 久久久久无码精品| 农村乱人伦一区二区| 亚洲手机在线| 伊人久久婷婷| 91色在线观看| 国产成人精品午夜视频'| 国产自无码视频在线观看| 亚洲午夜国产精品无卡| 日本爱爱精品一区二区| 久一在线视频| 久久香蕉国产线| 国产在线观看精品| 成色7777精品在线| 思思99思思久久最新精品| 久久婷婷综合色一区二区| 亚洲av无码片一区二区三区| 精品伊人久久久香线蕉 | 亚洲AV无码乱码在线观看代蜜桃| 国精品91人妻无码一区二区三区| 2020久久国产综合精品swag| 免费播放毛片| 性69交片免费看|