999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于協(xié)同過濾算法的高校圖書書目推薦系統(tǒng)設(shè)計

2023-01-30 13:40:16趙峰濤
微型電腦應用 2022年12期
關(guān)鍵詞:用戶模型系統(tǒng)

趙峰濤

(西安培華學院, 圖書館, 陜西, 西安 710125)

0 引言

互聯(lián)網(wǎng)時代,圖書無論是在種類上還是在數(shù)量上都呈現(xiàn)激增狀態(tài),高校學生在日常的學習過程中離不開圖書館的書本借閱,而傳統(tǒng)的借閱形式很難在數(shù)百萬冊的圖書中快速準確的找到目標種類,查找類似題材時更是需要耗費大量時間成本。傳統(tǒng)的檢索形式時間成本高、檢索效率低,已經(jīng)完全落后于時代。相較于傳統(tǒng)形式,智能化書目推薦系統(tǒng)可以通過學生偏好、興趣度等數(shù)據(jù)進行統(tǒng)計分析,從而有針對性的為讀者推薦相應書目,既節(jié)省時間又更為準確。

1 核心算法簡介

1.1 協(xié)同過濾算法

協(xié)同過濾算法主要是假設(shè)具有同樣或類似興趣點的用戶在需求上也存在相似性,通過分析用戶的歷史行為過濾篩選有用信息,利用近鄰技術(shù)獲取不同用戶或不同項目之間的相似性,采用權(quán)重加權(quán)平均分值預測目標偏好,從而進行智能推薦。

1.2 k近鄰搜索算法

近鄰檢索法是利用數(shù)據(jù)的相似性查找目標數(shù)據(jù),當目標數(shù)據(jù)為距離最近的前k個時則稱為k近鄰搜索法。相似性通常采用空間上的數(shù)據(jù)距離來進行表征,距離越近,則認為相似性越高。常用的包括歐氏距離、皮爾森積矩系數(shù)以及余弦相似性等。歐氏距離最直觀,但在受主觀影響大的評分時效果不佳;皮爾森積矩系數(shù)主要是反映線性變量的相關(guān)性;余弦相似度通常用向量之間的夾角來反映相似程度[1]。

2 圖書興趣度與圖書類型因子分析

2.1 學生對圖書的興趣度分析

高校圖書館中的圖書量遠遠多于學生量,針對這種用戶比項目少的情況,基于用戶的協(xié)同過濾算法更為適合。由于缺少用戶評分的渠道,因此引入借閱持續(xù)時長、借閱總次數(shù)以及續(xù)借次數(shù)作為影響用戶興趣的因子[2]。

(1)

(2) 借閱總次數(shù):被借次數(shù)越多,興趣越大。設(shè)借閱總次數(shù)為t,最大值為max,以最大值為基準劃分為5個級別:

like2=1,0

(2)

(3) 續(xù)借次數(shù):用戶感興趣才會續(xù)借,否則會及時歸還。將續(xù)借次數(shù)進行映射:

(3)

最終用戶對某一圖書的興趣度采用3個分量的平均值,即:

like=(like1+like2+like3)/3

(4)

2.2 基于類型因子計算權(quán)重

協(xié)同過濾法項目之間的權(quán)值是算法的核心,本研究采用中國圖書館分類號作為權(quán)值進行計算。根據(jù)中圖分類號,每本書都有唯一編號,從左到右通過數(shù)字、字母代表分類,其樹形結(jié)構(gòu)如圖1所示。

圖1 中圖分類樹

根據(jù)分類樹中的位置,兩本書之間的類型因子可以通過式(5)計算:

(5)

其中,height為分類樹高度,parent(i,j)為圖書i與j的父節(jié)點所處高度。

3 協(xié)同過濾推薦模型

3.1 模型建立流程

由于高校圖書管的圖書數(shù)量龐大,導致學生借閱圖書的關(guān)系矩陣特別稀疏,因此采用嵌入基于項目的協(xié)同過濾法與基于用戶的協(xié)同過濾法混合的形式,首先搜索近鄰用戶,然后通過圖書興趣度以及類型因子構(gòu)建推薦模型,整體流程如圖2所示。

圖2 協(xié)同過濾推薦模型建立流程

3.2 讀者特征提取

設(shè)n代表圖書類型,u(t)代表借閱頻次,則特征向量表示為U=(u(1),u(2),u(3),…,u(n)),將U作為讀者特征進行k近鄰檢索,v代表近鄰用戶,采用余弦定理計算用戶之間的相似度,將與目標距離最近的k個近鄰記作讀者集Uk[3]:

(6)

3.3 構(gòu)建協(xié)同過濾推薦模型

由于借閱關(guān)系矩陣稀疏,在計算用戶相似度時嵌入基于項目的協(xié)同過濾,采用這種混合協(xié)同過濾算法得出的評分彌補矩陣空缺。設(shè)Iu代表目標用戶u的待推薦項目集,Iv代表近鄰用戶v參與評分的項目集,對于Iu~Iv這部分項目,利用已參與評分的項目的加權(quán)平均得到的分數(shù)計算未評分的項目得分,從而計算得出目標用戶對這部分項目的評分。

(7)

4 高效圖書館書目推薦系統(tǒng)設(shè)計

4.1 學生需求分析

高校圖書館不僅是學生借閱圖書的場地,也是各類讀書小組、學術(shù)探討的重要活動場地。因此書目推薦系統(tǒng)的不僅要包括圖書檢索、自助借閱、超時扣費等基礎(chǔ)功能,還要提供圖書推薦、新書推薦、共同興趣好友推薦等輔助功能。利用原有的借閱數(shù)據(jù)庫獲取協(xié)同過濾推薦模型所需源數(shù)據(jù),采用Hadoop分布式框架增加運行效率,作為附加推薦功能的借閱系統(tǒng)為學生提供圖書管理與推薦工作。

4.2 系統(tǒng)整體結(jié)構(gòu)

由于推薦算法涉及輸入借閱記錄,需要從借閱數(shù)據(jù)庫提取數(shù)據(jù),因此采用與傳統(tǒng)業(yè)務分離的模式設(shè)計系統(tǒng)整體結(jié)構(gòu),主要包括數(shù)據(jù)層、預處理層、計算層、業(yè)務層以及展示層,整體結(jié)構(gòu)如圖3所示。

圖3 系統(tǒng)整體結(jié)構(gòu)

其中,數(shù)據(jù)層主要負責存儲借閱記錄,學生信息、圖書信息等基礎(chǔ)數(shù)據(jù);預處理層主要是剔除噪聲數(shù)據(jù),補充缺失數(shù)據(jù),將數(shù)據(jù)進行規(guī)范化格式轉(zhuǎn)換以利于計算;計算層作為推薦系統(tǒng)的核心模塊,利用MapReduce分布式框架并行運行關(guān)鍵算法,將運算結(jié)果存儲在數(shù)據(jù)層;業(yè)務層主要與數(shù)據(jù)層進行交互,封裝算法邏輯,分別處理借閱與推薦業(yè)務;展示層主要是通過圖形化界面為學生提供推薦書目。

4.3 功能模塊設(shè)計

根據(jù)學生的需求以及系統(tǒng)整體架構(gòu),將高校圖書館書目推薦系統(tǒng)劃分為前臺及后臺兩大核心功能,整體功能模塊組成如圖4所示。其中,

圖4 系統(tǒng)功能模塊

(1) 后臺管理:主要包括登錄管理、圖書管理、學生管理、公告管理、超期扣費、參數(shù)設(shè)置6個模塊。登錄管理模塊主要驗證用戶的賬號及密碼,確保權(quán)限;圖書管理模塊主要記錄圖書分類號、作者等基本信息;學生管理模塊負責學生帳號及基本信息管理;公告管理模塊實現(xiàn)管理員發(fā)布各項規(guī)定、時間表等信息;超期扣費模塊實現(xiàn)自主扣費;參數(shù)設(shè)置模塊由管理員進行參數(shù)管理[5]。

(2) 前臺展示:主要包括個性化圖書推薦、相同興趣好友推薦、新書推薦、借閱排行、系統(tǒng)公告、圖書搜索6個模塊。個性化圖書推薦展示根據(jù)協(xié)同過濾模型推薦的topN書目列表;新書推薦主要展示近期新增圖書;借閱排行展示按照借閱次數(shù)排序的列表;系統(tǒng)公告展示相關(guān)公告信息;圖書搜索模塊提供按照書名、作者、出版社等查詢條件的檢索查詢功能。

4.4 核心數(shù)據(jù)庫表

高校圖書館書目推薦系統(tǒng)中的推薦模型需要利用學生的借閱信息計算借閱持續(xù)時長、借閱總次數(shù)以及續(xù)借次數(shù),權(quán)值計算時涉及使用中圖分類號作為類型因子,因此系統(tǒng)的核心數(shù)據(jù)庫表需包括借閱記錄表、圖書信息表、興趣度記錄表、推薦書目表等。

(1) 借閱記錄表:主要包括學生姓名、學號、性別、學院、操作時間、圖書編號、圖書名稱、作者、isbn編號、操作類型等字段。其中操作類型包括借閱、歸還、續(xù)借三類。按年份進行分區(qū)存儲。

(2) 圖書信息表:主要包括圖書編號、中圖編號類型、圖書大類、類型名稱、圖書名稱、圖書類型、作者、出版社、出版年份、入館日期、位置、isbn編號等字段。其中中圖分類號采用“/”分隔,之前編號代表最小區(qū)分類型。

(3) 推薦好友表:主要包括學號、圖書編號、圖書名稱、興趣度、好友學號等字段。

(4) 推薦書目表:主要包括學號、圖書編號、圖書名稱、興趣度、作者、出版社等字段。

5 系統(tǒng)功能實例驗證

5.1 實例驗證過程

為驗證系統(tǒng)功能,選用國內(nèi)某大學圖書館的1 000名學生的實例借閱數(shù)據(jù)帶入設(shè)計的推薦模型進行實驗測試,設(shè)置服務器配置為8 G內(nèi)存,500 G硬盤,在Eclipse環(huán)境下利用Java語言編程,利用1 000名學生的實際借閱記錄54 w條作為實驗數(shù)據(jù),其中包括18個專業(yè)、22類圖書。統(tǒng)計不同類型圖書的借閱次數(shù)、時長、續(xù)借次數(shù),根據(jù)圖書興趣度模型計算,最終借閱頻次組成22維的圖書興趣數(shù)據(jù)表如表1所示(隨機截取了5位學生的記錄)。

表1 圖書借閱頻次即興趣度數(shù)據(jù)表

對得到的新數(shù)據(jù)表采用k近鄰搜索算法進行同類興趣同學的搜索,計算不同學生的近鄰用戶的余弦相似度,以學生J09240215為例,當k=5時,計算得到近鄰用戶相似度如表2所示。

表2 學生J09240215近鄰用戶相似度

5.2 推薦效果檢驗標準

由于借閱矩陣稀疏,采用推薦命中率評判推薦效果較難,因此本研究采用評價絕對誤差MAE衡量協(xié)同過濾推薦算法的實際效果,計算公式為

(8)

5.3 推薦書目效果

為了驗證模型推薦書目的實際效果,計算不同近鄰個數(shù)

k與不同推薦個數(shù)N的推薦絕對誤差MAE進行衡量,分別取k為10~80,N為10、15、20,將1 000名學生的借閱記錄代入系統(tǒng)模型,計算MAE值,得到結(jié)果如圖5所示。

圖5 不同k與N的推薦MAE值對比

由上圖可知k值過小則推薦效率降低,k值過大則算法運行負擔加重,當k值取10~50之間逐步增加時,推薦效果有顯著增強,當k值達到60以后,推薦效果不再顯著提升。而且,k值較少時,N的數(shù)量越小推薦效果越好。由此可知,當近鄰個數(shù)太少時,可推薦書目也很少,沒有包含目標用戶喜歡的大部分的書目,此時若推薦數(shù)量過多反而將用戶不喜歡的也加入了進去,反過來講,近鄰個數(shù)多則推薦數(shù)量多為好。因此建議近鄰個數(shù)k值選擇60以上,推薦數(shù)量N選擇20,此時誤差最小,推薦效果最好。

6 總結(jié)

本研究基于圖書興趣度排序構(gòu)建基于類型因子的協(xié)同過濾推薦模型,經(jīng)過實際借閱數(shù)據(jù)證明推薦效果隨著近鄰個數(shù)與推薦數(shù)量的變化有所不同,為高校圖書館的書目推薦提供了有實際意義的信息化方案。但目前模型采用的興趣度分量還比較少,后續(xù)如可以加入圖書標簽、文本摘要等信息則系統(tǒng)功能會更加完善,另外在圖書相似度算法方面還需進一步深入研究。

猜你喜歡
用戶模型系統(tǒng)
一半模型
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機系統(tǒng)
ZC系列無人機遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
主站蜘蛛池模板: 人与鲁专区| 91久久青青草原精品国产| 国产91丝袜在线播放动漫| 网友自拍视频精品区| 日本久久网站| 青青草原国产一区二区| 亚洲欧美成人网| 国产精品极品美女自在线网站| aⅴ免费在线观看| 日韩AV手机在线观看蜜芽| 中文无码精品A∨在线观看不卡 | 国产日韩欧美在线播放| 国产精品综合久久久| 日本精品一在线观看视频| 国产亚洲欧美在线人成aaaa| 婷婷色婷婷| 欧美午夜视频在线| 亚洲AⅤ无码国产精品| 在线国产毛片| 欧美日韩专区| 欧美激情网址| 国模在线视频一区二区三区| 欧美精品综合视频一区二区| 成年女人18毛片毛片免费| 欧美亚洲一区二区三区在线| 国产成人高清精品免费| 国产 在线视频无码| 日本91在线| 国产精品偷伦在线观看| a级毛片在线免费| 国产成人精品在线| 国产精品永久在线| 一级全黄毛片| 再看日本中文字幕在线观看| 久久综合九色综合97网| 国产亚卅精品无码| 欧美一级特黄aaaaaa在线看片| 久久久91人妻无码精品蜜桃HD| 在线一级毛片| 久久网欧美| 亚洲精品天堂自在久久77| 久久人妻系列无码一区| 欧美日韩一区二区在线免费观看 | 国产特级毛片| 人妻21p大胆| 一级不卡毛片| 国产亚洲精品91| 亚洲国产精品日韩专区AV| 国产乱人乱偷精品视频a人人澡| 午夜精品久久久久久久无码软件| 福利片91| 在线日本国产成人免费的| 99在线观看精品视频| 日韩成人高清无码| 亚洲精品天堂在线观看| 国产一二三区视频| 亚洲丝袜中文字幕| 国产99视频精品免费观看9e| 欧美日韩久久综合| 亚洲成人在线网| 国产一级裸网站| 欧美亚洲日韩不卡在线在线观看| 中国一级毛片免费观看| 一级毛片免费观看久| 白丝美女办公室高潮喷水视频| 99re免费视频| 最新国产高清在线| 一级黄色欧美| 国产免费久久精品99re不卡| 欧美成人精品高清在线下载| 白浆免费视频国产精品视频| 成人av专区精品无码国产 | 国产成人1024精品下载| 网友自拍视频精品区| www.精品国产| 中文字幕资源站| 国产主播一区二区三区| 久久精品欧美一区二区| 国产黄在线免费观看| 日韩小视频网站hq| 久久综合伊人77777| 综合亚洲色图|