999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于協(xié)同過濾算法的高校圖書館圖書推薦系統(tǒng)研究

2023-09-05 09:50:50楊玉枝
科學咨詢 2023年13期
關(guān)鍵詞:用戶評價

楊玉枝

(廣東嶺南職業(yè)技術(shù)學院圖書館,廣東廣州 510663)

一、背景

在當今世界,書籍的種類和數(shù)量急劇增加,高校學生難以準確、快速地找到自己喜歡的書籍。讀者在網(wǎng)上搜索書籍,往往會有數(shù)以千計的結(jié)果,因此,讀者要花大量的時間和精力來查找所需的書籍。此外,讀者的需求也是多種多樣的,不同專業(yè)、不同愛好的讀者的需求是不同的。在信息技術(shù)飛速發(fā)展的今天,高校圖書館要利用數(shù)據(jù)挖掘技術(shù)為讀者提供更好的服務。

圖書推薦系統(tǒng)主要是利用讀者信息、圖書信息、讀者歷史借閱等信息,對讀者的潛在需求進行預測,從而生成推薦結(jié)果,進而為讀者提供個性化服務。推薦算法主要有:內(nèi)容推薦算法、圖結(jié)構(gòu)推薦算法、數(shù)據(jù)挖掘推薦算法等。推薦算法的基礎是將自己感興趣的圖書推薦給讀者。協(xié)作篩選是目前應用最廣泛、效率最高的一種推薦方法[1]。本文旨在探討基于協(xié)同過濾算法的圖書推薦系統(tǒng)的建設,重點從其體系結(jié)構(gòu)、功能結(jié)構(gòu)、核心協(xié)同過濾算法等方面進行深入探討。圖書推薦系統(tǒng)的實現(xiàn)將有助于讀者更好地查找自己喜歡的書籍,從而更好地滿足讀者的個性化需求。

二、圖書推薦系統(tǒng)的體系結(jié)構(gòu)

本文介紹一種基于協(xié)同過濾算法的圖書推薦系統(tǒng),它由四個層面組成:表示層、Web服務層、應用服務層、數(shù)據(jù)庫服務層。

1.表示層:主要實現(xiàn)系統(tǒng)外人員與圖書推薦系統(tǒng)之間的交互,完成信息的輸入、輸出和顯示。

2.Web服務層:它的任務是處理來自圖書推薦系統(tǒng)表現(xiàn)層次的各類業(yè)務請求,并在處理完請求后發(fā)布相關(guān)信息。

3.應用服務層:主要承擔圖書推薦系統(tǒng)的業(yè)務和邏輯操作,并針對特定的業(yè)務提供多種Web服務。

4.數(shù)據(jù)服務層:主要承擔圖書推薦系統(tǒng)中各類數(shù)據(jù)的存儲、組織和管理等工作。

三、改進前的協(xié)同過濾算法

協(xié)作篩選算法主要是收集用戶的基本信息、借閱信息、評估信息,然后根據(jù)用戶信息的收集,建立用戶的評估矩陣,再利用評估矩陣計算用戶的相似性,得出被推薦用戶的鄰近集合,最后根據(jù)相鄰用戶的距離來進行推薦。協(xié)作篩選的推薦算法分為兩個方面。一是使用基于內(nèi)存的協(xié)作篩選方法,通過相似的統(tǒng)計方法來獲取相似的鄰集。二是使用基于模型的協(xié)作篩選算法,通過使用歷史資料建立推薦模型,并對其進行評估和完善,最終確定推薦結(jié)果。本文所述的兩種合作過濾算法均是以用戶為基礎進行協(xié)作過濾[2]。

(一)對用戶建模

筆者對用戶的相關(guān)數(shù)據(jù)進行了分析,得到用戶的評價矩陣R。這里m代表使用者數(shù)量,n代表被評價目標數(shù)量,rij代表使用者i在項目j上的得分。若得分為非數(shù)字類型,則可將其轉(zhuǎn)換成數(shù)值,則矩陣R可如下表達:

(二)生成最近鄰集

最近鄰集是一組用戶,其具有很高的相似性。我們可以利用用戶評估矩陣求出用戶間的相似度,從而獲得最相近的用戶群。產(chǎn)生最近矩陣的過程,實質(zhì)上就是利用R矩陣求出目標用戶U的相似性,并將使用者集合按遞減順序排列的過程,其計算方法為:1.余弦相似度的計算,當余弦數(shù)值增加時,相似度增加;2.皮爾森相關(guān)系數(shù)法,它克服余弦相似性法忽視用戶得分比例差異的缺點,使算法的相似性得到一定的改善;3.改進的余弦相似性計算方法,如關(guān)聯(lián)系數(shù)法,通過修改用戶的分數(shù),改善計算的相似性。我們在計算用戶的相似性之后,可以產(chǎn)生如下的相鄰關(guān)系:

1.將其他使用者與目標使用者的相似性按照先前的算法進行計算,篩選出相似性高于設定值(0.70)的使用者集合。2.將符合條件的使用者集合按照與目標使用者的相似性,按照遞減順序排列,選取最前面的N個使用者作為其最近的鄰接組。

(三)生成推薦結(jié)果

在公式(1)中,sim(i,j)代表使用者i和使用者j之間的相似性,Ri,d代表目標使用者的最近鄰集j對于某個項d的得分,以及使用者i和使用者j對于所有項的平均得分分別是Ri和Rj。盡管協(xié)同過濾算法已經(jīng)獲得業(yè)界的普遍認同,但是仍然存在以下問題。

1.評價數(shù)據(jù)的稀缺性問題,在用戶評價不高的情況下,推薦效果會受到較大的影響。2.在傳統(tǒng)的協(xié)同過濾方法中,用戶可以在不同的階段進行評價,其忽視用戶的興趣度隨著時間的推移而變化。3.傳統(tǒng)的協(xié)同過濾方法僅從用戶自身或項目自身的單個維度進行相似度的聚類,而忽視了用戶與目標之間的關(guān)聯(lián)性。4.忽視用戶的特征會對推薦結(jié)果造成一定的影響,不同特征的使用者可能會有不同的興趣,而特征相似的使用者也會有相似的愛好。因此,在生成使用者的最近鄰集時,我們要注意到使用者的特征,以便能提升推薦結(jié)果的品質(zhì)[3]。筆者主要針對用戶興趣度隨時間遷移、用戶與對象的關(guān)聯(lián)度、用戶特征等因素,提出一種基于用戶特征的協(xié)同過濾算法。

四、改進的協(xié)同過濾推薦算法

(一)從用戶興趣度隨時間遷移方面對算法進行改進

傳統(tǒng)的協(xié)作篩選方法沒有引入時間維度,只把各個階段的評估結(jié)果當作同等的權(quán)重,忽略了興趣隨著時間的流逝而逐漸減弱的特征。通常情況下,用戶的興趣會隨時間而變化,因此,從短期來看,用戶的早期評估在推薦算法中的比例要低一些,而近期的評估則要高一些。德國心理學家艾賓浩斯對時間與興趣之間的關(guān)系進行了分析,得出了一個結(jié)論:興趣是一種非線性的。我們能夠根據(jù)人們的興趣轉(zhuǎn)移規(guī)律提出一個基于時間的興趣度遷移函數(shù),如圖1所示。隨著時間的推移,用戶對該項目得分的權(quán)重值呈遞減趨勢,其變化趨勢是隨著時間的推移而變化的。Interest(u,t)是反映使用者最近評價的權(quán)重較大的非線性遞減函數(shù),其權(quán)重值通常為0~1。一般情況下,興趣的變化具有線性下降和指數(shù)下降的趨勢。

圖1 興趣度隨時間遷移函數(shù)

如圖1所示,根據(jù)興趣度隨時間遷移曲線,改進后的算法引入公式(2)考慮用戶興趣隨著時間變化對推薦結(jié)果的影響。

在(2)式中,D(u、i)代表使用者存取項的最近和最后的時間區(qū)間,m和n是不變的,并且隨著時間的推移,感興趣程度對推薦結(jié)果的影響可以由m和n的數(shù)值來控制。

(二)從用戶和對象相關(guān)度方面對算法進行改進

傳統(tǒng)的協(xié)同篩選算法忽略了用戶和對象的相關(guān)性對推薦結(jié)果的影響,僅考慮了用戶和對象個體的相似度,忽略了用戶和對象的內(nèi)在聯(lián)系。該算法將使用者u和對象i相關(guān)函數(shù)Relevance(u,i)用于考慮使用者對特定對象的興趣。

假設所有由使用者U評價的項是集Iu,且i與Iu中的項具有高度相似性,則使用者U感興趣的內(nèi)容有高度相似性,且使用者U感興趣的專案與使用者U的相似性較高,即i項對于生成用戶U的推薦結(jié)果有較大的參考意義。因此,我們可以定義Relevance(u,i)的功能,以評價在特定時期內(nèi)項i對使用者U的影響值,正如式(3):

在公式(3)中,sim(i,j)表示項目i和集合Iu中項目的相似性,j∈Iu,Σsim(i,j)表示i和集合Iu的總體相似度,Iu表示集合Iu中的項目數(shù)。改進后的算法引入用戶和對象相關(guān)度函數(shù)Relevance(u,i),根據(jù)特定用戶對某一項目的相關(guān)度推薦,也就是按照用戶對項目的興趣度賦予相應的權(quán)重值。

(三)從用戶特性方面對算法進行改進

不同功能的使用者會有不同的愛好,而擁有同樣功能的使用者也會有類似的愛好,所以在生成最近的鄰集時,使用者的特征是非常重要的。該方法可以構(gòu)造出一個特定的使用者,以幫助提升鄰近的建議的精確性[4]。一方面,不同專業(yè)的讀者所擁有的知識儲備也會影響到他們的學習興趣,例如,計算機專業(yè)的學生對信息技術(shù)的興趣更大,會計專業(yè)的學生對財務的興趣更大。同一領(lǐng)域的讀者對同一類別的圖書也會產(chǎn)生類似的興趣。因此,我們可以采用專業(yè)、年齡、性別等不同的用戶特性對算法進行優(yōu)化。

我們可以根據(jù)用戶的專業(yè)屬性對協(xié)同過濾算法進行改進,根據(jù)用戶的專業(yè)構(gòu)造一棵倒立的專業(yè)樹(見圖2)。

圖2 專業(yè)樹

如果專業(yè)樹中的專業(yè)m,n為根結(jié)點,則其高度為0。假設使用者i的專業(yè)是m,使用者j的專業(yè)是n,則使用者i與使用者j在專業(yè)特征方面的使用者相似性是Major(i,j),如計算式(4):

比如,一個使用者i的專業(yè)是馬克思,而使用者j的專業(yè)是知識論,他的公共最近的父系是哲學,高度是2,專業(yè)樹的高度H是4,則Major(i,j)的數(shù)值是0.5,即使用者與專業(yè)特征的相似性是0.5。

我們根據(jù)用戶性別特性對協(xié)同過濾算法進行改進,假定用戶i、j的性別分別為m、n,則用戶性別相似度Sex(i,j)可表示為:

協(xié)同過濾算法是基于使用者的年齡特征而進行的,假設使用者i是m,而使用者j是n,那么,我們可以將使用者的年齡相似性Age(i,j)表示為:

綜合考慮專業(yè)、性別及年齡特性,我們可以得出用戶特性相似度公式(7):

式(7)中,α和β都是一個小于1的正整數(shù),其功能是控制使用者的特征對使用者的相似性的影響。該算法的數(shù)值可以根據(jù)試驗數(shù)據(jù)進行優(yōu)化,得到最優(yōu)的建議。

(四)改進后的算法在個性化圖書推薦系統(tǒng)中的應用

本文提出了一種新的基于協(xié)同過濾的新算法,它可以分析讀者的專業(yè)、性別、年齡。根據(jù)用戶的特性相似度,我們可以很好地解決傳統(tǒng)算法所遇到的新的用戶問題[5]。圖3顯示了該算法的工作流程。

圖3 改進后算法的推薦流程

1.收集讀者數(shù)據(jù),包括讀者的基本數(shù)據(jù)以及讀者對借閱書籍的評價。2.基于讀者對借閱書籍的評價建立一個“讀者評價矩陣”。同時,基于讀者的基本信息產(chǎn)生一組讀者特征。3.讀者評價矩陣是基于讀者興趣的時間函數(shù)(式2)修改的,因此,在修改后的評價矩陣中,讀者的興趣會隨著時間的推移而改變。4.基于讀者對書籍的關(guān)聯(lián)函數(shù)(式3),計算出讀者對該書籍的感興趣程度,并基于該數(shù)值矩陣,計算出該用戶的相似性。同時,讀者特征相似性采用方程式(7)來計算。5.對讀者的相似性進行綜合運算,并產(chǎn)生與目標讀者的鄰近關(guān)系。6.基于所產(chǎn)生的讀者最近鄰區(qū)集合,對被評價對象的評價進行預測,從而得到一個推薦結(jié)果。

(五)試驗與分析

筆者選用的個性化圖書推薦系統(tǒng)包含了4 000位讀者對10 000冊書籍的評價,每位讀者對10冊以上的書籍進行評價。筆者將評價結(jié)果轉(zhuǎn)換成(01)上的數(shù)值,評分越高,表明讀者對該書籍的感興趣程度越高。其中,查準率公式(8)如下:

在(8)式中,Hits將正確的結(jié)果數(shù)推薦給讀者,以N代表讀者的全部評分,并根據(jù)讀者對書籍的評分計算出推薦書的正確率,如圖4所示。

圖4 算法改進前后查準率對比圖

實驗分析表明,采用傳統(tǒng)的協(xié)同過濾方法可以使推薦結(jié)果的準確率從70%提升到75%,從而使推薦效果得到顯著改善,這將能夠在一定程度上提高讀者的借閱率。

五、結(jié)束語

協(xié)同過濾算法是個性化推薦系統(tǒng)的基本算法,其在不同的個性化推薦方案中得到廣泛的應用。筆者在改進后的用戶協(xié)同過濾算法的基礎上,根據(jù)高校圖書館的實際情況和用戶輸出的數(shù)據(jù),利用多源數(shù)據(jù)的相似性權(quán)重以及時間衰減模型對上述問題進行改進,并取得了較好的效果。目前,高校圖書館中經(jīng)常會出現(xiàn)新的圖書,這些圖書沒有人借閱,導致出現(xiàn)圖書的冷啟動問題。因此,我們將協(xié)同過濾算法融入圖書館的圖書推薦中,將能夠更好地提高圖書的借閱率。

猜你喜歡
用戶評價
SBR改性瀝青的穩(wěn)定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
中藥治療室性早搏系統(tǒng)評價再評價
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
基于Moodle的學習評價
Camera360:拍出5億用戶
100萬用戶
如何獲取一億海外用戶
關(guān)于項目后評價中“專項”后評價的探討
主站蜘蛛池模板: 国产微拍一区二区三区四区| 国产精品污视频| 日本欧美一二三区色视频| 国产日韩AV高潮在线| 久久综合亚洲鲁鲁九月天| 最新国产成人剧情在线播放| 国产成人精彩在线视频50| 拍国产真实乱人偷精品| av在线无码浏览| 国产亚洲精久久久久久无码AV | 国产女人喷水视频| 国产香蕉国产精品偷在线观看| 国产区在线观看视频| 欧美成人在线免费| 久久久久人妻一区精品色奶水| 波多野结衣AV无码久久一区| 欧美精品不卡| 国产精品吹潮在线观看中文| 亚洲福利视频一区二区| 精品91自产拍在线| 一本久道热中字伊人| 爆乳熟妇一区二区三区| 99久久精品免费看国产电影| 亚洲天堂久久| yy6080理论大片一级久久| 欧美午夜在线视频| 欧美日韩国产在线人成app| 国产中文一区二区苍井空| 在线国产91| 亚洲手机在线| www亚洲精品| 中文字幕日韩丝袜一区| 高清乱码精品福利在线视频| 亚洲成人黄色在线观看| 国产精品.com| 中文字幕欧美日韩高清| 无码人中文字幕| 国产一级毛片yw| 黄色免费在线网址| 日本午夜三级| 狠狠色噜噜狠狠狠狠奇米777| 欧美成人综合视频| 首页亚洲国产丝袜长腿综合| 少妇露出福利视频| 国产综合精品一区二区| 亚洲人成影视在线观看| 色婷婷天天综合在线| 99精品这里只有精品高清视频| 毛片三级在线观看| 国产精品尹人在线观看| 91外围女在线观看| 岛国精品一区免费视频在线观看 | 男女男免费视频网站国产| 国产精品刺激对白在线| 五月天综合网亚洲综合天堂网| 久久免费视频6| 亚洲一区免费看| 亚洲天堂久久久| 午夜无码一区二区三区在线app| www.亚洲天堂| 国产成熟女人性满足视频| 2021国产在线视频| 免费一看一级毛片| 日韩欧美中文在线| 18禁影院亚洲专区| 无码'专区第一页| 无码精品国产dvd在线观看9久| 亚洲无码A视频在线| 国产高清在线观看91精品| 午夜视频免费一区二区在线看| 亚洲啪啪网| 国产免费人成视频网| 亚洲精品中文字幕无乱码| 欧美亚洲国产视频| 欧美亚洲欧美| 欧洲欧美人成免费全部视频 | 久草美女视频| 日韩AV无码免费一二三区| 97精品伊人久久大香线蕉| 91小视频在线播放| 激情五月婷婷综合网| 亚洲区欧美区|