劉莉

摘 要:本文研究在書籍推薦過程中,用戶興趣分布及特征向量的計算其與最近聚類中心的軌跡距離,并根據每個聚類中心計算屬于該聚類的數據之和,對每個節(jié)點的累加數據和進行合并求和,判斷 sum 和是否小于閾值,通過函數計算來完成更新聚類中心的操作,直到算法收斂或完成迭代從而輸出聚類中心和聚類結果。通過實驗證明了該研究算法的可行性和有效性。
關鍵詞:書籍推薦;興趣分布;特征向量;協同過濾
0 引言
隨著信息化數字圖書館時代的來臨,對于圖書館書籍的管理研究工作更加側重于新技術應用和開發(fā)上。目前,世界上針對于書籍管理的研究內容主要集中在書籍推薦的效果中,利用書籍對比關系進行定義和定位,將更多地書籍相關信息內容融合到書籍本體中,造成了書籍推薦研究的復雜關系。因此,在圖書館的書籍管理中,如何獲取書籍的相關信息進行分析并作出合理的評價及推薦成為書籍管理研究領域的一個難點。
書籍推薦被視為圖書館服務工作的重點,書籍推薦質量的好壞直接關系到圖書館服務質量。本文在書籍推薦系統中融入協同過濾算法來提升書籍推薦效果,建立的書籍推薦模型以書籍本體構架,在模型中引發(fā)觸發(fā)機制進行信息搜集、處理和過濾,并據此向用戶推薦書籍。本文研究重點在于用戶偏好模型表征用戶興趣的準確度和對潛在興趣的挖掘度直接決定了資源推薦的準度和廣度等問題上,通過將本體感知因子形成的特征向量形成數據集,從而實現了并行算法結構處理過程。通過設置本體感知因子的特征向量以確定容量及結構范圍,形成的初始化特征因子會被定義在局部結構內進行分析和學習能力,針對每個數據分片,計算其與最近聚類中心的軌跡距離,并根據每個聚類中心計算屬于該聚類的數據之和,對每個節(jié)點的累加數據和進行合并求和,判斷 sum 和是否小于閾值,通過函數計算來完成更新聚類中心的操作,直到算法收斂或完成迭代從而輸出聚類中心和聚類結果。經過實驗的測試過程證明了本文研究內容的準確性和有效性均能滿足當前書籍推薦的需要。
1 書籍推薦模型
書籍推薦系統主要由圖書信息庫、推薦引擎和數據庫三大部分組成。其中,信息庫儲存著是用戶與系統的基礎信息,用戶可以看到自己曾經感興趣的書籍和個人信息等內容,同時系統也會自動化地給用戶推薦一個書籍列表;推薦引擎是實現個性化推薦最重要的模塊,系統會根據用戶信息,根據用戶興趣和書籍信息進行書籍推薦,當用戶進行評分,產生行為數據后,采用協同過濾算法來實現個性化推薦。
書籍推薦模型的建立是依據與書籍相關知識內容的關聯產生的,這里的書籍信息和用戶信息被分別列為本體的感知因子,針對各類信息內容又會呈現出更多地感知因子,因此基于本體的感知因子因為聚類過程相互獨立且每次迭代相同任務,所以會形成龐大的粒子團,而隨著任務粒度增加,計算時間也相對越長。由于感知因子的數據對象彼此獨立,計算每個數據對象所屬的聚類,隨著聚類迭代次數增加,需要不斷更新聚類中心。針對以上情況,本文提出基于協同過濾算法,就是有效地支持迭代運算,提高算法效率[1-3]。
2用戶興趣分布變化函數
2.3 評估標準
本文運用召回率(Recall)α,準確率(Precision)δ,,召回率α 與準確率δ 的調和平均值(F-Measure) F ,平均絕對誤差(MAE)η 來評估實驗結果。預測項感知因子分集合。平均絕對誤差 MAE 越小,推薦質量越高。
2.4實驗結果
為了對本文研究的協同過濾算法的推薦效率和推薦準確度進行分析,采取了以下幾組實驗:
(1)對比算法在不同聚類下的平均絕對誤差 MAE 值、召回率 Recall 及 F-Measure 值,進而判斷算法所選擇的聚類參數值 K;
(2)對比基于協同過濾算法與加速運行的推薦效率。利用算法分別將用戶特征項目劃分成若干粒子群,同時,運用協同過濾推薦算法于每次迭代的每個粒子群中,并且計算平均召回率和 MAE 值。
協同過濾算法在測試過程中的運行軌跡,得到的推薦結果的召回率。其中,以圓心作為準確率靶標項,距離靶心越近則準確率越高,而偏離靶心的軌跡則為被干擾的因子項,在經過修正后回到糾偏軌跡則被標記為修正因子,也是影響召回率的主要參數內容。
經過測試過程的數據體現在坐標靶項中,軌跡在正常測試過程中,開始階段隨著聚類數增加,算法的 MAE 值下降速度最快,當聚類數為338 時,算法的 MAE 值才出現粒子群偏移問題,隨著聚類數增加,MAE 值也逐漸呈現出偏離過大的趨勢,說明目標用戶的MAE值初定在338的聚類范圍內,推薦精度保持在最佳狀態(tài)。協同過濾算法在不同迭代步數下推薦結果的召回率。當迭代步數在15左右時,各種情況下推薦結果的召回率基本都取得了最大值。
與目標用戶進行相似度計算的用戶數會隨之減少,算法的推薦準確度也不會下降。從加速運行軌跡中的參數值來分析,假定不考慮隨機因素的影響,隨著聚類數的增加,加速運行算法的軌跡與常規(guī)速度軌跡基本相同,其運動軌跡的偏差數值也與協同過濾算法勻速運動的數值成正比,這也證明加速過程的優(yōu)化算法效果明顯。
3總結
本文研究的協同過濾算法經過測試獲得了較高的精準度,并且召回率控制在合理的范圍內。通過海量數據進行實驗,在模擬環(huán)境下并行化執(zhí)行算法測試,從降維運行軌跡可以看出,數據計算時間并未隨著數據集規(guī)模而增加,讀、寫操作優(yōu)勢逐漸變得明顯,這充分體現了基于內存計算模式在時間開銷上的巨大優(yōu)勢。同時,在驗證本文研究算法的加速比,在數據集加速達到了算法的閾值1時,在處理初始階段通信節(jié)點間的通信使得時間消耗增加,而隨著數據集的增加,加速比則逐漸提高,這充分體現了協同過濾算法的優(yōu)勢。
參考文獻:
[1]基于遺傳算法的聚類與協同過濾組合推薦算法[J]. 馮智明,蘇一丹,覃華,鄧海.計算機技術與發(fā)展. 2014(01).
[2]混合協同過濾個性化推薦算法研究[J]. 黃瓊,馮軍煥.計算機光盤軟件與應用. 2014(04).
[3]基于協同過濾的個性化選課推薦與評論系統[J]. 周澤宇,王春玲.信息記錄材料. 2018(10).
[4]A content-collaborative recommender that exploits WordNet-based user profiles for neighborhood formation[J] . Marco Degemmis,Pasquale Lops,Giovanni Semeraro.User Modeling and User-Adapted Interaction . 2007 (3).
[5]Afelder and silverman learning styles model based personalization approach to recommend learning objects. BIROL CILOGLUGIL,MUSTAFA MURAT INCEOGLU. Computational Science and Its Applications-ICCSA . 2016.
[6]基于用戶的協同過濾算法的改進研究[J]. 蘇林宇,陳學斌.軟件. 2017(04).
[7]一種基于自適應近鄰選擇的協同過濾推薦算法[J]. 彭玉,程小平.電腦知識與技術. 2016(16).
[8]基于項目評分預測的混合式協同過濾推薦[J]. 盈艷,曹妍,牟向偉.現代圖書情報技術. 2015(06).
[9]一種基于向量空間模型的模糊本體映射方法[J]. 張凌宇,陳淑鑫,張光妲,呂洪柱.計算機應用研究. 2014(05).