張宏升

摘要:本文通過介紹推薦算法的概念入手,根據推薦算法的劃分分類,從分類中選擇4中推薦算法應用到圖書管理系統中進行對比,發現組合推薦技術避免或彌補其他推薦技術的弱點,更適合應用系統中,最后本文總結了4方法的優劣,提供大家更準確的選擇推薦算法,形成組合推薦算法。
關鍵詞:推薦算法;圖書管理系統;組合推薦
1.推薦算法的概念
推薦算法通過一些數學算法,推測出用戶可能喜歡的東西,目前應用推薦算法比較好的地方主要是網絡。所謂推薦算法就是利用用戶的一些行為,通過一些數學算法,推測出用戶可能喜歡的東西。[1]
2.推薦算法的劃分
推薦算法基本可劃分基于內容、基于協同、基于關聯規則、基于效用、基于知識、組合推薦,下面我們就將基于內容、基于協調、基于關聯規則的這三種算法應用到圖書管理系統中進行研究分析。
2.1基于內容
基于內容的推薦是在項目的內容信息上建立的推薦應用,并沒有考慮用戶的需求也就是用戶對項目的評價意見,其實它就信息過濾技術的延續和發展,更多地是從內容的特征描述的事例中得到用戶的興趣資料,使用機器學習的方法實現。
在圖書管理推薦系統中,基于內容的推薦算法依據項目或對象是由相關特征的屬性定義的,系統通過用戶評價對象的特征來進行機器學習用戶的興趣,常用的學習方法有決策樹、神經網絡和基于向量,再對比用戶資料與待預測項目的匹配程度。基于內容的用戶資料需要有用戶的歷史數據,用戶資料模型可能隨著用戶的偏好改變而發生變化,這一推薦算法能很好的建立用戶的喜好模型,但同時對歷史數據提出要求,當數據越多用于的喜好模型的準確度就會提高。
2.2基于協同
基于協同過濾的推薦算法推薦采用最近鄰技術,在圖書管理推薦系統中我們是先通過用戶的歷史喜好信息來計算用戶之間的距離,然后利用目標用戶的最近鄰居用戶對商品評價的加權評價值來預測目標用戶對特定商品的喜好程度,從而根據這一喜好程度來對目標用戶進行推薦。[2]這一算法是對推薦對象沒有特殊的要求,能處理如音樂、電影等這些非結構化的復雜對象。
基于協同過濾的推薦算法的基本思想非常易于理解就像人和人之間,人們往往會利用好朋友的推薦來進行一些選擇,該算法在圖書系統中若想要為一用戶找到他真正感興趣的內容的好方法的時候,首先找到與此用戶有相似興趣的其他用戶,然后將他們感興趣的內容推薦給此用戶。這一算法是從用戶的角度來進行相應推薦的,不需要用戶努力地找到適合自己興趣的推薦信息。
2.3基于關聯規則
基于關聯規則的推薦是以關聯規則為基礎,應用在圖書管理系統進行推薦時候,采用一種基于關聯規則的標簽推薦方法,包括以下步驟:步驟1:建立窗口模型采集每個用戶所使用過的標簽,并添加到標簽事務集合,形成標簽事務集合T;步驟2:利用最大頻繁項挖掘算法對標簽事務集合T進行頻繁項挖掘,得到頻繁共現的標簽集集合F;步驟3:對所得頻繁共現的標簽集集合F進行挖掘找出標簽集之間的關系,得到關于所找到標簽集之間的關聯規則集合R,所述關聯規則集合R包括先導標簽集及與其關聯的后繼標簽集;步驟4:收集每個待推薦的用戶使用過的所有標簽,得到關于每個用戶的標簽集合;判斷所述標簽關聯規則集合R中的先導標簽集是否存在于用戶的標簽集合中,當判斷為存在時,將該條規則中先導標簽集關聯的后繼標簽集推薦給對應用戶。其中,設置標簽頻繁地同時出現的支持度和置信度;將滿足所設置的標簽頻繁地同時出現的支持度和置信度的標簽之間關聯及加入關聯規則集合R。
2.4組合推薦
基于各種推薦方法的優缺點,在實際中組合推薦便成為人們較為青睞的使用方法,大部分應用研究和應用都是將內容推薦于協同過濾推薦進行組合,形成一個推薦的預測結果。在圖書管理系統我們就采取了這樣的推薦方式,就是分別用基于內容的方法和協同過濾推薦方法組合形成一個推薦預測結果,然后用協同過濾推薦方法組合形成的推薦預測結果。這個思路是基于研究人員提出的元級別的組合思路完成的。
關于組合推薦的組合方式上,研究人員門得出了一下7種組合思路:
1)加權(Weight):加權多種推薦技術結果。[2]
2)變換(Switch);根據問題背景和實際情況或要求決定變換采用不同的推薦技術。[2]
3)混合(Mixed):同時采用多種推薦技術給出多種推薦結果,為用戶提供參考。[2]
4)特征組合(Feature Combination):組合來自不同推薦數據源的特征被另一種推薦算法所采用。[2]
5)層疊(Cascade):先用一種推薦技術產生一種粗糙的推薦結果,第二種推薦技術在此推薦結果的基礎上進一步做出更精確的推薦。[2]
6)特征擴充(Feature Augmentation):將一種技術產生附加的特征信息嵌入另一種推薦技術的特征輸入中。[2]
7)元級別(Meta-Ievel):用一種推薦方法產生的模型作為另一種推薦方法的輸入。[2]
3.總結
綜上所述,將4中推薦算法應用到圖書管理系統中我們發現組合推薦就是通過組合來避免或彌補各自推薦技術的弱點,它可以彌補了其他推薦技術的各種問題,達到了我們預設的結果,提高了系統的在推薦技術上的信任度和準確度。因此,本文先給出各個推薦算法的詳細對比,讓讀者可以更準確地有效地去應用組合推薦算法。各個推薦算法的對比如下圖所示:
本文將4中推薦算法應用到圖書管理系統,并給出了這四種推薦算法的優缺點的詳細對比表,方便大家更準確的選擇推薦算法,形成組合推薦算法,將組合算法的優勢發揮到最大,做到通過組合各種推薦算來避免或者彌補各推薦技術的弱點。
基金項目:
項目編號:B2018400,項目名稱:圖書推薦系統徑向信任傳遞算法的應用研究,項目類型:2018年湖北省教育廳科學研究計劃指導性項目
參考文獻:
[1]趙守香,唐胡鑫,熊海濤著.大數據分析與應用:航空工業出版社,2015.12:第182頁.
[2]楊旭,湯海京,丁剛毅編著.數據科學導論 第2版:北京理工大學出版社,2017.01:第58頁.
(作者單位:武漢晴川學院)