摘要:隨著互聯網的出現,大數據時代迅速發展,用戶在上網的過程中可以滿足對各類信息檢索的需要。但隨著網絡技術不斷發展,信息數據量日益龐大,信息超載的現象隨之而來。推薦系統通過統計分析用戶的歷史瀏覽記錄挖掘用戶在不同情況下的喜好,從數據庫中檢索與其匹配的內容,將相關內容推薦給用戶,這是減少信息超載現象出現的高效辦法。本文介紹了推薦系統后運用的各類推薦算法,將算法的原理及優缺點進行了相關的闡述和解析。
關鍵詞:推薦系統;推薦算法;信息過濾;個性化推薦
中圖分類號:TP391.3 文獻標識碼:A 文章編號:1672-9129(2020)06-0080-01
Abstract:withtheemergenceoftheInternetandtherapiddevelopmentofbigdataera,userscanmeettheneedsofvariousinformationretrievalintheprocessofsurfingtheInternet.However,withthecontinuousdevelopmentofnetworktechnology,theamountofinformationdataisincreasing,andthephenomenonofinformationoverloadfollows.Recommendationsystemthroughstatisticalanalysisofusers'historicalbrowsingrecords,miningusers'preferencesindifferentsituations,retrievingthematchingcontentfromthedatabase,andrecommendingtherelevantcontenttousers,whichisanefficientwaytoreducethephenomenonofinformationoverload.Thispaperintroducesthevariousrecommendationalgorithmsusedaftertherecommendationsystem,andexpoundsandanalyzestheprinciples,advantagesanddisadvantagesofthealgorithms.
Keywords:recommendationsystem;recommendationalgorithm;informationfiltering;personalizedrecommendation
1推薦系統及其作用
在網頁上,很容易檢索到關于推薦系統的解釋:是一種可以根據用戶喜好將各類實物推薦給使用者的應用。推薦系統根據用戶歷史瀏覽的記錄,通過各類推薦算法,得出相應的用戶評價矩陣,利用機器學習所生成的算法產生針對某一用戶的個性化推薦內容,并適時根據用戶最終點擊量調整推薦商品,從而使結果與用戶喜好更加貼合。使得購物網站可以將商品精準推薦給購物者,提高商品的銷售量,有助于用戶快速找到適合自己的商品。
推薦系統具有以下表現形式:(1)用戶在對應網站的檢索框輸入自己的檢索需求,推薦系統根據輸入關鍵詞產生推薦結果;(2)用戶在將意向購置商品加入收藏夾或者購物車后,推薦系統在數據庫中自動匹配同種類的商品并將其推薦給用戶;(3)用戶在網站注冊登錄后,推薦系統利用電子郵件等通訊方式將用戶可能喜好的商品信息發送給用戶;(4)用戶瀏覽一件商品后,推薦系統將其他用戶對同件商品的等級評語推薦給用戶,以供用戶進行多角度選擇。
推薦系統的數據分類有兩種:顯式分類根據用戶的收藏,評價等,精準表現用戶對產品的愛好程度;隱式分類根據對用戶歷史瀏覽頁面,網頁停留時間,對商品查看次數的分析,得出用戶喜好的推薦。
2推薦系統背后的各類推薦算法
基于內容的推薦是針對信息過濾而實現的延續和發展,不需要利用每一個用戶對產品的評論觀點,而是通過機器學習訓練的算法,從各類信息內容中提取特征,描述事例,得出用戶的興趣喜好。基于內容的推薦是對已有信息過濾技術的一種延續,這種推薦方法不需要研究每個用戶對商品的評價和態度,只需要根據產品的各類信息來進行計算,用機器學習的方法從研究結果中找到用戶的樂趣愛好。在這種推薦方法中,機器學習的方法很大程度上決定了最終得出的用戶喜好模型,經常使用的有決策樹、神經網絡和基于向量的表示方法等。但是,基于內容的推薦需要內容具有一些易分辨的特征,整體上有較合適的結構性,用戶樂趣喜好可以用一些特征形式表現出來。
協同過濾推薦是目前推薦系統中應用比較普遍的技術,通過分析用戶的歷史瀏覽記錄來計算得出用戶之間的距離,將最近的鄰居用戶對商品的喜好評分進行加權計算,從而產生預測結果并將其推薦給其他用戶。這種過濾技術不需要對推薦對象做出要求,推薦系統自動從用戶歷史行為中得出推薦內容,不需要用戶對其進行配合,較為簡單方便。這種方法可以篩選出機器難以自動進行分析的一些信息,比如說文化,書法等;可以共享其他用戶的經驗,使得內容分析更加精確;可以精準根據其他用戶對某一商品最終是否選擇購買的行為,提高推薦內容的精準性和可靠性;能夠檢測到內容中完全不會匹配的信息,具有推薦新信息的能力。盡管協同過濾這種過濾方法是一種典型且目前較為成功應用的推薦技術,但稀疏問題和可擴展問題仍然有待進一步解決。
基于關聯規則的推薦是對不同種類,甚至看上去毫無聯系商品之間的關聯規則進行挖掘,尋找出不同商品在用戶實際瀏覽或購買過程中的相關性,即在購買商品A的人中,統計購買商品B的人的比例,例如在超市統計購買紙尿褲的人中,有多少人會去購買啤酒。目前看來,關聯規則的尋找和商品名稱同義性仍然是有待提升的難點。
基于效用的推薦是由推薦系統首先為用戶產生一個效用函數,函數對用戶實際消費過程中的效用和用戶最終購買的商品組合形成比例數據關系,從而衡量用戶在推薦內容中獲得滿足感的程度,從而展現推薦的精準程度。這個效用函數用來決定針對用戶推薦商品的推薦算法模型,效用函數的確定是效用推薦技術的一個核心問題。采用這種推薦方法的優點是可以將一些非產品的屬性,例如提供商的可靠性以及商品的可得性等難以估量的屬性考慮到效用計算中。
由于上述介紹的各類推薦方法都存在其優缺點,在實際算法中,我們常希望將各類推薦算法的優點進行匯集,缺點進行避免,也就產生了組合推薦的推薦方法。推薦系統背后所使用的推薦方法多種多樣,各種算法的組合形式更是不計其數,但在實際情況中,各類組合方法在運用中并不一定全部有效,我們通常將基于內容的推薦和協同過濾推薦兩種方法進行組合,產生合理準確的推薦預測結果。
3結語
當前,大數據時代迅速發展,為減少信息增益,科研人員對推薦系統的研究逐步深入,推薦技術也取得了一定的發展成果。推薦系統通過統計分析用戶檢索瀏覽過的信息,用戶的歷史記錄,挖掘用戶在不同情況下的喜好,將相關內容推薦給用戶,為用戶帶來了極大的方便。以上對推薦系統的各類推薦方法作了全方位的論述和多視角的分析。近年來,推薦系統在理論的深入和實際運用都有了極大程度上的飛躍,但很多問題還有待我們進一步去探索。在未來,推薦系統會給我們的購物及生活方式帶來極大的便利,其發展前景充滿希望。
參考文獻:
[1]Liu,Huan.Communitydetectionandmininginsocialmedia[M].
[2]李濤.推薦系統中若干關鍵問題研究[D].南京航空航天大學,2009.
[3]JannachD,ZankerM.推薦系統[M].9787115310699.人民郵電出版社,2013.
[4]王國霞,劉賀平.個性化推薦系統綜述[J].計算機工程與應用,2012,48(7):66-76.
作者簡介:劉昕雨,女,漢族,1999年生,山西大學計算機與信息技術學院本科在讀。