張宏亮(溫州廣播電視大學教育技術與資源建設中心,浙江 溫州 325000)
基于協同過濾技術的學習資源個性化推薦研究
張宏亮
(溫州廣播電視大學教育技術與資源建設中心,浙江 溫州 325000)
當前通過調研e-learning發現,e-learning當前的系統應用到學習資源的推薦的活動中只是有Top-N和
兩種搜索方法,不能向學習者個性的推薦學習資源。借鑒當前電子商務研究領域的許多的研究的結果,我們可以把協同過濾推薦技術應用到學習資源的個性化推薦過程中。我們分析學習資源個性化推薦的經常用的三種推薦的技術,分析出協同過濾推薦技術的工作原理、方法和出現的問題。本文,通過介紹一個優化理論模型,更好的協同過濾技術的學習資源的個性化推薦,注重探討模型的構成,相應的評分機制與算法的實現,而且分析個性化學習資源推薦模型里面的三種重要的技術。希望可以使e-learning相關的人員在搜索過程中對協同過濾技術進行有效利用,從而使學習資源個性化推薦的效率得到提升。
e-learning;協同過濾技術;個性化推薦;學習資源
DOI:10.16640/j.cnki.37-1222/t.2016.16.201
經過對許多的企業的e-learning門戶系統研究與分析得知,e-learning系統的推送學習資源主要有以下幾類方法:(1)Top-N推薦的方法,指向用戶推薦點擊率最高的前N個資源[1]。點擊率只是反映相應學習資源受歡迎的程度,而不能達到個性化推薦的目的。尤其對于一些涉及多種職業的行業的學習資源的管理,用戶針對資源的類別和需求是不同的,點擊率高的學習資源,只是單純的反應學習者的要求;(2)關鍵詞查詢的方法。該種方法的優點是便捷快速。這種查詢的方法只是單純的達到搜索目的和關鍵詞的默契,不能篩選目標資源的質量,不能達到資源的個性化推薦;(3)最新的資源的推薦。該種方法能會在第一時間向用戶反饋資源庫里面更新的情況,從而使最新的學習資源得到更多的學習,可是資源的質量不能得到有效保障,不能達到個性化推薦。
個性化推薦是推薦系統依據用戶的個性化因素,比如愛好、職業、專業等因素,給用戶主動的推薦滿足用戶學習的資源和咨詢的一種推薦的技術[2]。再者,通過個性化推薦技術還能很好的讓用戶之間分享學習經驗,更可以給用戶推薦相同的用戶群喜歡的信息。
2.1關聯規則的推薦方法
該技術的推薦技術的工作原理:開始的時候需要管理員制作一系列規則的條目,接著依據指定的規則來分析項目之間的聯系,并且把關聯緊密的項目給用戶推薦。并且在推薦的時候,系統合理的分析用戶目前的喜好和訪問的記錄,之后根據已制定的規則,推薦給用戶想要的資源。比如,若用戶正在學習網頁設計技術,則在他學習視頻ASP網頁設計的資源過程中,系統就會將和HTML技術有關的學習資源推薦給他。主要原因是:HTML技術是網頁制作的基礎知識,學習的人還沒掌握,或者還有想繼續學的樂趣。
2.2內容過濾推薦
內容推薦作用機理:以機器學習與概率統計等技術為基礎,來實現過濾,最初選用客戶的興趣向量來代表用戶的信息需求;而后,篩選文本集內的文本,主要采用詞頻統計加權、標引、分詞等方式,與此同時,得到一個文本向量;最終,對文本向量與用戶向量進行計算,確定其相似度,并向這個用戶模型的注冊的用戶推薦相似度高的資源。
2.3協同過濾推薦
不同與以上兩類推薦技術,協同過濾推薦是基于對資源內容的分析、資源和用戶的匹配度的計算,來產生用戶推薦的,此外,資源推薦的憑據就是用戶對資源的評分。其工作原理:開始的時候就是分析用戶的特點,比如:職業、興趣等;之后采用相似性算法對用戶之間的相似性進行計算,并找出和目標性相似度高的K個用戶;最終,以鄰居用戶對資源的評分為依據,來對目標用戶評分進行預測,再向目標用戶推薦預測評分最高的幾個資源[3]。
協同過濾推薦系統采用統計技術,對目標用戶進行搜索,獲取多個最近鄰,而后,以最近鄰對項目的評分為依據,來對目標用戶的評分進行預測,并得到相對應的推薦的列表。實現協同過濾推薦的流程分為以下三步:
首先,獲得用戶信息,并將其表示出來。用戶的數據可分為用戶的注冊的信息、學習的數據與行為記錄三類。通常情況下,推薦系統采用評分的方式,來獲取用戶的行為數據。
然后,形成鄰居。協同過濾技術的最主要的環節就是尋找和目標用戶相同或相似興趣的用戶群。通過采用傳統的余弦相似性計算方法,尋找相似度高的用戶。
最后,產生推薦。協同過濾最后的步驟就是產生推薦。產生推薦的主要依據是鄰居集對資源的評分,以此評分對目標用戶學習資源的評分進行預測,最終向用戶產生推薦。
存在的不足:(1)數據稀疏。由于數據稀疏,系統無法產生有效的鄰居用戶集,且計算用戶間的相似時,將消耗較長的時間,最終不能產生較好的推薦結果;(2)“冷啟動”問題。一方面,若用戶是新注冊的,則系統沒有相關的數據記錄,系統不能很好的產生推薦,另一方面,新的資源,系統沒有匹配的評分記錄,無法別推薦,上述情況就造成協同過濾算法的“冷啟動”問題。
關于數據稀疏,當前有兩種對應措施。第一,缺省值法,即對于用戶沒有評分的項目,將其評分統一設置成一個固定的缺省值(一般,該固定的缺省值是用戶對項目評分的平均值,比如:5分制中的2.5);第二,項目評分的預知的方式。對根據數據相似性,由用戶對相似的評分來對未評分項目的評分進行預測,使用戶共同評分項目增加,有效解決該問題。
借鑒當前電子商務研究領域的許多的研究的結果,我們可以把協同過濾推薦技術應用到學習資源的個性化推薦過程中。本文對協同過濾推薦技術進行研究,希望可以使e-learning相關的人員在搜索過程中更好的利用好協同過濾技術,提升學習資源個性化推薦的效率。
[1]楊焱,孫鐵利,邱春艷.個性化推薦技術的研究[J].信息工程大學學報,2005,6(02).
[2]趙艷霞.基于關聯規則的推薦系統再電子商務中的應用[J].價值工程,2006,25(05):88-91.
[3]楊焱.基于項目聚類的協同過濾推薦算法的研究[D].東北師范大學,2005(05).
張宏亮(1985-),男,河南信陽人,研究生,助教,研究方向:計算機應用技術、教育技術。