王琳琳
(東北石油大學 計算機與信息技術學院,大慶 163318)
基于協同過濾的在線學習個性化推薦技術研究
王琳琳
(東北石油大學 計算機與信息技術學院,大慶 163318)
個性化學習是當今在線學習領域研究的熱點問題,根據不同學習者的行為、偏好為其推薦個性化的學習資源,體現了在線學習系統設計以人為本的思想。在學習行為分析的基礎上,設計了在線學習系統的個性化推薦流程。利用Web日志挖掘和系統操作信息收集結合的方式,建立學習者興趣模型。對常用推薦算法的優缺點進行比較分析,提出了一種改進的協同過濾算法,算法將用戶聚類加入到推薦算法中,并針對算法稀疏性問題進行了改進,實現了基于協同過濾的推薦算法在在線學習個性化學習資源推薦中的應用。
協同過濾; 個性化推薦; Web日志挖掘; 在線學習
隨著現代社會的發展,人們對個性化學習的呼聲越來越高。教育信息化的推進使在線學習技術得到的快速的發展。然而現有的在線學習技術大多是均質化的,忽略了學習者的個體差異,不能滿足學習者對學習的個性化的需求。大量的、多樣化的學習資源也容易讓在線學習的學習者產生認知超載和網絡迷航的現象。根絕學習者不同特點為其提供學習資源推薦服務能夠體現學習的個性化,幫助學習者快速地發現有價值的資源[1],有有利于提高在線學習效率。協同過濾技術可以發現學習者潛在的學習興趣,向其推薦新的內容。本文研究基于協同過濾的推薦技術在在線學習中的應用。
個性化推薦的完成是通過學習者的歷史行為信息,構建學習者對學習資源的興趣模型,從而挖掘學習者可能感興趣的資源,并選取最合適的資源進行推薦[2]。個性化學習資源的推薦分為學習者的行為收集、建立學習者興趣模型和使用推薦算法進行推薦等3個步驟。
(1)學習者行為收集:要建立學習者的興趣模型首先需要收集記錄學習者的評分信息和學習行為,例如學習者對資源的評分、瀏覽、收藏、分享、下載等信息。學習者對學習資源的顯式評分是最直接、最容易分析的數據,但是評分這一操作對學習者本身來說沒有直接意義,并非所有學習者都會對學習過的資源進行打分。因此系統的個性化推薦主要利用隱式評分,即分析學習者的行為。本文采用Web日志挖掘和系統操作信息收集兩種方式結合,來獲取學習者行為信息,所需收集的信息,如表1所示。

表1 學習者行為信息
(2)建立學習者興趣模型:學習者行為收集完成后,需要對學習行為信息進行分析,建立學習者對學習資源的興趣模型。學習者的興趣模型是學習者對資源的興趣度矩陣。學習者對資源的興趣度計算方法如下。
① 由日志信息計算興趣度P1,如式(1)。
(1)
其中n為瀏覽該資源的次數,Ti為每次瀏覽時長,B為該資源字節數,α為資源媒體類型系數[3]。
② 對系統操作信息賦值,學習者行為對應的分值可設為如表2所示。

表2 學習行為分值
學習者對某個學習資源有多個學習行為時,評分為學習行為對應分值之和,得到興趣度P2。
③ 最后對由日志信息與系統信息得到的興趣度進行加權求和,得到學習者對資源的興趣度P,如式(2)所示,其中μ為P1所設的權重值。
(2)
(3)推薦算法:根據學習者興趣模型,選擇合適的推薦算法,從學習資源庫中篩選出學習者可能感興趣的資源進行推薦。本文選擇基于協同過濾的推薦算法來實現學習資源的個性化推薦。
目前,在學習資源推薦的應用中常用的推薦算法法有基于內容的推薦和基于協同過濾的推薦[4]。
基于內容的推薦較為簡單直觀,根據用戶的歷史喜好信息來向用戶推薦其可能感興趣的資源。但這種推薦技術要求推薦內容能夠容易提取出有良好的結構性的特征[5]。
基于協同過濾的推薦是應用最成功的推薦技術之一[6]?;谟脩舻膮f同過濾推薦根據不同用戶對相同內容的偏好程度計算用戶之間的距離,然后在有相同喜好的用戶間進行內容的推薦。協同過濾技術能夠共享其他人的經驗,避免內容分析片面性。協同過濾算法的推薦機制使其能夠處理非結構化的對象。同時協同過濾能夠使用較少的反饋信息提供推薦,效率較高。但協同過濾存在冷啟動和稀疏問題,在實際應用中需要解決。
協同過濾推薦方法的優點和缺點對比,如表3所示。
(1)建立學習者對學習資源的評分矩陣
首先通過對學習者的學習行為分析,確定學習者對學習資源的評分,得到評分矩陣。M個學習者對N個教學資源的評分矩陣為P(M×N),如表4所示。其中第i行j列的Pij代表了第i個學習者對第j個教學資源項的興趣度。

表3 協同過濾推薦方法的優點和缺點對比

表4 學習者-學習資源評分矩陣P(M×N)
學習者注冊系統時,系統會通過注冊信息和量表測量對其基本信息、興趣偏好等進行初始化,可以解決協同過濾算法的冷啟動問題。針對協同過濾算法的稀疏性問題,首先計算一下評分矩陣的稀疏度。稀疏度計算公式,為式(3)[7]。
(3)
其中ENum為學習者對資源的評價數量,LNum為學習者的數量,RNum為學習資源數量。設定一個矩陣的最小稀疏值,當稀疏度小于最小稀疏值時,代表學習者對教學資源的評價矩陣過于稀疏。此時,需要對評分賦初值。根據學習系統的特性,對本專業類別內的未評分資源,取所有已經評分的本專業資源的加權均值作為評分,對于非本專業的資源,采用傳統方式評分為0。
(2)用戶聚類
在查找相似用戶前,將學習者進行聚類可以縮小尋找鄰居的范圍,從而降低算法的時間復雜性。根據學習系統的特點,按照學習者模型中的學習者專業進行聚類。k-means聚類算法的簡單靈活,能夠動態計算出各個聚類中心[8],本文選擇基于k-means的聚類算法對學習者進行聚類。如圖1所示。K-means聚類算法的步驟如下。
其中M為學習者數據集,N為指定的聚類類數,P為設定的最大循環次數。
K-means聚類算法的評價標準,如式(4)。
(4)
將每個類中的數據與該聚類中心做差的平方和,J最小時,聚類分割的效果最好。式中μN為聚類中心,M為數據源個數,N為聚類中心個數。

圖1 K-means聚類算法的步驟
(3)查找相似學習者集合
計算查找相似的鄰居集是協同過濾算法中最為關鍵的一步。通過對學習者進行聚類后,可以在同一個聚類中心內選取最相似的學習者作為鄰居,提高效率,縮短運算時間。接下來通過相似度算法計算出學習者之間的相似度,其中余弦相似性算法和修正的余弦相似性算法是常用的兩種相似度計算方法。
① 余弦相似性算法[9]
余弦相似性算法是最典型的相似性計算方法,它將用戶對項目的評分看做n維向量,通過計算其余弦的夾角來得出用戶之間的相似度,具體算法,如式(5)。

(5)
② 修正的余弦相似性算法[10]
修正的余弦相似性算法將余弦相似性算法做出了修改,在計算時將項目的評分減去該用戶對所有項目的平均評分,來改善余弦相似性方法存在的某些數據孤立點的問題。具體算法,如式(6)。
(6)
相似度計算完成后,得出與學習者最鄰近的n個鄰居的集合Z,如式(7)。
Z={User1,User2,…,Usern}
(7)
(4)形成個性化推薦
根據最近鄰居集Z中的學習者對資源i的評分,就可以預測出目標用戶a對該項目的評分,并且產生最終的推薦結果。具體算法,如式(8)。
(8)
其中,Ra,i為用戶a對資源i的推薦度,n根據最近鄰居集Z中的鄰居個數,sim(a,b)為用戶a與用戶b的相似度,Rb,i為用戶b對資源i的興趣度,即用戶b對資源i的評分權值。
本文研究了基于協同過濾的推薦技術在在線學習資源推薦中的應用,設計了學習者行為收集、建立學習者興趣模型和使用推薦算法進行推薦的在線學習系統的個性化推薦流程。首先通過Web日志挖掘和系統操作信息收集學習者行為,建立學習者興趣度模型,最后用改進的協同過濾算法實現了學習資源的個性化推薦。
[1] Fethi A. Inan, Raymond Flores, Michael M.Grant. Perspectives on the Design and Evaluation of Adaptive Web Based Learning Environments[J]. Contemporary Educational Technology, 2010,1(2):148-159.
[2] 王茜,錢力.大數據環境下電子商務個性化推薦服務發展動向探析[J].商業研究,2014,57(8):150-154.
[3] 王龍.教育資源推薦服務中若干關鍵技術的研究[D].長春:吉林大學,2013.
[4] 陳品德,李克東.適應性教育超媒體系統一模型,方法與技術[J].現代教育技術,2002,12(1):11-17.
[5] Mu,XW; Chen,Y. An Improved Similarity Algorithm Based on Hesitation Degree for User -Based Collaborative Filtering [C]. 5th International Symposium on Intelligence Computation and Applications. Wuhan, PEOPLES R CHINA: Advances In Computation And Intelligence,2010:261-271.
[6] 孫歆,王永固,邱飛岳.基于協同過濾技術的在線學習資源個性化推薦系統研究[J].中國遠程教育,2012,32(8):78-82.
[7] 胡曉楠.基于知識點的學習內容個性化推薦研究[D].重慶:重慶大學,2010.
[8] 楊芳,潘一飛,李杰,王云峰.一種改進的協同過濾推薦算法[J].河北工業大學學報,2010,39(3):82-87.
[9] Gao,M; Wu,ZF. User rank for item-based collaborative filtering recommendation[J]. Information Processing Letters,2011,48(9):440-446.
[10] Luo,Q;Tian,X.A Personalized Recommendation Algorithm Combining Slope One Scheme and User Based Collaborative Filtering [C]. International Conference on Industrial and Information Systems.Hankou,China:2009 International Conference On Industrial And Information System,Proceeding,2009:152-154.
Research on Personalized Recommendation Technology of Online Learning Based on Collaborative Filtering
Wang Linlin
(School of Computer and Information Technology, Northeast Petroleum University, Daqing 163318, China)
Personalized learning is a hot issue in the field of online learning. The personalized recommendation of learning resources depends on to different learners' behavior and preference, embodies the people-oriented design idea of online learning system. In this paper, based on the analysis of learning behavior, the personalized recommendation process of online learning system is designed. Based on Web log mining and system operation information collection, the model of learner interest is established. The advantages and disadvantages of the commonly used recommendation algorithm are comparatively analyzed. This paper proposes an improved collaborative filtering algorithm, into which the user clustering recommendation algorithm is added. And the problem of sparse algorithm is improved. The collaborative filtering recommendation algorithm based on personalized learning in learning resource recommendation is realized.
Collaborative filtering; Personalized recommendation; Web log mining; Online learning
王琳琳(1991-),女,河北邢臺人,碩士研究生,研究方向:現代遠程教育。
1007-757X(2017)05-0049-03
G40-057
A
2016.12.06)