徐福江



摘 要:針對當前慕課資源協同過濾推薦算法存在推薦誤差大、無法實現在線推薦的難題,為了提高慕課資源協同過濾推薦精度,設計了基于云平臺的慕課資源協同過濾推薦算法。首先分析慕課資源協同過濾推薦的原理,提取慕課資源相似度特征,然后引入k-最近鄰對慕課資源相似度進行評價,實現慕課資源分類和協同過濾推薦,最后在云平臺分布式、并行實現慕課資源協同過濾推薦算法,并與傳統算法進行了仿真對比實驗。結果表明,相對于傳統算法,提出的算法使得慕課資源協同過濾推薦精度得到較高提升,能夠解決當前慕課資源協同過濾推薦算法存在的一些缺陷,而且可以實現慕課資源協同過濾在線推薦,實際應用價值也得到了改善。
關鍵詞:慕課資源;k-最近鄰算法;協同過濾;資源分類;推薦精度
Abstract:The design of collaborative filtering and recommendation algorithm for MOOC resources is of great significance. In order to improve the accuracy of collaborative filtering and recommendation of MOOC resources, a collaborative filtering and recommendation algorithm based on cloud platform is designed. Firstly, the principle of collaborative filtering and recommendation of MOOC resources is analyzed, and the similarity features of MOOC resources are extracted. Then the k-nearest neighbor is introduced to evaluate the similarity of MOOC resources and realize the classification and collaborative filtering recommendation of MOOC resources. Finally, the collaborative filtering and recommendation algorithm of MOOC resources is implemented in the cloud platform in a distributed and parallel way. The simulation experiment is carried out for the proposed algorithm and traditional algorithms. The results show that, compared with the traditional algorithm, the accuracy of collaborative filtering and recommendation of MOOC resources in this algorithm has been improved greatly. It can solve some defects of current collaborative filtering and recommendation algorithm of MOOC resources, and realize online recommendation of collaborative filtering of MOOC resources. The actual application value has also been improved.
Key words:MOOC resources;algorithm of k-nearest neighbor;collaborative filtering;resource classification;recommendation accuracy
0 引言
隨著國家對高校教育質量的不斷重視,高校面臨前所未有的發展機遇,為了提高高校教育質量,教育部提出建立海量的教學資源庫。各所高校順應教育部的指標,利用互聯網、人工智能、大數據分析技術的優勢,提出智慧教育。在智慧教育實施過程中,慕課資源是最重要的組成部分[1-2]。自從2012年以來,慕課資源得到蓬勃的發展,出現許多慕課平臺,其成為各高校混合式教學資源的共享平臺。在慕課資源共享實際應用中,如何為學生推薦最需要的慕課資源,實現個性化教學,是當前慕課平臺需要解決的問題,因慕課資源協同過濾推薦算法設計具有十分重要研究意義[3]。
隨著大數據技術不斷發展,出現了慕課資源推薦算法,該系統根據學生學習的歷史記錄以及相關資料,分析學生的學習興趣,國外對慕課資源推薦的研究比較重視,它們借助于電子商務、旅游線路、社交網絡等領域的推薦技術,提出許多優秀慕課資源推薦算法[4-5],當國內對于慕課資源推薦算法的研究比較少,有學者提出了基于內容的慕課資源推薦算法,運用本體論建立慕課資源模型,利用學生興趣模型對慕課資源進行分類,最后根據慕課資源特征和學生興趣特征之間的相似度實現慕課資源推薦,該類算法存在慕課資源推薦精度大,學生難以獲得真正需要的慕課資源[6-7]。隨后有學者提出慕課資源推薦的協同推薦算法,首先建立學生學習的慕課資源庫和學習瀏覽歷史記錄,通過慕課資源和學學習記錄的多屬性評估,根據一定的關聯技術為每一位學生推薦最適合的慕課資源,是一類個性的推薦技術,獲得比基于內容的慕課資源推薦效果[8-10]。由于當前慕課資源推薦算法均基于單機平臺,而慕課資源推薦不斷直線上升,而且學生在線學習的人數成千上萬,當前慕課資源推薦算法均存在工作效率低,難以實現在線學習的要求[11]。
云平臺是在互聯網、分布式處理技術的基礎上發展起來一種數據處理技術,可以加快問題求解的速度,為了解決當前慕課資源協同過濾推薦過程中存在的問題,設計了基于云平臺的慕課資源協同過濾推薦算法,并與其它慕課資源推薦算法、單機平臺相比,云平臺的慕課資源協同過濾推薦精度、效率均更優。
1 云平臺的慕課資源協同過濾推薦算法
1.1 云平臺
隨著數據朝大規模、海量的發展,以及問題處理的速度要求越來越高,云平臺的產生,其將軟硬件資源按需提供給需求者,所需的軟件和數據則存儲在云端,用戶在不同地方隨時可以提問和使用,是分布式計算、虛擬化、海量存儲等技術的集成產物[12]。Hadoop系統是近年來比較熱門的云平臺,本文采用其構建慕課資源協同過濾推薦算法的運行平臺。Hadoop系統的關鍵模塊為:HDFS和MapReduce,其中HDFS負責對文件的分布式存儲和管理,MapReduce負責對文件進行并行處理,如讀和寫作操作,結構如圖1所示。
1.2 云平臺的慕課資源協同過濾推薦思路
基于云平臺的慕課資源協同過濾推薦算法的工作思路:首先將慕課資源劃分為不同的類,提取描述慕課資源類型的特征,建立慕課資源特征庫;然后計算學生的學習行為數據特征,并基于云平臺,采用k-最近鄰計算每一類慕課資源特征和學生學習行為數據特征之間的相似度,最后根據相似度值生成慕課資源協同過濾推薦結果,云平臺每一個節點的工作流程具體如圖2所示。
1.3 云平臺的慕課資源協同過濾推薦算法的具體設計
1.3.1 學生和慕課資源之間的評分矩陣
設m個學生,慕課資源數量為:n,rij表示學生i對慕課資源j的評分,所有學生對慕課資源的評分組成一個學生和慕課資源之間的評分矩陣R={rij}m×n,具體如表1所示。
1.3.2 慕課資源評分預測
計算全部慕課資源間的相似性,從而產生一個“鄰居”群,然后計算目標慕課資源與其它全部慕課資源之間的預測評分值,找出k個最相似慕課資源集—“最近鄰居”, 產生了一個慕課資源推薦列表,實現了慕課資源的精準推薦,因此在慕課資源協同過濾推薦中,慕課資源評分預測十分關鍵,直接決定了慕課資源協同過濾推薦結果的好壞,設r-u為慕課資源的平均評分,sim(i,j)是慕課資源i和慕課資源j之間的相似度,如式(1)所示。
1.3.3 相似度計算
當前慕課資源i和慕課資源j之間的相似度sim(i,j)的計算公式主要有:余弦相似度、皮爾遜相關系數和約束的皮爾遜相關系數,它們的計算公式分別為式(2)—式(4)。
云平臺的慕課資源協同過濾推薦算法選擇式(4)計算慕課資源i和慕課資源j之間的相似度。
2 仿真實驗
2.1 實驗環境搭建
為了測試云平臺的慕課資源協同過濾推薦效果,通過具體仿真實驗進行驗證性分析。云平臺包含10個節點,全部節點根據功能劃分兩類:一類主節點,數量為1個,一類為從節點,數量為9個,每一類節點的配置情況,如表2所示。
采用Java語言編程實現慕課資源協同過濾推薦算法。
2.2 實驗數據及實驗結果的評價標準
選擇大量的慕課資源實驗對象,共獲得10 000個慕課資源,它們被劃分為10類,每一類的慕課資源數量,如表3所示。
當前慕課資源協同過濾推薦算法性能的評價標準很多,本文選擇推薦準確度作為評價標準,其定義如式(5)。
2.3 慕課資源推薦準確度對比與分析
選擇文獻[9]和文獻[10]的資源協同過濾推薦算法進行對比實驗,對于相同的數據集,它們的慕課資源推薦準確度如圖3所示。
對圖3的慕課資源推薦準確度進行對比分析可以發現,本文算法的慕課資源推薦準確度要遠遠高于文獻[9]和文獻[10]的慕課資源推薦準確度,減少了慕課資源推薦誤差。
2.4 慕課資源推薦準時間對比與分析
為了分析云平臺的慕課資源協同過濾推薦算法的優越性,選擇單機平臺進行對比測試,不同數據的慕課資源下,云平臺的慕課資源協同過濾推薦算法和單機的慕課資源協同過濾推薦算法的運行時間如表4所示。
從表4可以看出,當慕課資源數量比較少時,單機的慕課資源協同過濾推薦時間更少,這是因為云計算需要對節點調度,當慕課資源不斷增加時,云平臺的慕課資源協同過濾推薦時間就相對更少,尤其當慕課資源數量較大時,云平臺的優越性更加明顯,可以實現大規模慕課資源在線推薦,具有更高的實際應用范圍。
3 總結
由于慕課資源的數量大,在線要求的實時性高,當前單機工作模式無法滿足慕課資源協同過濾推薦的要求,為了提高慕課資源協同過濾推薦效果,提出了一種基于云平臺的慕課資源協同過濾推薦算法,通過引入云平臺分布式、并行處理技術,在多個節點同時運行慕課資源協同過濾推薦算法,加快了慕課資源協同過濾推薦算法的工作效率,同時改善了慕課資源協同過濾推薦結果,相對其它算法,云平臺的慕課資源協同過濾推薦誤差更低,為大規模的慕課資源協同過濾推薦提供了一種新的研究思路。
參考文獻
[1] 柏建嶺,陳峰,趙楊,等.以慕課為基礎的生物統計學翻轉課堂教學[J].中國衛生統計, 2017, 34(5):829-831.
[2] 郭冰,孫小榮,吳杰. “慕課”背景下的工程測量教學改革思考[J].測繪通報,2017(3):145-148.
[3] 嚴三九,鐘睿. 教育資源的公平共享與可持續發展:慕課[J].中國人口·資源與環境, 2015,25(2):176-178.
[4] 石博,何楚,卓桐,等.慕課教學中基于局部社區發現的主題交互模型[J].計算機應用研究,2015,32(6):1724-1727.
[5] 蔣卓軒,張巖,李曉明.基于MOOC數據的學習行為分析與預測[J].計算機研究與發展,2015,52(3):614-628.
[6] 劉國麗,白曉霞,廉孟杰,等. 基于專家信任的協同過濾推薦算法改進研究[J].計算機工程與科學,2019,41(10):1846-1853.
[7] 鄭鵬,王應明,梁薇.基于信任和矩陣分解的協同過濾推薦算法[J].計算機工程與應用, 2018, 54(13):34-40.
[8] 黃賢英,龍姝言,謝晉. 基于用戶非對稱相似性的協同過濾推薦算法[J].四川大學學報(自然科學版), 2018,55(3):489-493.
[9] 王永貴,宋真真,肖成龍. 基于改進聚類和矩陣分解的協同過濾推薦算法[J].計算機應用, 2018, 38(4):1001-1006.
[10] 李昆侖,萬品哲,張德智. 基于改進用戶相似性度量和評分預測的協同過濾推薦算法[J].小型微型計算機系統,2018,39(3):567-571.
[11] 汪軍,朱建軍,覃朗. 基于云模型熟悉相似度的協同過濾推薦算法[J]. 計算機工程與科學, 2017, 39(11):2102-2108.
[12] 田保軍,杜曉娟,楊滸昀, 等. 云計算環境下混合協同過濾優化技術研究[J]. 計算機應用研究,2018,35(7):2079-2083.
(收稿日期:2019.07.26)