程允麗 賈瀟宇

摘要:本文圍繞大數據環境下個性化教育資源推薦系統的構建及關鍵技術研究展開,設計一個可以處理PB級教育資源的個性化推薦系統架構,并基于此架構實現一個教育資源個性化推薦系統。主要設計一種基于內容與基于協同過濾相結合的混合推薦算法,在滿足推薦新穎性要求的同時也解決了推薦系統的冷啟動問題。研究一個彈性的、可靠的、高性能的可以存儲、處理PB級數據并可進行實時推薦的個性化推薦系統架構,研究個性化推薦引擎,數據預處理及數據挖掘模型構建,對實現的推薦系統進行相關功能及性能驗證,確定系統的可用性有重要的意義。
關鍵詞:大數據、教育資源、推薦系統、技術研究
1. 研究的主要內容框架
項目研究的主要內容是設計一個可以處理PB級教育資源的個性化推薦系統架構,并基于此架構實現一個教育資源個性化推薦系統。個性化推薦系統建設時整體邏輯結構內部建設兩個子系統同時與外部另外兩個系統協作,即內部的分類樹子系統、個性化推薦Web子系統及外部的資源共享平臺、統一登錄系統相互協作實現系統功能。系統功能設計及應用總體架構如圖1所示:
MapReduce是一個分布式計算框架,最早由Google公司提出,因可以在上千臺廉價服務器組成的分布式集群中處理海量數據而被熟知,廣泛應用于大數據處理。本項目采用的是HadoopMapReduce,是一個廣泛使用的開源MapReduce實現,其MapReduce詳細執行過程如圖2所示。
3. 研究重點難點
(1)構建基于三維矩陣的數學模型。建立基于三維矩陣的數學模型。將得到的數據的每個屬性定義為空間中的一個維度,從而構成一個N維空間。
(2)基于協同進化思想的關聯規則分析方法。采用改進的遺傳算法和粒子群算法對兩個種群同時進行迭代,彌補遺傳算法早熟收斂和后期收斂速度慢的缺陷,有效地搜索出高質量的關聯規則。
4. 研究技術路線
課題圍繞大數據環境下個性化教育資源推薦系統的構建及關鍵技術研究展開,在對現有研究成果進行梳理分析的前提下,立足于實踐發展需要,采用以下幾種研究方法,從多角度對個性化教育資源推薦系統的構建的應用,結合數據預處理技術、個性引擎推薦、數據挖掘技術等問題及對策展開探討。
(1)三維矩陣數學模型
將所有矩形按照一定規則組合形成一個包含所有信息的三維矩陣即我們建立的數學模型。三維矩陣數學模型如下圖3所示。
本課題圍繞大數據環境下個性化教育資源推薦系統的構建及關鍵技術研究展開,在對現有研究成果進行梳理分析的前提下,立足于實踐發展需要,從多角度對個性化教育資源推薦系統的構建的應用,結合數據預處理技術、個性引擎推薦、數據挖掘技術等問題及對策展開探討。設計了一個可以處理PB級教育資源的個性化推薦系統架構,以面向大數據的可拓數據挖掘技術作為研究對象,旨在為大數據時代下的數據分析技術、數據提取技術以及可拓數據挖掘技術打下理論基礎,并最終建設一個基于可拓數據挖掘技術的教育資源個性推薦系統。
參考文獻
[1]基于大數據的個性化自適應在線學習分析模型及實現[J]. 姜強,趙蔚,王朋嬌,王麗萍. ?中國電化教育. 2018(01)
[2]獲取教育大數據:基于xAPI規范對學習經歷數據的獲取與共享[J]. 顧小清,鄭隆威,簡菁. ?現代遠程教育研究. 2017(05)
[3]一種基于Kademlia的全分布式爬蟲集群方法[J]. 黃志敏,曾學文,陳君. ?計算機科學. 2018(03)
[4]大數據與智慧教育[J]. 柯清超. ?中國教育信息化. 2018(24)
[5]面向大數據的開源推薦系統分析[J]. 米可菲,張勇,邢春曉,蔚欣. ?計算機與數字工程. 2018(10)
基金項目
(1)2019年1月,主持廣東省特色創新項目(人文社科)--《新工科背景下創新人才培養模式研究》(2018GWTSCX054),已順利開展;
(2)2019年5月,主持《新工科背景下高職院校大數據專業建設與創新人才培養模式研究(GDYJSKT19-13)》廣東省高等教育學會高職高專云計算與大數據專業委員會項目,已順利開展;