楊楨 從傳鋒



摘 要: 針對傳統網絡教育方向選取方法在向用戶推薦網絡教育方向中存在選取方法不準確,用戶滿意度低的問題,提出基于大數據的網絡教育方向選取方法。采用基于本體樹的個性化網絡教育方向推薦算法構建學生特征行為概念本體樹和網絡教育資源特征概念本體樹,對不同網絡教育資源本體樹的關聯度進行計算。給出算法流程模型圖,該算法實現過程中將網絡教育資源的特征概念與數據庫中的網絡教育資源進行相似度匹配,實現學生用戶對網絡教育資源的個性化選擇,將學生用戶偏好相似度運用到網絡教育方向選取過程中,有利于實現網絡教育方向的個性化選取。實驗結果說明,所提方法可為用戶選取正確的網絡教育方向,具有較高的準確率和召回率,用戶滿意度高。
關鍵詞: 大數據; 網絡教育; 方向選??; 特征概念; 本體樹; 相似度
中圖分類號: TN911?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2018)15?0087?05
Research on network education direction selection method based on big data
YANG Zhen, CONG Chuanfeng
(Foreign Trade and Business College of Chongqing Normal University, Chongqing 401520, China)
Abstract: The traditional network education direction selection method is inaccurate to recommend the network education direction for users, and has low user satisfaction. Therefore, a network education direction selection method based on big data is put forward. The personalized network education direction recommendation algorithm based on ontology tree is adopted in the method to construct the ontology trees of students behavior concept and network education resources characteristic concept, and calculate the correlation degree of different network education resource ontology trees. The diagram of algorithm flow model is given. The similarity matching is performed for the characteristic concept of network education resources and network education resources in database in the process of algorithm implementation to realize the personalized selection of student user for network education resources. The preference similarity of student user applied to the selection process of the network education direction is conducive to the realization of personalized selection of the network education direction. The experimental results show that the proposed method can select the correct network education direction for users, and has high accuracy and recall rate, and high user satisfaction.
Keywords: big data; network education; direction selection; feature concept; ontology tree; similarity
隨著科學技術的發展,互聯網和教育也在逐漸互相融合,網絡教育已成為社會進步的發展趨勢。將大數據技術運用到網絡教育中能逐步完善教育體系改革[1],革新傳統教育在教學中存在時間及空間局限的問題,運用大數據技術處理海量的教學資源,對相關資源進行整合可提高網絡教育資源的利用效率。傳統平均值的網絡教育方向選取方法存在選取結果用戶滿意度低、選取方法不當的問題,本文提出基于大數據的網絡教育方向選取方法,實現用戶對網絡教育方向的精確選取。
本文基于大數據的網絡教育方向選取方法,采用基于本體樹的個性化網絡教育方向推薦算法,實現網絡教育方向的準確選取。本文方法利用本體樹對學生用戶和網絡教育資源采取本體描述,得到學生行為概念和網絡教育資源特征概念本體樹,將數據挖掘算法運用其中,將用戶需要的內容推送給用戶,實現網絡教育方向的個性化推薦。分別對學生用戶和網絡教育資源進行本體樹構建,可以得到用戶對網絡教育資源的選擇結果,再根據學生用戶對網絡教育資源的需求將與其相類似的網絡教育資源推薦給學生用戶。同樣的網絡教育資源特征概念本體樹也會尋找網絡資源間的聯系[2],方便學生對網絡教育方向進行選擇。

在大數據環境下,學生用戶在對網絡教育資源A進行搜索時,學生特征行為概念本體樹會將與網絡教育資源A相關的教學資源推薦給學生用戶,根據學生用戶的學習方式和學習時間推送適當的網絡教育資源。本文采用OWL本體構建方法構建學生特征行為概念本體樹對學生學習的特征進行描述[3],并對學生行為本體樹的相似度進行計算。圖1為學生特征行為概念本體樹。
網絡教育資源可以采用網絡教育資源特征概念本體樹描述,網絡教育資源特征對應概念本體樹相應的特征概念節點[4]。本文采用OWL本體樹構建方法對網絡教育資源本體樹進行構建,將每一種網絡教育資源都描述成網絡資源教育本體樹,對不同網絡教育資源本體樹的關聯度進行計算。圖2為網絡教育資源特征概念本體樹。
學生用戶對網絡教學資源A進行搜索時,可以采用網絡教育資源特征概念本體樹將網絡教育資源的特征概念與數據庫中的網絡教育資源進行相似度匹配[5],將匹配結果從大到小進行排列構成網絡教育資源列表,用于學生用戶選取適合自己的網絡教育方向,根據自己學習行為尋找適合的網絡教育資源類型,最后將網絡教育資源列表和適合學生的網絡教育資源方向推薦給用戶,實現學生用戶對網絡教育資源的個性化選擇[6]。圖3為算法流程模型圖。
1) 計算特征概念節點相似度
[S=S1,S2,…,Sn]表示所有特征概念節點集合,特征概念節點個數為[n],特征概念節點[Si]和[Sj]之間的相似度用[L(Si,Sj)]表示,本文對特征概念節點相似度的計算公式如下:
[L(Si,Sj)=Distance(Si,Sj)+α?α?d(Si)+d(Sj)CE(Si,Sj)×2?Dep?maxd(Si)-d(Sj)] (1)
式中:[Distance(Si,Sj)]為特征概念節點[Si]和[Sj]間的最短距離和;特征概念節點[Si]和[Sj]在本體樹中的位置用[d(Si)+d(Sj)]表示;最短路徑的條數用[CE(Si,Sj)]表示;[α]為常數,可取任意值。
利用式(1)能夠得到本體樹特征概念節點的相似度。學生用戶對網絡教育資源的需求和網絡教育資源方向都在不斷地更新和完善,取任意的用戶需求和網絡教育資源對其進行相似度計算,[Ri=a1,a2,…,an]和[Rj=b1,b2,…,bn]為任意網絡資源特征集合,則[Ri]和[Rj]的相似度計算過程為:
[Sim(Ri,Rj)=αL(a1,b1)+βL(a2,b2)+…+γL(an,bn)] (2)
式中的[L(a1,b1)]通過式(1)計算得出,[α]和[β]均為與特征概念節點相對應的相似度計算權重。
2) 算法描述
輸入:待搜索網絡教學資源A
輸出:個性化的網絡教育方向
步驟1:學生用戶對需要搜索的網絡學習資源A進行分析,并對學生用戶特征節點概念本體樹實施構建,建立學生特征行為概念本體樹。
步驟2:將搜索的網絡教育資源A的特征概念節點與網絡教育資源數據庫實施相似度匹配。
步驟3:將相似度輸出結果進行相似度大小排列,并根據學生用戶的學習習慣,輸出學生用戶對網絡教育資源可接受的難易度。
步驟4:對學生用戶可接受的網絡教育資源進行篩選,確定最終輸出結果。
步驟5:將確定的網絡教育方向推薦給學生用戶,并根據學生用戶的滿意度結果對網絡教育方向的推薦結果進行修改。
將學生用戶的偏好相似度用于基于大數據的網絡教育選取過程中,有利于實現網絡教育方向的個性化推薦。將每位學生用戶的偏好矩陣EQ視為[n]維向量,通過計算[n]維向量中余弦夾角的方法,得到學生用戶對本文基于大數據的網絡教育方向選取方法的偏好相似度[7]。學生用戶[ui]和[uj]的偏好向量分別為[ui=(eqi1,eqi2,…,eqin)]和[uj=(eqj1,eqj2,…,eqjn)],對學生用戶的偏好相似度計算公式為:
[rsij=cos(ui,uj)ui×ujui×uj=k=1neqikeqjkk=1neq2ikk=1neq2jk] (3)
利用式(3)計算學生用戶對網絡教育方向選取的偏好相似度 [8],得到學生用戶偏好相似度系數RS,是對角線為1的對稱矩陣。
[RS=1rs12…rs1nrs211…rs2n????rsk1rsk2…1] (4)
假設每個網絡教育方向都有幾個學生用戶對其進行評價反饋[9],將第[d]個學生用戶對第[i]個網絡教育方向的第[j]個網絡教育資源的評價記作[Qdij],已知學生用戶的偏好相似度為[EQt(eqt1,eqt2,…,eqti)],采用式(3)計算當前學生用戶的偏好相似度與[k]個學生用戶的偏好相似度[RSt(rst1,rst2,…,rsti)],記作:
[SUM1=i=1neqti, SUM2=i=1krsti] (5)
第[i]個網絡教育方向的偏好相似度的總和為:
[Qti=d=1krskdSUM2j=1neqtjSUM1Qdij] (6)
先按照學生用戶的偏好相似度計算公式對網絡教育方向進行偏好相似度求值,得到學生用戶偏好相似度系數RS,相似度高的評價結果具有較高的參考價值。通過式(6)可以得出所有網絡教育方向的偏好相似度的總和[10],記作[Ft=(Qt1,Qt2,…,Qtm)],該結果反映了學生用戶對網絡教育方向偏愛的個性化數值,針對學生用戶的網絡教育方向推薦列表,向其進行專屬的個性化網絡教育方向推薦。
實驗為了檢測不同用戶對網絡教育方向選取方法推薦的網絡教育資源的主觀感受,通過用戶滿意度調查問卷評估不同方法的用戶滿意度情況。調查問卷中包括四種情況:
情況1:推薦的網絡教育資源都非常符合我的興趣,是我想找的;
情況2:推薦的網絡教育資源大部分滿足我的興趣;
情況3:推薦的教育資源很多不滿足我的興趣;
情況4:不知道為什么會推薦這些資源給我,我不感興趣。
實驗隨機選擇某大學的100名學生,發放100份調查問卷,回收100份調查問卷,統計學生對本文方法以及傳統平均值網絡教育方向選取方法推薦的各項情況的勾選次數,結果用圖4描述。
分析圖4可得,用戶對本文方法的情況1和情況2的勾選次數更多,說明本文方法推薦給用戶的網絡教育資源更滿足用戶的興趣度;用戶對傳統平均值選取方法的情況3和情況4的勾選次數更多,說明傳統平均值選取方法推薦給用戶的網絡教育資源無法滿足用戶的興趣度。相對于傳統平均值選取方法,本文方法推薦結果具有更好的效果。
實驗通過準確率檢測本文基于大數據網絡教育方向選取方法的預測用戶行為的查準率,通過離線實驗得到方法的準確率,同時實施定量運算。將為用戶選取的網絡教育資源基于用戶是否感興趣以及方法是否為該用戶實施準確選取進行分析,能夠劃分成圖5描述的4種狀態。
圖5中范圍[R1]是用戶感興趣同時方法為其推薦的,[R2]是用戶不感興趣但方法為其推薦的,[R3]是用戶感興趣但方法沒有選取的,[R4]是用戶不感興趣但方法沒有選取的。準確率是選取列表中用戶感興趣的教育資源占據為其選取的教育資源的比例,也就是圖5的上端,網絡教育資源選取的準確率為:
[Precision=R1R1+R2] (7)
召回率是評估選取方法預測用戶行為的查全率,其用于描述方法為用戶推薦出的網絡教育資源占數據庫內全部用戶可能感興趣教育資源的比重,是圖5中的左半部分,網絡教育方向選取方法選取結果的召回率為:
[Recall=R1R1+R3] (8)
實驗采用的數據集來自于某大學英語、化學、物理、數學和計算機的網絡教育資源庫,面向每種網絡資源隨機選擇50位用戶,分別采用準確率運算公式以及召回率運算公式,運算本文方法以及傳統平均值選取方法下50位用戶在不同類型教育資源下的平均準確率和平均召回率,結果分別用表1,表2描述。
對比分析表1和表2能夠看出,本文方法對不同類型教育資源選取的準確率以及召回率都高于傳統平均值選取方法,說明本文方法能夠向用戶推薦出高質量的網絡教育資源,提高網絡教育方向選取的準確度和穩定度。
用戶的滿意度是評估網絡教育方向選取方法是否滿足用戶需求的關鍵參數。實驗分別采用本文方法和傳統平均值選取方法為用戶實施網絡教育方向選取服務,基于用戶對選取結果滿意度的評估,從兩個方面實施分析: 各網絡教育方向選取服務用戶對請求過的4門網絡教育課程的教育服務滿意度平均值如圖6a)所示;每門課程教育服務的全部用戶滿意度平均值如圖6b)所示。
對比分析圖6a)和圖6b)可得,無論是用戶請求過的全部網絡教育方向選取服務的滿意度均值,還是每門課程網絡教育服務的滿意度均值,采用本文方法的用戶滿意度都高于平均值選取方法。
本文提出基于大數據的網絡教育方向選取方法。實驗結果表明,相比傳統的平均值選取方法,本文方法提高了用戶對選取結果的滿意度,增強了網絡教育資源的應用價值。
參考文獻
[1] 彭飛霞.MOOC時代遠程教育品牌營銷與擴散:兼論教育大數據的調節作用[J].成人教育,2016,36(3):41?46.
PENG Feixia. Brand marketing and diffusion of distance education in the MOOC era: on the adjusting function of macro educational data adult [J]. Education, 2016, 36(3): 41?46.
[2] 鄧莉瓊,肖秋根,李中寧,等.基于大數據分析的計算機網絡課程自適應學習系統構建[J].計算機工程與科學,2016,38(z1):276?280.
DENG Liqiong, XIAO Qiugen, LI Zhongning, et al. Construction of an adaptive learning system of computer network course based on big data analysis [J]. Computer engineering and science, 2016, 38(S1): 276?280.
[3] 趙夢龍,唐鄭熠,萬良,等.大數據分析中基于MapReduce的空間權重創建方法研究[J].計算機應用研究,2016,33(7):2068?2070.
ZHAO Menglong, TANG Zhengyi, WAN Liang, et al. Research on construction method of spatial weights based on MapReduce in analysis of big data [J]. Application research of computers, 2016, 33(7): 2068?2070.
[4] 黃麗霞,蔣永福,傅榮賢.基于新建構主義的高校信息素質教育模式研究[J].圖書情報工作,2014,58(7):35?39.
HUANG Lixia, JIANG Yongfu, FU Rongxian. Research on college information literacy education model based on new constructivism learning theory [J]. Library and information service, 2014, 58(7): 35?39.
[5] 張長海.基于批判性思維和創造力的我國大學生信息素養教育模式研究[J].中國圖書館學報,2016,42(4):102?116.
ZHANG Changhai. An information literacy education model of undergraduates in China based on critical thinking and creativity [J]. Journal of library science in China, 2016, 42(4): 102?116.
[6] 李青,任一姝.教師數據素養能力模型及發展策略研究[J].開放教育研究,2016,22(6):65?73.
LI Qing, REN Yishu. Research on teacher data literacy competency model and development strategy in smart education [J]. Education research, 2016, 22(6): 65?73.
[7] 陳琦,鄧娜.青少年本土優秀傳統文化教育模式探究:以紹興市為例[J].圖書館論壇,2014,34(4):49?53.
CHEN Qi, DENG Na. Exploration on the educational pattern of local fine traditional culture for teenagers: taking Shaoxing City as an example [J]. Library tribune, 2014, 34(4): 49?53.
[8] 唐濤.基于大數據的網絡輿情分析方法研究[J].現代情報,2014,34(3):3?6.
TANG Tao. Research on method of Internet public opinion analysis based on big data [J]. Modern information, 2014, 34(3): 3?6.
[9] 艾小平,董澤芳.“四元多維”教師教育模式的理論建構與運行策略[J].教育科學,2014,30(1):43?49.
AI Xiaoping, DONG Zefang. The theory construction and the operation strategy on "quaternary subjects and multi?dimensional" model of teachers′ education [J]. Education science, 2014, 30(1): 43?49.
[10] 馮登國,張敏,李昊.大數據安全與隱私保護[J].計算機學報,2014,37(1):246?258.
FENG Dengguo, ZHANG Min, LI Hao. Big data security and privacy protection [J]. Chinese journal of computers, 2014, 37(1): 246?258.