張春飛1,李萬龍2,魏久鴻1
(1.吉林大學計算機科學與技術學院,吉林長春 130062;2.長春工業大學計算機科學與工程學院,吉林長春 130012)
當今社會,人們越來越重視教育的投入,據不完全統計,每年世界各類組織用于教育培訓的費用高達250億美元[1]。傳統的學習過程僅僅局限于書本和課堂,顯然已不適應今天教育的快速發展。E-learning環境允許學習者在模擬實驗室中進行實驗[2],觀看視頻和在線學習其他國家的語言[3]。E-learning系統可以概括為一個基于web的系統,通過用戶在線通訊技術來實現學習者與學習系統的交互[4]。目前,它主要是指網上課程的學習。不同的基于web的學習管理系統已經發展到在線對學習者的學習過程進行全程實時幫助。傳統的網絡教學環境缺乏用戶與系統的交互,不能智能地分析和評估教育資源,從而導致不能根據學習者的學習水平制定個性化的學習指導[5]。根據學習者的學習層次提供合適的交互的學習環境能夠追蹤學習者的學習特點,從而提供個性化的學習課程[6]。當學習者帶著相同的學習請求再次登錄該系統時,個性化的學習推薦模型便自動生成了。通過分析學習日志信息,為學習者提供個性化的學習資源。而且這些算法可以識別學習者的興趣和偏好,從而在無處不在的網絡環境中為學習者創建自適應的學習內容[7-8]。
本文給出了一種個性化的學習評價環境,并提出一種新的稱為推拉模式的E-learning模式。在拉模式中,數據采集和分析技術用于挖掘個人的學習信息。在推模式中,利用決策樹理論和個性趨勢分析算法來分現學習過程中薄弱環節,從而給用戶提供合理的學習建議。
考慮到傳統的網絡教學環境的不足之處,基于推拉模式的思想提出了一個交互式的個性化E-learning系統框架。推和拉模式可以有效地提高用戶與系統之間的交互性。
信息采集和分析模塊的主要功能是在LAN范圍內從所有節點收集和分析個性化的學習信息。這些信息資源主要包括注冊信息、登錄狀態、學習狀態以及網絡日志等。系統的數據挖掘模塊動態地生成相應的記錄,從而提供一個更好的交互式的學習環境,幫助學生方便地查詢他們的學習情況。基于這些個性化的分析信息,系統能夠提供學習者的智能評估情況,以及用于改善教學環境的合理建議。信息的采集和分析的過程主要依賴于LAN中的不同的agent節點。本文給出了一個面向教育的動態點擊流采集算法。Agent結點將收集所有的數據信息來構建數據庫中的表,進而進行個性化的分析和評估。
推模式的主要任務是選擇合適的算法來建立個性化的學習評估模型。信息分析和評估模塊如圖1所示。應用決策樹理論和個性趨勢分析算法來評估學習者的學習現狀,并提供給他們合理的建議。評價結果存放在一個表中,稱為PLAT表,即個性學習推薦表。

圖1 個性化的評價和推薦模塊
為了更好地了解學習者的狀態,本文引入個性趨勢分析算法,基于對一個人的學習狀態評估和考試結果,能夠預測該學習者的學習趨勢。學習趨勢能夠表現出,如果該學生繼續當前的學習方法、進度和狀態,那么在下一階段的學習中,會得到什么樣的結果。通過分析趨勢預測的結果,系統可以及時調整教學方法和策略,以保證在其下一個學習階段能達到更好的學習效果。個性趨勢分析算法分為以下幾個部分:
2.1.1 歸一化數據
原始數據如表1所示。對于各種各樣的評估數據,該算法只選擇與系統相關的幾個數據集,并且將其歸一化成0~10范圍內的數據,作為下一次數學分析的基礎。假設當前有n個數據集,如果算法選擇其中的m個數據集,算法的預測深度為τ,則它應該滿足0<τ 表1 原始數據集表 2.1.2 原始數據處理 (i)累積轉換 (ii)平均值轉換 2.1.3 計算功能 2.1.4 評估和預測 (i)MSE(均方誤差) (ii)比值 (iii)最小誤差率 通過以上的計算,數據評估和預測值如表2所示。 表2 評估和預測表 在表2中,pi0的值越大越好,ci0的值越小越好,它們是對當前原始數據的評估。從x贊i(ni+1)到x贊i(ni+τ)是對該組數據集在下一階段預測的結果。這表明學習者目前的學習狀態,及在未來可能達到的學習效果。 表3 預測等級表 表3是預測等級表,Level1是最好的預測結果,它表明如果學習者保持目前的學習狀態,將能夠保持一個好的學習趨勢。相對來說,Level4是最壞的情況。學習者必須調整學習方法和策略,以扭轉當前的不良的學習情況。 在推模式下,決策樹理論用來對一門學科進行分析,并且對學習者的學習信息進行評估。在決策樹的構建過程中,信息增益方法通常用于幫助確定生成決策樹的分枝。假設集合E=F1×F2×…×Fn是一個n維有限的向量空間,其中Fj是一個有限的離散符號,E中的元素Vj∈Fj,j=1,2,…,n。設PE和NE是E中的兩個實例的子集,分別稱為正樣例集和負樣例集,其大小分別為P和N。決策樹算法是基于以下兩個假設進行的。 在向量空間E中,對于任意集合的一個正確的決策樹的分類概率同E中的正樣例集和負樣例集的概率是一致的。構建一個決策樹來制定正確的決定所需的信息集合如下: 如果以屬性A作為決策樹的根,A具有V個值(V1,V2,…,Vv),它將E分為V個子集(E1,E2,…,Ev),假設Ei中包含有Pi個正樣例集和Ni個負樣例集,那么Ei子集所需的期望信息就是I(Pi,Ni),從而使屬性A作為根的信息熵表示為: 將A作為根節點的信息增益是:Gain(A)=I(p,n)-E(A)。選擇Gain(A)的最大值,也就是說,選擇E(A)取最小值的屬性A*作為根節點。對A*的不同取值對應的E的V個子集Ei遞歸調用上述過程生成A*的一組子節點B1,B2,…,Bv。 在個性趨勢分析算法實驗中,我們選擇了兩個學生的相同數據集,每一個都含有10個原始數據,選擇其中9個進行計算,算法的預測深度為3,原始數據如表4所示。 表4 兩名學生相同類別的原始數據表 計算結果如表5所示。根據表3的預測等級,在這個類別中,學生1有一個非常好的數據樣本,他對應的等級為Level1,個人學習趨勢處于上升階段。學生2的數據不夠理想,他對應的等級為Level3,他的學習趨勢處于下降階段,因此,如果他不能改變目前的學習方法策略,那么將來獲取知識的情況會更加糟糕。 表5 預測結果表 在學科評估實驗中,決策樹算法用于提供教學推薦。選擇五門課程的160個考試成績作為測試集來評估學生的情況。測試成績如表6所示。 表6 五門課程成績表 將160條記錄全部作為訓練集,并將這些記錄分為A、B兩個層次,如表7所示。 表7 分數統計表 因此,算法可以得到Course1所需的信息: 基于以上決策樹理論分析,算法的計算過程主要遵循以下規則: 依據以上規則,使用該系統的教師可以適時地調整和改進他們的課程和教學策略,以取得最佳的教學效果。 基于教學過程中的推拉模式,本文提出了一個基于Agent的交互式個性化學習評估模型。引入個性趨勢分析算法,設計了個性分析和評估模塊,用于滿足不同用戶的交互性和個性化需要。實驗結果證實該評估算法的有效性和準確性。然而,信息采集的效率和個性化評估的準確性等問題仍需將來的進一步完善。 [1]R.Johnson,S.Hornik,E.Salas.An empirical examination offactors contributingtothe creation ofsuccessful e-learningenvironments[J].International Journal ofHuman-Computer Studies,2008(66):356-369. [2]H.J.Gibbons,C.Evans,A.Payne.Computer simulations improve universityinstructional laboratories[J].Cell BiologyEducation,2004(3):263-269. [3]H.Y.Xu,Y.Feng.Design and Implementation on E-learningSystembased on Agent and integrated with studycontext[J].Computer Engineeringand Design,2009(30):515-520. [4]路鵬,周東岱,解月光.面向E-learning領域的軟件體系結構設計[J].中國電化教育,2011(197):125-131. [5]Q.J.Wang,R.M.Shen.Studies on Web MiningBased Intelligent and Personalized Distance learningEnvironment[J].Computer Engineering,2000(26):157-159. [6]藍雯飛,鄭波盡.基于資源整合的E-Learning系統研究[J].計算機應用與軟件,2011(3):53-57. [7]李好,楊貫中.基于本體的E-Learning課程構建[J].計算機工程與設計,2010(4):881-884. [8]A.Rae,Y.K.Dwivedi.Web-based implementation ofthe Personalized SystemofInstruction:Acase studyofteachingmathematics in an online learningenvironment[C].Int.J.ofWeb-based Learningand TeachingTechnologies,2007(1):36-39.









2.2 學科評估:決策樹分析算法


3 實驗和分析
3.1 評價:個性趨勢分析算法


3.2 推薦:決策樹分析





5 結語