明巧英
(西安翻譯學院,西安 710105)
計算機與通信技術的迅猛發展,足以支撐了建設終身學習型社會的需求,網上在線學習因其信息量大、覆蓋范圍廣等特點,逐步走進人們的身邊,目前已成為一種普遍的學習方式。它有力地推動著我國教育大眾化的進程。但是,隨著時間的推進,學習者要求的不僅僅是時間的自由、學習資源的共享等,更多的是根據自身情況的個性化學習。因學生在興趣、學習風格、認知等方面存在差異,這些差異在一定程度上影響其學習效果。所以,個性化教育理論認為,學生的學習過程應該是“以學生為中心”,針對學生的個性特點、發展潛能來采取恰當的手段、起點、內容、進程等,把最適合學生自己的學習資源及教學設計提供給他,促使學生在各方面得到自由、充分、和諧的發展。這樣才能真正做到因材施教,提升學習效率。目前的網絡學習系統雖然很多,而且功能較強大,但都沒從根本上解決學生個性化學習的需求。其原因主要是:沒有充分考慮學習者的需求、習慣等,要求學習者去適應系統而不是系統適應學習者;其次是缺乏實時的幫助和有效的監管;再者是教學資源沒有被充分、有效的利用。這些導致了學生偏離學習目標、失去興趣等。針對上述問題本文具體采用決策樹方法分析學習者的學習風格,挖掘出其個性特征,為個性化學習系統提供決策依據,使個性化學習系統具有學習風格的獨特性、學習資源的多維性、學習過程的終身性等。
1.1 個性化學習的概念
個性化學習長期以來倍受關注,它的思想與實踐可追溯到中國的孔子和古希臘的蘇格拉底,人本主義、建構主義、多元智能、學習風格等學習理論都體現出個性化學習的理念。
從教學的角度,個性化學習被定義為在小班化、特別的環境中針對性的學習;從學生的角度,它被定義為學生自主選擇進行的學習模式。整體上,個性化學習是一種因材施教的學習方式,它強調對學習者個體差異的認識及其對整個教學的影響,具體的說,其概念包含以下核心特征:
1)個性化學習有明確的教學、學習目標體系。該體系由學生的個體特征及發展潛能驅動,進而衍生出相應的教學內容、教學策略、教學環節(環境)設計、教學評價體系等,其最終目標是學生的認知能力、實踐能力得到和諧、全面發展[1]。
2)個性化學習的教學模式必須符合學生認知心理現狀與發展規律。深入挖掘其個性特征,并提供其創造發展空間,使學生在學習的過程中實現自我追求與價值。
總之,我們不能忽視學習者之間的各種差異,而是努力確保學習者所接受的教育能使其優勢最大限度地發揮[2]。在線學習系統要實現個性化的學習功能,就必須根據學習對象組織能夠促進其充分發展的學習資源。
1.2 個性化的學生模型的構建
挖掘發現學生個性特征差異是個性化學習的前提,因此,開展個性化學習的首要任務是建構個性化的學生模型。完備的個性化學生模型能幫助教師掌握學生學情、給學生制定符合自身的學習方案、推薦相符的學習內容等。
IEEE1484.2PAPI模型是目前比較成熟的學生模型。該模型涵蓋了與學生學習相關的個人基本信息、安全信息、績效信息等。較好地反映出學生的認知能力,但未能更好地兼容學生學習過程的信息。它描述的學生個體模型及對學生個體特征的分析不夠深入,不能很好地反映學習過程中的非智力因素的影響。
學生的學習動機、學習風格、學習偏向及線上登錄時間、頁面停留時長、學習路徑等都是影響在線學習質量的重要參數,也可作為個人信息的擴展。通過對相關數據的適當擴展,不斷完善學生模型,為個性化學習提供決策依據。
針對上述問題,對IEEE1484.2PAPI模型進行了改進,如圖1所示,加粗部分是修改的。

圖1 面向個性化的學生模型
改進后的學生模型不但細化了學生的學習過程、學習特點,更細化了學生本身的個性特點。將圖1學生模型信息用五元組進行再次的歸類描述[3],如圖2所示。
學生的基本信息主要從其初次登錄系統時注冊的信息中獲取;認知水平是學生模型中的動態信息,它反應了學生的認知能力,包括課程、知識簇、知識點等;學習風格反映的是一個人的學習行為、素材類型喜好、參與活動情況、解決問題的能力等;學習狀態信息也是學生模型中的動態信息,它是隨著學生的不斷學習而變化的,主要包括學習用時、學習進度等;學習傾向包括認知、情感、目的等。

圖2 學生模型設計
總之,個性化學習模型的原則是依據學生的個性特征對學生進行分類,然后建立相應的學生模型并有針對性的向學生推薦與其學習風格和傾向相符的學習內容。
1.3 決策樹技術
數據挖掘就是從巨大的、不完整的、有噪聲的、隨機的、模糊的數據中,提取隱藏在其中的有價值的信息的過程[5]。它是在沒有明確假設的前提下去挖掘、發現知識的。數據挖掘方法可分兩大類,即類統計型和機器學習型,統計型常用的技術有相關性、概率分析、判別分析和聚類分析等;機器學習型是通過訓練、學習大量的樣本集得出需要的參數或模式。從機器學習中引出的決策樹方法根據給定的訓練樣本集來構建分類模型,模型用樹的形式來表達。決策樹算法常被分為兩個階段:決策樹的構建和修剪。決策樹按照根節點到葉節點的順序對實例進行分類,形成分類規則。其中的每個節點代表一個屬性,每個分枝代表它所連接的上節點在其屬性上的可能取值。決策樹在葉結點得到結論,所以從根到葉節點的一條路徑就對應著一條規則[6],整個決策樹就對應著一組析取表達式規則。決策樹停止分割的條件有進行分割的數據沒有再能用的屬性;同樣類別的數據都在該節點上。圖3簡單描述了決策樹的生成過程。

圖3 決策樹生成過程
2.1 決策樹在個性化學習中的應用分析
本文從以下幾個方面分析怎樣把決策樹方法應用到在線學習系統中。
1)學生特征挖掘與學習評價
根據學生的注冊信息、在線學習記錄、認知結構等,挖掘學生學習特征,使教師有根據的幫助學生達到既定行為目標;對數據庫中學生的行為記錄、學習成績、獎勵處罰等進行量化分析,不但可以即時得到學生學習情況的評價結果,而且可以減輕教師工作量,并克服教師主觀評價不客觀、不公正的弱點。
2)個性化學習
依據學生注冊時的信息以及需求紀錄,顯示給學生可能引起學習興趣的相關知識;在“以學生為中心”的學習理念的指導下,了解學生、分析學生,按照學生層次對學生分類,為學生“量身定做”學習資源和學習策略,引導學生根據各自的興趣特長進行學習;識別不同學生的喜好并建立相關信息檔案,并能根據學生的學習進度進行調整,使每個學生對系統的訪問都與其他學生不同。
3)改進網站設計
采用決策樹數據挖掘后,網站設計者可找出學生訪問頻繁的路徑,再根據頻繁路徑來修改網站的結構,即依據網站訪問者的相關信息來設計和修改網站結構及外觀。從而節約學生的訪問時間、提升網站的訪問率、減少網站開支。
4)分析需求趨勢
挖掘分析學生瀏覽學習資料的歷史數據,對學生的學習需求進行趨勢預測,評估學生需求傾向的改變,及時調整網站的專業設置與課程設置,在最大程度上滿足學生的個體需求,有助于提升網站的競爭力。
總之,決策樹技術在在線學習系統中的應用,可及時發現學生的個體特性,分析學生的需求變化,對網站進行針對性的改變等,從而實現學生的個性化學習,提高其學習效率。
2.2 決策樹在個性化學習中的應用流程
本文把決策樹在個性化學習中的應用流程細分為六個步驟:數據采集、數據預處理、數據量化、決策樹構建、決策樹剪枝、規則和結論的生成。
1)數據采集
本文的研究數據主要來源于學習系統的底層數據庫及學生的非智力因素兩大方面。底層數據庫的數據主要包括:學生的網頁瀏覽行為記錄、學生的電子筆記、實時交流等,這些數據主要用于分析學生在線學習行為對學習效果的影響。
研究非智力因素對學生學習效果影響的方法主要是對其調查問卷的統計分析,調查問卷回收所得數據的結構化是不能保證的,因此要對所得數據進行規約簡化處理,使最終得到良構的數據集。
2)數據預處理
數據預處理不但要將第一步得到的數據進行篩選并剔除無效的或置信度低的信息,而且要分析得到多組數據的相關系數和協方差,然后得出元素屬性。如果數據與所要分析對象的相關性低,則刪除掉。經過這一步壓縮和簡化處理,所得數據基本上就可用了。
3)數據量化
本研究需要對以下幾類數據分別進行不同的量化處理:
(1)將收集來的調查問卷中選項的形式轉化為簡約的文字描述形式,即將ABCD數據還原成所對應的文字。
(2)量化處理學習效果。本研究采用加權相關系數分析的結果,但該結果沒有直觀性,,所以取四分點劃分學習效果,從而得出學習效果的評定等級。
(3)分布類數據的處理。本研究按區間將分布數據(成績分布、時間分布等)進行劃分,分別用文字或布爾值表示。
(4)拆分處理并列類別的選項。本研究問卷的多選題的選項屬于并列類,對這類題首先應從宏觀角度考慮本題所有選項因素對學生學習效果的影響,然后再將選項拆分,進一步考慮各因素對學生學習效果的影響。
4)決策樹的構建
將經過上述處理的數據以訓練樣本集的角色輸入到開源平臺中,進行配置后生成決策樹。
5)決策樹的剪枝和評測
決策樹在生成時,限制了樹的深度和每一個節點至少要包含的要素數,對測試結果進行隨機序列分布分析和交叉驗證,并根據驗證結果來篩選規則,再分析篩選出規則的置信度及變量支持屬性,最終把較優的決策樹選取為預測模型。
6)生成規則和結論
當完成上述5個步驟后,就得到了一棵修剪好的、表述直觀的決策樹模型,經決策樹模型的根節點到葉子節點順序判定的方法提取出析取規則。
以下為在一周內,根據學生對學習資源的使用情況來分析學生的學習風格[7]。如圖4所示。停留時間長指停留時間≥15分鐘,點擊率高指一周內點擊次數≥9次,且同類型不一樣的資源學習次數≥3次,參與次數多指一周內參與答疑討論≥3次。
根據圖4的決策樹,每完成一次從根節點出發到葉子節點的過程就可形成一條規則,規則描述如下:

圖4 學習風格分類決策樹
(1)if(學習資源=媒體 and音/視頻=停留時間長、點擊率高)then (學生學習風格=視聽型);
(2)if(學習資源=媒體 and音/視頻=停留時間短、點擊率底 and教案/講義=停留時間長、點擊率高) then (學生學習風格=讀寫型);
(3)if(學習資源=媒體and音/視頻=停留時間短、點擊率底and教案/講義=停留時間短、點擊率底) then (學生學習風格=協調型)。
后面相似的,不再羅列。老師可依據學習風格分類規則給學生推薦適合的學習資源。
本系統設計的總體原則是:關注分析學生的問卷結果、注冊信息,并利用數據挖掘技術,挖掘系統數據庫,分類預測出學生的個性特征,然后根據學生自身的特點和規則庫中的規則,給學生制定或推薦適合的學習內容、學習路徑等。
3.1 系統的整體架構設計
系統的總體架構圖,它由數據采集層、數據存儲處理層、數據挖掘層、應用層組成,這四個層次是相對獨立的,如圖5所示。

圖5 在線學習系統的總體架構
1)數據采集層
該層的數據來源主要包括:教師上傳的各種學習資料、利用工具從網絡上采集的各種相關學習資料,還有從學生本身獲得的資料(學生想要在線學習,必須注冊自己的基本信息;開始學習某一門課前,需填寫自我認知能力預估表;自愿參加自我學習風格測試的測試結果;在線交流信息及網絡日志等)。
2)數據存儲處理層
該層主要對各種數據進行存儲、分析、計算、調度等。
3)數據挖掘層
該層主要對相關數據進行數據預處理、數據量化、利用支持工具構建決策樹、對決策樹進行剪枝,生成個性化推薦的相關規則和結論。
4)應用層
應用層主要是通過操作界面讓學生達到學習目的獲得滿意的。學生不但能應用普通的在線學習功能,而且可以由系統依據學生的個體特征給學生推薦適合的學習資源,從而完成學習者個性化服務、接收用戶需求以及反饋需求結果。
3.2 個性化學習模型設計
“個性化授導”的在線學習本質上是以學生需求為中心的個性化服務的過程。其既能根據學生特征提供學習資源即“授”,也能提供學習過程的支持服務指導學習即“導”。
學習系統的個性化學習模型結構如圖6所示,以學習者模型為核心實現個性化服務,老師的主要作用是教學設計、提供教學資源、對教學和學生行為作出診斷,同時實施一定的管理。個性化學習模型結構的主要模塊功能詳述,如圖6所示。

圖6 個性化學習模型結構
1)數據庫
系統中的數據庫包括:資源庫、用戶信息庫、規則庫。資源庫中存儲著大量的表現形式各異的學習資料,如講稿、PPT課件、電子書、知識點常見問題解答、單元分塊等;還有便于學生了解課程結構的說明,即課程地圖、目錄表等。用戶庫中保存的主要信息有:學生注冊時的基本信息、學習風格預測信息、學習日志、學生各項考核信息等[8]。這:些信息一方面反映出學生的知識水平和學習風格,另一方面給后期的數據挖掘提供了數據分析基礎,使系統的個性化有據可依。規則庫在學習系統中起著至關重要的因素。它包括的規則有:一開始就加載在庫中的教育界公認的規則、利用數據挖掘挖掘出來的規則、還有組織學習資料的依據,如給視覺型學生提供圖表、視頻一類的學習資料。規則庫中的規則既要不斷更新,也要經過專家的認可。
2)管理模塊
管理模塊主要是體現管理員對系統的管理維護,管理員可修改學習資源、用戶信息等,權限較高。再者教師也具有一定的管理權限,學習系統中教師的參與能彌補智能計算機的不足,給學生提供真正的個性化服務。
3)用戶模塊
用戶模塊主要體現系統的學習用戶。學習用戶在系統中可選擇自己要學習的內容,或使用系統給自己推薦的學習資源等。
4)學習者模型模塊
學習者模型是對學生在系統中的注冊信息、測試結果、學習過程、學習方式等進行的一定的分析、歸類及表示,如圖2。
5)數據挖掘模塊
數據挖掘模塊主要是從系統中存儲的大量的數據中,提取隱藏在其中的對學生個性化學習有價值的信息的過程。
6)個性化學習模塊
個性化學習模塊在結合學生模型和數據挖掘的基礎上,根據規則庫的數據動態,形成學習內容等,然后以不同的表現方式提供給不同的學生(如同樣意思的知識內容,有陳述簡單和詳細之分;同樣的知識有體現新知識傳授的,有體現知識掌握程度測試的;在知識內容相同的情況下,系統對不同的用戶顯示的頁面也不同)。學習系統這種有的放矢的個性化服務是依據學生的個體特征實現的。
3.3 基于決策樹的數據挖掘模塊設計
該模塊從服務器上獲取學生的檔案信息、學習動態信息等,進而對學生訪問日志的路徑補充后,對數據庫中的數據進行抽取、預處理、清除與挖掘無關的信息項等,最后得到學生信息的原始數據立方體數據庫,如圖7所示。

圖7 數據挖掘模塊
應用數據挖掘算法中的決策樹方法等來處理立方體數據庫,得到的挖掘結果,對學生個性模型進行不斷的補充和完善,最后依據規則等把學習內容以學生容易明白和接受的方式呈現,還可以通過服務器給學生反饋合適的學習策略及學習建議。
3.4 個性化推薦模塊設計
學習系統的個性化推薦模塊層次結構分為數據存儲層、數據挖掘層、推薦引擎層和應用層,如圖8所示。

圖8 個性化推薦模塊層次結構
數據存儲層主要存儲與學生有關的各種信息,由于存儲量巨大,所以是基于HDFS的分布式數據存儲。數據挖掘層對存儲的大量數據進行挖掘分析,找出潛在的有價值的信息。推薦引擎層在進行推薦時,以學生的個性特征、規則等為依據,給學生推薦偏愛的資源或信息類型,并發掘資源或信息自身的相關性,然后再根據對象間的關聯性進行推薦[9];對于有相同或相近特性、喜好的學生,可進行好友推薦,形成興趣小組;對于點擊率高的資源,可進行熱點推薦;新上傳的資源可進行最新推薦;還有最優路徑推薦等。
數據挖掘技術在學習系統中的應用,不但提高了學習系統的個性化服務水平,而且也為教學的決策分析提供了輔助手段。基于決策樹技術的個性化學習系統的分析設計充分考慮了學生的性格特點、認知水平等,構建出了個性化的學生模型,并完成了系統的分析設計。這些工作在一定程度上為在線學習系統的個性化應用提供了研究、推廣的參考價值。但該研究還有待于進一步深入的、全面的進行,直到把數據挖掘技術與個性化學習系統深度融合,最終成熟地應用在在線學習的各個 環節,增強學生的內部動機,以提高其學習的積極主動性,及其學習效率,使教學真正做到因材施教。
[1] 葛慶敏.基于WEB的個性化學習指導系統設計與開發[D].濟南:山東師范大學,2016.
[2] 朱興宇,時慶濤,李德泓.基于數據挖掘技術的個性化學習系統的設計[J].吉林廣播電視大學學報,2015(9):49-50,102.
[3] 王曉波.基于測試的個性化學習引導系統的研究與實現[J].計算機教育,2015(14):56-60,65.
[4] 陳超.基于數據挖掘的個性化學習模式研究[J].電子設計工程,2013,21(12):18-20,23.
[5] 陳芳.基于決策樹的個性化網絡教學系統的設計與實現[D].南京:東南大學,2015.
[6] 趙學孔,岑磊.面向用戶需求的自適應學習系統個性化學習路徑推薦研究[J].中國教育信息化,2016(21):28-31.
[7] 于洋.基于決策樹的網絡教學系統的學生模型研究[J].魯東大學學報(自然科學版),2013,29(1):32-34,37.
[8] 陳亦欣.基于人工智能的在線學習系統的研究與設計[J].江蘇科技信息,2017,(20):55-56.
[9] 王琳琳.基于協同過濾的在線學習個性化推薦技術研究[J].微型電腦應用,2017,33(05):49-51.
[10] 吳洪艷.智慧學習視角下個性化在線學習系統設計與應用[J].中國電化教,2015(6):127-131.