朱興宇 時慶濤 李德泓
(長春工業大學應用技術學院,吉林 長春 130012;長春工業大學人文信息學院,吉林 長春 130122;吉林大學,吉林 長春 130000)
基于數據挖掘技術的個性化學習系統的設計
朱興宇 時慶濤 李德泓
(長春工業大學應用技術學院,吉林 長春 130012;長春工業大學人文信息學院,吉林 長春 130122;吉林大學,吉林 長春 130000)
網絡技術的進步帶動了基于網絡的學習方式,越來越多的學生需要個性化的學習服務。本文引入數據挖掘技術和個性化服務思想,設計了一個基于“C#程序設計”課程的個性化學習系統。該系統能根據
關聯度和個人學習興趣向學生推薦學習內容,充分體現了個性化學習的思想,滿足了不同學生的學習需求,激發學生學習的興趣和自主學習的積極性。
學習系統;
關聯;學生興趣模型;個性化推薦;模糊聚類
隨著網絡技術和多媒體技術的飛速發展,人們的學習不再受時間、空間限制,越來越多的教學系統將知識內容以多種形式呈現給學生,使學生對學習內容達到深層次的理解。但是仍然存在著問題,最主要的是這些系統以其自身為中心,沒有充分考慮學生的個性需求與習慣,沒有充分按照不同學生的個性化需求來提供學習服務,造成學生學習興趣較低,學習效果不明顯的問題。
所謂個性化學習主要是強調以個別差異為出發點,以學生興趣與需要為中心,以每個學生能力與個性的最大發展為目標。
本文是以“C#程序設計”課程為課程基礎,C#語言是一門對象程序設計語言,應用領域十分廣泛,例如:
數據庫應用程序開發,各種業務管理軟件,比如企事業單位的財務管理系統,醫院的醫療管理系統等,C#提供的數據訪問技術非常適合這類軟件的開發;Web應用開發,使用ASP.NET技術設計網站十分流行,C#正是該技術的主要后臺開發語言;RIA應用程序,支持C#語言的SilverLight技術已普遍用于各種前端應用;智能設備應用,隨著移動互聯網的普及,越來越多的智能設備出現,應用C#語言和相關技術開發的應用也呈現增多的趨勢。
綜上所述,為不同知識結構,不同技術需求的學生設計一個C#學習的個性化學習系統是必要的,也是基于Web學習系統發展的趨勢。
本系統包括三類用戶,即系統管理員、教師、學生。管理員角色具有的功能:學習專題資源管理、用戶權限管理、關鍵詞關聯閥值設置;教師角色具有的功能:學習專題資源的錄入,教學資源的管理。學生角色具有的功能:C#知識學習,課程資源學習,主題收藏,根據系統推薦學習等功能,其中知識以專題的形式呈現,每個專題中都包含不同方式呈現的知識,系統結構如圖1。

圖1 個性化學習系統系統結構
系統由教學資源管理、學習專題資源管理、學生興趣管理和個性化推薦模塊3部分構成。教學資源是指“C#程序設計”課程的相關課程資源,包括:大綱、教案、實驗指導書、實訓指導書等。學習專題資源管理用來組織和管理學生學習的專題資源,并計算專題關鍵詞關聯度,為個性化推薦模塊提供學生學習的專題關聯模型;學生興趣管理通過學生對專題資源的學習,構建學生興趣模型,為推薦專題提供數據支持;個性化推薦模塊可以采用兩種方式為學生推薦其感興趣的專題內容,基于關鍵詞關聯推薦和基于用戶興趣度的推薦。
學習專題資源管理存儲的是豐富的學習資源。筆者認為,“學習資源”不應僅局限于C#程序設計課程,同時還應包括課程中未講授到,但實際軟件開發項目中經常使用的知識點。這些知識點以專題形式呈現給學生。每個專題由多種學習手段組成,一個專題包括若干文章、視頻、案例、專題測試、程序示例,專題關鍵詞由有經驗的教師設置。
本文中的關聯模型采用基于向量空間模型的表示法,
關聯算法如下:
(1)檢索所有專題的構成一個n維向量{p1,p2,…, pn},其中pi=(ki,ci),1≤i≤n,ki為i為出現i的次數。
k
,c
(2)利用如下公式計算兩個之間的關聯度

(3)形成關聯矩陣,存入數據庫,供個性化推薦模塊使用。
關聯度高,說明專題的關聯度也比較高,管理員根據
關聯度設置推薦閥值。
學生興趣管理是整個系統的重要模塊,負責提取學生的興趣特征,計算學生學習專題的興趣度,構建學生興趣模型。
1、學生興趣模型的表示方法
在個性化學習系統中,首先收集學生的興趣信息,然后由學生興趣管理模塊將所收集的學生興趣信息從無結構的原始形式轉化為計算機能夠理解的結構化形式,也即構建學生興趣模型,而模型的表示方法決定了其反映學生真實興趣的能力和計算能力。目前,常見的模型表示方法有:主題表示法、關鍵詞列表表示法、基于神經網絡的表示法、基于本體論的表示法和基于向量空間模型的表示法。本文的學生興趣模型采用基于向量空間模型的表示法,將學生興趣模型表示成一個n維特征向量:

其中,每一維分量fi稱為學生的一個興趣節點,由專題Si及其權重Wi組成,權重Wi表示學生對某個專題Si感興趣的程度。
2、學生興趣度計算
本系統中的學習專題的學習方式由文章、視頻、案例、專題測試、程序示例構成,不同專題對于學習形式的重點不同,允許教師為不同的學習方式設置不同的權重,但要求總權重為1,即滿足:
專題權重=文章權重(AW)+視頻權重(SW)+案例權重(C教師在添加專題內容時,需要設置文章標準學習時間,視頻標準學習時間,測試標準通過率。
學生學習某一專題文章興趣度計算公式:
其中TAi表示該專題下第i篇文章學生學習時間,TSi表示該專題下第i篇文章的標準學習時間。
其中TSi表示該專題下第i個視頻學生學習時間,TSAi表示該專題下第i個視頻的標準學習時間。
若某個專題存在n個案例,學生下載了其中i個,則
專題測試興趣度計算方法,若學生測試專題正確個數/測試總個數≥測試標準通過率,則專題測試興趣度(TP)= TW,否則專題測試興趣度(TP)=0。
每個專題的程序示例只有1個,若學生下載了該示例,則程序示例興趣度(PP)=PW,否則程序示例興趣度(PP)=0。
學生對專題的興趣度=AP+SP+CP+TP+PP,計算結果存入學生興趣庫。
本系統采用兩種方式為學生推薦學習內容,一是根據關聯度實現推薦,二是基于學生興趣模型,采用模糊聚類的方法實現推薦。
1、基于關聯的推薦
C#語言可以在Window編程、網絡編程、Web應用、圖像處理等各個方面作為語言工具,學生在學習C#過程中,根據自身情況可以有重點的學習。關鍵詞推薦可以很好的指導學生的學習方向。
推薦算法:
(1)獲取學生學習過的專題及其特征向量

其中Si表示學生學習過的專題,kli表示該專題的列表;
(2)獲取存入數據庫的關聯矩陣,遍歷
列表kli,找到
關聯度大于閥值的
,形成列表L1;
(3)根據L1獲取推薦的專題列表SL;
(4)在SL中去掉用戶已經學習過的專題,形成推薦專題列表ISL;
(5)呈現ISL供學生選擇學習。
2、基于學生學習興趣的推薦
從學生興趣庫獲取學生興趣向量,計算學生和學生之間的相似度,按照相似度排序,推薦相似度排在前10位的學生所學習過的專題。具體算法如下:
(1)學生相似度采用歐氏距離計算n維向量公式兩個學生之間的距離,fi={(s1,w1),(s2,w2),…,(sn,wn)},fj={(s1,w1),(s2,w2),…,(sn,wn)},具體公式如下:

(2)得到模糊相似矩陣R,利用如下公式修改R

系統中的λ采用靜態值,分別設置為0.2、0.5、0.8,代表用戶相似度的模糊、普通、精確。
(3)根據相似矩陣和當前λ值,生成學生的相似度列表LS;
(4)當前用戶遍歷LS,按照倒序獲取興趣相近用戶所學習過的專題列表;
(5)呈現專題列表供學生選擇學習。
個性化學習一直是數據挖掘領域的一個重要方向,本文采用了關聯規則和模糊聚類2種數據挖掘技術,設計了個性化學習系統,該系統實現了根據學生當前的興趣需求向其提供學習專題的目標,體現了個性化學習的思想,本文采用兩種方式實現專題學習內容的推薦,是對構建個性化學習系統的有益嘗試。如何更準確地提取和表示學生的興趣特征以及如何更精確地體現學生的興趣變化等將是需要進一步研究的工作。
[1]曹曉明,何可抗.學習設計和學習管理系統的新發展[J].現代教育技術,2006,16(4):57-63.
[2]劉通江,王陸.基于信息理論的個性化教學系統的研究[J].計算機工程與應用,2004,40(9):104-106.
[3]林月排,汪更生,陳棄秋.個性化推薦系統中的用戶建模及特征選擇[J].計算機工程,2007,33(17):196-198.
[4]趙立江,何欽銘.一種個性化Web推薦系統的研究與實現[J].武漢理工大學學報,2004,29(5):681-684.
[5]姜強,趙蔚.自適應學習系統述評及其優化機制研究[J].現代遠距離教育,2011,(6):57-63.
[6]José Janssen,Adriana J.Berlanga and Rob Koper.E-valuation of the Learning Path pecification[J],Educational Technology&Society,2011,14(3):218-230.
TP311
B
1008-7508(2015)09-0049-03
吉林省教育廳“十二五”科學技術研究項目(吉教科合字[2013]第157號)。
2015-05-11
朱興宇(1982-),吉林長春人,長春工業大學應用技術學院講師,碩士,研究方向:人工智能與數據挖掘、軟件工程。時慶濤(1981-),女,吉林長春人,長春工業大學人文信息學院信息工程系講師,碩士,研究方向:軟件工程、嵌入式系統。李德泓(1993-),吉林長春人,吉林大學信息系統與信息管理專業,研究方向:信息處理及應用。