摘 要:個性化教學實現方法的研究是人們對網絡教學提出的更高層次要求,也是未來教育信息化發展的必然趨勢。從現有網絡教學系統缺乏深入了解用戶興趣的實際現狀出發,提出了一個基于Agent的個性化教學系統原型,并結合神經網絡技術,以用戶興趣追蹤為出發點,探討了采用啟發式算法來獲取用戶興趣特征的方法,從而以最快的速度學習到最新的用戶興趣。
關鍵詞:個性化教學;用戶興趣;Agent;BP神經網絡
中圖法分類號:TP183 文獻標識碼:A 文章編號:1001-3695(2006)10-0189-02
Study of Personalized Tutoring System Based on Agent
ZHANG Xiaobo1,HAN Yongguo2,LIN Yong1,LIU Guangqi3
(1.Automation Research Institute,ShandongAcademy of Sciences, Jinan Shandong 250014, China;2.College of Computer Science, SWUST, Mianyang Sichuan 621002, China;3.Computer Science Center,ShandongAcademy of Sciences, Jinan Shandong 250014, China)
Abstract:The research of the personalized teaching is more highlevel request that people put forward for network teaching, and it is the inevitable trend of educating informationbased development in the future. For the existing network tutoring systems lack in the method and tactics of understanding user’s personalized needs in depth, a personalized tutoring system prototype based on Agent is given. By means of neural network technology, user’s objective behavior is studied heuristically, which combines user’s subjective interest information. As a result, the later user’s interest is obtained fast.
Key words:Personalized Teaching;User Preferences;Agent;BP Neural Network
人類已經進入了網絡時代,網絡技術的發展為網絡教學提供了一片嶄新的天地。與傳統教育相比,網絡教學的學生群體存在著個性差異大的特點,這對教學及其教學系統提出了個性化的要求[1]。現有的網絡教學系統,雖然自身信息量極其豐富,但缺乏深入了解用戶個性化需求的方法和策略。研究滿足個性化需求的方法,對于網絡教育和知識科學等具有重要的意義。個性化教學系統將直接關系到網絡教學的有效性,其設計已經引起了人們廣泛的關注。
為了在國家“863”計劃項目“縮小數字鴻溝—西部行動”專項課題“基于國產軟硬件的多通道網絡教育關鍵技術與應用研究”提供的西部中小學網絡教育平臺中發現學習者全體特征和學習者個體特征,為個性化教學提供更可靠的基礎,在項目中引入了Agent技術和神經網絡技術。
一般認為,Agent是一個自治的實體,它能夠感知環境,并且對外界的信息作出一定的判斷和推理,以此來控制自己的決策和行動,完成一定的任務[2]。由于Agent具有自主性、社會能力、自適應性和移動性,若將這些特性應用到個性化的遠程教學系統中,便能很好地解決學習者在學習過程中的個性化問題,達到個性化教學的效果。另外,在網絡教學中引入BP神經網絡技術,隨時跟蹤用戶的學習行為,同時結合用戶主動提交的相關信息對用戶個人興趣進行學習分類,可以避免技術上的實現難度,還能夠快速適應用戶的變化,從而更加準確地刻畫出用戶的興趣特征,提供滿足需求的個性化教學服務,達到良好的教學效果[3]。
1 基于Agent的個性化教學系統設計
為了幫助用戶選擇更適合其個性特征及知識水平的教學內容,以便提供更好的教學服務,本文提出一種個性化網絡教學系統原型,如圖1所示。
個性化教學系統中的個性化主要體現在對學習者的興趣特征進行提取、分析和處理,系統根據處理的結果自動提供給學習者符合其興趣特征和知識水平的教學內容。教學系統進行個性化處理的全過程如下:
(1)新用戶注冊及用戶建模。教育平臺的新訪問者首先需填寫好自己的基本資料后進行注冊,成為本網站的免費用戶,系統為該注冊用戶進行建模。
(2)用戶信息采集。當用戶登錄到系統,通過身份確認后,他可以主動向系統提交其興趣愛好以及感興趣的程度。同時在學習過程中,系統的用戶行為采集Agent開始收集用戶請求,跟蹤用戶的行為,這里一般收集的信息有用戶學習課件的類型及時間、點擊的URL、表單填寫的情況,以及做作業、考試的過程和結果等。采集到的數據被送到用戶信息數據庫進行信息的預處理和歸一化。
(3)興趣分析。興趣分析Agent根據最新采集的原始數據結合用戶興趣數據庫進行個性分析,產生結果,更新用戶興趣數據庫,并將結果送往個性化調度中心。
(4)信息推薦和再學習。調度中心根據個性化信息和用戶請求對原有網站課件信息庫發出調度命令,將用戶最需要的課件信息推薦給用戶。
2 用戶興趣分析功能的實現
用戶興趣分析模塊是個性化教學的核心模塊,它決定Agent的學習能力與適應能力。用戶興趣的學習是根據用戶對教學信息的選擇,采用某種學習方法來逐步明確用戶興趣的一個過程。實質上它是一個機器學習的過程,可采用多種機器學習的方法來實現它。本文采用BP神經網絡來學習用戶的興趣。
2.1 興趣學習模型的BP網絡結構
在用戶興趣學習模塊中采用了具有一個隱含層的三層BP神經網絡,在設計BP網絡時應注意以下四點:
(1)輸入層和輸出層的設計。本網絡中,假設有N個興趣類別,則輸入層和輸出層神經元的節點數為N,網絡的輸入模式向量為
Xk=(χ1, χ2,…, χN),k=1,2,…,m
式中的m為學習樣本個數。
網絡的輸出模式向量為
Yk=(γ1,γ2,…,γN),k=1,2,…,n
式中的n為興趣學習的次數。
(2)隱含層和隱含層神經元數的確定。隱含層單元數的選擇是一個非常復雜的問題,目前還沒有通用的法則。隱含層單元數與問題的要求、輸入/輸出單元的多少有直接的關系。網絡隱含層單元數太少,則不能訓練好網絡,或網絡不強壯,容錯性就比較差;但隱含層單元數太多又會延長網絡學習的時間,而且會出現“過學習”的情況,誤差并不一定是最小[4]。對本系統而言,存在一個最優隱含層單元數的問題。本文采用以下經驗公式確定隱含層單元數:
H=I+J+k
其中,H為隱含層節點數,I為輸入層節點數,J為輸出層節點數,k為1~10之間的整常數。
(3)初始權值的選擇。由于系統是非線性的,初始值對于學習是否能夠收斂、是否達到局部最小以及訓練時間的長短關系很大。如果初始值太大,使得加權后的輸入落在激活函數的飽和區,從而導致其導數f ′(x)極小,而在計算權值修正公式中,因為δ正比于f ′(x),當f ′(x)→0時,則δ→0,使得ΔWij→0,從而將使調節過程停頓。所以,一般總是希望初始加權后的每個神經元的輸出值均接近于0,這樣可以保證每個神經元的權值均能夠在它們的S型激活函數變化最大之處進行調節。因此,一般取初始權值在(-1,1)之間的隨機數。
(4)學習速率的選取。學習速率決定每一次循環中所產生的權值變化量。大的學習速率可能導致系統不穩定,但小的學習速率又會導致學習時間較長,可能收斂速度很慢,不過能保證網絡的誤差值不跳出誤差表面的低谷而最終趨于最小誤差值。所以在一般情況下,傾向于選取較小的學習速率以保證系統的穩定性。學習速率的范圍一般選取在0.01~0.7間。
2.2 用戶興趣分析Agent的功能實現
用戶登錄教學網站后,用戶興趣分析Agent會跟蹤用戶的所有信息瀏覽行為,修改用戶興趣知識庫中的各項興趣度和相關性系數,以達到對用戶興趣愛好的全面掌握。興趣學習Agent如圖2所示,其興趣分析過程如下:
(1)當用戶瀏覽課件時,Agent自動獲取該課件的各項參數,如關鍵字集合所屬分類,同時取出當前用戶的個人興趣隊列以及相應的興趣度。另外,使數據庫中該用戶點擊課件所屬分類的點擊次數增加1。
(2)BP神經網絡根據用戶的當前興趣度以及歷史瀏覽課件行為的統計數據進行訓練,得到BP網絡參數。
(3)用戶登錄系統學習完后,根據用戶最新的瀏覽行為對用戶興趣進行預測,得到當前最新的用戶興趣及其相關興趣度。
(4)檢查用戶個人興趣隊列,若某興趣點對應的興趣度大于閾值δ(設δ=0.6),則說明這是用戶目前感興趣的內容。
2.3 興趣學習模塊測試
在該系統實現時,假設興趣類別分為植物、動物、人物、天文現象、加減運算、乘除運算、方程運算、平面幾何、英語等九個類別。系統輸入向量的值為用戶每次登錄網絡教學系統所點擊各興趣類相關課件的次數,如Xk=(6,3,0,1,0,0,0,1,2),則說明該用戶本次登錄學習了六個植物類課件,三個動物類課件,兩個英語類課件,一個天文現象類課件和平面幾何類課件;輸出向量的值為當前用戶對植物等各類課件感興趣的興趣度值,如Yk=(0.8,0,0,0,0,0,0,0,1),則說明當前用戶對植物感興趣的興趣度值為0.8,對英語類感興趣的度值為1,其他的不感興趣。
為檢驗用戶興趣學習模型的正確性,本文選取如表1所示的用戶統計數據作為實驗樣本數據進行建模。其中前10次登錄的10組數據為訓練樣本,第11次統計數據為預測樣本,在程序中對數據首先要進行歸一化處理。當前該用戶的興趣度為<0.9,0,0.5,0,0,0,0.6,0.9,1>。
表1 用戶的統計數據
根據經驗公式選取隱含層節點數為九個。本文的最大訓練次數為60 000,初始學習速率為0.05。
訓練過程中,誤差變化曲線如圖2 所示。從圖中可以看出,依照上述原理建立的BP網絡,全局收斂速度較快,迭代次數一般小于5 000次,且誤差較小,平均誤差不超過0.435%,計算成本低。為檢驗模型的正確性,選取用戶第11次登錄的統計數據進行檢驗。檢驗結果如表2所示。
表2 BP網絡對用戶第11組數據的模擬輸出
甲O0O1O2O3O4O5O6O7O8110.899 10.001 30.496 70.001 30.001 30.001 30.595 20.900 20.998 7實驗結果的數據表明,用戶甲對植物類(X1)、平面幾何類(X8)、英語類(X9)非常感興趣。通過測試用戶的反饋,這與他們目前的興趣愛好基本一致,滿意度達90.8%,這說明用BP網絡對用戶興趣進行預測確實是可行的。
3 結論
本文提出的基于Agent技術和BP網絡技術興趣學習模型,具有很高的靈敏度和區分度以及很好的預測效果,學習的誤差較小,收斂速度很快。目前,本系統已經應用到“縮小數字鴻溝——西部行動”專項課題“基于國產軟硬件的多通道網絡教育關鍵技術與應用研究”項目中。根據實際應用的檢驗,證明該系統是BP網絡一個成功應用的實例。這對構建個性化網站具有很好的借鑒意義,也將給計算機軟件與理論的研究和發展以新的啟迪[5]。
參考文獻:
[1]沈軍.網絡教學中個性化策略研究[J].計算機研究與發展,2003,40(4):589-595.
[2]Phlip R Cohen,Adam Cheyer,Michelle Wang,et al. An Open Agent Architecture[M].CA:AAAI Press,1994.1-8.
[3]Hash D R,Home B G.Progress in Supervised Neural Networks[J].IEEE Signal Processing Magazine,1993,3(1):8-39.
[4]高寧.基于BP神經網絡的農作物蟲情預測預報及其MATLAB實現[D].合肥:安徽農業大學,2003.917.
[5]楊宗凱,吳砥,劉清堂.網絡教育標準與技術[M].北京:清華大學出版社,2003.193-213.
作者簡介:
張曉波(1977-),女,河南鄧州人,助理研究員,碩士,研究方向為計算機網絡技術及應用、智能交通;韓永國(1963-),男,四川遂寧人,副院長,副教授,博士,研究方向為分布式計算;林勇(1973-),男,四川資陽人,網控室副主任,副研究員,博士,研究方向為實時交通信息估計與預測、動態交通需求估計與預測、微觀交通仿真及管理信息系統;劉廣起(1978-),男,山東德州人,助理研究員,碩士,研究方向為圖像處理。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文