陳小峰
(淮南師范學院,安徽 淮南 232038)
學生模型是ITS(Intelligent Teaching System,智能教學系統)核心組成部分之一,ITS的主要功能是實現個性化學習.而學生模型創建的好壞直接關系到ITS為學生提供個性化服務的水平.只有設計出科學合理的學生模型,才能全面細致地分析學生學習特點和自身特性,制定科學合理的教學策略,達到個性化教學的目的.本文主要針對ITS學生模型設計方法進行研究,提出了一種認知型學生模型的設計方法.
隨著對學生模型的研究,研究者提出了多種構造學生模型的方法,常見的有以下幾種:
①覆蓋模型:將學生的領域知識看作專家知識的一個子集.專家知識可以被分解為各個模塊或項目,學生模型描述學生對各項目的掌握程度.通過這一技術,易于找到學生的知識結構缺陷,并向學生推薦應學習的內容.
②偏差模型:是在覆蓋模型基礎上發展起來的,把學生的錯誤概念表示為專家知識的偏差.通過建模學生的錯誤,系統能夠給出具體的不久措施.
③認知型模型:認知能力是學習過程當中的一個重要能力,覆蓋模型和偏差模型只能顯示出學生的學習水平.認知模型不僅可以對學生的知識水平和學習情況進行反映,而且也是對學生認知能力的反映,這一點對學生及教師都非常重要.
認知學習理論認為,學生學習的實質,是在以學生為認知主體的基礎上,對外界刺激主動形成認知結構的過程.因此,我們在設計ITS過程當中,以激發學生的學習興趣和學習動機為首要的目的,將教學內容與學生原有的認知結構有機的聯系起來,不再是單純灌輸學生知識.
每個人的情況有所不同,因此,在學生進行系統信息注冊時,我們需要確定學生的學習風格,我們會要求學生根據自己的情況去選擇學習風格,或者通過系統設置的問卷進行調查,綜合兩者的數據后,得到一個較為客觀的結果,這樣可以避免學生自身把握不準的偏差影響分析結果,便于更好的體現學生的個性特征,從而更準確地實現個性化教學指導.
在課程設置上,我們將課程的章節根據難以程度定力積分和等級制度,通過這種形式去調動學生學習的熱情,滿足學生學習的成就感.而教師也可以利用學生反饋回來的信息,以學生的實際情況為依據進行課程內容的更新設置,更好的實現因材施教.
利用學生的六種認知能力(知道、領會、運用、分析、綜合、評價),診斷學生在學習過程當中的學習情況,并在以后的學習中,對學習狀態進行修改,不斷提高數據的準確性,以利于教師與學生對其學習情況進行全面的了解.
通過學生學習過程當中的狀態的變化,將這些動態的變化反饋到學生模型當中,利用數據挖掘技術對相關的信息進行挖掘,為學生的學習與教師的教學提供有用的信息,為學生的學習活動進行檢測提醒.
在教學系統的使用過程當中,日志記錄了學生的所有活動,利用數據挖掘技術對這些日志進行分析,就可以推斷出學生的背景、興趣、心理特征等個性化資料,為個性化教學提供依據.本學生模型應用的Web日志挖掘技術包括數據采集、數據預處理、模式分析和應用等環節.
學生在訪問遠程教育網站時,留下了許多數據信息,包括用戶的IP地址,用戶ID,請求方法,訪問時間,傳輸協議,錯誤代碼等屬性.本系統的數據采集是利用挖掘技術從學生學習留下的數據信息中取出與探索目標相關的數據子集,為后面的個性化教學實施提供素材和資源.
從學習者的訪問日志中得到的原始日志記錄并不適于挖掘,必須進行適當的處理才能進行挖掘,其中的步驟主要包括數據清洗、用戶識別、會話識別、路徑補全和事物識別.
3.2.1 數據清洗
數據清洗包括刪除一些對于分析沒有意義的數據,去掉SC-Status中的出錯記錄,及用戶請求方法中非“GET”的記錄.網頁上的圖片在日志中也記錄為單獨的請求,這對于挖掘用戶興趣一般沒有意義,通常去掉它們.
3.2.2 會話識別
一個會話(Session)就是用戶從進入到離開網站的一系列瀏覽請求.在跨越時間段較大的Web日志中,用戶可能多次訪問了該網站,會話識別的任務就是把屬于同一用戶的同一次訪問請求識別出來.本系統使用了時間戳的方法,例如,我們將時間戳設為30分鐘,30分鐘內同一用戶只在同一頁面瀏覽內容,都只把前面的所連續訪問的頁面作為一個頁面集,超過30分鐘則視為一個新的會話.
3.2.3 路徑補全
由于存在客戶端緩存,當用戶使用瀏覽器的后退功能時會產生路徑信息不完整的描述.路徑補全就是把用戶會話中的訪問路徑補全,從而更好的反映用戶的訪問過程.例如如果學習者的歷史訪問記錄上有多個頁面都包含與當前請求頁面的鏈接,則將請求時間最接近的作為當前請求的來源,如果引用信息不完整,可以利用站點的拓撲結構來代替.
3.2.4 事務識別
在本系統中,我們將事務定義為教學內容頁面和為達到頁面而經歷的所有輔助頁面《提供鏈接、進行導航的頁面》的序列之和.本系統采用最大向前引用路徑來定義事務.例如,一個學習者請求的頁面順序是①→②→③→④→③→⑤,這表明學習者在訪問完④以后退回③再鏈接到⑤,所以,這個訪問序列生成兩條訪問路徑①→②→③→④和①→②→③→⑤.
模式分析是利用挖掘算法挖掘出新穎的、潛在的及最終可以被理解的信息和知識.常用的模式分析有統計分析、關聯規則、聚類和分類、序列模式及依賴關系建模等,在本系統的學生模型中,我們根據需求,采用聚類和分類技術對學生進行分析.
分類技術可以給出識別一個特殊群體公共屬性的描述,這種屬性可以用于分類學習者.例如:在/P1/P2頁面學習的學生中有30%是物理專業的.
聚類分析可以從Web訪問信息數據中聚類出具有相似特性的學習者,有利于開發和設計未來的教學模式和學習群體.例如:在學生的學習過程中,通過分析Web日志我們發現一類學生在學習的過程中,對知識頁面瀏覽的時間較短,但測試成績較高.我們則可以把這部分的同學歸為學習水平較高的一組,并通過調整教學策略,在該用戶的下一次的學習中,適當增加測試難度或提供其它的相關課外學習資源,以供其更深入全面的學習課程,實現個別化的教學指導.
我們設計的推理機的功能主要體現在兩個方面,一是擁有領域知識、學生模型知識,二是具有選擇教學策略知識來解決問題的能力.通過產生式規則來表示教學策略知識,使用基于產生式系統的推理規則來設計推理機.
產生式系統是認知心理學研究人類心理活動中信息加工過程的基礎,其求解問題的過程和人類思維很相似,可用來模擬人類求解問題的思維過程.基本形式為:IF X Then Y.其中,X代表前提或原因,Y代表結論或現象.基本組成如圖1所示:

圖1
在本系統中,規則庫是學生在學習過程中所有可能出現情況的應對策略的存儲器,其信息存放于數據庫表1中.動態數據庫用于存放系統推理過程中各種當前信息的數據結構,如問題的初始狀態、中間推理結論和最后結果等,其信息存放于數據庫表2中.當規則庫中的某條前提可與動態數據庫中的某些已知事實相匹配時,該產生式就被激活,并把它推出的結論放入動態數據庫中,作為后面推理的已知事實.

表1 規則表

表2 事實表
完整、準確的規則庫是系統高度智能化和個性化的前提,根據我校對系統的教學要求,積極進行調查研究,聽取教師和學生的建議,我們進行了規則的制定,以下是其中的一些規則示例:
(1)IF分析能力低THEN未通過(2)IF識記能力低THEN未通過(3)IF操作能力低THEN未通過
(4)IF分析能力一般AND識記能力一般AND操作能力一般AND總體認知能力較高THEN通過
(5)IF未通過AND試題難度<0.7 THEN重學本章內容
(6)IF未通過AND試題難度>=0.7 THEN重做測試題

圖2
產生式系統的運行過程如圖2所示,就是推理機不斷運用規則庫中的規則,作用于動態數據庫,不斷進行推理并不斷檢測目標條件是否滿足的過程.當推理到某一步,目標條件被滿足,則推理成功,系統運行結束;或者再無規則可用,但目標條件仍未滿足,則推理失敗,當然系統也運行結束.成功的推理可以為學生提供科學合理的教學策略,達到個性化教學的目的.對于不成功的推理,在使用過程中我們應總結原因,并不斷完善規則庫,使系統日趨科學.
本學生模型通過Web日志挖掘技術及學生自主選擇等方式確定學生的個性化資料,結合產生式規則庫和推理算法,智能呈現相應的的學習內容和學習流程,具有一定的實用價值.學生模型基于模塊設計,具有一定的通用性,把此模型加入到教學軟件中對提高教學軟件的智能特性大有益處.
〔1〕楊卉,王陸.在智能教學系統中兩層動態學生模型的研究[J].電化教育研究,2005(1).
〔2〕孫中紅.個性化智能網絡教學系統學生模型的研究[J].中國電化教育,2009(10).
〔3〕曲紅亭,申瑞民.基于數據挖掘的個性化學習導航系統的設計與實現[J].計算機工程,2003(5).
〔4〕李錚,趙桂欽.ICAI系統學習者建模的研究[J].計算機工程與科學,2002(03).
〔5〕楊靜,高琳琦.顧客偏好的動態挖掘算法楊[J].信息與控制,2007(01).