計算機自適應測試系統研究綜述

2015-07-03 12:44:41于建芳徐振國劉劍

中國教育技術裝備 2015年6期

關鍵詞：計算機

于建芳++徐振國++劉劍

摘要首先介紹計算機自適應測試的國內外研究現狀，然后簡要介紹自適應測試的理論基礎，最后結合目前計算機自適應測試系統的不足，總結其未來的發展趨勢。

關鍵詞計算機；自適應測試；項目反應理論

中圖分類號：TP315 文獻標識碼：B

文章編號：1671-489X（2015）06-0028-02

1 國內外研究現狀

在自適應測試領域，國內外都進行了許多研究。國內影響力較大的有北京師范大學的余勝泉教授對自適應測試系統進行了探索，歸納了自適應測試系統的特點。他提出了適應性學習模式，包括三個關鍵環節：學習診斷、動態地組織學習內容以及學習策略。并且研究了系統中各模塊的功能。

首都師范大學的研究者王陸教授主持的個性化學習支持系統和游戲化虛擬學習社區都是自適應測試系統在輔助教學方面的實踐，為網絡學習提供了一個很好的平臺，主要研究了學生的學習風格和性格對學習的影響。他研制了面向小學課程學習的個性化課件生成系統，該系統能夠實現教學策略的個性化、創造力、教學活動序列的多樣化以及科學地對學生進行分類。

華南師范大學的陳品德博士等人提出了體現自適應特征的學習支持系統結構模型，提出應從兩個方面來考慮，即適應性的內容呈現和適應性的導航支持，并基于這兩方面，開發了支持自適應學習的環境。

浙江大學教育學院、教育技術研究所張劍平教授在適應性學習支持系統方面也頗有研究，曾申請了國家社會科學基金教育學課題項目“遠程學習機制及其在適應性學習支持系統中的應用”，完成該項目的同時，還發表了許多相關研究成果。

從近十年國內有關自適應測試系統的研究論文的研究內容來看，國內對于自適應測試系統的研究主要集中在四大方面：自適應測試系統的整體性建模；系統各個組件的研究；先進技術與自適應測試系統的結合；自適應測試系統的比較研究。但國內自適應測試系統的產品還有待于開發，多數還是集中在理論研究。

國外針對自適應測試系統進行的研究與實踐的案例比比皆是。較早開展適應性測試系統這方面研究的國家是美國，美國匹茲堡大學的研究者等研究者早在20世紀90年代末期就建立了一個專門的自適應超文本與超媒體網站，這是世界上第一個驗證自適應效果的自適應教學系統。此外，世界上其他一些國家也做了很多自適應的研究，如德國、英國、澳大利亞、加拿大、奧地利等國家也一直在追蹤自適應的研究。在理論層面，取得較豐富成果的方面有適應性學習的概念、特點、模式、關鍵因素、適應性測試系統結構等，在技術層面能提供個性化服務的自適應測試系統也如雨后春筍般涌出。

德國學者格哈德主持研究的自適應項目，是一個基于網絡的關于編程語言入門學習的自適應學習支持系統，這是一個智能可交互的網絡教學系統，并且在德國特里爾大學的教學活動過程中取得很好的試驗效果。美國密蘇里大學的研究學者設計與開發了一個自適應智能代理系統，它是一個基于網絡的、分散的、多代理的測試系統，能夠自適應內容呈現以及自適應導航支持。

2 自適應測試的理論基礎——項目反應理論

項目反應理論的基本假設及反應模型項目反應理論（Item Response Theory，簡稱IRT）基于三個假設：能力單維性假設；局部獨立性假設；項目特征曲線假設。IRT模型是一種數學模型，通常按照參數個數對模型進行分類，含有一個參數（難度）的為單參數模型，含有兩個參數（難度和區分度）的為雙參數模型，含有三個參數（難度、區分度和猜測系數）的為三參數模型，其中三參數模型是最復雜的。項目反應模型能夠從概率的角度來解釋被試者對題目的應答情況。

項目反應理論優點與經典測量理論相比，項目反應理論具有的明顯優點有：被試能力參數和項目參數具有不變性的特征，考生的能力值與所施測的項目無關，這是項目反應理論與經典測量理論最大的區別；被試能力參數與項目難度參數具有統一的量表；可以針對不同被試精確估計每個項目及測驗的測量誤差。在測試過程中，可以對能力水平不同的被試施測不同的測驗題目，并且測驗不受時間地點的限制，縮短測驗長度，同時還提高了測驗的精度。

參數估計方法常用的參數估計的方法有近似技術、最小卡方估計技術、極大似然估計、貝葉斯估計、邊際極大似然估計。其中，極大似然估計和貝葉斯估計是兩種最常用的方法。

終止規則終止規則分為兩種：固定測驗長度和不固定測驗長度。固定測驗長度是指當實測數目累加到預設值時即停止，如當實測數目為25時停止測驗。不固定測驗長度指的是當測驗滿足事先設定的標準誤精度時終止測驗。

3 自適應測試系統研究的不足

目前的自適應測試系統固然有諸多優點，但是同時也不可避免地存在一些不足，有待于完善的地方。

用戶模型的構建不完善用戶模型構建是適應性測試系統建設過程的最重要部分之一，是保證實現自適應測試的前提和基礎。但是當下許多自適應測試系統中的用戶模型構建有待完善，有些系統只考慮了認知水平，忽略了學習風格；而有的系統則只考慮了學習風格，忽略了認識水平。用戶模型設計時考慮的因素全面性不足。

針對性和智能性弱不能根據學習者自身情況提供有針對性的、智能化的交互界面，不能根據學生的能力提供有針對性的指導，學生在測試系統中不能準確找到自身的定位。

缺乏對網絡教育的實際性影響大多數對于自適應測試系統的研究都是在論述如何將自適應的思想應用于網絡教學，但對網絡教育產生的真正意義上的影響不大。

缺乏靈活授導自適應測試系統雖然屬于人工智能領域的范疇，但它受既定“經驗”的制約，缺乏對不同學習者的個性化指導，對不同的學習者幾乎采用相同的指導方案，不能很好地實現因材施教。

輕視“學生為主”過程設計自適應測試系統應該以學生為中心，但目前有的測試系統在師生角色上還是不夠明確，有待于完善。

人機交互不足，缺乏沉浸式體驗目前多數自適應測試系統都缺乏沉浸式體驗功能，學生不能切身體驗到人機交互的感覺，這是因為被試者與系統以及被試者之間的相互交互不能動態適應，系統資源共享力度不夠。

對學習者需求的研究和個性化學習方案的適應性不足研究者更多的還是關注網絡課程自身的建設，忽略了對學習者需求及其個性差異的研究。此外，現有的適應性測試系統在個性化學習方案的設計上適應性不夠，這也會影響學習效果。

4 自適應測試系統研究的未來發展趨勢

自適應測試系統的研究是近幾年來教育技術領域的研究熱點，通過對國內相關研究文獻的統計和分析，總結出自適應測試系統的研究呈現如下發展趨勢。

研究重點的轉變目前，自適應測試系統的研究重點已由整體的理論研究轉向局部組件的設計。在未來，隨著自適應測試系統及其組件產品的不斷增多，研究重點將轉變為自適應測試系統標準化問題的研究，標準化問題會對不同的自適應測試系統間的通信及數據交換產生直接影響。

關注模型的轉變在之前的研究中，學者多用現有的一些量表來推測學生的學習風格，從而構建學習風格模型。但在未來，僅僅單純地研究學生模型是不夠的，位置模型和設備模型的設計與開發也將是未來自適應測試系統的一個研究趨勢。

適應焦點的轉變目前的測試系統自適應引擎組件主要是適應測試內容，在未來對測試情景的適應也將是一個重點。測試情境指的是自動感知被試者的地理位置、設備情況等。

涉及領域的轉變自適應測試系統研究最初只是簡單地涉及到教育學和計算機科學，但隨其研究和應用的不斷深入，已經開始涉及一些高級計算機科學，如數據挖掘技術和語義網絡技術。而且自適應測試絕不會止步于此，在未來，必將有更多的計算機最新成果會被不斷地應用到自適應的研究中，如神經網絡技術、智能識別技術和機器學習技術等。

5 結束語

雖然目前計算機自適應測試系統存在許多不足，但它克服了經典測量理論的局限，以人工智能為基礎，以學習者為中心，最大優點是參數不變性，使它在試卷編制、高效測驗等多方面得到重視，在教育測量與評價中得到越來越廣泛的應用。在未來，自適應測試必將擁有更加廣泛的發展空間。

參考文獻

[1]余嘉元.項目反應理論及其應用[M].南京：江蘇教育出版社，1992：20-36.

[2]丁樹良.項目反應理論新進展專題研究[M].北京：北京師范大學出版社，2012：9-38.

[3]許祖慰.項目反應理論及其在測驗中的應用[M].上海：華東師范大學出版社，1992：41-56.

[4]李昕.自適應測試與輔導系統設計與實現[J].現代教育技術，2013（4）：86-109.