淺談計算機自適應測試研究進展

2014-08-08 17:27:21鄭潔張艷華

無線互聯科技 2014年6期

鄭潔張艷華

摘要：計算機自適應測驗(Computerized Adaptive Testing，簡稱CAT)是近年來發展起來的一種新的測驗形式。這種測驗以項目反應理論為基礎，以計算機技術為手段，并由計算機根據被試能力水平自動選擇測題，最終對被試能力作出估計的一種新型測驗。

關鍵詞：計算機自適應測試；項目反應理論；試題庫1什么是計算機自適應測試

計算機自適應測驗是利用項目反應理論建立題庫，并由計算機根據被試能力水平自動選擇測題，最終對被試能力作出估計的一種新型測驗。

相對于傳統的測試計算機自適應測試是一種動態的測試。這一點上計算機自適應測驗也不同于一般的計算機化測驗，計算機在測驗過程中不光是呈現題目，輸入答案、自動評分、得出結果，而且根據被試對試題的不同回答，它能自動選擇最適宜的試題讓被試回答，最終達到對被試能力作出最恰當的估計。因此，計算機自適應測驗是因人而異的測驗。

2計算機自適應測試的發展

在上世紀80年代末國家有關人士開始對計算機自適應測試進行了相關的嘗試，至2008年全國四六級考試業已經嘗試使用計算機自適應的方式進行測試。2011年北大研制成功全球首個商務漢語自適應測試系統。由此可見計算機自適應測試正越來越被國家和社會所接收，也有著越來越蓬勃的發展。

3計算機自適應測試的流程

3.1 測試流程

計算機自適應測試有著與一般測試不同的流程，見圖1：

3.2 應試者

計算機自適應測試能夠利用題庫的不同來區別不同的人才，因此可以對不同應試者進行測試，從而對應試者進行區分。同時，隨著互聯網的普及可以對不同地區的應試者在同一時間進行測試，甄別。

傳統的考試測量模式則是應試者獨自面對著考試試題，每個人可能面對的題目不同但是沒有一個閉環的反饋過程，也就是說每個人都獨自面對著一個不同的題庫。

3.3 題庫的選擇

計算機自適應測試系統中最為關鍵的就是題庫的設置以及題庫的曝光率。

在題庫的設置中初始難度設置在0.5~0.6之間，當應試者答對一定題目后之后可進入高一難度的題庫進行選擇，若錯一定程度后可以降到一個難度進行測試，從而進行分級測試。

一個大型考試的試卷通常要經過這些環節：第一要預測，預測好了之后才知道一個題目可用不可用。第二是題庫的使用和管理。考題的好壞，從統計學的角度講，有難度系數和區分度系數，太難和太容易都不行。第三是考后要有數據分析和診斷，使考分具有跨時間、區域的可比性，這都需要開發各類應用軟件。國內近年來開發了不少題庫，但由于缺乏應用軟件，這些題庫僅僅成為“題堆”，而非具有應用價值的題庫。

傳統的測試通過筆試或者計算機測試，它們的題庫是固定的，固定的題庫就會導致題目的曝光率十分高，一段時間之后基本上就是對記憶力的比拼，而不是能力的測試，而采用計算機自適應測試則不同，是動態的題庫，每個人選到的題目都不相同，這就會讓題庫在比較長的時間內保持秘密性。

3.4 測試后的處理

計算機自適應測試與普通測試有著一個本質的區別，在自適應測試之后有一個對結果的測量。

由于題目是動態的題目，難度有區別，那么結果也不相同，通過對結果的分析可以對將不同人員的特點區分出來，有的人擅長某一項，那么他在這類題的分數就會很高，而不擅長的那些就可能分數不是很好，從而對人進行不同的培養，以達到因材施教的目的。

3.5 結果的反饋

不同的測試結果也不相同，在對結果的反饋過程中不同人員甄別之后進行歸類存檔，同時可以將結果保存，以作為資料進行整理。

4前景

計算機自適應測試是一個不算新的概念，但是對于中國來說仍然處于發展的初期，從目前情況看來，大部分的時候還在使用傳統的測試手段，計算機仍需要大力的宣傳普及。

同時計算機自適應測試不僅僅可以應用在考試上，也可以應用在其他領域，比如說人力資源的管理，工作能力的評估等方面。在這些領域的中已經或多或少的使用了自適應的測試。

[參考文獻]

[1]袁健.基于Web的自適應上報系統技術的研究與實現.計算機工程與設計，2007，（19），4810-4812.

[2]張默.項目反應理論與計算機化自適應考試研究.黑龍江科技信息,2010，（09），25-26.

[3]徐信葉,丁樹良.結合認知診斷的計算機化自適應考試在高校教改中的作用探討.福建電腦，2008，（01），191-192.