摘要: 本文介紹了當前國內外采用的考試形式,國外以自適應測驗為主,國內以紙筆測驗為主。計算機自適應測驗相對于紙筆測驗有很多優點,其中最重要的是自適應測驗的測驗結果在不同測驗中具有可比性、有基于認知診斷的自適應測驗,而紙筆測驗不能提供被試測驗進一步的信息。自適應測驗是未來測驗的發展方向。
關鍵詞: 高校考試形式 改革 計算機自適應測驗
一、概述
在美國的教育測試中,計算機自適應測驗(Computerized Adaptive Testing,CAT)已經得到了普遍應用。大型計算機自適應測驗的具體實例包括美國研究生院入學測驗(GRE)、美國商學院研究生招生測驗(GMAT)、美國護士執照測驗、美國軍事職業傾向測試(ASVAB)等。計算機自適應測驗的理論經過幾十年的發展,也日趨成熟。而在我國計算機自適應測驗基本上還處于研究階段,大部分行業使用的還是紙筆測驗,這里面有客觀原因,也有主觀原因。
計算機自適應測驗與傳統紙筆測驗(Paper and Pencil Testing,PPT)截然不同。參加計算機自適應測驗,相當于給每位被試一份獨特的試卷。而在傳統紙筆測驗的模式下,每個人答的都是同樣的一套項目。事實上,計算機自適應測驗的主要目的就是要為每一位被試量身打造一份試卷,從而對被試的水平(θ)進行更變精確的測度。具體的做法就是依據被試的答題情況,從題庫里連續選取最接近被試實際水平的項目讓其作答。換句話說,項目難度是與被試的能力水平(θ)相匹配的。這樣一來,水平較高的被試就不必回答過多的簡單考題,而水平相對較低的被試也不必回答太多難題。因此,計算機自適應測驗能通過較少的考題就對被試的水平(θ)做出更加有效的測度[1]。這是它較之傳統紙筆測驗的優勢之一。
近幾年來,隨著認知診斷(Cognitive Diagnosis,CD)[2]理論的興起,計算機自適應測驗有了新的發展,出現了帶認知診斷功能的自適應測驗[3]。廣義的認知診斷是指建立起觀察分數和被試的內部認知特征之間的關系。這種認知診斷既包括在心理學理論建構中的應用,也包括在教育教學領域中的應用[4]。認知診斷理論被視為新一代的心理與教育測量理論的核心,認知心理學與心理測量學是實現認知診斷的兩大基礎。認知診斷的一個非常重要的任務就是對被試按照其細粒度的知識掌握情況進行分類。具有認知診斷功能的自適應測驗是未來測驗的發展方向。
二、傳統的紙筆測驗存在的問題
我國自古就用考試來選拔人才,一直發展到今天,已經形成了一整套完整的理論。目前紙筆測驗在我國還十分流行,主要是因為紙筆考試在國人心里已經根深蒂固,并且有完善的考試制度和機構。
傳統的紙筆考試采用紙和筆的形式,應試人員利用筆在紙質試卷上作答。傳統考試思想是面向試卷,或者說是面向試題的。在這種考試中,每次考試以固定的考題考核每個考生,考試考卷單一,出題方便,對于每個考生而言,題目中只有一部分是符合自己真正能力的,其余的題目要么簡單,要么過難。所測出的被試水平的準確性受到懷疑。并且對同一個被試來說,兩次不同的考試之間基本上沒有可比性。
隨著計算機技術和考試理論的發展,紙筆測驗已經越來越不能滿足要求了,主要表現在以下幾個方面:考查的項目較多;考試時間必須固定;數據分析十分不方便;不同測驗的測驗分數沒有可比性;不能提供被試更具體的知識掌握情況;由于被試筆跡等導致的測驗誤差較大;閱卷不方便,效率不高,導致測驗結果公布不及時。
三、計算機自適應測驗
計算機自適應測驗是相對于傳統的紙筆考試及基于計算機的測驗(CBT)來說的,它與傳統的紙筆考試截然不同,參加計算機自適應測驗,相當于給每位被試一份獨特的試卷。計算機自適應測驗的好處也正在于此,計算機自適應測驗的主要目的就是要為每位考生(被試)量身打造一份試卷,真正做到“因人而異”。它像“因材施教”那樣“因人施測”,高能力水平的被試作答難度大的試題,低水平被試作答容易的項目,不同能力水平的被試作答不同難度的項目,從而對被試的能力水平進行更為精確的測量,真正開創了測驗領域的新天地。而在傳統的紙筆考試模式下,每個考生答的都是同樣的一套試題(也稱項目),是一種“千人一卷”的模式,沒有針對被試的水平來設計測驗,測驗的效率較低。
計算機自適應測驗的理論基礎是項目反應理論(Item Response Theory,IRT)。項目反應理論是一種新興的心理與教育測驗理論,是在分析與克服經典測驗理論(Classical Test Theory,CTT)的局限性的基礎上發展起來的[5]。CAT是建立在IRT基礎上的,從題庫的建設、參數的估計、項目的選擇再到最后的評分,都是以IRT為指導進行的,可以說IRT是CAT的核心,甚至有人說,計算機加上IRT就是CAT。基于IRT的測驗模型稱為IRT模型。IRT模型是一種數學模型,定義了被試對項目的作答反應和潛在能力特質之間的關系。IRT的模型有很多,可在實際需要的時候選擇最合適的模型。計算機自適應測驗利用了最先進的工具:計算機,因此,自適應測驗的優點大多和計算機有關,比如:實時閱卷,被試當時就可以知道測驗成績;被試測驗數據分析方便;測驗長度較短,測驗誤差小;由于被試能力與項目難度是定義在同一個量表上,因此測驗成績具有可比性,等等。
認知診斷研究是近年來發展迅速的一個方向。具有認知診斷功能的自適應測驗是未來測驗的發展方向,因為它不但提供被試的測驗分數,而且提供被試詳細的知識掌握情況,為教師的教學提供指導,也為學生今后的學習提供參考。
四、高校考試形式的改革勢在必行
目前,我國各高校里采取的考試形式主要是紙筆考試的形式,前面已經談到,紙筆測驗有很多缺點,并且紙筆測驗不能很好地保證測驗的公平性,同一被試不同測驗的測驗分數沒有可比性,紙筆測驗不能提供認知診斷功能,這些都是造成紙筆測驗逐漸被自適應測驗所取代的原因。計算機在我國已經平民化,已經有了實行計算機自適應測驗的物質基礎。隨著計算機技術和考試理論的發展,高校考試形式有必要進行改革——實行計算機自適應測驗,并且將來實行帶認知診斷功能的自適應測驗。當然,進行大規模考試形式的改革必須有相應的國家政策支持,出臺相關的文件。我國的大學生英語四、六級測驗有望率先實行自適應測驗,相信在不遠的將來,自適應測驗在我國將蓬勃發展。
參考文獻:
[1]Weiss,D.J.Improving measurement quality and efficiency with adaptive testing.Applied Psychological Measurement[J].1982,(6):473-492.
[2]Jacqueline Leighton,Mark Gierl.Cognitive Diagnostic Assessment for Education:Theory and Application[M].2007.
[3]林海菁.具有認知診斷功能的CAT的研究與實現[D].江西師范大學碩士論文,2005.
[4]劉聲濤,戴海崎,周駿.新一代測驗理論——認知診斷理論的源起與特征.心理學探新[J].2006,(4):73-77.
[5]漆書青,戴海崎,丁樹良.現代教育與心理測量學原理[M].高等教育出版社,2002.