代闖闖 劉詠晨 畢成
【摘 要】隨著科技的進(jìn)步發(fā)展,考試測驗的方式也不斷發(fā)展。自適應(yīng)測驗是就是測驗方式不斷革新后出現(xiàn)的一種測驗形式,使用計算機(jī)進(jìn)行的自適應(yīng)測驗也是當(dāng)下被廣泛應(yīng)用的方式,本文關(guān)于計算機(jī)化的自適應(yīng)測試做了淺要要就,介紹其概況和一些相關(guān)的研究成果,指出這種測試方式目前存在的問題最后提出解決方案。
【關(guān)鍵詞】自適應(yīng)測試 CAT 項目反應(yīng)原理
1 計算機(jī)化自適應(yīng)測試的產(chǎn)生與發(fā)展
自適應(yīng)測試是一種因人而異的測試,根據(jù)測試者年齡等的不同選擇不同難易程度的試卷進(jìn)行的測試,試題不完成的情況下也能達(dá)到測試的目標(biāo)。計算機(jī)化自適應(yīng)測試則是利用計算機(jī)星星的測試,試題的選擇與答題都在計算機(jī)上完成。這種自適應(yīng)的測試前身是比奈測試,當(dāng)時的測試步驟非常麻煩,也存在一定的缺陷。計算機(jī)產(chǎn)生之后,這些問題就一一得到解決。這種測試方式在美國的發(fā)展比較迅速,早在一九四六年美國就有自適應(yīng)的相關(guān)研究出現(xiàn),隨后不斷發(fā)展。我國對自適應(yīng)測試也有相關(guān)的研究。計算機(jī)是自適應(yīng)測試實施的重要輔助工具,因測試試題選擇與結(jié)果評估都有著較為復(fù)雜的過程,因此計算機(jī)的使用可減輕人力的投入,并開啟了新的測試發(fā)展歷程。
2 計算機(jī)化自適應(yīng)測試的相關(guān)理論研究
計算機(jī)化自適應(yīng)測試的理論基礎(chǔ)是項目反應(yīng)原理,測試建立題庫到測試結(jié)果分析都是在項目反映原理的基礎(chǔ)上實施的,根據(jù)項目反應(yīng)原理建立的數(shù)學(xué)模型有很多種,可在測試時根據(jù)被試者情況的不同選擇。根據(jù)被試者答題的具體情況,利用項目反應(yīng)理論建立模型函數(shù)推算被試者的實際能力,主要有三種參數(shù)的函數(shù)模式。基于項目反應(yīng)理論建立的模型能夠較準(zhǔn)確全面的了解測試試題的情況以及能夠準(zhǔn)確推斷出被試者的能力情況,其中三參數(shù)的模型最為準(zhǔn)確,因此被自適應(yīng)測試廣泛應(yīng)用。
測試的具體程序,自適應(yīng)測試的進(jìn)行,主要有以下幾個步驟:(1)開始測試。這是測試的第一步,主要是對被試者的水平進(jìn)行一個初步的測試,然后根據(jù)結(jié)果在題庫中選擇一套合適題目給被試者。(2)進(jìn)行測試。這是在測試過程中,被試者在回答每一道題目后對測試者的能力進(jìn)行的評估。(3)結(jié)束測試。這是指在被試者測試過程中,可以檢測能力的參數(shù)獲取足夠時,就可以結(jié)束考試。因此題目即使不回答完也可在參數(shù)足夠時就停止測試,因此以不是百分制這種傳統(tǒng)的概念來衡量被試者能力的。
3 計算機(jī)自適應(yīng)測試的應(yīng)用
國內(nèi)外應(yīng)用自適應(yīng)測試的成功例子比比皆是,在此列舉一些優(yōu)秀的代表性測試。漢語水平考試是測試包括外國人、華僑以及我國國內(nèi)的第一語言非漢語的少數(shù)民族人員在內(nèi)的考生漢語水平的國際漢語能力測試。簡稱HSK。HSK測試從命題到評卷整個過程都非常的專業(yè)和標(biāo)準(zhǔn),是較高水平的自適應(yīng)測試。
美國研究生入學(xué)考試與新托福,也稱托福網(wǎng)考,是現(xiàn)金計算機(jī)自適應(yīng)考試應(yīng)用最為廣泛、最具影響力的兩種能力測試。這是一種在考試過程中,通過結(jié)合專題與綜合的知識,對被試者的實際水平進(jìn)行比較確切的評估,這種自適應(yīng)測試的系統(tǒng)是一種綜合且新穎的學(xué)科,有利于自適應(yīng)測試系統(tǒng)題庫的擴(kuò)展。
我國英語教學(xué)中閱讀是最為重要的教學(xué)點,傳統(tǒng)的英語閱讀是閱讀文章然偶回答幾個問題,這種測試方法已受到質(zhì)疑。可考慮的測試方法是設(shè)置一個語境,然后在這個語境中進(jìn)行自適應(yīng)性的閱讀測試,可以更準(zhǔn)確的測試出學(xué)生的英語能力。
臺灣國中的學(xué)力測試是對臺灣國中學(xué)生基本學(xué)力的測試,主要有四個優(yōu)勢:(1)測試的標(biāo)準(zhǔn)化;(2)題目的設(shè)置都有一個明確的指標(biāo);(3)建立了題目優(yōu)質(zhì)的題目;(4)自測試的結(jié)構(gòu)可以轉(zhuǎn)化為一定的分?jǐn)?shù)作為衡量尺度,便于能力的比較。
自適應(yīng)心理測試是專門針對中國人開發(fā)的一種心理測試系統(tǒng),利用計算機(jī)網(wǎng)絡(luò)進(jìn)行。自開發(fā)以來被廣泛的使用,便于通過測試發(fā)現(xiàn)自我,增強(qiáng)自我了解并提升自我能力。我國從九十年代就開始研究CET4和CET6考試的計算機(jī)自測試應(yīng)用,目前四六級分?jǐn)?shù)的處理已成功應(yīng)用IRT技術(shù),但題庫仍在建設(shè)中,不久的將來會簡稱計算機(jī)輔助的自適應(yīng)測試系統(tǒng)題庫。
4 機(jī)助自適應(yīng)測試現(xiàn)存的問題
機(jī)助自適應(yīng)測驗有一定的有點也存在一些問題。主要有以下的問題:(1)題型比較簡單,一般測試的題型都是以客觀題為主,測試者的有些能力可能測試不出;(2)測試結(jié)果的解釋不易,人們對于考試結(jié)果的認(rèn)定都是以分?jǐn)?shù)為準(zhǔn),這種自適應(yīng)的測試結(jié)果是一定的參數(shù),因此解釋起來比較困難;(3)測試的成本比較高。因為從題庫的設(shè)置到結(jié)果的分析,都需要利用計算機(jī),所以研制起來比較費時費力,不如傳統(tǒng)的紙質(zhì)測試來的方便;(4)必須要計算機(jī)的輔助。若選擇自適應(yīng)測試的地區(qū)計算機(jī)不夠普及,測試進(jìn)行起來就無法進(jìn)行;(5)題庫更新的較慢,比如美國研究生入學(xué)考試管理機(jī)構(gòu)曾經(jīng)在中國和韓國發(fā)現(xiàn)了歷年試題的交流網(wǎng)站,由于題庫內(nèi)容不多,隔年就會有相似的題目出現(xiàn),一些考生就產(chǎn)生了投機(jī)取巧的心理。
計算機(jī)輔助的自適應(yīng)性測試是一種新型并且有效的能力測試方式,值得在今后被更廣泛的領(lǐng)域應(yīng)用,它有著不同于傳統(tǒng)紙質(zhì)測試的優(yōu)點,但也存在一定的缺點和不足,但只有缺點不斷的出現(xiàn)不斷解決,才有利于自適應(yīng)測試系統(tǒng)的不斷提升。目前計算機(jī)輔助自適應(yīng)測試技術(shù)已比較成熟,但還需要不斷的研究使自適應(yīng)測試更加完善。
參考文獻(xiàn):
[1] 謝康,曾祥華.計算機(jī)自適應(yīng)性測驗的數(shù)學(xué)模型研究[J].贛南師范學(xué)院學(xué)報,2002(3).
[2] 何利平.C程序設(shè)計非標(biāo)準(zhǔn)化試題CAT模型的建立[J].衡陽師范學(xué)院學(xué)報(自然科學(xué)),2003(3).
[3] 彭云,聶承啟.操作系統(tǒng)自適應(yīng)考試系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機(jī)與現(xiàn)代化,2001(6).
[4] 李廣洲,丁金芳,鄧海山.基于Web的化學(xué)計算機(jī)化自適應(yīng)測驗系統(tǒng)的實現(xiàn)[J].計算機(jī)與應(yīng)用化學(xué),2002(5).
[5] 謝小慶,任杰.對從HSK題庫中計算機(jī)自動生成試卷穩(wěn)定性的試驗檢驗[J].心理學(xué)探新,1999(4).