計算機化調適性語言測試研究

2019-09-10 07:22:44陳雯雯

科學導報·學術 2019年31期

陳雯雯

摘 ?要：隨著計算機的普及和快速發展，信息技術對語言測試形式產生了重要的影響。很顯然，計算機適應性語言測試已經成為這一領域最重要的發展方向。本文主要介紹了計算機化調適性語言測試（Computerized Adaptive Language Test以下稱CALT）的定義。并且分析了CALT的優勢及其面臨的問題與挑戰。并指出，計算機化調適性語言測試因為它符合外語教學改革發展的實際需求，將成為引領外語測試的新方向。

With the popular of computer and its rapid development，information technology has a significant impact on language testing. Obviously，Computerized Adaptive Language Test（CALT）has become the most important development direction in this field. This article mainly introduces the definition of CALT. At the same time，it not only analyzes the advantages of CALT but also analyzes the questions and challenges it faced. It also point out that because CALT can meet the actual demand of foreign language teaching reform，it will become the new leading direction of foreign language testing.

計算機技術的發展不但影響著外語教與學的整個過程，同時也使得語言測試的技術手段和方式發生了重大的改變。語言測試技術已經成為眾多研究者關注的新課題。2001年在美國舉行的第23屆國際語言測試研討會的主題就是“語言測試與技術”，基于計算機技術所構建的測試新方法——計算機化調適性語言測試成了本次會議的重要議題。計算機化調適性語言測試由于其因材施測、能精確估計考生能力及節省施測時間等顯著的優點，正逐步滲透到各類外語測試中去，將引領外語測試發展的新方向。

一、計算機化調適性語言測試的定義

計算機化調適性語言測試源于計算機化調適性測試（Computerized Adaptive Test）（下稱CAT），是一種技術上受計算機終端和PC管理的先進的測試語言能力的方法。它是現代語言測試理論與當代多媒體技術相結合的產物，采用項目反應理論為數學模型建立題庫，并以此根據題目的各方面信息和受測者的答題情況，從題庫中選取符合受測者語言水平的題目進行測試，在最短的時間內迅速準確地估計受測者的語言能力，直到達到預定的測試精度要求。

二、計算機化調適性語言測試的優勢

計算機技術的發展和測量學“項目反應理論”的成熟催生了新一代計算機化語言測試——計算機適應性語言測試。這種被稱為“量體裁衣”式的測試具有傳統的紙筆測試無法比擬的優勢，如具有良好的反饋作用，測試的個性化、人性化加強，安全性提高。為每位受試提供適合其語言能力的題目或任務，能夠提高他們的興趣，促使他們發揮最佳水平，從而實現對受試語言能力更準確的測量。例如，基于網絡的DI-ALANG融自我評估和診斷性測試為一體，為受試提供個性化的語言能力評估信息。一些新題型得以開發使用，如文章復原法可以用來考察受試在句子和語篇層面的語言理解能力。

比較傳統的紙筆考試而言，CALT具有以下的四點優勢：

（一）具有人性化和個體性

在傳統的考試中，不管考生實際語言能力如何，都必須做大量的固定的試題進行語言考查，需要較多的時間;而在CALT中，后面試題的呈現是以前面答題的反應情況來決定的，或難或易，循序漸進的進行。同時，CALT還可以根據不同的測試對象確定不同的常模，考試的內容、題量因人而異，有針對性的施加測試題目，具有無可比擬的個體性，具有人性化特征，符合外語教學改革的要求。

（二）具有科學性和準確性

效度與信度是語言測試中最重要的兩個原則，測試的科學與準確性取決于該測試是否具有高效度和高信度。在傳統的測試中，由于不同考生接受同一批題目的測驗，語言水平低的考生無法作答難度大的題目，那些難度小的題目對語言水平高的考生又測不出真實水平，測試的效度時而高、時而低，難以把握。CALT則不同，它不但定義了信息函數這一綜合質量指標作為科學挑選題目的標準，而且題目函數估計準確，電腦能根據題目相對難度、題型和考生對初始題目應答的整體表現，適度調整出與考生水平相適應的題目。因此，由于測驗的信息量最大，也就能最大限度地測算出代表考生實際語言能力的成績，測試的效度也就最好，實得分數分布與目標分數的分布的擬合度也最好。同時，就信度而言，傳統的測試評分往往由人工評判，雖然有統一的參考評判尺度，也難免會因人而異而產生誤差。CALT則通常具有良好的穩定性、等值性與客觀性，且考生每答對一個試題就會重新估計一次考生的能力估計值，測試之后能馬上打印測試結果，各項工作由電腦自行進行，排除了人為的因素，測試成績公開、公正、公平、真實可靠、準確性高。

（三）具有保密性和安全性

與傳統的測試不同，CALT由于對不同的考生施測不同內容，大大地降低了猜題、舞弊的發生，對題庫中題目曝光頻率的控制與測試數據的層級保密很大程度上都提高了語言測試的安全性。

（四）具有經濟性與實效性

比較傳統的測試，CALT的題量較少，考試時間短，節省了大量的人力物力，降低了成本。測試之后能立即計分并報告成績和給出反饋，快捷又實效。除此之外，CALT由于可以調整學生的作答速度與題目難度，測試環境自然、寬松，降低了考生的考試焦慮與挫折感，尤其在口語、聽力考試中更益于考生正常發揮自己的真實水平。

這種被稱為“量體裁衣”式的測試具有傳統的紙筆測試無法比擬的優勢，如具有良好的反饋作用，測試的個性化、人性化加強，安全性提高。與其他的考試相比，CALT考試更注重考試過程及其測試精確度的提升。CALT能為每位受試提供適合其語言能力的題目或任務，由此可提高他們的興趣，促使他們發揮最佳水平，從而實現對受試語言能力更準確的測量。

總之，CALT的優勢在于具有明顯的漸進性和個體性，即受試者即將面對的試題是以其前面答題情況而定，其題目或難或易，因人而易，循序漸進，具有很強的科學性和準確性。CALT不但以信息函數這一綜合質量指標為科學的選題標準，而且題目函數估計準確，能最大限度地測算受試者的實際語言水平，并且具有穩定性、等值性與客觀性的特點。CALT安全指數高保密性好，幾乎不可能猜題、壓題、舞弊。CALT由于題量靈活，時間可長可短，測試后能即時記分并報告成績，所以說其具有經濟性和實效性。

三、計算機化調適性語言測試面臨的問題與挑戰

現代信息和網絡技術為語言測試帶來了許多快捷和希望，同時也帶來了一些問題和隱患。雖然互聯網和電腦技術的普及速度非常快，但目前網絡帶寬和網絡安全還是一個急需解決的問題。在我國有些地區計算機還不夠普及，這就給計算機化語言測試的推廣帶來一定的困難。《教育部關于 2013 年深化教育領域綜合改革的意見》提出要實施高考英語科目一年多次考試。隨著“一年多考制度”的推廣，必然會遇到同時使用多套試題的情況，隨著而來的是試題庫建設，現代網絡和計算機技術的發展為試題庫建設帶來諸多方便，但試題庫建設和使用涉及多方面的工作。試題參數的確定需要做大量前期工作。試題庫的試題需重復使用，在試題使用之后主要問題之一是試題的安全性，如何不讓使用過的試題泄露出去，這些需要更多研究和實踐。同時為了保證考試的公平，多套同時使用的試卷之間的等值顯得尤為重要，如何科學地利用現代技術等值試卷還需進一步進行研究。基于計算機的考試改變傳統紙筆考試的一些題型和做法，這些改變對學生有影響，會在一定程度上影響試卷的效度。

而由于CALT研究起步較晚，所依據的理論基礎與技術手段有待進一步完善，加之語言測試的特殊性及其與傳統測試的差異性等原因，均不可避免地決定了CALT仍存在著諸多的問題：

（一）CALT的評分問題

傳統測試中，如果學生不能回答某些問題，可以跳題或者省略，然而在CALT中允許跳題，若選題項沒有被計分，學生可跳過題項答題時可能會對題目的安全性有影響。而如果不允許跳題，則是剝奪了學生資助決定做題順序的自由。

（二）CALT的題項設計問題

在題項的采集上，傳統測試在設計上常常根據明確的考試要求來收集某個特定領域不同的知識或者技能題項。而CALT的一般時間上會比傳統測試短，很難像傳統測試一樣根據具體要求來收集題項。它一般是從所有可能的集體要求中隨機抽選出。

（三）CALT測試題目中的交際能力問題

外語教學的目的是培養學生的交際能力，測試考生交際能力的高低則通過對語言行為的衡量來判斷，即需在交際、環境、話題和目的等語言使用環境中測試考生的語言組織能力與語用能力;但是由于語用背景是具體的，千變萬化的，沒有固定的模式可尋，難以數字化和信息化，測試結果也只能被看成在考試所設計的背景下的特定的運用外語行為，而非考生在真實外語生活環境下的交際能力。因此，如何鎖定測試目標設計出充分體現交際能力的真實測試項目是CALT須解決的棘手問題。

（四）CALT題型與語言測試目標能力關聯性問題

不同起始題目與題型的選擇對不同目標能力初步估計值的效度也不同，直接影響到目標測試能力的準確定位，起始題目、題型的選擇對整個測試過程起著關鍵的導航作用。考生測試速度與語言能力的關系、CALT對教學的反撥作用、計算機操作熟練程度與測試成績之間的關系以及如何避免商業化等問題都有待我們外語工作者與軟件工程師進一步研究與實踐。

曾用強教授在2009年全國英語專業四、八級測試暨計算機技術應用專題研討會中，作了“計算機化考試的幾點思考”為題的發言。他認為目前人們對計算機化考試存在一些誤解，主要體現在：計算機化考試就是紙筆考試的計算機化或網絡化;計算機網絡技術決定了機考的發展;實現多次考試;簡化考務工作。計算機化考試一般要經過內容設計、技術開發和實施三個階段，計算機化考試有它獨特的特點和規律，我們必須遵循這些特點和規律才能開發出符合考試發展和需要的計算機化考試。

四、總結

綜上所述，CALT是現代化教育技術改變測試手段的新方向，世界上許多很有影響的國際性英語考試也正在全面推行CALT。作為一個新興的事物，CALT仍有許多問題和挑戰，需要不斷地改進與完善。隨著語言教學的改革與進步，計算機技術的優勢將扮演越來越重要的角色。目前，在我國這方面的研究涉足并不多，相信計算化調試性語言測試將會越來越普及，研究成果也將日益豐碩。

參考文獻

[1] ?陳冰冰. 引領外語測試新方向——計算機化調適性語言測試[J]. 外語電化教學，2005 （102）

[2] ?陳慧麟. 基于紙筆的語言測試和基于計算機的語言測試之間效度對等性驗證模式初探[J]. 外語界，2009（3）

[3] ?蔡基剛. 大學英語四、六級計算機口語測試效度、信度和可操作性研究[J]. 外語界，2005（4）

[4] ?高國安. 淺談計算機在外語教學中的應用[J]. 高校社科信息，2001（3）

[5] ?何蓮珍. 認知計算機適應性考試模型的設計[J]. 現代外語，1999（2）

[6] ?洪云. 計算機化語言測試的發展及其面臨的問題[J]. 中國成人教育2010（15）

[7] ?金艷. 計算機化語言測試的效度研究——淺析計算機能力與測試構念的關系[J]. 外語電化教學，2012（1）

[8] ?金艷，張曉藝. 技能綜合對語言測試構念效度的影響——培生考試與大學英語六級網考的對比研究[J]. 外語電化教學，2013（154）

[9] ?孔文，李清華. 大規模語言測試的方向：計算機適應性語言測試[J]. 外語界，2002（2）

[10] ?劉建達. 現代技術與語言測試應用、影響及發展方向[J]. 外語電化教學，2013（152）

[11] ?李清華，孔文. 基于計算機的語言測試及其效度驗證[J]. 外語界，2009（3）

[12] ?李清華. 基于紙筆的語言測試與基于計算機的語言測試的等效研究綜述[J]. 外語界，2006（04）

[13] ?田文燕. 國外計算機化語言測試（IBT）現狀綜述[J]. 外語界，2006（5）

[14] ?田文燕. 從紙筆測試到計算機化語言測試的發展[J]. 湖北廣播電視大學學報，2007（2）

[15] ?田文燕，張震宇. 計算機化語言測試的應用問題與展望[J]. 外語電化教學，2007（4）

[16] ?吳會芹. 用現代化手段輔助語言測試[J]. 外語電化教學，2006（109）

[17] ?王勇旗. 計算機化語言——新測試形式帶來的思考[J]. 學科改革，2008（05）

[18] ?楊安良，田少華. 我國計算機化調適性語言測試（CALT）研究現狀[J]. 外語界，2008（2）

[19] ?應真箭，葉新東. 計算機適應性語言測試的幾個問題[J]. 教學與管理，2005（6）

[20] ?楊滿珍. 20世紀90年代國外語言測試的發展[J]. 外語教學，2002（05）

[21] ?楊琪. 計算機輔助大規模英語口語測試的實踐與反思[J]. 外語電化教學，2012

[22] ?朱音爾，張肖瑩. 基于網絡的大學英語機考探索與實踐[J]. 外語電化教學，2009（126）

[23] ?鄭佩蕓，史光孝，潘鳴武. 信息技術在語言測試中的應用現狀及展望——計算機信息技術應用專題研討會述評[J]. 外語電化教學，2010（131）