【摘要】大學英語四級由筆試向網考的轉型引起了全社會的關注,但四級網考的效度如何,很大程度上取決于能否搜集到足夠的測試數據。iTEST系統是當今市面上為數不多的可以模擬四級網考的語言測試與訓練系統。通過iTEST系統對學生進行四級網考模測、統計得失分、采集數據和分析,可以對四級網考的信度和效度有個準確的判斷。
【關鍵詞】iTEST系統 CET-4網考 大學英語教學 南通大學
導語
隨著網絡技術的快速發展,語言測試研究人員見證了電腦取代傳統紙張進行語言測試的趨勢。在過去的半個世紀里,基于電腦的語言測試有大規模的發展,即以獨立電腦為操作平臺,借助互聯網及其他相關設備進行綜合配置,達到測試和評估的目的。作為一種新型的測試方式,網考/機考在世界各地也變得越來越普遍,例如美國在1998年和2006年兩次推出新托福機考及其升級版,這標志著以網絡為基礎的語言考試系統已經日臻完善并且在全球范圍內得以大規模實施。
在我國,大學英語四級考試(CET-4)從筆試向網考的轉變引發了人們對這一新型考試形式的爭論。四級網考的效度如何,很大程度上取決于能否搜集到足夠的測試數據。基于對考試分數的分析和解讀,教師和研究人員可以對考試的內部結構做出調整。根據學生的自身學習背景和學習能力,定位一個適合他們的考試難度,已經成為了近年來研究英語等級考試的焦點。最終目標則是通過考試,促進學生語言熟練度和學習素質的共同提高。iTEST系統是當今市面上為數不多的可以模擬四級網考的語言測試與訓練系統,其一方面可以給學生提供身臨其境的考試環境,另一方面又可以給教師提供足量的試卷樣本進行大數據分析。教師應重視該系統的功能,并將其充分利用到對學生的培訓中,助其更好地適應即將到來的四級網考(CB CET-4)并進行有針對性地備戰。
一、基于iTEST3.0系統的四級網考模擬測試
iTEST測試與訓練系統是一個為高校提供英語試題庫資源和在線評測服務的綜合測試管理平臺,適合于高校外語教學、高校圖書館、培訓學校等使用。在國內大學英語測試平臺中,它是首個對試題進行預測試以保證其科學性的測試平臺,也是首個提供專業考試數據統計分析的測試平臺,既實現教學、測試與科研相結合,又能全真模擬大學英語四級網考。2014年初,iTEST1.0系統正式登陸南通大學,并成為大學英語網絡教學平臺的一個重要組成部分。經過三年的發展完善和不斷革新,iTEST系統已經進化到了3.0系統,較之初版系統有了很大的提升,為即將大面積實施的大學英語四級網考做好了評測準備。
眾所周知,自1989年大學英語四級考試創立至今,已經歷經了多輪改革,而當下的網考轉向是大勢所趨。較之CET-4的紙質版測試,基于互聯網和電腦的四級網考無論在題型還是考試要求上,都有巨大改變。但這種改變是否具有足夠的合理性,之前很少見到有調查報告對此重點關注或有進一步研究。通過對比學生參與四級筆試和四級網考的成績,可以分析當今大學生對以計算機為基礎的英語測試具有多大的自我適應性,借此為四級網考的測試模型建構提供必要的數據支撐和修正建議。南通大學外國語學院的公共英語教學部,自2014年伊始就致力于依靠iTEST系統模擬四級網考,并大量收集到學生的考試數據,已取得了階段性成果。
大學英語四級筆試涵蓋的題目類型主要是寫作、聽力、閱讀和翻譯;而網考的題型則改變為聽力、綜合和閱讀,其中的綜合項目還包括聽寫、完形填空、口語和寫作等數個小項成績。此次新增的綜合性題型對大學生的語言組織和處理能力提出了更高的要求。而考生在綜合項目中的表現也真實地反映出他們的英語水平。本文旨在根據iTEST系統提供的大數據,對以下三個問題進行探討:(1)如何比較四級筆試和四級網考的測試結果?(2)四級網考的試卷結構能否真實反映學生的能力水平?(3)四級網考的各考試題型的效度如何,其之間的關聯如何?
二、基于iTEST3.0系統的四級網考數據采集
首先課題組的研究人員精選了10套大學英語四級網考的模擬試卷,并抽取了來自文科、理工科和藝體科的共計12個自然班作為應試對象,參加測試的學生總人數達到388名。在同一個班級進行測試的過程中,計算機先統一預留一套試卷作為筆試,然后隨機抽取剩余九套模擬試卷中的一套分配給每一位學生。為了確保筆試和網考都是基于同樣的英語基礎和水平,學生須在第二天的同一時間再進行四級筆試。
如前文所述,四級網考絕非是簡單地把筆試試卷照搬到電腦上用熒屏展示,而是在格式和內容上都有一系列的相應變化。因此次日的筆試試卷來自預留的網考模擬卷改造,重新調整題目順序和分值,并適當在題量和題型上予以增減使之符合當前的CET-4筆試卷要求。教師不僅需要獲得學生的成績,還需要以班級為單位統計筆試卷上每一道題的正誤,而網考卷上得失分情況的統計則由iTEST3.0系統完成。
鑒于連續兩天且每天要花費兩個小時左右進行四級模擬測試,對于學生的精力和體能是一個巨大的消耗。絕大多數學生都是第一次參加模擬網考,他們后來都反映坐在電腦前用鼠標及鍵盤順利鍵入答案是一個全新的考驗。為了能夠激勵學生竭盡全力在模擬網考中有上佳表現,教師預先通過學工辦和輔導員告之學生:兩次模測的平均值將計入本學期的總評成績,占20%總分值。以此鼓勵學生同等對待這兩次測試以維持相同的測試動機,在某種程度上也將影響考試成績后續分析的不利因素降低到最少。
三、基于iTEST3.0系統的四級網考數據分析
根據英語四級網考和筆試所呈現的結果,研究人員可以從數據分析中得出結果。排除掉3組明顯的問題樣本,剩余的有效樣本為385組。事實上兩者確實是很具可比性的,總得分呈現相關系數為0.86,證明考試模式雖不同,卻是高度相關的。從總分上看,四級網考的成績更加接近正態分布,不同分級之間的檔次拉開得比較明顯。換言之,四級網考擁有更高的辯別能力,可以更準確同時也更加快捷有效地反映受試者英語語言能力的差別。endprint
兩種考試的各分項得分沒有很大區別,但是網考的聽力平均得分要略微高于筆試,這有點令人出乎意料。究其原因,可能是由于網考聽力時間更長,所以網考的聽讀段落較之筆試更為簡單,也更易于為學生所接受。另一個可能的解釋是新穎的考試形式和信息傳送模式發揮了積極作用,因為其更加利于學生的自我表現和發揮。研究人員還發現在四級網考的聽力部分中,由于視頻為學生提供了可視化的線索,受試者在圖像的指引下,提高了對聽力材料的理解和宏觀把握。從題型結構和內容難度上看,網考和筆試的閱讀理解相差不大,兩者的相關性也最高。無論是常規閱讀還是快速閱讀,兩組考試的閱讀部分權重分接近,學生對于網考的閱讀理解適應度也較高。
此外,四級網考中的綜合測試呈現出非常積極的測試效果,該題型依據學生所處的現實語言環境設題,測試內容著眼于學生在日常生活中最常見的語言表達,由此作出相對客觀公正的語言評估。四級網考的發展呈現出一種新趨勢,即在同一個考試項目中對兩種或更多種語言技能進行評估。而聽力與閱讀、聽力與寫作、聽力與口語的互動和結合,增強了該項測試的權威度。受試者必須先準確理解語言輸入的內容,然后做恰當地回答。較之以前的測試僅僅專注于聽說讀寫四個技能中某一單項,新增的四級網考綜合題型能在語言測試中模擬現實,進而促使學生的語言能力具備更廣闊的發展前景,也間接地提高了語言學習的有效性。
四、結語
自上世紀九十年代起,各種學術組織和測試機構都開始加強對于網絡化和電腦化測試的評估和研究,其間有許多國內外大學和語言測試機構都參與了進來。全國大學英語測試委員會目前正在調查在線測試的可行性,并不斷修正CET-4網考的試卷結構和測試手段。其改革目標旨在要求中國的英語學習者不僅能理解英語,還要能實現有效的溝通,因此新出臺的四級機考將重點考察學生的語言綜合能力乃至學術溝通能力。從紙質版到計算機版,測試內容也發生相應變化,尤其是將口語的考察重組編入綜合試題部分。基于網絡和電腦的CET考試有很多優點,其在未來會有怎樣的走向,值得所有研究者深入探討。
根據前文的討論和針對測試結果所做的相關分析,本課題組可以得出以下結論并回應前文提出的三個問題。首先,大學英語四級機考和四級筆試之間有著很高的可比性和關聯性。由于CET-4已經運營多年,有一整套可靠的測試模式,市面上也存在大量的測試卷銷售,因此學生的四級筆試成績具有更加穩定的分布值;而四級機考仍處于試驗階段,還有很大的改進空間,學生也尚未完全適應此類新型題目類型和考試模式,也有一些同學反映他們不習慣用鍵盤輸入答案。其次,也正因為四級網考的新穎性,才使得學生無法依賴猜題技巧,從而真實展現其英語水平。最后,四級網考的各考試題型之間,具有很好的內部相互關系和邏輯聯系,尤其是綜合部分可以視為是對學生英語綜合能力的檢測,具有很高的科學性。
參考文獻:
[1]訾韋力.iTEST系統及其在CET_4網考培訓中的應用研究[J].西南民族大學學報(人文社會科學版),2012(9):273-275.
[2]張天驕,高文宇.iTEST系統在獨立學院CET-4輔導中的應用研究[J].職教通訊,2015(9):22-24.
[3]鐘曉流,宋述強,焦麗珍.信息化環境中基于翻轉課堂理念的教學設計研究[J].開放教育研究,2013(2):58-64.
[4]胡鐵生.“微課”:區域教育信息資源發展的新趨勢[J].電化教育研究,2011(10):61-65.
[5]焦建利.從開放教育資源到“慕課”——我們能從中學到些什么[J].中小學信息技術教育,2012(10):17-18.
[6]張金磊,王穎,張寶輝.翻轉課堂教學模式研究[J].遠程教育雜志,2012(8):46-51.
作者簡介:張天驕(1981.1-),男,江蘇南通人,任南通大學外國語學院講師,碩士研究生,研究方向為大學英語教學。endprint