大學英語四級機試的效度驗證

2011-12-31 00:00:00羅娟

職業時空 2011年12期

　　摘要：通過實施四級機考與四級筆試的對比實驗，對大學英語四級機試的效度進行了實證性的論證，并通過幾所高校進行的問卷調查驗證了四級機試的反撥效應。研究證明四級機助考試是一項效度較高的語言測試，并對語言教學產生了積極的反撥作用。
　　關鍵詞：四級改革；機試；效度
　　
　　一、研究背景
　　為順應我國近幾年的大學英語教學改革進程，教育部2007年頒布了大學英語四、六級網考作為“高等學校本科教學質量與教學改革”項目之一，網考總體目標是建立“以試卷為基礎的計算機網絡系統，盡可能在適當時間、適當地點為考生提供以聽力測試為主包含讀寫譯測試在內、重點考查英語學習可持續發展能力的計算機試測試”（張堯學 2008）。與傳統紙筆測試的試卷結構相比，網考加大了聽力在考試中的比例，與聽力相關的考試內容和時間約占整個考試的70%，并選用了視頻作為聽力材料，改變了過去單一音頻聽力測試形式。聽力測試題型除傳統的多項選擇題外，還包括聽寫、句子跟讀和基于視頻的寫作等綜合性產出試題，并將口語和寫作測試也融入視聽測試中。
　　近年來，語言測試界的國內學者對于四級機試的測試效度進行了多方面的理論論證，但在效度研究上的實證研究尚未多見。鑒于大學英語四級作為超大規模的標準化英語測試在國內的影響，本研究將對四級機試效度進行實證性驗證。
　　二、研究設計
　　此次研究的參與對象為湖南省某高校二年級本科生，考生抽樣數量共為85名。實驗參與對象于2008年12月底先后參加了四級筆試及機試考試，考生考前被告知取兩次考試成績較高者為最終成績，有效減輕了考生的心理壓力。兩次測試于前后兩天實施，保證了測試對象語言能力的同質性。機試完畢后，馬上對考生實施了問卷調查。
　　在考試完畢后，筆者對本省具有四級機試試驗點的五大本科院校師生也實施了問卷調查，共回收有效問卷教師71份，學生305份，問卷形式以多項選擇題為主，少量為開放式問題。本實驗旨在回答以下研究問題：四級機試的測試效度如何？筆試與機試兩種測試形式，是否對測試結果產生顯著影響？機試對語言教學與學習產生了哪些反撥作用？
　　三、數據分析及結果
　　1.機試與教師評價的相關分析
　　參加機試的本科二年級3個班級的任課教師都連續教授參加本實驗的考生至少兩個學期，對其英語能力較了解。在四級考前這3名任課教師完成了有關四級機試的問卷調查。問卷結果顯示，將考生的測試成績以425分為設定及格線，在綜合評估考生英語綜合應用能力基礎上，任課教師對學生英語水平是否合格的判斷與機試結果的相關達到了0.628，與筆試考試結果的相關達到了0.684，均為高水平的顯著相關，說明四級機試能比較準確地評估學生語言水平。
　　2.測試結果
　　筆試與機試，不同的測試形式是否對考生能力估計產生顯著影響，是許多考生、教師及研究者關注的問題，特別是現在很多高校將大學英語四級考試證書與學生畢業證書相聯系，因此本研究以下來驗證兩種測試對測試結果的影響。
　　分析結果顯示四級筆試與機試結果有較高相關，兩次測試結果具有較高的一致性；t檢驗結果顯示兩次測試的總分在統計上沒有顯著性差異（p>.050），說明考生無論是參加機試還是筆試，兩種測試對受試的語言能力的測評結果沒有顯著性差別。
　　但不同語言水平的考生是否因測試形式不同，測試結果因此受到不同影響，需要進一步驗證。我們將筆試成績作為效標，以425分為分級點，將考生分為高分組（49人）和低分組（36人），驗證高分組與低分組考生的筆試與機試成績是否存在統計學差異。
　　首先，低分組、高分組考生的機試與筆試成績均存在顯著的正相關關系（p<.05）；表3說明低分組的機試與筆試成績存在顯著性差異（p<.05），且機試分數顯著高于筆試總分；而高分組的機試與筆試成績無統計上的顯著差異（p>.05），說明對于語言水平較高的考生，無論是參加機試還是筆試，兩種測試對受試的語言能力的測評結果沒有顯著性差別。
　　對于低分組考生機試分數顯著高于筆試總分，本研究認為可從以下方面解釋：低分組樣本過小（n=36），抽樣上的誤差有可能造成統計結果的誤差；機試提高了語言測試任務的真實性及多樣性，使其更接近于真實世界的任務，因紙筆測試方式無法測量的語言次能力，從而使得機試對于語言能力的區分更加準確，能對低分群體的語言能力進行更準確的測量。
　　3.問卷調查
　　反撥效應是收集效度證據的重要方面（Weir，2005），我們通過問卷調查了解機試測試對語言教學與學習產生了哪些反撥作用，是否促進了語言教學的改進和學生語言能力的提高。問卷調查的結果經統計分析后，將問卷部分調查結果列表如下：
　　問卷調查還顯示，半數以上考生反映對CET-4機試不太適應，有緊張心理（52.8%），導致其緊張的主要因素是聽力比例加重（62.3%），跟讀題型的增加（45.6%），電腦上讀、做題不習慣（37%）。因此，相對于筆試考生普遍認為機試整體難度偏難（67.9%），且機試對他們沒有利（42.6%）。盡管如此，教師及考生大多數認為機試內容設計合理，能反映學生的實際英語水平，促進學生語言交際能力的提高，因此對于機試改革持支持態度。
　　在對機試各測試部分效度的調查中，大多數教師及考生認為機試的整體效度比較好，并且對各分項目效度的評價排序也很一致，相對來說，聽力/視頻被認可的效度最高，而語法結構題型的效度不太理想。此外，經綜合考生在問卷中就四級機試的意見及建議主要概括如下：（1）機試的難度應適當降低；（2）減少語法結構的測試；（3）聽力/視頻的語速應稍減慢，短文過長；（4）短句跟讀的句子過長，錄音時間稍短；（5）降低口語考試分數線。
　　四、討論及結語
　　本文通過大學英語四級機試與筆試對比試驗，對四級機試效度進行了實證性的驗證。基于以上分析，本研究發現，以筆試作為外在效標，機試總分成績與筆試成績無統計上的顯著差異，且兩者間的相關度較高，測試結果一致性較高，說明測試形式的改革不會對考生成績產生顯著影響。問卷調查結果發現，教師對考生英語水平評估與機試測試結果相關較高，說明四級機試能較準確地評估學生語言水平；教師及考生普遍認為CET-4機試設計合理，新的測試對考生聽說綜合應用能力的考察，將通過反撥促進學生語言交際能力的提高。
　　測試要保持其生命力，就需不斷改革與完善，不僅要跟上語言學和語言教學新思想的發展，而且還要跟上時代的發展。基于網絡和多媒體技術的機試是測試發展的必然趨勢，四、六級機試順應了這一發展趨勢。
　　參考文獻：
　　［1］ Weir C J.Language Testing and Validation［M］.Palgrave：Macmillan，2005.
　　［2］張堯學.關于大學英語四、六級考試改革的總體思路［J］.外語界，2008，（5）：2-4.

職業時空2011年12期

職業時空的其它文章: 衛生類高職院校學生現狀及思政工作開展初探; 大學生思想政治教育要加強人文關懷; 新時期大學生思想政治教育創新模式探究; 獨立學院必須建設高素質的干部隊伍; 于光遠：《中國民商》的一篇文章; 學分制下學生黨員在大學生“三自”教育中的作用探討