摘 要:有教學就有測試,兩者不可或缺。語言測試是環繞試卷進行的。命題是保證考試的質量的重要環節。如何有效避免測試中常犯的錯誤對提高測試的信度和效度有著深刻意義。
關鍵詞:語言測試 錯誤 信度 效度
引言
語言測試是伴隨語言教學出現的,沒有語言教學也就無所謂語言測試。語言教學是第一性的,語言測試為語言教學服務。語言教學的任務是培養學習者實際運用所學語言的能力,而語言測試的目的則是提供一種科學的測試工具,通過對學生語言運用能力的抽樣測試,對學生的語言能力進行客觀的、準確的、公正的評價。語言測試的規??纱罂尚?,小到一個班級、年級、學校的各種考試測驗,大到各種全國性的甚至是跨國界的考試??荚嚨囊幠T酱?,考試的社會性越強。考試對考生、對用戶、對相關管理者往往有重大影響。因此,語言測試工作者必須明了所負的責任,盡最大努力,保證考試的科學性、客觀性、公正性。語言測試是一項專業性極強的工作。一個大規模的考試項目,從開始到成熟,至少要經過三個環節:設計階段、實施階段和考后階段。語言測試是環繞著試卷進行的,命題是保證考試質量最重要的一個環節,因此本文將重點討論第一個環節中命題的常見問題。
一、測試的常見錯誤
由于對于語言本質及能力的認識不同,基于心理學、社會語言學理論的教學方法在不同的時期有不同的流派,因而也派生出不同的測試理論和方法。不同的語言觀不但決定考什么,而且決定怎么考,這兩者直接關系到語言測試的信度和效度。
正確的測試同正確的運用語言一樣,可以通過避免錯誤而獲得。在任何語言教學過程中都需要編寫試題和進行測試。只有避免常見的測試錯誤,測試才能起到篩選、診斷和評價的作用。筆者憑借多年的教學經歷和對測試方面的濃厚興趣,對測試中常見的錯誤進行了不完全的整理分析。如果這些問題得到解決,對提高測試質量將一定有幫助。這些問題可分為:試題的一般性錯誤,單項試題的錯誤,測試的有效性等。
A 測試的一般性錯誤
1. 試題太難或太易
測試都應該具有較好的區分性或者說區分力,起到區分受測者能力的高低的作用。試題太難或太易時,考試分數就會集中在分數圖線的高端或低端。出現這種情況的結果,就是達不到預期的目的,或降低了試題用來區分學生能力的作用。這樣的測試對于預期的考核目的來說是既不可靠又不適合。為了更好地、更充分地達到預期目的的效果,在準備試題和每個項目時,要注意使這些題目能有50%的考生順利通過。這樣做就會盡可能地提高測試中的信息量及其信度。
2. 試題數量不足
試題的數量與測試的信度有直接關系。試題太多會不必要地使學生感到厭煩、疲憊;而另一種較為常見的錯誤則是試題太少,從而影響測試的信度。對大多數英語測試來說,筆試試題的數量在少于50個題目的情況下,要得到令人信服的信度是較困難的。題目太少,在測試考生聽力能力時,結果尤其難以可信。同時,要是測試有了100個或更多的試題時,再增加試題數,對提高測試的信度就完全不起作用,或只起很小的作用。
3. 試題類型過多
在英語測試中,通常的做法是將整個試卷分成幾個部分,以此來保證對全部重要的語言技能都能考查到。要設計出有效的測量學生語言水平的測試,這是一個很必要的步驟。如果對試題的組合和類別不加限制,在測試時也會出現問題。
實踐證明,測試包含很多部分,結果往往并不理想。一般來說,只要預期要測試的語言能力或語言知識在試題中得到有效反映就可以了,沒有必要一種能力或一種知識在同一試卷中用不同的方式多次檢測。很多盲目設計的英語測試實效很低,原因就是它們背上了太多的額外包袱。
4. 缺少有關數據
大多數標準測試都附有使用說明。這些說明提供有關該測試的信度和效度的情況。當使用自編試題時,并要以其結果作重大決定時,必須估算出該試卷的信度和效度。
規范的測試在命題結束后,試題必須經過預測,才能知道題目的質量。預測必須保證三點,即采樣要有代表性、保密性,樣本要有一定的量。預測以后要對題目進行項目分析(item analysis),主要是求試題的難易度和區分度。
5. 虛構語言形式的負作用
目前英語測試中多項選擇題題型應用非常廣泛,除了閱卷信度高外,它具有在大規??荚囍惺r、省力、省錢的優點。多項選擇題還具有考點明確、抽樣覆蓋面廣等其他優點。然而它也有很多弊端。多項選擇題的選項中采用了不適當的形式,就有可能教給學生錯誤的用法,試題起到了負反撥作用。請看下題:
We______here since eight o’clock.
a. are being b. have been c. will be d. are be
很明顯,選項d在任何一個自然英語環境中都是不存在的。但一個學習英語的人,特別是在初學階段,可能因此而學會這種形式并誤認為are是be的助動詞。如果為了分散考生的注意力,選項中有必要包括一些不正確的形式,但是也應選一些在適當的語言環境中是可以出現的形式。
B 單項試題的錯誤
1. “捉弄人”的試題
試題中絕對不能采用“捉弄人”的試題。一般來說,這類試題會削弱學生的學習動力,降低教師的威信以及試題的質量。這種試題是拙劣的教學法的明顯標志。請看下題:
I did not observe him not failing to do his work because he was_____.
a. always working b. ever conscientious
c. consistently lazy d. never responsible
只要對試題很快瞥上一眼,就會看出題干中含有雙重否定結構,這種結構超出了正常英語規范用法的界限。這樣的試題會產生反向辨別的后果。很多學習成績比較好、詞匯量較大的學生,常會受這種試題的迷惑而出錯。反之,學習差但由于細心的學生卻能答對。這也許是由于他們只注意到了選項c與其他答案是不同的。
2. 試題用詞累贅
出試題時一個常見的問題是用詞上不必要的重復。這種現象在多項選擇試題中尤其明顯。請看下題:
Wherever you go on the earth,there is always gravity_______.
a. to keep you to fall off b. to keep you from falling off
c. to keep you falling off d. to keep you fall off
這樣的試題最好改寫為:
Wherever you go on the earth,there is always gravity to keep you______off.
a. to fall b. from falling c. falling d. fall
試題用詞累贅會大大降低測試的效率。因為多余的措詞會影響考生在測試所規定的有限時間內了解更多的信息,同時還會模糊考點。
3. 選項形式不一致而引起的暗示
在設計多項選擇試題的選項時,要注意防止對正確答案提供任何暗示。“會猜題”的學生,即使他們不懂試題所要考查的內容,也經常能選出正確的答案。無意中給了答案的線索,有多種情況。一種情況是答案項在長度、結構、類屬或難度上明顯地不同于其他三個選項。另一種情況是干擾項明顯地缺乏似乎可能性。同一次考試中一道題目泄露另一道題目的答案,在試卷不同部分由不同的人命題的情況下,是很容易出現的。負責拼題的人應當從這個角度仔細考慮審查,才可能避免這種問題的發生。題干語境也能泄露答案,被考詞的詞形給了答案線索,選擇項成分變體的組合泄露答案,這些情況在此不一一舉例,但這些因素都影響考試的效度。
4. 選擇項目中的共性引起暗示
與選項形式不一致而引起的暗示相比,選項共性給學生的暗示更不易察覺。“會猜題”的學生會因為答案內容的重疊而辨別出正確答案。下面是一個略去了題干部分的例子。
a. crawl b. creep c. brawl d. trudge
即使對問題毫不理解,我們也能推測出crawl是正確答案。理由是:a,b和d都是指一種較緩慢、簡單的動作。c與其他選項唯一明顯的共同點是它與a押韻。這些選項采用了語義上和音位上的相同點來分散考生的注意力,而兼有四者共性的選項是a。在絲毫不用考慮題目問的是什么的情況下,考生便可使用上述方法推斷出正確的答案。
5. 選擇的數量
在多項選擇題里,經常出現選擇項目的數量不足,或有多有少。對于多項選擇題或正誤選擇題,考生有可能憑猜測而得出正確答案。供選擇的選項越少,由于猜測而得出正確答案的可能性就越大。
與選項數量不足有關的另一個問題,是選項的數目不一。這除了審美的觀點外,由于可供選擇的答案數目不定,就難以應用各種公式來糾正分數中由于學生猜測而出現的誤差。總之,最好在同一試卷中,多項選擇題的選項數目始終不變。
C 測試的有效性
1. 混合的內容
測試要準確地測出預期的內容或考生的能力,這才是有效的。但有時試題中會出現測試范圍以外的內容。請看下面兩例:
He_______the man yesterday.
a. see b. saw c. will see d. is seeing
The lady______to many cities in Europe last year.
a. visited b. traveled c. visits d. climbed
第一個例子旨在測試動詞時態,但選項中a實際上是在測試主語與謂語一致性方面的知識。同樣,第二例試題旨在測試識別詞匯的能力,但卻包括了測試時態的選項c。這樣試題本身的矛盾,影響了考試所要達到的預期效果。
2. 不恰當的答題方式
有些測試要求考生在答題時所使用的技能并不是該測試所要考查的技能。如考查閱讀理解能力的試題卻要求考生用筆頭準確地表達對文章的理解或翻譯文章中的某些句子或段落。這樣的測試不能算有效,因為這種要求超出了測試的內容。因此,命題時必須注意使答題所需要的技能與測試所要考查的技能一致起來。
3. 單憑常識就能正確選出的答案
單憑常識就能回答的試題應當避免。以下面的閱讀理解題為例:
According to the story,Napoleon was born in______.
a. England b. France c. Germany d. Italy
對這道試題的正確回答,并不能說明對試題中所摘錄的文章具有理解能力。因此,考生的得分可能很高,但這種高分不能說明考生的閱讀理解能力。
4. 試題與教學大綱不符
學業成就測試(Achievement Test)無效的原因往往是由于測試既沒有考查教學目的是否達到,也沒有測試出考生對課程內容的掌握程度。也就是說試題缺乏表面效度或內容效度。在設計這類試題時,教師應該按照一定的程序系統地抽選出所要考查的課程內容。課程必須與教學目的相一致。測試也應在所教的詞匯、句型結構以及語言技能等方面反映出預定的教學目的。
結論
教學通過測試了解學生的學習情況、問題的癥結,檢查教學的結果,而測試可以影響和促進教學的改進??茖W有效的測試方法和評估方式能給教學以積極的反撥作用。筆者希望以上所討論的測試中的常見錯誤能在今后的英語測試中少見或最終避免。但就目前而言,如何更好地科學客觀地測試,仍需要廣大外語工作者和教育者進一步探索和努力。
參考文獻:
[1]胡春洞,王才仁.英語測試論.廣西教育出版社,1996年.
[2]李筱菊.語言測試科學與藝術.湖南教育出版社,2001年.
[3]武尊民.語言測試的理論與實踐.外語教學與研究出版社,2002年.
[4]鄒申.英語語言測試——理論與操作.上海外語教育出版社,1999年.
[5]鄒申,楊任明.簡明英語測試教程.高等教育出版社,2002年.
[6]J. Charles Alderson Caroline ClaphamLanguage Test and Evaluation. Foreign Language Teaching and Research Press,Cambridge University Press,2000.
本文系“全國中小學英語教師教育和培訓方式、內容及其效果研究”子課題“英語教育專業(專升本)課程設置改革與教師職業發展”課題的階段性研究成果。