摘 要: 本文主要從命題原則、題型結構、評分標準和評分辦法等方面分別對外語測試中常用的三種題型,即多項選擇題、完型填空、寫作題進行分析比較,旨在提高這些測試題的信度和效度。
關鍵詞: 英語測試題 優劣性 信度和效度
作為語言教師,我們幾乎天天和測試打交道。比如說,每次講授新課之前,可能抽出幾分鐘的時間復習一下上一課學過的知識,或做單詞拼寫,或做短文聽寫等。每教完一課,可能要進行一次測驗,檢查一下學生對本課掌握的情況。到學期中間,一般進行期中考試,期末還要進行期末考試,等等。在這樣的一個教學過程中,我們不僅可以看到學生的學習及進步情況,同時還可以了解到自己的教學效果。因此,教學離不開測試。現代教育理論的發展,尤其注重人的素質的教育,強調發揮學生的主觀能動性,強調因材施教。要檢驗教學的效果,離不開對學生的評價,通俗地講,就是對學生進行測試。那么,為了正確地、更好地、更有效地運用測試手段來檢查學生的成績及評價教師的教學效果,筆者從命題原則、題型結構、評分標準和評分方法等方面分別對外語測試中常用的三種題型,即多項選擇題、完型填空、寫作題進行分析比較,并對這三種測試題的優劣性進行了論述。
一、多項選擇題(multiple choice item)
多項選擇題命題的出發點是提高測試效度。
各類試題的命題都應為測試目的服務,以提高測試效度為前提。在多項選擇題的命題中,經常會由于過多地考慮選擇項而忽略其他問題。例如,在學生還沒有學過San Francisco這個詞時,就要求學生做下面的練習:
San Francisco is________the west of the United States.
A.onB.toC.inD.at
這道題命題的本意是測試學生對英語常用介詞in和to在表示方位時用法上的區別,但是如果學生不知道San Francisco 是一個國家名還是美國國內一個地名,他們就無法作出判斷,也很難找到正確答案。像這樣的試題根本無法達到測試介詞的目的。
1.多項選擇題的命題原則
(1)多項選擇題對題干和選擇項的要求
命題時要注意題干必須有一定的內容,不能僅是一兩個詞,題干內容提供的信息應有效地將考生帶入測試點范圍之中。選擇項中共同的語言應該放在題干中,避免每個選項里重復出現。同時,選項的內容和語言應平行、對等,應屬于同種類型(如同為單詞、短語或者從句)。正確答案的長度應與其他選項大致相同,太長或太短都會對考生有暗示之嫌。例如:
The passage tells us________.
A.different waysB.teaching approach
C.educational systems D.different ways of learning in China
上題中,由于D項內容豐富,有一定的長度,考生很容易通過比較選出正確答案項。此外,選項還要避免生詞形、搭配、詞序等的出現。例如:
He stood up and it.
A.objected to doB.objected to doing
C.be objected to doD.be objected to doing
上例中A、C、D三個選擇可能是生造的結構。這樣的錯誤信息可能成為誤導學生的語言輸入,使他們形成錯誤假設,妨礙以后的學習。這種試題效度差,達不到測試目的。
(2)命題要緊扣閱讀或聽力材料內容
在閱讀和聽力測試的多項選擇題中,試題答案必須緊扣材料內容,使考生只有在讀懂或聽懂之后才能作出正確選擇,而不能憑自己的經驗和常識甚至記憶就能猜對答案。因為選擇題本身就包含有猜測因素,如果測試內容不緊扣閱讀或聽力材料,就很難保證測試效度。
2.多項選擇題的優劣性
多項選擇題的優點在于:首先,它只有一個正確答案,是一種客觀性試題,評分省時省力,因此,無需考慮評分者的因素,可把精力集中在提高命題質量上。其次,使用該題型能夠控制試題的難度,并能通過測試等手段篩選試題,使正式考試更具可行性和科學性。再者,多項選擇題題義清晰,考生不會產生誤解,考生無須書面表達而不受其寫作能力的影響。另外,它對考生在英語語法、詞匯的理解、分析等方面內容的考查信息量大,覆蓋面寬,形式靈活多樣,而且這種題型對于考生答題省時,因此可以增加考試的覆蓋面和采樣量,提高考試的信度。
然而,多項選擇題也存在弊病,不能濫用該題型。因為,1.多項選擇題只能顯示正確或錯誤答案,它只考語言知識的識別,不能測量語言的運用和產出能力,更不能排除猜測因素,考生可以靠猜測答題。而且多項選擇題最容易靠旁窺和打暗號等方式作弊,因此,測試結果的效度會打折扣。2.命題難。它的命題需要命題者花費大量的時間和精力反復推敲,稍有不慎就會問題很多。3.反撥效應差,容易使師生片面追求應試技巧而忽視語言訓練本身。
二、完形填空測試題(cloze test)
1.完形填空題的命題原則
完形填空測試(cloze test)是指所選的一段文章中有意地把每隔5—7個左右的單詞刪除掉,要求學生根據前后所提供的信息推測空缺中的意義并據此填上正確的詞,使之復原意義完整、結構正確的短文,以測試考生綜合運用語言的能力。該題型對命題的基本要求是:
該題往往是一篇或一段文章,段落的開頭和結尾的那個句子總是完整的,不留任何一個空格,這樣,為考生提供了更為完整和充分的語境。整題必須有一定的長度和適當的空格數,只有這樣才能使考生正確理解題意,不致誤導,才能達到測試信度的要求。
完形填空題的留空形式有兩種:一是定詞留空,大約每隔5—11個詞留一個空,詞與詞間隔的距離越短,難度越大,一般以7—9個詞的詞距為宜。二是不定留空。根據測試要求,需要測試什么內容就把該位置留空,例如測試習慣搭配、介詞用法、時態或語態的變化等都可以在這些地方留空。
2.完形填空題的三種評分辦法
(1)確切詞評分法(exact-word method)
確切詞評分法是指考生在空缺處填寫的詞正確與否要根據它所刪除的詞是否一致。這種評分既簡單又客觀。但是,由于很少有考生能夠填出與原文完全相同的詞語,這種評分方法使完形填空題加大了難度,降低了測試的區分度,故現在很少使用這一測試方法。
(2)可接受詞評分法(acceptable-word method)
可接受詞評分法是學生在空缺處所填寫的詞并不強求與原文完全相同,只要在結構上、語義上正確就可視為正確的答案。這樣做的好處是降低了難度,提高了成績,而且從考生多種多樣的答案中教師還能發現教學的不足。但使用這種方法評分可能產生分歧意見,因而可能會降低評分的客觀性。因此它不適用于大規模的標準化測試。
(3)多項選擇評分法(multiple-choice method)
多項選擇評分法是嚴格的完形測試作適當的修正,把由學生在空缺處填入正確的詞改為向學生提供備選項,供他們選擇。這種形式的試題評分較客觀,命題較科學,信度和效度都達到要求,是目前各類測試中完形填空題最常用的一種形式。
3.完形填空題的優劣性
完形填空的優點在于:1.完形填空題具有測試考生綜合運用語言能力的優勢。例如目前廣為流行的CET,DETS,IELTS(雅思)等都有這類題型。考生在做這類題型時,需要運用英語語言的各種知識和能力,除了熟練運用語法、詞匯等知識以外,還必須具有很強的概括、分析、推斷等能力,只有這樣才能保證答案的準確性。2.完形填空題命題省時,是一種比較經濟的測試手段。它的命題無需像多項選擇題那樣,每一個題都要仔細斟酌,花費大量的時間和精力。
與此同時,完形填空題也不可避免地存在一定的局限性,集中體現在以下三個方面:1.不能敏感地測定學生在低年級學習英語所取得的效果,也就是說,完形填空測試題在低年級似乎不能發揮其本身的優勢。2.采用可接受詞評分似乎在某種程度上能更好地了解被試者的英語運用水平,然而,對于在非英語國家這一環境里教授英語,命題方面受到客觀因素的制約。3.嚴格的完形填空題,每隔5—8個單詞刪除一詞,留一空格,可能有時遇上一些地名、人名或其他常識性或對學生來說較難猜測的詞,這就可能提高試題難度,從而降低了考試的信度和效度,以及試題的區分度。
三、寫作測試(writing test)
1.寫作的命題原則
寫作是大學英語教學中的一個重要組成部分。縱觀各類綜合英語教科書,寫作必定是其中一項重要內容。同樣,寫作測試在考試中也是一個不可少的項目,在綜合能力考卷中。人們予以寫作的高度重視體現了寫作能力在實際語言交流中的重要作用。
能夠正確拼寫英語單詞及運用標點符號不等于會寫完整的句子;會寫完整的句子不等于會寫通順連貫的文章;但會寫通順連貫文章的人必須具備以上拼寫、詞匯和語法知識。
大學英語寫作能力實際上還涵蓋了其他一些因素——內容條理性、文體恰當性、修辭知識等。
寫作測試是一種高效度的語言測試手段,我們應該發揮其最大的效度優勢。要做到這一點,在設計寫作試題時,應注意下面幾條原則:
第一,寫作試題要有真實的情景,也就是考生現在或將來很有可能會遇到的情景。這條原則稱作真實性原則。設計寫作試題要遵循這條原則。因為只有試題的情景真實,才能測試我們所期望學生應掌握的寫作技能。
第二,寫作試題要保證以意義為測試焦點,而非語言形式。
第三,試題的要求應該是互動性行為。在現實生活中,人們使用語言來進行交際時,是一個交互性的、動態的過程。寫作同樣也是一種交互性的行為,因為寫出來的東西是讓讀者看的。這就意味著設計寫作試題時,需要考慮到互動性這一特征。
2.寫作測試題的兩種評分法
(1)整體(或印象)評分法(holistic/impression scoring)
整體評分法把作文視作一個完整的篇章,根據其總體印象打分,所以有時被稱為印象評分法。問卷人員就總的印象給出獎勵分,而不是按語言點的錯誤數目扣分。
整體評分法把所閱作文分成幾個檔次(band),每個檔次與一個分數或分數段相對應。每個檔次還必須明確該檔次作文的特征,比如內容、語法、組織、表達等,同時檔次之間應顯示明顯區別。閱卷人員注重的是作文的整體質量,而不是局部現象的特征,比如作文主題擴展和例證是否充分,論證是否有力;作文風格是否符合閱讀對象的層次和背景,等等。
(2)分析評分法(analysis scoring)
分析評分法認為作文是由不同的成分(components)組成,如語法、內容、組織、表達和連貫等。分析評分法根據不同成分給作文分別打分,最終分數由各個小分相加而成。
分析評分法有以下特點:1.使問卷人員明確具體評分方面。2.組成部分之間的評分不互相干擾或影響。由于一個人各種具體寫作技能的發展常常是不平衡的,因此很難用一種固定模式來衡量。分析評分法可以針對每項技能或每個方面單獨打分,從而避免出現整體評分法所面臨跨檔次的難題。
但是,分析評分法存在的第一個問題是把寫作能力人為地分割成互不關聯的部分。寫作能力的體現事實上不僅僅是按照規范把句子聯在一起,它還涉及其他方面,如文體、風格,這些都需要從文章總體上觀察和評判。把各個部分分離出來會導致閱卷人員過多地關注作文的局部性而忽略其全局性。分析評分法的第二個問題起源于第一個問題。寫作能力劃成單獨部分后就涉及分值分配,即某個部分占總分的比例。換句話說,比例如何分配牽涉到考試的結構效度,即考分的解釋功能。如果在寫作總分中語言分的比例過高,寫作分數實際上反映的是語言知識,不是寫作能力。因此,我們在使用分析評分法時要力求做到重點明確、分值合理,較高的分值比例應給那些較能體現或代表寫作能力的部分。
3.寫作測試的優劣性
寫作測試的最大優點是效度高。第一,寫作測試是一門綜合性測試,它不僅能考查學生的輸出性技能(productive skill),同時還能考查學生的接收性技能(receptive skill)。第二,它能同時測試語言的各個層次和范疇。它可以測試學生的組織能力、分析能力、表達能力、邏輯推理、對各種語體的掌握等。寫作測試作為一種行為測試,測量的是學生實際運用語言的能力,給教學帶來的是非常積極的正面反撥作用。
寫作測試的弱點是信度低。寫作測試屬于主觀測試,主觀測試的評分無法客觀化。比如對一篇作文的評分,10位評分員可能給出10個不同的分數。有時同一位評分員也無法做到評分標準始終如一。評分無法客觀化,測試信度難以保證。
綜上所述,筆者從命題原則、評分標準、操作進程諸方面對這三種常見題型(多項選擇、完形填空、寫作測試)的命題進行了盡可能客觀的論述,并指出其優劣性。目的是讓英語考試命題者在運用以上題型時揚長避短,以便更好地考查出英語學習者真實的英語水平。
參考文獻:
[1]劉潤清,韓寶成.語言測試和它的方法.外語教學與研究出版社,1999.
[2]鄒申,楊任明.簡明英語測試教程.高等教育出版社,2000.
[3]Bachman,L.F.Fundamental Considerations in Language Testing.Oxford University Press,1991.