論多項選擇題的測試效度

2011-12-29 00:00:00白雅

考試周刊 2011年22期

　　摘要：隨著語言測試理論的不斷發展，多項選擇題的效度受到了關注。多項選擇題在不同的效度中有不同的表現，但是整體效度有很大的局限性，而如何提高其效度也一直需要進一步的研究，在測試中要盡量揚長避短，從而保證測試的效度，達到既檢驗教學效果又促進教學質量提高的目的。
　　關鍵詞：英語測試多項選擇題效度
　　
　　隨著我國英語教學事業的蓬勃發展，英語測試顯得日益重要。根據教育測試學理論，測試在教育中占據重要位置。教學通過測試來檢驗其效果，進行教學評估;而測試又會對教學產生有利或有害的反撥作用（washback effect）。因此，要充分發揮測試對教學的正面影響，提高測試效度就成為關鍵問題之一。而在語言測試中，多項選擇題，簡稱MC題型，是近幾十年來使用最廣泛的題型，尤其在一些大規模考試中，如高考，大學英語四、六級考試，研究生入學考試，出國人員外語水平考試，等等。多項選擇題不僅成為決定外語測試有效性的關鍵因素，而且對教師的教學和學生的學習方法與態度產生了不容忽視的影響。本文旨在對多項選擇題的效度進行分析，探究提高其效度的方法。
　　1.理論基礎
　　多項選擇題是典型的心理—結構測試階段的測試手段。它最初創立于心理測試。上世紀二十年代初，以多項選擇題型和是非題型為代表的客觀測試開始在美國教育界包括語言學科中使用，并迅速獲得承認;三十年代，心理計量學的發展進一步促進了客觀測試手段的應用;到五十年代，客觀語言測試已經在美國教育性語言測試中占主導地位；在六十年代許多結構主義語言學家和教育心理學家開始研究語言測試問題，并用測量學的方法計算測試的信度和效度。他們非常注重客觀性測試，隨著交際測試的倔起，八九十年代多項選擇題在交際測試中漸成主流。
　　一道多項選擇題通常由題干和3—5個選擇項組成。選擇項通常包括一個答案項(或稱正確選擇項)，以及若干個干擾項。這種類型試題稱為填空性多項選擇題。一種常見類型為取代性多項選擇題，通常用于測試考生的詞匯和結構知識。命題者給出一個完整的句子作為題干，把其中要考的詞用下劃線標出，要求考生從所給的選擇項中選取可以放到句子中取代下劃線部分的答案項。
　　2.效度
　　效度通常是指測試的恰當性或者測試的任何組成部分發揮出其測量的作用。有效的測試應該能夠測試出其應該測試的東西。測試有各種作用與目的。錯誤使用效度，測試在某些時候是有效的而在某些時候卻是失效的。效度一般分為五種：表面效度、結構效度、內容效度、共時效度和預測效度。結構效度也稱觀念效度或理論基礎效度，是指測試是否以有效的語言觀和語言學習觀為理論根據。觀念效度是語言測試的主要效度，是一切其它效度的基礎，與觀念效度密切相關的是內容效度。內容效度是指測試的內容中兩種相互關聯的性質，即測試內容與測試之間的相關性;測試內容與測試的目的及與學習目的之間的相關性。觀念效度和內容效度屬語言測試的內在效度。共時效度和預示效度屬外在效度，它們指測試結果在多大程度上與一些外在標準相關，故又稱標準參照效度。表面效度是指測試從外觀看上去被人接受的程度，即看上去是否考了它應該考的。因而具有表面效度的測試容易引起應試者的興趣。
　　2.1 MC題型的表面效度
　　表面效度強調的是測試對于測試者是否呈現出它所要測試的內容。MC試題采取一題一考點的方式，每道題只測試一個語言點，非常有針對性。教師可以及時準確地了解學生的掌握情況和教師的教學效果，測試的表面效度較高。考生在回答MC試題時，只需在答卷上書寫符號或在答題卡上涂黑相應圓圈，比自行書寫答案耗費的時間要少很多。所以在相同的時間限制內，MC試題可以測試更多數量的試題，可以覆蓋更多的語言點，如語音、詞匯、語法、閱讀理解和完形填空等，測試抽樣量較大，測試內容覆蓋面較廣，意味著測試的覆蓋面較全，即考試結果的可靠性和穩定性相對較高。MC試題編排上可視測試需要而定，少則幾十題，多則上百題，使試卷有較大覆蓋面，從多方面測試受試者水平。根據測試的不同需要，還可降低或增加測試難度。比如選擇項數量可三選一或五選一不等，還可與其它題型構成混合題型。MC試題在拼幾道平行卷時也比較方便，換一換題干或選項順序，或刪改個別干擾項就可迅速完成任務，測試手段比較靈活。因此，MC試題的表面效度相對較高。
　　2.2 MC題型的結構效度
　　結構效度是整個效度中最基礎、最重要的要素。甚至，有時候用來代替效度本身。結構效度主要包括考生所掌握的各種語言能力和語言知識，例如寫作能力，口語的流利性，或者是對語法知識的掌握，等等。而這些知識和能力就成為語言測試測試的內容和對象。根據對MC試題的理論基礎的分析，如果MC試題定位的結構效度，是語言知識，該測試手段在這樣的語法測試中具有高度的結構效度。這也是，為何多項選擇題在心理—結構測試階段十分盛行，并至今仍被廣泛采用的原因。
　　并且隨著語言學的發展和各種語言學派的交流融合，MC試題的結構效度的局限性就日益暴露出來。分離式的測試將語言分割成孤立的元素，那么語言的綜合能力就無法在這種試題中體現出來。同時由于語言的社會性，語言使用者的心理，認知等因素也被考慮到實際的語言使用中，很明顯，對于語言能力的定義早突破了傳統的語法知識。由此可見，MC試題的結構效度幾乎為因為它已經和多項選擇題的理論基礎相背離了。它的設計和解答都和實際的語言使用相距甚遠。MC試題雖然能夠成功地測得考生對語言知識的辨認能力，但較難測出考生運用語言知識的實際能力。如在以MC試題出現的結構和書面表達部分能拿高分的考生，并不一定表明其能夠自如運用這些語法結構知識進行書面或口頭交際。甚至有少數語法部分得高分的考生，耳不能聽，口不會說。這就給MC試題的結構效度打了折扣。經過多年研究，一些測試專家指出，多項選擇題只能測試考生的語言輸入能力，如聽和讀，但不能測試考生的語言輸出能力，如說和寫。因此，MC試題的結構效度在當前的測試理論之下的局限性突出。
　　2.3 MC題型的內容效度
　　內容效度強調的是測試內容與測試之間的相關性，測試內容與測試目的及學習目的之間的相關性。一個對學生至關重要的考試若單純采用MC題型，則很可能對語言學習和教學產生負面影響。MC題型成為使用最普遍的測試手段的主要原因在于它較高的表面效度和信度。但是，MC題型并不是有效的教學手段，在教學中大量操練MC題將對教學造成不良影響。比如由于回答MC題并不是真實的語言使用活動，熱衷于做MC題，放棄采用各種反映現實生活中真實語言交際活動的、激發學生運用語言達到交際目的的交際任務，不利于提高學生的語言交際能力。同時，由于MC題型無法直接測量語言表達能力，只能用于詞匯、句法、聽力和閱讀考試，只做MC題勢必造成學生語言接受能力較高、而語言表達能力低下的情況。而且師生在大量操練MC題時，必然會將部分注意力集中在對付MC題型的技巧上，而忽視語言學習這一根本目的。這就使測試內容與測試目的和學習目的之間的相關性大大減少。
　　2.4 MC題型的預測效度
　　MC題型的預測效度比較差。預測效度指該測試對考生未來語言表現的預測度。然而，上述分析明確地指出，MC題型測試的只能是學生的語言知識，甚至只是語言知識中的某個部分，如語法、詞匯或是聽力。很多語言學家和測試專家強調雖然語言語法知識是整個語言能力中不可或缺的一部分，但是語言知識并不等于實際的語言交流能力。對于語言知識的測試無法去預測學習者在真實的語言環境中是否具有整和這些獨立的語言元素，從而創造性地進行語言交流。因此，運用MC題型來預測考生的語言能力，它的預測效度是極低的。
　　
　　2.5 MC題型效度的干擾因素
　　MC題型有利于受試猜測答題。單純憑猜測答對一道四個選擇項的MC試題的概率是25%;如果受試憑借自己所掌握的不全面的語言知識進行猜測，則答對概率相對小得多。此外，MC題型的答題過程受到猜測和作弊因素的干擾，也降低了其整體的效度。當然，在重大的考試中，常常通過采用A/B卷，不同的答題卡等手段來降低這方面的影響，確保整個測試的效度。
　　同時，MC試題的干擾項設計方面也可能存在著問題。如考點不明確。一般語法/詞匯題要求每題只涉及一個考點，或最多兩個能互相增補的考點，在不可避免地涉及多個考點因素的情況下，必須對一些不相關的、互相抵消干擾作用的選項加以嚴格控制。當選項之間的區別對試題的答對與否毫無影響時，這種選項就是多余的，不能有效地起測試作用；或者干擾項本身有錯誤，缺乏有效性。有些干擾項放入題干，與其它選項相比較處于很低的語言層次，在語法結構、詞匯意義、詞匯搭配方面不符合答案的基本要求，與題干明顯不相容，因而缺乏干擾作用。
　　2.6測試效度與測試目的
　　綜上所述，多項選擇題的整體效度有很大的局限性。雖然它無法有效地評價也無法預測學習者的真實的語言運用能力，但是它在語言語法知識的測試中還是被普遍采用的。對于其效度的評價，應該結合測試本身的目的和內容。首先，在水平測試中，基于單一、孤立語法知識的多項選擇題，其結構效度和預測效度幾乎無效。所以，在新型的大學英語四、六級考試，和國際的TOFEL和IELTS考試中，這樣的多項選擇題已經淘汰。但是對于基于課本的成績測試，或者是期初或期末的診斷性測試，其重點是學生對于一定的詞匯，句型的理解和掌握。很明顯作為傳統的語法測試手段的多項選擇題的效度還是很強的。這些測試的目的是對學生的當時語言知識的評價，并且無需根據該成績做出任何預測，所以MC題型極低的預測效度可以不加考慮。此外，雖然廣大語言學家和教育者強調對綜合語言能力的培養和測試，但是語言知識始終是整個語言能力中不可或缺的基礎能力之一。特別是對于一些語言水平較低的學生來說，夯實語言基礎知識仍是必需的。所以不能因為MC題型在評價語言能力上的不足，而忽視它在語法測試中的高效度。因此，在基于語言知識的成績和診斷測試中，MC題型應當充分被利用。
　　3.如何提高效度
　　由于各種效度的差異，要想提高MC題型的整體效度，既要分析具體考試性質根據每個具體考試的使用目的、主辦方式、對象范圍、實施頻度、對受試命運的決定性作用、對教學的反撥作用，又要權衡考慮信度和效度，決定是否使用MC題型。例如，學校范圍的甄別測試，目的是鑒定學生個人各種能力之間的強弱，指出努力方向，供今后教學、學習參考，而不在于區分學生之間的差別。考試由學校組織，受試人數有限，對受試的命運沒有決定性影響，但是對教學的反撥效應很顯著，所以信度并不重要，效度卻很關鍵，可以采用比MC題型更直接的、效度更高的講話、寫作或多技能運用的表達性題型。
　　在決定使用MC題型后，應在維持高信度的基礎上，從確定與之相結合的題型、確立選材原則、寫題原則、寫題技巧和評分原則等各個環節入手，積極探索提高其效度的辦法。另外，在聽力、閱讀測試命題中，可以發掘、利用一些非常適合于改編成MC試題的、現實生活中的真實交際活動。例如，利用兩個人就報紙上招聘信息專欄列有的幾條信息進行的對話可以制作一道聽力試題，請受試在聽過該對話后判斷這兩人各自中意的是專欄中的哪個工作。
　　語言考試能否取得預期效果，首先取決于命題是否成功。命題質量是保證MC題型應有的信度和效度的前提。MC題型的命題必須嚴格遵守各環節的命題原則，對任何環節都不能疏忽大意，否則會產生不良試題，降低該題型應有的信度和效度。MC題型與其它題型一樣，需經過“編寫—審題—預測—修改”這樣一個過程，在編寫題干、正確答案和干擾項時，應明確規定題意，措辭簡潔、準確，提高內容效度。
　　4.結語
　　從以上的分析可看出，MC題型的各種效度中有較高的表面效度，也有較差的內容和結構效度。正是效度表現的差異性使得其有其它題無法替代的優勢，同時也存在著許多弊端。因此，在測試中要盡量揚長避短，從而保證測試的效度，達到既檢驗教學效果，又促進教學質量提高的目的。
　　
　　參考文獻：
　　［1］劉潤清.語言測試和它的方法［M］.外語教學與研究出版社，2001.
　　［2］潘之欣.語言測試中的多項選擇題型［J］.外語界，2001，（3）：67-74.

考試周刊2011年22期

考試周刊的其它文章: 論新時期企業思想政治工作; 淺論領導者的非權力性影響力; 如何支持幼兒的自主學習; 當前幼兒園男幼師缺失的主要原因與相應對策; 利用家庭資源進行節日教育; 用愛心撐起一片天空