曹娟
摘 要: 語(yǔ)言測(cè)試是大學(xué)英語(yǔ)教學(xué)過(guò)程中必不可少的一環(huán),是檢測(cè)外語(yǔ)教學(xué)成效和提高英語(yǔ)教學(xué)質(zhì)量的重要手段。本文首先說(shuō)明了信度與效度的定義及關(guān)系,然后以分析廣泛用于大學(xué)英語(yǔ)測(cè)試中的多項(xiàng)選擇題為入口,發(fā)現(xiàn)大學(xué)英語(yǔ)在應(yīng)試教育的指揮棒作用下有普遍追求高信度而忽視效度的傾向,提出當(dāng)前大學(xué)英語(yǔ)語(yǔ)言測(cè)試的取向應(yīng)是效度重于信度。
關(guān)鍵詞: 效度 語(yǔ)言測(cè)試 信度 多項(xiàng)選擇題
1.信度與效度
1.1信度。信度是什么?信度是指測(cè)量的結(jié)果要有穩(wěn)定、可靠和一致性,一般情況下,多以內(nèi)部的一致性表示測(cè)驗(yàn)信度的高或低。信度的系數(shù)如果越高,此測(cè)驗(yàn)的結(jié)果就越可靠、一致、穩(wěn)定。由于系統(tǒng)誤差始終以同樣的方式影響測(cè)量值,不會(huì)造成不一致性,因此系統(tǒng)誤差對(duì)信度的影響可以忽略。相反,隨機(jī)誤差卻可能因?yàn)閷?dǎo)致不一致性而降低信度。我們可以把信度定義為隨機(jī)誤差r影響測(cè)量值的程度,如果r=0,就認(rèn)為信度最高,測(cè)量是完全可信的。在大學(xué)英語(yǔ)測(cè)試中,信度表明了試題、應(yīng)試者及分?jǐn)?shù)之間相互的關(guān)系,而影響試題的因素很多,包括考試的相關(guān)組織形式、試題質(zhì)量和試卷的評(píng)判等。測(cè)試者要想確保有較高的信度,必須首先保證試卷有一定的量。一般情況下,試題量愈大,信度就愈高,而且考試的分?jǐn)?shù)必須有一定的分散性,即兩頭小,中間大。那么,怎樣才能達(dá)到這個(gè)標(biāo)準(zhǔn)呢?首先,試卷要能很容易被區(qū)分開(kāi),這樣方能將不同水準(zhǔn)的考試者區(qū)別開(kāi)來(lái);其次,試題要具備適宜的難度,既不能太難,又不能太簡(jiǎn)單,否則測(cè)不出考試者的層次;最后,試題應(yīng)具有同質(zhì)性,也就是說(shuō),要考的內(nèi)容屬于同一個(gè)范圍,試題與應(yīng)試者之間具有相互適應(yīng)性。
1.2效度。效度指什么?效度指的是一種相關(guān)性,表示的是測(cè)試與測(cè)試目的的相關(guān)度。我們可從以下兩方面進(jìn)行理解,首先,想考的內(nèi)容與所考的內(nèi)容是否是一樣的;其次,考試能否達(dá)到目的。效度是考試的關(guān)鍵所在,即如果某項(xiàng)高信度的考試沒(méi)有考到應(yīng)考的內(nèi)容,那么這項(xiàng)考試效度就低。各種考試種類(lèi)多,規(guī)模大,但大多數(shù)只管得到成績(jī),很少有人考慮成績(jī)是否有效,命題人員很少分析考試的結(jié)果。如果命題人對(duì)所命的題缺乏足夠充足的反饋信息而命題,那么題目的水平就難以得到提高。最近幾年開(kāi)始有一些考試的分析研究,但只限于研究信度,對(duì)一些大型的如CET等考試,需要對(duì)其展開(kāi)效度調(diào)查和研究。原因是在一項(xiàng)測(cè)試中,效度信度同等重要,若其中的任一項(xiàng)被忽略,命題的質(zhì)量就無(wú)法得到保證、
2.語(yǔ)言測(cè)試中效度與信度的關(guān)系
第一,信度與效度是辯證統(tǒng)一的關(guān)系。一個(gè)語(yǔ)言測(cè)試擁有以下兩個(gè)基本的過(guò)程:一是確保語(yǔ)言行為能有效說(shuō)明受試者的語(yǔ)言能力,并在此范圍內(nèi)選擇樣本;二要確保受試者的語(yǔ)言行為能被測(cè)試結(jié)果準(zhǔn)確真實(shí)地反映出來(lái)。因此,語(yǔ)言測(cè)試效度反映的是語(yǔ)言能力與所測(cè)語(yǔ)言行為的關(guān)系,而語(yǔ)言測(cè)試的信度則表明考試結(jié)果與語(yǔ)言行為的關(guān)系。如果沒(méi)有信度,那么測(cè)試人員難以借此測(cè)量出任何東西,該測(cè)試不能真實(shí)地反映被測(cè)試者的語(yǔ)言行為。相反,無(wú)效度測(cè)試也是沒(méi)有意義的,因?yàn)闆](méi)有效度的測(cè)試準(zhǔn)確地測(cè)量出了與語(yǔ)言能力毫無(wú)關(guān)系的東西。在此情況下,測(cè)試者同樣沒(méi)辦法根據(jù)測(cè)試結(jié)果推測(cè)被測(cè)試者真實(shí)的語(yǔ)言能力。綜上所述,效度信度要在一起方可實(shí)現(xiàn)某項(xiàng)語(yǔ)言測(cè)試的目標(biāo),二者具有辯證統(tǒng)一性。
第二,信度與效度是相互對(duì)立的。信度要求語(yǔ)言測(cè)試彰顯語(yǔ)言的科學(xué)性,即將語(yǔ)言進(jìn)行劃分處理,并要求測(cè)試題目具有同質(zhì)性,如此方能使語(yǔ)言測(cè)試的內(nèi)容與形式與語(yǔ)言應(yīng)用的真實(shí)情況脫離開(kāi)來(lái);效度則聲稱(chēng)語(yǔ)言測(cè)試需關(guān)注語(yǔ)言的整體性、藝術(shù)性及題目的多樣性,并且,測(cè)試的內(nèi)容與形式應(yīng)符合語(yǔ)言應(yīng)用的真實(shí)情景。因此,任何測(cè)試題型、任何測(cè)試,都不能同時(shí)兼有極高的效度與信度。以真實(shí)語(yǔ)言為內(nèi)容的交際性測(cè)試能保證較高效度,而強(qiáng)調(diào)以分散性為主要特征的語(yǔ)言測(cè)試則能確保較高的信度。
3.多項(xiàng)選擇題信度效度剖析
3.1題型信度分析。一是題目具有客觀性。廣泛存在于大學(xué)英語(yǔ)測(cè)試中的多項(xiàng)選擇題是通過(guò)測(cè)試學(xué)生所掌握的詞匯、語(yǔ)法、語(yǔ)音等知識(shí),推斷學(xué)生構(gòu)建句子、理解句子及語(yǔ)篇的能力。由于此種題型考點(diǎn)層次比較低,因此,在有限的時(shí)間內(nèi),多項(xiàng)選擇題語(yǔ)言點(diǎn)覆蓋面較廣泛,而且通常題量較大,這會(huì)讓評(píng)閱試卷的人能夠更準(zhǔn)確地推測(cè)出考生對(duì)語(yǔ)言知識(shí)的掌握程度。因此,多項(xiàng)選擇題擁有較高的信度。而且,只要某多項(xiàng)選擇題被用于語(yǔ)言測(cè)試,那么它的評(píng)分就不會(huì)受到一些人為因素的干擾。所以,多項(xiàng)選擇題具有客觀性。
二是評(píng)分的客觀性。只要多項(xiàng)選擇題的題目被設(shè)計(jì)好,每個(gè)題目的分值比例被確定,那么閱卷人對(duì)其進(jìn)行評(píng)閱就很便捷。在規(guī)模比較大的語(yǔ)言測(cè)試中,此優(yōu)越性特別受人們的歡迎,原因是多項(xiàng)選擇題題型的答案已經(jīng)是固定了的,評(píng)分非常客觀,完全不會(huì)受到不同評(píng)卷人主觀情緒等因素的影響,甚至可以使用電腦進(jìn)行閱卷,能維持很高的評(píng)分信度。
3.2題型效度分析。第一,英語(yǔ)語(yǔ)言能力包括聽(tīng)、說(shuō)、讀、寫(xiě),多項(xiàng)選擇題只能測(cè)試被測(cè)試者的language receptive ability,即語(yǔ)言接受能力,如聽(tīng)和讀,卻不能測(cè)試被測(cè)試人員的language productive ability,即語(yǔ)言輸出能力,如寫(xiě)和說(shuō)。多項(xiàng)選擇題孤立地測(cè)試組成語(yǔ)言的元素,忽視了聽(tīng)、說(shuō)、讀、寫(xiě)這些元素在真實(shí)語(yǔ)境中的相互作用功能。然而,語(yǔ)言的本質(zhì)不單單是各要素處于孤立狀態(tài)而呈現(xiàn)出的特性,更重要的是這些要素在語(yǔ)言整體系統(tǒng)中相互作用而體現(xiàn)的功能。綜上所述,多項(xiàng)選擇題考察的僅僅是學(xué)生的語(yǔ)言形式識(shí)別能力,而對(duì)語(yǔ)言的輸出能力和語(yǔ)言知識(shí)的運(yùn)用能力無(wú)從判斷,也無(wú)法測(cè)試出學(xué)生的語(yǔ)言知識(shí)與語(yǔ)境特征相結(jié)合時(shí)的創(chuàng)新能力。
第二,多項(xiàng)選擇題題型有些時(shí)候所測(cè)試的只是受試人員的猜測(cè)和推理能力,而不是他們真正的語(yǔ)言運(yùn)用能力。
考試大綱不能依據(jù)考試內(nèi)容設(shè)定,不應(yīng)該把語(yǔ)言技能訓(xùn)練的主要方法定義為考試技術(shù)訓(xùn)練,正常教學(xué)不能被測(cè)試取代。大學(xué)英語(yǔ)語(yǔ)言測(cè)試不僅要重視信度,更要思慮其效度,效度要重于信度。通過(guò)上述對(duì)多項(xiàng)選擇題題型的信度效度剖析,可知多項(xiàng)選擇題題型的優(yōu)點(diǎn)與弱點(diǎn)并存,既有其他類(lèi)型題型所無(wú)法比擬的優(yōu)點(diǎn),又具有語(yǔ)言使用不真實(shí)、不能測(cè)試受試者語(yǔ)言輸出能力等效度方面的弱點(diǎn)。筆者認(rèn)為對(duì)待該題型應(yīng)采取科學(xué)和理性的態(tài)度,可通過(guò)采取綜合考慮各項(xiàng)語(yǔ)言技能、不同考試不同對(duì)待、保證命題質(zhì)量、提高試題效度等策略。
參考文獻(xiàn):
[1]孫成崗.現(xiàn)代語(yǔ)言測(cè)試與試卷分析[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2000(4).
[2]牛強(qiáng).現(xiàn)行高校英語(yǔ)測(cè)試中的問(wèn)題[J].外語(yǔ)教學(xué)與研究,2001(2).