摘 要: 本文簡單地介紹了評估語言測試最為關鍵的兩個質量指標:信度和效度,在論證了信度與效度的關系后,探索了如何達到信度和效度之間的平衡以獲得測試最大的總效用,并對語言測試的改革實踐提出了一些參考性建議。
關鍵詞: 語言測試 信度 效度
隨著語言學、語言心理學、社會語言學和教學測量學的發(fā)展,語言測試已成為一門科學性和實踐性都很強的新興學科。語言測試是對語言教學進行測量和評估的一個重要手段,越來越受到廣大外語教學工作者的重視。眾所周知,測試是教與學的向導,為了讓測試發(fā)揮出其向導的作用,并從測試中準確而客觀地評估教與學的效果,一份好的試卷是必不可少的。一般來說,評判一份試卷科學與否的標準是看這份試卷是否有信度、效度、區(qū)分度、實用性、全面性、公正性和后期效應。而信度與效度則是這些標準中最重要的兩個因素。
一、語言測試中的信度與效度
1.語言測試的信度
語言測試的信度,又叫可靠性,是指考試結果的可靠性和穩(wěn)定性。也就是說一份試卷的測試結果在多大程度上具有一致性,即考試結果不受考試時間、監(jiān)考人員和考場等外在因素的影響。鄒申認為,考試信度簡單地說就是考分的一致性。從理論上講,如果一個考試要具有高信度的話,無論在什么情況下對同一學生測試多少次,該學生每次的考試成績都應該是一致的;反之,如果該學生每次的成績忽上忽下很不穩(wěn)定,那么這次考試的信度就不是很高。
與考生能力無關卻又會影響測試信度的因素有很多,例如:自然條件差,天氣過熱或過冷,考場周圍嘈雜等;試題的量是否足夠大;題目是否屬于同一性質或范疇;題目的區(qū)分度是否高;題目難易度是否適中;評分是否客觀;考生本人身體及心理狀態(tài)不好等因素都會影響測試的信度。所以,為了提高信度,我們必須對癥下藥,采取各種相應的措施,其中統(tǒng)一規(guī)范的考試環(huán)境、規(guī)范的監(jiān)考和規(guī)范的試題要求都是必不可少的。
用來檢驗信度最常用的有三種方法:考后復測法、平行測試法和分半法。考后復測法是指在考試后讓學生做同一份試卷,如果幾次試驗的結果都是一致的,那么這份試卷就是有信度的。但是在實際操作過程中,考后復測法還是有一定的不足,因為學生在不斷地學習并提高,而且記憶的因素也會影響到復測的結果。平行測試法是指在設計試卷時,先設計兩份難度一樣的試卷,并在不同的時間給學生做,如果分數相當,則說明有信度。這種方法的弊端在于無法確定兩套試卷在難易程度和內容范圍上是否完全相同。分半法是指只進行一次測試,然后將試題的題號按奇偶數分為兩半,計算兩半所得分數的高低排列的相關性。由于前兩種方法存在不足,在實際工作中人們往往采用試題分半法求得測試的信度。
2.語言測試的效度
效度,又稱有效性,是指一套測試所考的是否就是設計人想要考的內容,或者說,在多大程度上考了想要考的。具體說來,效度就是指一份試卷能在多大程度上滿足考查的目的,它是針對某一目的正確解釋和使用分數的問題。假如一份試卷具體考查數種語言技能或考查內容超出了考查目的,那么其效度就大大降低。效度是衡量語言測試最重要的指標,或者說是語言測試的基本出發(fā)點,一項效度很低的語言測試是沒有意義的。
提高效度常用的方法有:明確考試的目的、決定與考試目的相同的內容、決定考試的方法和增加考試的信度。在設計一套試卷時,設計者首先要明白此次測試的目的,然后嚴格按照這個目的展開設計工作。考試的目的是什么,就要設計與目的想適應的內容,如果測試的內容完全不符合測試目的,那么這個測試就稱不上有效度。考試的方法也是提高效度的一個重要方面,有什么樣的考試方法就要設計什么樣的試卷。如果是閉卷考試,就應該兼顧到所學的考試內容,難易程度要適中;如果是開卷考試,試卷的設計就應當突出重點和難點,要給學生思考和自由發(fā)揮的余地,而不是直接在書上可以找到答案。口試應側重什么而筆試又應側重什么等一些問題都是在設計試卷過程中應該考慮的。考試的信度提高了,測試的效度就會相應提高,兩者是相輔相成的。
3.信度與效度的關系
信度和效度是衡量語言測試質量的最重要的兩項指標,它們之間是既相互依存又相互排斥,既各有側重又相輔相成、密切聯系的關系。考試信度側重與考分的一致性,考試效度則強調考試達到其預期測試目的的程度。考試的高效度只能以考試的高信度為基礎,離開信度,效度就無法實現。在Bachman看來,信度和效度是緊密相連而且不可分割的。語言測試的目的是測量考生的語言能力,所以在設計試卷時,不能為了追求信度或效度而忽視另一方面,而應采取一種積極平衡的態(tài)度,即研究并發(fā)現影響考生語言能力的因素,消除不利因素的影響,擴大有利因素的影響,這樣才能既保證效度又有信度。
二、在語言測試實踐中把握好信度和效度的平衡關系
作為評估測試質量的兩個基本特性,信度和效度雖然在一定程度上是相互矛盾的,但完全可以通過相互協調達到適切的平衡,從而保證測試的總效用性最大化。因此,在語言測試的設計和命題中,不能絕對、片面、盲目地追求或強調某一方面而以失去另一方面為代價,只有綜合平衡二者的關系才能獲得最大的總效用。
1.考試內容是否體現新的語言教學觀
語言測試隨著語言觀的發(fā)展而發(fā)展,也隨著教學理念和教學模式的更新而更新。二十世紀八十年代中期開始流行的交際功能觀和九十年代以后興起的任務教學法都對語言測試的改革提出了新的要求。現行的多種類型的考試題型還是以結構主義語言測試理論為基礎的多選題為主,某些語言項目的測試與實際語言能力的相關性不高,很難體現當代語言教學觀提倡的英語交際運用能力方面的考查。因此,可以通過調整主觀題和客觀題的比例,多采用直接測試法,增加聽力和寫作測試的權重,加大口試考核力度,變化題型等手段提高考試的效度。也可以通過采取大題量小分值,細化評分標準,綜合使用整體評分法和分析評分法等措施提高考試信度。
2.語言測試能否產生正面反撥效應
測試是教和學的導向,而在實際操作過程中,很多類型的考試長期以來采用固定不變的模式,客觀上造成了學生甚至是老師猜題和押題的現象,廣大教師更是偏向于應試教學,由此產生了不良的教學效果。Hughes提出了若干提高正面反撥效應的建議:測試要培養(yǎng)能力;測試內容要覆蓋面廣并具有一定的不可預測性;盡量使用直接測試法;成績測試要與教學目標相結合,使用尺度參照等。這些建議多數涉及效度,也與信度相關。信度和效度是影響反撥效應的重要因素,正確處理好兩者的關系能使測試產生積極有利的反撥效應。
三、結語
語言測試的信度和效度問題一直是語言專家關注的問題,也是廣大語言教師所關心的問題。了解語言測試中信度和效度這兩個重要的標準及其關系后,教師和試卷設計者應重視語言測試理論的研究,掌握命題的原則,在試卷設計過程中把握好信度、效度及其它評價指標之間最佳的平衡關系,提高各類測試的質量,從而真正達到測試的最終目的,這是服務于教學的這一宗旨。
參考文獻:
[1]鄒申.語言測試.上海外語教育出版社,2005.
[2]劉潤清,韓寶成.語言測試和它的方法.外語教學與研究出版社,1991.
[3]李筱菊.語言測試科學與藝術.湖南教育出版社,1997.
[4]舒運祥.外語測試的理論與方法.世界圖書出版公司,1998.