朱薇
(重慶師范大學涉外商貿學院,重慶 401520)
語言測試的信度效度
朱薇
(重慶師范大學涉外商貿學院,重慶 401520)
語言測試是檢驗學習者習得成果的重要手段,同時也是教學中的重要環節。信度和效度是語言測試中的基本概念。本文介簡單介紹了信度和效度的定義,分析了他們的影響因素及相互關系,得出了良好的測試是信度和效度的合理平衡的結論。
測試;信度;效度;關系
(一)什么是信度
信度是指測試結果的可信程度,是衡量測驗穩定性,可靠性的重要指標。語言測試信度主要衡量語言測試結果對語言受試者的真實的語言水平的反映程度,例如語言測試的成績與語言受試者的真實語言水平如果保持一致,則此考試的信度最大,反之則最小。
(二)影響信度的因素
語言測試的每個環節都不可避免的會受到一些偶然因素的影響,這些偶然因素必然會對測試的信度有影響,影響越大,信度就越低。因此在組織與實施測試過程中,對全部的受試者都應該保持環境與條件的一致,以取得比較高的信度;在測試的評分環節中,同一項測試的評分標準應該客觀,必須保持一致且穩定,這樣才能保證取得較高信度;另外評分者同樣是影響語言測試信度的重要因素,因為評分者會將自己的主觀意愿移植到評分過程中。
除了已提到的因素之外,就試卷本身而言,影響信度的因素主要還有:1)抽取樣本的大小,抽取的樣本越大,就越具有廣泛性,那么測試的信度當然也就越高,反之越低;2)試題的長度,就一份試卷而言,如果題量越大,則信度也會越大;3)試卷的同質性程度,試卷同質性程度越高,則信度也越高;4)試題的難度,試題的適宜度是否和受試者的水平匹配合適。
(一)什么是效度
測試效度是指語言測試的真實性和準確性,也就是此測驗與旨在測量的目的相符合一致的程度。也就是說該測試是否有效度在于它是否真實地測試出它想要考察的內容。如果測試和測試內容的相關系數為0,表明測試內容是無效的;如果相關系數小于0.4,表明效度很低;相關系數在0.4~0.7區間,表明測試有效;換言之,相關系數越接近1,則說明考試的效度越高,反之則越低。
(二)影響效度的因素
所有對測試準確性和真實性構成偏差的因素都對效度有影響:1)試卷題目的要求不清楚,考生會因為不明確要求而降低了成績;2)試卷題目的適宜度太差,沒能在受試者的合適的水平上測試想要測試的內容;3)試卷選擇項目含糊不清,同1)一樣會使受試者因模棱兩可的選擇而降低成績;4)測試內容與測試目的不符合或者沒有足夠的題目來代表測試內容;5)受試者的心理因素:例如測試題目一開始太難導致受試者因受挫而影響后面的發揮;6)測試選項不合理:如多想選擇里,正確答案很容易被考生以某種技巧識別。
Bachman(1996)和Fiske都對語言測試信度和效度的關系做過相關的研究和闡述。Bachman認為信度和效度測試是影響測試分數的兩個很重要的因素,此二者相互補充和限制。信度可以反映出測量隨機誤差在考試結果不一致的原因中所占的比重;而效度則是反映出測試結果與測試的參照標準之間的相關性。換一種說法就是,信度是考察考試結果的影響因素那些想考的內容以外的因素;而效度則是考察考試結果的差異哪些是由受試者語言能力所引起。
在語言測試中,信度和效度的關系是互為依卻又互為排斥的;信度是效度的前提條件,一個效度高的考試必然有較高的信度;否則該考試就不是真實的反應了受試者的語言水平,當然也就沒有達到測試目的;但是,同樣的一份試卷卻很難同時兼顧信度和效度兩方面;測試信度的提高有可能導致測試效度的降低,反之亦如此;信度和效度在語言測試中似乎存在不可調和的矛盾;因此,現代語言測試以測試目的為最基本的出發點,在信度和效度之間努力尋找一個最佳平衡點,避免一味的將二者對立起來。例如托福考試是心理測量學-結構主義語言測試思想的重要產物,但托福的TSE考試設計卻充分體現了交際語言測試思想,其考試評分標準通過考察考生能否有效而得體的使用規定語言完成規定的交際任務來進行定性的評判;現代語言測試在實踐中不斷的融合新舊兩種體系的測試思想,試圖在測試中盡量兼顧信度和效度兩方面,達到一個合理的平衡。
效度和信度的測試是評定語言測試中必不可少的兩個重要指標,它反映的是語言測試的本質性問題,對評定是否達到預期教學目的和指導教學具有重要的參考意義,但只有二者達到合理的平衡,相互補充,才能保證考試的可靠性和準確性,從而達到測試目的,提高測試質量。
[1]桂詩春.標準化考試——理論、原則與方法[M].廣州:廣東高等教育出版社,1986.
[2]劉朝杰.問卷的信度與效度評價[J].中國慢性病預防與控制,1997,5(4):174-177.
[3]楊惠中.大學英語四、六級考試效度研究[M].上海:上海外語教育出版社,1998.
G42:
A
1005-5312(2014)14-0246-01