999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

論信度——測試質(zhì)量的重要方面

2009-07-28 08:00:22王丹妮
中國新技術(shù)新產(chǎn)品 2009年11期

王丹妮

摘 要:測試的質(zhì)量保證一直以來都是出題專家非常重視的方面,包括很多領(lǐng)域和方面。本文僅針對其中一個方面:測試信度,進行分析和說明。本文首先通過引用塔克(Tucker)相關(guān)定義對信度進行解釋和說明。其次,列舉出可能影響信度的因素。最后,針對這些影響因素,提出一些解決方法。

關(guān)鍵詞:信度;效度;測試質(zhì)量;教與學

每個測試設(shè)計者都希望考試能夠達到公平、準確和可信的標準。因此,許多出題專家對測試發(fā)展態(tài)勢作以研究,希望能夠平衡測試質(zhì)量的信度和效度(Reliability and Validity)、沖擊力和實用性(Impact and Practicality)的關(guān)系,實現(xiàn)整個試題的效度和效用,保證試題能夠?qū)ζ錅y試的領(lǐng)域真正有用。

傳統(tǒng)意義上,測試質(zhì)量的評價主要有兩個關(guān)鍵的決定因素:信度和效度。但是,巴赫曼(Bachman)和帕爾默(Palmer)(1996)將沖擊力和實用性也納入其中,認為它們也決定著測試在其所測試領(lǐng)域的有效性。但不論如何,信度的重要性是不容置疑的。因此,測試以及子測試的信度就成為公平性的關(guān)鍵因素,也是參試者需要了解的內(nèi)容。

1 信度和效度

信度是為了使某一考試達到準確性和分數(shù)一致性的方法。可信度(Reliability)這一詞,用于日常生活中時涵義廣泛,可以是對朋友的忠誠,對質(zhì)量的承諾,對安全的保證等等。但是當它用于測試這一專門意義時,是指可以用于反復測試考生水平,而在反復使用后所得到的測試結(jié)果是非常相近的。但是,雖然信度是一份好試卷的必要條件,它并不是唯一條件。一份信度很高的試題,卻可能無法測試出考生其它方面,例如:考生的興趣——事實上,這份試題可能與考生的興趣毫無關(guān)系。因此,測試另一個重要方面:效度,就應(yīng)運而生了——這份試題是用來測試我們想要測試的方面嗎?

雖然高信度是測試的一個關(guān)鍵因素,但是早在1945年就有人提出:“提高信度與測試水平的矛盾”(格利克森(Gulliksen),1945,塔克(Tucker),1946)。下文是摘自塔克的一段話:

如果統(tǒng)一所有試題的信度,就要統(tǒng)一所有的試題。那么,一名考生會做其中一個試題,他就會做其它所有試題;相反,如果一名考生不會做其中一個試題,那么,他就勢必不會做所有試題。這樣,唯一會出現(xiàn)的分數(shù)就只能是一分或零分……難道人們希望一次測試中的所有試題難度都一樣,而最終只產(chǎn)生兩種分數(shù)嗎?

——塔克,1946

其實,塔克這里所指的“測試水平”在某種意義上就是效度。也就是說當要同時提高信度和效度時,二者之間是存在一定矛盾的。信度在一定程度上制約著效度的提高。

巴赫曼(Bachman)(1990, p 161)對信度是這樣解釋的:信度是為了使測試達到最小錯誤率,而效度是為了使語言能力的測試達到最大效果。巴赫曼認為信度和效度是“一般測試中互補的兩個方面——它們鑒定、評價和控制所有影響測試分數(shù)的因素”(1990, p 160)。然而,他也指出,信度和效度之間明顯地存在著緊張關(guān)系(tension)。當我們要采取各種手段實現(xiàn)高信度時,例如:通過限制題型或限制測試范圍,這些限制同時也制約了測試的性能和目的,即:測試效度。

可以看出,很多學者都認為用信度系數(shù)來評價測試質(zhì)量對測試范圍會帶來影響。因此,對一份試題信度的評估僅僅是管理特定應(yīng)試者們的行政手段,而并非試題本質(zhì)特征。有些試題的報考者們形形色色,水平參差不齊,因此很容易分級排名,類似于這樣的測試,與應(yīng)試者水平相近的測試相比,其信度系數(shù)要高很多。因此,當我們比較不同測試的信度時,例如考生水平差距等很多因素都必須考慮進去。

2 信度的影響因素

考生之間的水平差距僅僅是可能影響信度的因素之一。除此之外,還有諸多其它因素:第一,考生本身的波動(fluctuation),包括疲勞、遺忘、疾病、感情挫折、練習效應(yīng)等。第二,分數(shù)波動,包括評分者本身的誤差偏差等。第三,測試管理波動,包括對考試指南的解釋、測試時間控制、監(jiān)考人員和考生的交流、作弊控制、考試剩余時間的告知、打擾、干涉、考試教室光線等。第四,試題特征:長度、難度、鑒別力、速度等。第五,響應(yīng)特征:猜題能力、應(yīng)試能力等。

3 如何規(guī)避信度的影響因素

要解決以上五大影響信度的因素,最大程度上達到信度和效度的標準,以下不失為一些好的方法:試題量要足夠:從某種意義上說,試題的數(shù)量越多,其可信度就越高;考試指南要清楚和詳細:這樣是為了避免考生誤解考試指南;保證試卷排版合理清楚,字跡清晰;報考者應(yīng)熟知考試格式和測試技巧;試題本身要明確清楚;盡量直接比較報考者水平;提供詳細的評分標準:指明正確答案,可能出現(xiàn)的部分正確的答案的給分標準也要明確說明;對評分人進行培訓:尤其是主觀題的評分人;改卷之前統(tǒng)一不同答案的確切給分;提供統(tǒng)一良好的評分環(huán)境;試題本身應(yīng)該利于客觀評分:例如,自由問答題,其答案應(yīng)唯一和統(tǒng)一。

以劍橋大學的一系列考試為例,他們測試的是英語語言水平。這些考試的報考者大都在應(yīng)試前參加了預試班,并準備繼續(xù)學習和參加劍橋大學的連續(xù)水平測試。和考試相關(guān)的書籍和資料有很多。因此,考生的水平基本在一個層次。所以,要保證較高的測試信度,應(yīng)該說難度還是很大的。劍橋大學考試體系在發(fā)展了十幾年的今天,根據(jù)不同語言測試水平的要求出臺了很多新考試。由于這些測試都是針對某一特定水平,測試的結(jié)果是以通過和未通過的形式公布的,其實,這在一定程度上也保證的測試的信度。但是,其信度并沒有和效度分家,而是緊密的結(jié)合在一起的。例如,劍橋主流英語認證(The Cambridge EFL Main Suite exams)以及商務(wù)英語證書(Business English Certificates)等考試的設(shè)計是為了通過鼓勵教和學,并反對“應(yīng)試教育”來促進語言學習。目的是告訴學者:備考就是要學好這門語言。每次對試題的修訂,劍橋大學都是為了體現(xiàn)他們當前對語言教與學的觀點和看法。近期他們對測試的修訂是為了突出語言的交流作用,因此,試題設(shè)計傾向于語境的把握和篇章本質(zhì)的撲捉。

劍橋大學考試對測試信度和效度的研究有很多年,并根據(jù)信度和效度的要求對其考試作了很多修訂。即便如此,他們也不得不承認,測試信度和效度的一些負面影響因素還是很難避免的。但是,其在注重信度的同時不斷改進試題,使其達到更高的效度,這種方法是劍橋大學給我們的一個寶貴經(jīng)驗。

4 結(jié)論

總而言之,信度,作為測試質(zhì)量的重要因素,是用于評價測試結(jié)果是否真實的反映的考生的實際水平。它是反映測試是否受到非測試因素的影響,是反映測試客觀性和可靠性的指標。信度和效度是相互補充、不可分割的。在注重和提高信度的過程中,無疑會對效度產(chǎn)生影響和制約。所以,要平衡好二者的關(guān)系,找到一個切合點,才不失為是一份好的測試。不同測試,其信度高低的評估絕對不能不考慮諸多的影響因素。然而,作為一名測試的設(shè)計者,出題過程中也必須考慮并盡量避免這些影響因素。

參考文獻

[1]Hughes, A. 1989. Testing for Language Techers. Cambridge: CUP.

[2]Weir, C. 1988. Communicative Language Testing. UK: Prentice Hall International Ltd.

[3]Bachman, L F (1990): Fundamental considerations in language testing, Oxford: OUP

[4]Bachman, L F and Palmer, A (1996): Language testing in practice, Oxford: OUP

[5]Gulliksen, H (1945): The relation of item difficulty and inter-item correlation to test variance and reliability, Psychometrika 10 (2), 79-91

[6]Tucker, L R (1946): Maximum validity of a test with equivalent items, Psychometrika 11 (1), 1-13

[7]劉潤清,韓寶成.語言測試和他的方法[M].北京:外語教學與研究出版社,1999.

[8]桂詩春,語言測試:新技術(shù)與新理論[J].外語教學與研究,1983,(3).

主站蜘蛛池模板: 亚洲美女久久| 欧美一区二区三区不卡免费| 精品自拍视频在线观看| 国产又粗又爽视频| 亚洲香蕉在线| 亚洲成人动漫在线| 国产午夜精品鲁丝片| 国产成人精品视频一区视频二区| 欧美不卡视频一区发布| 国产精品永久免费嫩草研究院| 国产欧美另类| 国产精品污视频| a在线亚洲男人的天堂试看| www.91中文字幕| 伊人久久综在合线亚洲2019| 青青青国产免费线在| 国产成人三级| www.av男人.com| 亚洲系列无码专区偷窥无码| 亚洲第一综合天堂另类专| 女人18一级毛片免费观看| 精品91视频| 国产亚洲男人的天堂在线观看| 中文无码精品A∨在线观看不卡| 成人福利在线观看| 一级高清毛片免费a级高清毛片| 欧美成人一级| 91久草视频| 波多野结衣二区| 在线免费a视频| 国产国产人在线成免费视频狼人色| 国产浮力第一页永久地址| 91香蕉国产亚洲一二三区| 日韩天堂视频| 亚洲天堂成人| 制服丝袜亚洲| 婷婷亚洲视频| 97无码免费人妻超级碰碰碰| 狠狠操夜夜爽| 国产成人高清精品免费5388| 国产亚洲欧美另类一区二区| 婷婷亚洲最大| 亚洲中文字幕久久精品无码一区| 国产第一页免费浮力影院| 亚洲无线一二三四区男男| 国产精品第页| 精品欧美日韩国产日漫一区不卡| 国产精品99在线观看| 日本免费新一区视频| 亚洲天堂久久久| 国模视频一区二区| 日韩乱码免费一区二区三区| 色综合天天综合中文网| 免费无码又爽又刺激高| 久久女人网| 日韩大片免费观看视频播放| 在线va视频| 精品人妻AV区| 精品亚洲欧美中文字幕在线看| 中文字幕亚洲精品2页| 欧美综合成人| 亚洲a免费| 日日噜噜夜夜狠狠视频| 亚洲国产欧洲精品路线久久| 亚洲精品成人片在线播放| 综合天天色| 18禁色诱爆乳网站| 欧美色视频日本| 欧美精品亚洲精品日韩专区va| 久久精品娱乐亚洲领先| 国产乱论视频| 久久女人网| 国产永久无码观看在线| 国产理论一区| 五月天综合婷婷| 亚洲天堂成人在线观看| 91在线国内在线播放老师| 欧美不卡二区| 一本久道久久综合多人| 亚洲无码精品在线播放 | 国产精品自在在线午夜| 亚洲欧洲免费视频|