屠煜
【摘要】漢語成績測試的編制既要反映它的診斷目的,也要遵循語言測試的一般原則,這就是重視試卷的信度和效度,它們是漢語成績測試質(zhì)量評估和檢驗的指標。文本通過闡述漢語成績測試的信度、效度以及二者之間的關(guān)系,說明如何提高漢語成績測試的質(zhì)量。
【關(guān)鍵詞】漢語成績測試信度效度
【中圖分類號】G642【文獻標識碼】A 【文章編號】2095-3089(2014)2-0042-02
一、信度
信度即測試結(jié)果的可信程度,又稱為可靠性和穩(wěn)定性(劉潤清、韓寶成,2000)。亦即測量結(jié)果是否真實、客觀的反映實際水平,如果用某套試題對同一應(yīng)試者先后進行兩次測試,結(jié)果第一次得85分,第二次得45分,結(jié)果的可靠性即信度就值得懷疑了。對成績測試來說,試卷的穩(wěn)定性除了可以保證達到同一分數(shù)線的測試對象具有基本相同的水平以外,還可以反映教學(xué)的變化情況,如果這一屆學(xué)生的成績比上一屆普遍提高了,就說明教學(xué)質(zhì)量提高了;如果這-屆學(xué)生的成績比上一屆普遍降低了,就說明教學(xué)質(zhì)量降低了。
那么怎么知道一個漢語成績測試的信度情況呢?
(一)檢驗信度的方法
1.再測法:這種方法是用同一套漢語成績測試試卷給同一批漢語學(xué)習(xí)者考兩次,比較兩次的漢語成績測試結(jié)果,求出相關(guān)系數(shù)。
2.復(fù)本法:根據(jù)復(fù)本考試結(jié)果的得分情況來計算二者之間的相關(guān)系數(shù),就可以判斷漢語成績測試的復(fù)本信度。
(二)提高信度的方法
1.適當增加測試題目的數(shù)量:數(shù)量多則代表性就大,學(xué)生就不會說出這樣的話"老師,我會的你都沒出",既能提高信度,又可提高效度。但數(shù)量太多又操作困難,引起漢語考生的疲勞和反感,所以反而降低測試的可靠性。所以命題者應(yīng)該尋找一個合適的量,確定合適的題量。
2.測試的難度要適中:難度適中,則信度大,區(qū)分度也大。
3.測試的程序應(yīng)統(tǒng)一:測驗的過程直接關(guān)系到信度的高低,信度需要規(guī)范公平的測驗過程去保證。
4.測試的時間要充分:測驗的時間如果不足,不能客觀反映學(xué)生的實際水平,也影響信度。
5.評分要盡量客觀、準確:評分不準確,必然降低信度。
二、效度
效度是指測量結(jié)果的準確性和有效性的程度,亦即測量是否達到了預(yù)期的目的。換句話說,也就是測量是否精確地測量了想要測的東西,即測試結(jié)果與測試目標的符合程度。
例如,如果要全面測量閱讀理解能力,就必須設(shè)計含有有關(guān)的漢字、詞匯、語法、文化、語用等方面的知識的綜合性閱讀試題,而不應(yīng)當設(shè)計只含有某一兩個方面的知識的分立式試題。閱讀理解必須有-定的速度,因此卷面的長度必須與測試的時間相一致,如果卷面太短,就測不出閱讀速度。又如,測量閱讀理解能力只能設(shè)計測量閱讀能力的單項卷面,如果試卷上既有閱讀方面的試題,又有寫作方面的試題,就不能精確地測量出閱讀理解能力。閱讀理解既需要一定的語言知識,又需要一定的文化知識,如果文化知識太專,超過了多數(shù)測試對象的知識范圍,也達不到測試目的,因為難以判斷是語言能力方面的問題,還是文化能力方面的問題。
可以從以下三個方面理解效度:
1.一般而言,判斷效度的高低,就是判斷測驗達到目的的程度。
2.測量結(jié)果真實、正確的反映被測對象的水平,則為效度較高或有效。
3.效度只是高與低的問題。
(一)效度的類型
在語言測試領(lǐng)域,根據(jù)漢語教師的客觀情況和實際需要,主要討論三種效度:內(nèi)容效度、表面效度、結(jié)構(gòu)效度。
1.內(nèi)容效度:是指漢語測試樣本體現(xiàn)整體的程度,也就是測量內(nèi)容的代表性程度。
2.表面效度:是指審題者個人,依據(jù)自己的漢語教學(xué)經(jīng)驗和漢語理論修養(yǎng)以及對漢語成績測試的理解,對該漢語成績測試的有效程度的評估。
3.結(jié)構(gòu)效度:是指成績測試在多大程度上與語言學(xué)、第二語言學(xué)習(xí)和第二語言教學(xué)等理論相一致。
(二)提高效度的方法
1.精心編制題目和試卷:題目難易度、區(qū)分度要恰當,數(shù)量要適中。
2.嚴密組織和安排漢語測試:盡量減少無關(guān)因素對測試的干擾,為學(xué)生創(chuàng)造規(guī)范的應(yīng)試環(huán)境。
3.擴充樣本的內(nèi)容和代表性:緊密圍繞教學(xué)大綱和教學(xué)目標命題,考核內(nèi)容應(yīng)全面,并能有效代表學(xué)生應(yīng)掌握的知識領(lǐng)域。
三、信度與效度的關(guān)系
對漢語成績測試來說,測試的可靠與有效都很重要。信度和效度的基本關(guān)系是復(fù)雜的,他們既相互依存,又相互排斥。認識二者之間的這種矛盾本質(zhì),有利于我們在編制漢語成績測試時更好地平衡和兼顧它們。
(一)相互依存
信度和效度二者之間是相互依存的。雖然具有一定的信度,并不一定有效,但沒有信度當然就不可能有效度;而沒有效度,信度就毫無意義。要想效度高,信度就必須高。有高效度就一定有高信度,高信度不一定就有高效度。
(二)相互排斥
成績測試的信度和效度二者之間既是相互依存的,又是相互排斥的。因為"從信息的量與質(zhì)的矛盾來說,對量的測量容易保證信息的高信度,對質(zhì)的測量容易保證信息的高效度。但是量的測量要求被測的對象必須是可數(shù)的,以便用數(shù)字加數(shù)量單位來表示"(李筱菊,1997)。我們的漢語成績測試是測學(xué)生的漢語使用能力,這種能力表現(xiàn)為學(xué)生的漢語行為是無限的、不可數(shù)的,本質(zhì)上是不能用數(shù)字加數(shù)量單位來表示的。漢語成績測試要滿足信度,只有把測試設(shè)計為全部是定量型的,但這會影響效度;漢語成績測試要滿足效度,只有把測試設(shè)計為全部是定性型的,但這又會影響信度。由此可見,漢語成績測試的信度和效度也是一種矛盾的關(guān)系。
綜上所述,因為測試信度與效度之間存在的矛盾關(guān)系,需要我們在設(shè)計漢語成績測試時綜合平衡考慮效度、信度、可行性。在進行具體的設(shè)計操作時,可以采取直接測試與間接測試相結(jié)合的方法,用直接測試(如口試、作文)來提高漢語成績測試的效度,用間接測試(如多項選擇題)來提高漢語成績測試的信度,這樣才能逐步提高漢語成績測試的質(zhì)量。
參考文獻:
[1]楊翼.對外漢語教學(xué)的成績測試[M].北京:北京大學(xué)出版社,2010
[2]楊翼.漢語教學(xué)評價[M].北京:北京大學(xué)出版社,2010