孫麗紅
呼倫貝爾學(xué)院
淺析大規(guī)模外語考試與學(xué)校教學(xué)考試
孫麗紅
呼倫貝爾學(xué)院
為了進(jìn)一步提高我國各類外語考試的客觀、公正和有效,本文根據(jù)考試目的和作用,測試信度和測試效度,對目前我國組織的各類大規(guī)模外語考試和學(xué)校的教學(xué)考試進(jìn)行了對比分析,以期為政府行政決策、學(xué)校教學(xué)改革、用人單位外語評價等不同需求提供可靠保障。
外語;教學(xué);考試
隨著國際化全球化的趨勢日益明顯,作為思想的載體和信息傳達(dá)主要方式的語言是國際化交流的主要工具,外語學(xué)習(xí)就成為各國科技文化交流的基礎(chǔ)。為了考核外語人才的語言運(yùn)用能力和滿足社會生活的需求,我國目前組織了大規(guī)模的各類外語考試,既有面向社會的國家英語等級考試,也有針對學(xué)生的高中英語會考,高考外語,大學(xué)外語四、六級考試,外語專業(yè)四、八級考試,研究生外語考試,還有職稱外語考試等等。而作為衡量外語教學(xué)成效和提高外語教學(xué)質(zhì)量的重要手段之一的學(xué)校教學(xué)考試也不容忽視。
語言測試的主要目的是對被試語言能力進(jìn)行準(zhǔn)確、公正的測量與評價。2014年10月30日“國家外語能力測評體系建設(shè)啟動會暨中國英語能力等級量表研制總體方案論證會”上獲悉,我國啟動首個國家外語能力測評體系建設(shè),提出制定國家外語能力量表,明確外語能力標(biāo)準(zhǔn)和制定適合我國國情的外語質(zhì)量標(biāo)準(zhǔn),規(guī)范大規(guī)模外語考試,建成一套覆蓋大中小學(xué)各教育階段、覆蓋聽說讀寫譯綜合能力、覆蓋各種形式外語學(xué)習(xí)成果的評價系統(tǒng),使我國的英語教學(xué)和測評“車同軌、量同衡”,推動分級教學(xué),實(shí)施因材施教,提升外語教育成效,以更好地滿足人才培養(yǎng)和選拔的要求,為政府行政決策、學(xué)校教學(xué)改革、用人單位外語評價等不同需求提供服務(wù)。
學(xué)校外語教學(xué)考試是外語教學(xué)的重要組成部分,是衡量外語教學(xué)成效和提高外語教學(xué)質(zhì)量的重要手段之一,了解學(xué)生語言掌握程度和語言運(yùn)用能力,及時調(diào)整教學(xué)方法和教學(xué)進(jìn)度,有效提高教學(xué)質(zhì)量。自從1967年美國著名評價學(xué)專家斯克里芬(Scriven)提出形成性評價(formative assessment),各中高等院校的英語教學(xué)逐步廣泛應(yīng)用這一評估方式,并配合總結(jié)性測試,以達(dá)到教學(xué)與測試為一體,教學(xué)質(zhì)量不斷提高的目的。學(xué)校外語教學(xué)考試正是結(jié)合了形成性評價和總結(jié)性測試診斷教育方案或計劃及教育活動中存在的問題,為正在進(jìn)行的教育活動提供反饋信息,以提高實(shí)踐中正在進(jìn)行的教育活動質(zhì)量的評價。布魯姆(Broome)曾經(jīng)明確指出,教學(xué)考試的主要目的是考查了解給定的學(xué)習(xí)任務(wù)被掌握的程度、未掌握的部分,它的目的是為了幫助學(xué)生和教師把注意力集中在為進(jìn)一步提高所必需的學(xué)習(xí)上,既指向正在進(jìn)行的教育活動,也針對教育活動全部過程。它既是分析性的,嚴(yán)密交織在教學(xué)過程中的,強(qiáng)調(diào)教師和學(xué)生的信息反饋,能幫助查找教學(xué)和學(xué)習(xí)中存在問題的原因,便于及時采取全新的或補(bǔ)救的措施;也是總結(jié)性的,以便決定是否需要對教學(xué)和學(xué)習(xí)活動及時進(jìn)行調(diào)整。學(xué)校教學(xué)考試中的形成性評價旨在反映與培養(yǎng)學(xué)生的能力結(jié)構(gòu),總結(jié)性測試反映出學(xué)生知識的獲得和認(rèn)知加工技能,為了逐步培養(yǎng)學(xué)生的能力。
只有建立在對語言測試?yán)碚摰膬?nèi)涵及其基本要求、測試的類型、現(xiàn)狀、缺陷等充分了解和思考之上的,學(xué)校考試才能真正做到科學(xué)、合理、有效的測試,充分發(fā)揮測試的教學(xué)正面反撥作用。反撥作用(Washback)是語言測試的后效,專指在教育領(lǐng)域中語言測試對外語教與學(xué)的影響或反饋?zhàn)饔谩?荚噷虒W(xué)產(chǎn)生兩種不同的反撥效應(yīng):有促進(jìn)作用的正面反撥和有消極作用的負(fù)面反撥。正面反撥作用能推動教與學(xué)的發(fā)展,而負(fù)面反撥則會使教與學(xué)走入歧途。科學(xué)有效的學(xué)校考試可以與教學(xué)和學(xué)習(xí)形成良性互動。其一,測試服務(wù)于教學(xué)又影響教學(xué),科學(xué)的學(xué)校考試可以為師生提供正確的反饋信息,通過測試,教師可以認(rèn)識到教學(xué)中的問題,進(jìn)而對教學(xué)計劃、教學(xué)內(nèi)容進(jìn)行調(diào)整,改進(jìn)教學(xué)方法。其二,學(xué)生通過測試可以掌握自己對知識的掌握情況,促進(jìn)學(xué)習(xí)的積極性,增強(qiáng)學(xué)生學(xué)習(xí)動力。
語言測試的信度(reliability)是指考試結(jié)果的可靠性和穩(wěn)定性。也就是指同一考生在不同考次或不同測試條件下使用同一個考試,或使用平行試題進(jìn)行考試,所獲得的分?jǐn)?shù)(如果不計測量誤差)具有一致性。(劉潤清:210)
大規(guī)模外語考試的信度做到以下四個方面的標(biāo)準(zhǔn)化:試題編制標(biāo)準(zhǔn)化、考試實(shí)施標(biāo)準(zhǔn)化、閱卷評分標(biāo)準(zhǔn)化以及分?jǐn)?shù)轉(zhuǎn)化與解釋的標(biāo)準(zhǔn)化。為了保證測試的信度,必須制定考試規(guī)范、命題準(zhǔn)則,專業(yè)培訓(xùn)命題人員,題目必須經(jīng)過“命題—審題—試測—試題項(xiàng)目分析—終審—拼卷”,整個周期需要超過一年的時間,證明每道試題的質(zhì)量都是可靠的、且難易程度和區(qū)分度都在控制范圍以內(nèi),然后用于實(shí)際測試。
為了得到學(xué)校考試對教學(xué)的積極作用,Hughe給語言教育者提出了建議:首先,測試你希望學(xué)生提高的那部分能力;其次,測試相關(guān)能力的時候,盡可能多地給學(xué)生任務(wù)來完成;第三,使用直接測試方法;第四,使測試標(biāo)準(zhǔn)參照型;第五,教學(xué)考試應(yīng)基于教學(xué)目標(biāo);第六,確保考試被學(xué)生和老師了解;第七,有可能的話,給教師提供輔助培訓(xùn)。題目可由多個英語教師試做,可先期發(fā)現(xiàn)試題中出現(xiàn)的問題,并增加試題的信度。
測試效度(validity)亦稱測試的有效性,指一套測試對應(yīng)該測試的內(nèi)容所測的程度。也就是說,一套測試是否達(dá)到了它預(yù)定的目的以及是否測量了它要測量的內(nèi)容。
大規(guī)模外語考試不僅應(yīng)試者人數(shù)眾多,而且考試結(jié)果可能影響考生的命運(yùn),所以它的設(shè)計、開發(fā)和實(shí)施有一定的質(zhì)量標(biāo)準(zhǔn),以保證命題的科學(xué)性、評分的一致性、組織的嚴(yán)密性,成績具有可比性和可解釋性。因此,專門的考試機(jī)構(gòu)遵循專業(yè)的質(zhì)量標(biāo)準(zhǔn),由經(jīng)過訓(xùn)練的專業(yè)隊(duì)伍開發(fā)、設(shè)計和實(shí)施以確保考試的公平公正。從設(shè)計開發(fā)、命題、施考,到成績發(fā)放包含諸多環(huán)節(jié),每一個環(huán)節(jié)的失誤,都會對考試的結(jié)果產(chǎn)生不可彌補(bǔ)的影響,必須為每一個環(huán)節(jié)制定相應(yīng)的專業(yè)標(biāo)準(zhǔn),以規(guī)范教育考試行為,這樣的標(biāo)準(zhǔn)將為評價一項(xiàng)考試及其實(shí)施的后果提供依據(jù)。我國在參照國際上的已有經(jīng)驗(yàn),結(jié)合我國實(shí)際,也在制定我國自己的教育與心理測量標(biāo)準(zhǔn)。
學(xué)校外語教學(xué)考試主要是對學(xué)生所學(xué)知識的綜合運(yùn)用能力的考察,真實(shí)地測試出學(xué)生對信息的捕捉能力、理解能力、概括總結(jié)能力,語言表達(dá)運(yùn)用能力。為了保證測試試卷的科學(xué)化、規(guī)范化,能客觀公正的評價教學(xué)質(zhì)量,使測試積極反撥于教學(xué),考題效度注重的是以下幾點(diǎn):1)符合教學(xué)大綱的要求。內(nèi)容上有相當(dāng)?shù)母采w面和側(cè)重點(diǎn),難度與學(xué)生的實(shí)際水平相吻合,但不會為了增加及格率而人為的降低難度。2)測試項(xiàng)目保持相互獨(dú)立。這要求受試者對一個測試項(xiàng)目的反應(yīng)不影響其它測試項(xiàng)目的反應(yīng)。3)題項(xiàng)內(nèi)容不對答案有提示作用。4)時間的控制和題量分配恰當(dāng)。如果標(biāo)準(zhǔn)考試時間為120分鐘,而大多學(xué)生在30分鐘就交卷或120分鐘后都沒有答完試卷,就表明此次測試失敗。5)主客觀題型的比例得當(dāng),做到既重知識又重能力。6)建立完善的測試試題庫。考慮到學(xué)生的學(xué)習(xí)環(huán)境,學(xué)習(xí)材料和學(xué)生特點(diǎn)等因素,適時適量地安排階段考核并完善考核方式,幫助教師和學(xué)生及時發(fā)現(xiàn)這總結(jié)教與學(xué)中的問題。
無論是大規(guī)模外語考試還是學(xué)校的教學(xué)考試,都需根據(jù)考試的目的和作用,不斷完善考試管理體制,盡可能做到考試內(nèi)容涉獵的廣泛性和考試方式的多樣性,規(guī)范試題的設(shè)計,難易程度適中,選材廣泛,分值分布合理,評分標(biāo)準(zhǔn)設(shè)計合理,機(jī)考規(guī)范。在保證測試的系統(tǒng)化和標(biāo)準(zhǔn)化的同時,做到高質(zhì)公平并不斷驗(yàn)證改進(jìn)。
[1]蔡基剛.大學(xué)英語四六級寫作要求和評分標(biāo)準(zhǔn)對中國學(xué)生寫作的影響[J].解放軍外國語學(xué)院學(xué)報,2002,(05).
[2]陳靜,車麗娟.論測試模式變革對大學(xué)英語教學(xué)的影響[J].東北財經(jīng)大學(xué)學(xué)報,1999,(06)
[3]付英,李鑒.大學(xué)英語校內(nèi)測試信度、效度分析[J].讀與寫雜志,2011,(06).
[4]何林.大學(xué)英語校內(nèi)測試對英語教學(xué)的反撥作用[J].吉林工程技術(shù)師范學(xué)院學(xué)報,2006,(08).
[5]李蘭蘭.淺析加強(qiáng)大學(xué)英語測試中信度和效度研究的必要性[J].長春教育學(xué)院學(xué)報,2014,(09).
[6]劉潤清,韓寶成.語言測試和它的方法[M].外語教學(xué)與研究出版社,1991.
[7]孫文敏.英語語言測試的改革與英語教學(xué)[J].洛陽師范學(xué)院學(xué)報,2008,(04).
孫麗紅:性別:女,籍貫:內(nèi)蒙古赤峰市,出生年月:1978年1月,學(xué)歷:研究生,職稱:講師,工作單位:呼倫貝爾學(xué)院。
《淺析大規(guī)模外語考試與學(xué)校教學(xué)考試》屬于中外語言測試與研究項(xiàng)目》
課題名稱:中外語言測試與研究
課題編號:Y BKT—004
課題負(fù)責(zé)人:黎 楠
負(fù)責(zé)人所在單位:呼倫貝爾學(xué)院