鹿軍紅
摘 要 大學(xué)英語四六級(jí)考試的作文評(píng)卷采用網(wǎng)上閱卷的方式,評(píng)分員已經(jīng)成為影響網(wǎng)上閱卷質(zhì)量的重要因素之一。本文介紹了四六級(jí)英語作文的閱卷流程,分析了幾種常見類型作文的評(píng)閱方法,最后對(duì)相關(guān)的統(tǒng)計(jì)參數(shù)做了分析,以此供評(píng)分員及改卷機(jī)構(gòu)參考,從而提高英語作文的閱卷質(zhì)量,提高考試的公正性和準(zhǔn)確性。
關(guān)鍵詞 評(píng)分員 英語作文 評(píng)卷質(zhì)量
中圖分類號(hào):G642.475 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.16400/j.cnki.kjdkz.2018.09.022
Abstract The essay marking of the CET-4 is based on online scoring. The scorer has become one of the important factors affecting the quality of online scoring. This paper introduces the scoring process of four or six English essays, analyzes the evaluation methods of several common types of essays, and finally analyzes the relevant statistical parameters for reference by scorers and reorganization institutions, thus improving the scribble of English composition quality; improve the fairness and accuracy of the exam.
Keywords scorer; English essays; quality of assessment
目前,在全國大學(xué)英語四六考試中,英語作文的評(píng)閱采用網(wǎng)上閱卷的方式,評(píng)分員則采用整體式評(píng)分法(Global Scoring)對(duì)英語作文進(jìn)行評(píng)閱。由于評(píng)分員對(duì)評(píng)分標(biāo)準(zhǔn)把握不一,嚴(yán)厲與寬松程度不同,同時(shí)受到語言能力、欣賞習(xí)慣、心態(tài)情緒等主觀因素的影響,導(dǎo)致評(píng)分結(jié)果產(chǎn)生差異,有時(shí)同一篇作文,不同的閱卷員給出的分?jǐn)?shù)相差很大。一些評(píng)分員主觀隨意性太大,一些評(píng)分員評(píng)卷經(jīng)驗(yàn)不足,或評(píng)卷態(tài)度不認(rèn)真,都會(huì)造成準(zhǔn)確性不高,評(píng)卷質(zhì)量差。提高閱卷員英語作文評(píng)卷質(zhì)量對(duì)于保證考試的公正性和準(zhǔn)確性,提高考試的信度至關(guān)重要。筆者多次參加大學(xué)英語四六級(jí)考試作文的評(píng)卷工作,本文通過筆者的體會(huì)對(duì)這一問題加以研究。
1 閱卷流程
從閱卷流程來看,首先選拔認(rèn)真負(fù)責(zé)的英語教師參加閱卷,然后進(jìn)行相關(guān)培訓(xùn)。考試組織方提供評(píng)分標(biāo)準(zhǔn)及樣卷,樣卷的評(píng)分量表分為1~3、4~6、7~9、10~12、13~15 分,共五檔,每檔中有三個(gè)分值。
閱卷教師先學(xué)習(xí)評(píng)分標(biāo)準(zhǔn),分析評(píng)分樣卷,試評(píng)后開始進(jìn)入正評(píng)。評(píng)分員根據(jù)評(píng)分標(biāo)準(zhǔn),對(duì)照樣卷進(jìn)行評(píng)分,如果認(rèn)為與某一檔樣卷相似,則定為該分?jǐn)?shù)檔,若認(rèn)為稍優(yōu)或略于該分?jǐn)?shù)則可加一分或減一分。打分采取整體式評(píng)分方法(global scoring),亦被稱作“印象評(píng)分法”,即評(píng)分員根據(jù)閱后的總體印象打分,而不是按語言點(diǎn)的錯(cuò)誤數(shù)目扣分。
閱卷系統(tǒng)采用計(jì)算機(jī)輔助閱卷方式,打分?jǐn)?shù)據(jù)能夠通過計(jì)算機(jī)進(jìn)行快速統(tǒng)計(jì)分析。主要統(tǒng)計(jì)指標(biāo)有:相關(guān)系數(shù)(R)、均分(Avg)、離散(Std)、主客比(P)、速度(Speed)、綜合(Integration)等。這些數(shù)據(jù)不僅能夠?yàn)榭荚嚈C(jī)構(gòu)進(jìn)行質(zhì)量監(jiān)控提供支撐,也便于評(píng)分員進(jìn)行自我檢測(cè)和修正。
2 評(píng)閱方法
2.1 分檔
改好作文最關(guān)鍵的是劃分好檔次,要對(duì)評(píng)分樣卷(Range-finders)認(rèn)真學(xué)習(xí)領(lǐng)會(huì),了解掌握每個(gè)檔次作文的基本特征,例如最高分檔就要求表達(dá)思想清楚,文字連貫通順,基本沒有語言錯(cuò)誤,我們稱此類作文“漂漂亮亮”。次高檔的作文略差,有少量的語言錯(cuò)誤,我們稱作“明明白白”。中檔作文表達(dá)思想不夠清楚,文字勉強(qiáng)連貫,但總體還說得過去,我們稱“馬馬虎虎”。到了5分檔的作文就有些“稀里糊涂”,表達(dá)不清,語言錯(cuò)誤嚴(yán)重。最低檔作文幾乎沒有一句完整的句子,語言支離破碎,簡(jiǎn)直是“一塌糊涂”。
評(píng)分標(biāo)準(zhǔn)的表述是原則性的,評(píng)卷員在實(shí)際評(píng)閱的過程中,所遇到的作文是五花八門,千差萬別,需要在短時(shí)間內(nèi)判斷出一篇作文的真實(shí)水平,要從各個(gè)方面進(jìn)行甄別、權(quán)衡,這往往需要大量的實(shí)踐。一般而言,新閱卷員由于評(píng)卷經(jīng)驗(yàn)不足,往往片面地看待一篇作文,打分不夠準(zhǔn)確,造成脫檔或跨檔。
看到一篇作文,我們通常從這樣幾個(gè)方面進(jìn)行考量:(1)思想內(nèi)容:切題還是偏題;(2)流暢程度;(3)句子結(jié)構(gòu);(4)語法正確;(5)詞匯短語。
評(píng)卷員應(yīng)該從這些方面進(jìn)行綜合判斷,給出一個(gè)總體印象分。經(jīng)驗(yàn)豐富的評(píng)分員往往使用一項(xiàng)以上的標(biāo)準(zhǔn)作為打分依據(jù),而新評(píng)分員往往對(duì)其中某一項(xiàng)給予突出的重視,對(duì)作文的水平做出片面的判斷,出現(xiàn)打分的偏差。作文多種多樣,以下我們僅就幾種常見類型的作文做一些分析。
2.2 幾種常見類型的作文分析
(1)高分作文。句式表達(dá)靈活多樣,讀來自然流暢。能夠使用連接詞以及替代、省略、照應(yīng)等方式增強(qiáng)句子間的銜接和全文的連貫。能正確使用一些高級(jí)詞匯。
(2)有些作文很通順,語法錯(cuò)誤少,但句式簡(jiǎn)單,用詞簡(jiǎn)單。這類作文應(yīng)屬中檔,說明考生沒有駕馭復(fù)雜句式的能力,對(duì)高級(jí)詞匯掌握不夠。有的考生試圖使用一些復(fù)雜的句子結(jié)構(gòu),但組織不夠恰當(dāng)而顯得有些混亂。
(3)有些作文語法錯(cuò)誤多,連貫性差,卻使用了一些高級(jí)詞匯。這說明了此類學(xué)生詞匯量較大,閱讀能力可能較好,可給予中檔評(píng)分。還有一些學(xué)生試圖使用一些高級(jí)詞匯,但一用就錯(cuò),要么用法錯(cuò)誤,要么拼寫錯(cuò)誤,此類作文不能歸于高檔作文。
(4)有嚴(yán)重的語法錯(cuò)誤或拼寫錯(cuò)誤的作文。有的老師一看到作文中有嚴(yán)重的語法錯(cuò)誤或拼寫錯(cuò)誤就難以容忍,給予極低的分?jǐn)?shù)。這時(shí)應(yīng)該看看文中有無完整的句子,是否真得在表達(dá)一些思想,分?jǐn)?shù)能否再高一些。好作文多看錯(cuò)誤,從高分酌減;差作文多看優(yōu)點(diǎn),從低分酌加。
(5)套卷。有些學(xué)生死記一些句子或模板進(jìn)行套用,還有些同學(xué)把考試指令中給出的詞匯反復(fù)套用,有時(shí)簡(jiǎn)直是生搬硬套。批改這類作文的要點(diǎn)是:特別注意學(xué)生臨場(chǎng)所寫的幾句話,這幾句話往往反映出他的真實(shí)水平。
(6)筆跡潦草。一些學(xué)生書寫太過潦草,寫得“龍飛鳳舞”,難以識(shí)別。遇到這類試卷,不要隨意給予低分,要有耐心去認(rèn)真辨識(shí),看出其真實(shí)水平,說不定還是一份好卷。相反,書寫得工工整整,也不要被此所迷惑,誤給了高分。
在實(shí)際閱卷的過程中,評(píng)卷員一定要對(duì)一篇作文作多角度的判斷權(quán)衡,掌握各個(gè)檔次作文的特征,不斷地總結(jié)經(jīng)驗(yàn),練就一雙“火眼金睛”,成為一名優(yōu)秀的閱卷員。
3 相關(guān)參數(shù)分析
計(jì)算機(jī)輔助閱卷可以即時(shí)提供統(tǒng)計(jì)數(shù)據(jù),這樣能夠?qū)υu(píng)分員的打分?jǐn)?shù)據(jù)及質(zhì)量進(jìn)行有效的監(jiān)控,評(píng)分員也應(yīng)該根據(jù)這些反饋數(shù)據(jù),及時(shí)修正偏差,努力提高自己的各項(xiàng)評(píng)分指標(biāo)。以下對(duì)這些統(tǒng)計(jì)參數(shù)做一分析:
3.1 相關(guān)系數(shù)(R)
相關(guān)系數(shù)R的取值范圍是-1≤R≤+1,R的絕對(duì)值越大,相關(guān)程度越高,這里是指客觀分與作文分的相關(guān)性。由于客觀成績(jī)已經(jīng)由機(jī)器改出,一般而言,學(xué)生的客觀成績(jī)高,作文得分也應(yīng)與之相應(yīng),兩者呈正相關(guān)關(guān)系。因此相關(guān)系數(shù)高的閱卷員評(píng)卷的準(zhǔn)確性就高。R值是衡量評(píng)卷質(zhì)量的首要指標(biāo)。
提高R值的關(guān)鍵首先在于以認(rèn)真的態(tài)度準(zhǔn)確評(píng)好每篇作文。實(shí)際上,評(píng)分過程是一個(gè)根據(jù)評(píng)分要求對(duì)學(xué)生作文按照優(yōu)劣進(jìn)行“排隊(duì)”的過程,如果好作文給了低分而差作文卻給了高分,排序反了,則系數(shù)會(huì)迅速下降。其次,要敢于給出高分作文。把握高分作文的特征,敏銳地發(fā)現(xiàn)高分作文,如果學(xué)生的客觀成績(jī)也很高,這時(shí)的系數(shù)就會(huì)很快上升。另外,打分標(biāo)準(zhǔn)要統(tǒng)一,如果早上一個(gè)標(biāo)準(zhǔn),下午一個(gè)標(biāo)準(zhǔn),或者今天一個(gè)標(biāo)準(zhǔn),明天又變了,這樣就會(huì)產(chǎn)生排序錯(cuò)亂,總體R值肯定不高。
3.2 主客比(P)
對(duì)一份試卷而言,由于客觀分已由機(jī)器評(píng)出,客觀分除以作文分就是主客比。個(gè)人的主客比的平均數(shù)應(yīng)與小組或閱卷點(diǎn)保持接近。對(duì)于一個(gè)小組而言,要想提高小組的R值,使每位成員P值保持同步是關(guān)鍵中的關(guān)鍵,因?yàn)榇蠹覕Q成了一股繩,整個(gè)小組齊步走,步調(diào)一致,相關(guān)系數(shù)自然高漲。對(duì)整個(gè)閱卷點(diǎn)而言也同樣如此。
3.3 離散度(Std)
離散度是評(píng)價(jià)評(píng)卷質(zhì)量的第二個(gè)重要指標(biāo),離散值趨中為最好。離散過低,表明給分過于趨中,沒有拉開檔次,該給高分的沒有給上去,該給1分的卻給了2或3分。在各類考試中,作文評(píng)分容易出現(xiàn)趨中傾向,有時(shí)因?yàn)闀r(shí)間緊、任務(wù)重,為趕速度,評(píng)卷員會(huì)給一個(gè)平均分附近的分?jǐn)?shù),所謂打‘保險(xiǎn)分,這樣就會(huì)造成離散度過低。
如果離散值低,打開離散的關(guān)鍵是:敢于給出高分作文,一定要敏銳地發(fā)現(xiàn)高分作文,試想一個(gè)作文本來能得13分,你卻給了10分,這樣就把好學(xué)生給虧了。
如果離散值過大則正好相反,是因?yàn)楸緛聿粔蚝玫淖魑膮s給了高分,高分區(qū)和低分區(qū)太多,降低的方法也正好相反。
3.4 均分(Avg)
個(gè)人的均分應(yīng)該和小組或閱卷點(diǎn)的保持接近。過高表明改卷過于寬松;過低則表明過于嚴(yán)厲。小組成員之間均分保持接近,同主客比一樣,對(duì)于小組整體的相關(guān)系數(shù)的提高非常重要,因?yàn)榇蠹也秸{(diào)一致,整體作文的排序不會(huì)錯(cuò)亂。
3.5 速度(Speed)
一般閱卷點(diǎn)對(duì)閱卷老師有時(shí)間上的要求,如每份試卷的閱卷時(shí)間平均不低于60秒。有的老師評(píng)卷過慢,給分猶豫不決,搖擺不定,要知道評(píng)得慢不一定評(píng)得準(zhǔn),掌握每個(gè)檔次作文的基本特征才能評(píng)得既快又準(zhǔn)。當(dāng)然一掃而過的不負(fù)責(zé)任的過快閱卷,也是不可取的。
3.6 綜合(Integration)
綜合指數(shù)是以上各個(gè)指標(biāo)的綜合,其中相關(guān)系數(shù)占比最大(50%),其次為離散度占30%,其余占20%。綜合指數(shù)反映出一個(gè)閱卷員的整體評(píng)卷質(zhì)量,要提高綜合指數(shù)就要提高各個(gè)分項(xiàng)的質(zhì)量。
3.7 分布圖(Distribution Graph)
改卷軟件中還會(huì)提供個(gè)人的評(píng)分分布圖,分布圖反映了評(píng)卷分?jǐn)?shù)的分布構(gòu)成,分?jǐn)?shù)構(gòu)成應(yīng)服從正態(tài)分布,圖形最好是一條呈鐘形的平滑曲線。有的評(píng)卷員的分布圖呈鋸齒狀,如10分多于9分。有的呈火箭形,如6分給得太多,突出向上,這些都是不好的打分習(xí)慣造成的。分布圖反映出一位評(píng)分員的打分習(xí)慣,組長(zhǎng)應(yīng)幫助組員及時(shí)分析,使組員了解并糾正自己不好的打分習(xí)慣。
4 小結(jié)
閱卷員應(yīng)本著為每位考生負(fù)責(zé)的態(tài)度認(rèn)真閱好每篇作文,努力做到客觀公正,同時(shí)也要不斷總結(jié)改卷經(jīng)驗(yàn),提高閱卷的準(zhǔn)確性和可信度。組長(zhǎng)或閱卷點(diǎn)也應(yīng)根據(jù)統(tǒng)計(jì)數(shù)據(jù)對(duì)閱卷員進(jìn)行監(jiān)督指導(dǎo),及時(shí)糾正閱卷中的偏差。閱卷點(diǎn)也應(yīng)該加強(qiáng)評(píng)分員培訓(xùn)管理工作,培養(yǎng)出一批優(yōu)秀的閱卷員,建立一支穩(wěn)定,經(jīng)驗(yàn)豐富,專業(yè)能力強(qiáng)的評(píng)分員隊(duì)伍,這樣,才能充分保證評(píng)卷質(zhì)量,使考生得到準(zhǔn)確公正的分?jǐn)?shù)。
參考文獻(xiàn)
[1] 李清華,孔文.外語寫作測(cè)試評(píng)分研究綜述[J].外語測(cè)試與教學(xué),2011.4.
[2] 陳建林.大規(guī)模英語考試作文評(píng)分標(biāo)準(zhǔn)效度驗(yàn)證[J].中國考試,2016.1.
[3] 陸遠(yuǎn).寫作測(cè)試公正性研究——作文評(píng)分員偏頗研究綜述[J].外語測(cè)試與教學(xué),2011.4.