龔建新



[摘要] 對R縣某學年度第二學期七年級和八年級語文期末考試的數據分析發現,作文書寫水平和作文成績顯著相關。七年級的回歸分析發現,寫字分1分對作文分有1.10分的貢獻;八年級的回歸分析發現,寫字分1分對作文分有1.52分的貢獻。該結果驗證了語文考試中作文的“印象分”是存在的;同時表明,通過訓練書寫可以提高學生的作文應試成績。該結果提醒考試組織者,在大規模考試中需要控制考生書寫水平對作文判分的影響。
[關鍵詞] 作文書寫;作文成績;相關性;大數據
一、引言
書寫工整美觀,在中、高考等大規模考試中可以獲得“印象分”,這幾乎是人人皆知的考試技巧。有老師稱:寫好字就是給作文披上一件美麗(迷人)的外衣。大規模考試,由于閱卷量大、閱卷人手少、閱卷時間緊,一份作文在閱卷老師面前停留時間短,不可能慢慢推敲,書寫工整美觀往往可以獲得好的第一印象,這完全符合人們的日常經驗,也符合心理學中“暈輪效應”。但是,在中、高考(包括區域性的期中、期末統一考試)等大規模考試中,書寫的“印象”對作文成績的判分究竟有多大的相關性,能夠有多大“貢獻”,國內目前少有人做過深入的研究。董繼文曾做過相關實驗:取一篇初一女生的作文《沒有手表的日子》(原版),讓一字跡相當潦草的男生抄一份(男生版),再適當地運用不同的字體與字號打印一份(打印版),將3份作文各復印3份,混雜在其他考試作文中,讓3個不同年級的老師評分(滿分100分),最后得分如表1所示。
從表1可以看出,組與組之間的打分基本上呈遞降變化,表明各年級要求不一樣,打分還是比較準確的。同一篇文章,因為書寫不一樣,兩極差高達24分,表明書寫這一項的實際權重過大。如果說打印稿比較特殊,影響評分的話,那么原版與男生版相差18.34分就能說明暈輪效應的存在。董繼文的實驗雖然作文樣本數量少,也不是針對大規模考試作文閱卷開展的研究,但足以引起我們對這一現象的重視,值得做進一步的實證研究。
二、數據搜集與研究方法
(一)研究樣本的選取
以R縣27所初中學校某學年度第二學期七年級和八年級語文期末考試成績為研究樣本,考試全縣統一命題,統一網絡閱卷,試題卷面總分為150分,其中作文60分,寫字5分。閱卷采用網絡閱卷,兩個年級作文均由縣內一所師資水平最好的學校老師閱卷,閱卷100%采用雙評,誤差分5分以內取兩人平均分,超過5分交由閱卷組長仲裁,兩個年級寫字分別由一名寫字水平較高的教師判分。該學年全縣初中學校27所,在籍學生人數七年級5717人、八年級5931人,剔除本次缺考學生后得到有效樣本數據如下:初中學校27所,七年級學生5700人、八年級學生5906人。
(二)研究過程
作文分作為因變量可能會受多種因素的影響,寫字是眾多因素中的一個,為了分析眾多因素中寫字對作文分的貢獻,決定采用多元線性回歸模型進行分析,以作文分為因變量,寫字分、其他題的分數、學校為自變量,逐步加入自變量,一共建立8個模型。首先通過描述性統計分析,分析七、八年級主要變量的平均值和標準差,研究自變量對因變量是否有顯著的影響,并呈密切的線性相關,以保證回歸模型具有優良的解釋能力和預測效果,為進一步分析尋找可能;然后以因變量為作文分,寫字分、其他題的分數、學校為自變量,逐步加入自變量,分別對七、八年級進行回歸分析,分析寫字對作文分的貢獻。
(三)數據分析方法
數據處理與分析均在STATA/MP 13.1中進行。
三、結果與分析
1.七、八年級主要變量的平均值和標準差
從上述描述性統計中可以看出,主要變量的觀察值之間都具有較大的變差,這為下文的計量估計提供了可能。
2.七年級線性回歸分析
以作文分為因變量Yi,寫字分、其他題的分數、學校為自變量。模型1:單自變量線性回歸,Wi代表寫作分,代表截距(常數項),代表寫作分對作文分的貢獻(這個貢獻是相關性,不是因果關系):
從表3看出,隨著自變量增加,的估計值從1.9降低到1.10,但是始終在P=0.01水平上顯著。1.10解讀為寫字分1分對作文分有1.10分的貢獻。課文填空分1分對作文分有0.13分的貢獻。課外閱讀總分1分對作文分的貢獻是0.07分。如果把課外閱讀拆分成4小題分布看相關性,第一題中國古典文學與作文分負相關,不是特別顯著(P<0.05);第4題比較主觀,對作文的貢獻穩定而且非常顯著(0.33分)。
比較模型5、6和7、8,結果差不多,這說明控制學校因素是可有可無的。學校之間的差異不大。
3.八年級線性回歸分析
從表4看出,隨自變量增加,的估計值從2.49降低到1.52,始終在P=0.01水平上顯著。
4.研究結論
盡管由于試卷難度不同,八年級的1.52和七年級的1.10不能進行比較,但從表1可以看出來,八年級作文分的標準差是3.56,寫字分標準差是0.47;七年級作文分標準差是2.79,寫字分標準差是0.57。結果投射到標準差上之后就是:
(1.52/3.56)/(1/0.47)=0.20
(1.10/2.79)/(1/0.57)=0.22
可以看出1標準差的寫字分對作文分大約有0.2標準差的影響,這個結果在兩個年級是基本統一的。
四、討論與建議
1.這個研究結果表明:在大規模考試的閱卷中,因寫字而造成的“印象分”是存在的。寫字水平和作文成績之間存在顯著相關性,結果驗證了語文考試中作文的“印象分”是存在的。這個結果告訴我們:一是通過訓練書寫,提高書寫水平可以提高學生的作文應試分數;二是提醒考試組織者,在大規模考試中,閱卷組織者需要采取一定的措施控制閱卷老師因為考生書寫水平影響對作文的客觀判分。
2.學生書寫水平對作文分貢獻,除了因為閱卷者的“暈輪效應”外,也可能與書寫水平和學生的非認知水平有一定的相關性。以第一題(課文默寫)分數為y,其他題目作為x,做線性回歸分析,在不加學校變量的情況下,七年級和八年級的coef值都約等于0.13,這個結果顯示,在考慮了其他題的因素下,寫字分對第一題還是有顯著的正效應的,只是影響不及對作文的大。考慮學校的情況下結果還是幾乎不變,寫字還是對第一題有顯著的正影響,但其間是否具有因果關系還有待實驗驗證。應該說課文默寫是典型的客觀題,閱卷時不會因寫字而造成“印象分”,但為什么還會有顯著影響,這可能和學習態度、學習習慣等非智力因素有關。有研究也表明寫字訓練不僅僅是技能訓練,還是一個形成良好習慣、學習態度、學習興趣、意志品格等非智力因素的過程。[2]從而對學生的語文素養產生正面影響,促進學生提升寫作能力。因此,我們認為,通過訓練書寫可以改善學生學習態度,促進學生語文素養的整體提升,從而提高寫作水平。
3.在大規模考試中是否需要單列寫字分并且獨立評分,可以做進一步的實證研究。有部分地區的中考語文試卷在作文中設“作文分+寫字分”,這對引導學生和老師重視寫字教學有一定的導向作用,但作為高考的考試,從閱卷的公平、公正角度考慮,是否需要另加寫字分,是否需要安排教師單獨賦分,應該做進一步的研究。因為學生的書寫水平已經影響其寫字分,書寫水平又影響其作文得分,其中是否有重復得分和扣分?值得研究。
4.適當控制單篇作文網上閱卷的時長。閱卷速度快的教師質量未必差,而閱卷速度慢的教師質量未必好。在閱卷過程中,又好又快和又慢又差的情況都出現過。但是,不限定閱讀速度的上限,就有可能出現個別教師為追求速度而忽略質量的情況。所以,網上閱卷系統一定要有限制閱卷速度過快的功能。[3]控制速度,適當延長一篇作文的閱卷時間也是降低“暈輪效應”導致的認知誤差的重要方法。
本研究采用自然狀態下的數據。判分誤差和作文水平的實然差異都會影響學生成績,學生的成績在多大程度上受書寫水平影響,還有待更加深入的、可靠的實驗研究。
本研究數據分析由上海科技大學徐劍鋒博士完成,特此致謝!
[本研究系江蘇省教育科學“十三五”規劃重點課題“基于大數據技術學業質量精準評價與指導的服務平臺建設及應用研究”(項目編號:B-b/2016/02/105)階段性研究成果]
[參考文獻]
[1]董繼文.考試作文評分誤差控制研究[D].上海:華東師范大學,2004:19-20.
[2]高順翠.從寫字教學入手培養學生的非智力因素[J].連云港師范高等專科學校學報,1998(1):90-91.
[3]陳志國,芮南.高考作文網上閱卷雙評過程中的質量監控[J].中學語文教學,2009(6):62-65.