






摘要:傳統(tǒng)的英語(yǔ)作文批閱工作量大,作文講評(píng)效率不高。人工智能批改在幫助教師減負(fù)增效、對(duì)學(xué)生進(jìn)行個(gè)性化批改以及引導(dǎo)學(xué)生關(guān)注英語(yǔ)寫作細(xì)節(jié)方面具有較大的應(yīng)用價(jià)值。但由于受技術(shù)限制,人工智能對(duì)作文的反饋評(píng)價(jià)主要集中在詞匯和語(yǔ)法等基本語(yǔ)言知識(shí)層面,無法深入至英語(yǔ)學(xué)科核心素養(yǎng)的文化意識(shí)和思維品質(zhì)等層面。因此,采用人機(jī)分工合作評(píng)價(jià)反饋的方式,將最大限度地發(fā)揮各自優(yōu)勢(shì),提升初中生的英語(yǔ)寫作能力。
關(guān)鍵詞:人工智能;初中英語(yǔ);批改網(wǎng);智學(xué)網(wǎng);人工智能作文批改
英語(yǔ)作文的批閱是英語(yǔ)評(píng)價(jià)的重頭戲。就拿中考英語(yǔ)批閱來說,作文批閱教師人數(shù)就占了中考英語(yǔ)批閱人數(shù)的近75%。在日常教學(xué)中,學(xué)生英語(yǔ)作文的批閱工作量更大。教師無法做到篇篇全批全改,對(duì)學(xué)生寫作的修改建議也只能以改錯(cuò)和簡(jiǎn)單反饋為主。就教師而言,批閱學(xué)生的英語(yǔ)作文很難從微觀與宏觀、內(nèi)容與形式等方面對(duì)寫作文本進(jìn)行全面批閱和及時(shí)反饋,無法全面了解學(xué)生的寫作情況;就學(xué)生而言,大多數(shù)學(xué)生不重視教師批閱的反饋建議,只關(guān)注寫作的得分,即使被要求重寫,也不會(huì)按照教師的要求將需要修改處全部修改,加上后期的監(jiān)督難以跟上,致使相同的錯(cuò)誤頻繁出現(xiàn),嚴(yán)重阻礙其英語(yǔ)寫作水平的提高[1]。
人工智能技術(shù)加速了神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理中的應(yīng)用,使人工智能技術(shù)自動(dòng)評(píng)分成為可能。能否運(yùn)用人工智能完成原本需要消耗教師大量時(shí)間和精力的批閱工作,讓教師節(jié)省時(shí)間專注于信息技術(shù)目前無法完成的工作呢?為此,筆者組織一批初中英語(yǔ)骨干教師開展了以人工智能(AI)技術(shù)為支撐的智能批改實(shí)踐應(yīng)用,把英語(yǔ)寫作訓(xùn)練、批改和個(gè)性化點(diǎn)評(píng)指導(dǎo)有機(jī)結(jié)合,嘗試減輕教師批改作文的工作量,提高英語(yǔ)寫作教學(xué)的效率[2]。
教師選擇使用科大訊飛智學(xué)網(wǎng)、句酷批改網(wǎng)和網(wǎng)易有道AI作文批改系統(tǒng)對(duì)同一篇文章進(jìn)行批改打分和評(píng)價(jià)反饋。科大訊飛智學(xué)網(wǎng)前期通過專家對(duì)少數(shù)文章進(jìn)行定標(biāo)評(píng)分,接著根據(jù)計(jì)算機(jī)學(xué)習(xí)專家的評(píng)分尺度和評(píng)分標(biāo)準(zhǔn),訓(xùn)練評(píng)分映射模型,最后由計(jì)算機(jī)對(duì)所有非異常卷實(shí)現(xiàn)自動(dòng)打分。句酷批改網(wǎng)通過計(jì)算學(xué)生的作文與系統(tǒng)中語(yǔ)料庫(kù)的差距做出評(píng)分。它以句子為單位反饋結(jié)果,主要對(duì)單詞的拼寫及用法錯(cuò)誤進(jìn)行反饋,并對(duì)句子和篇章結(jié)構(gòu)做淺層評(píng)價(jià)。網(wǎng)易有道AI作文批改系統(tǒng)是嵌入在網(wǎng)易有道詞典中的一項(xiàng)新功能,學(xué)生可以直接拍照或者手動(dòng)輸入需要批改的作文,提交后該系統(tǒng)將從詞、句、篇章多個(gè)維度對(duì)英語(yǔ)作文進(jìn)行打分和批改,生成個(gè)性化報(bào)告。
一、實(shí)踐與分析
為驗(yàn)證人工智能批改系統(tǒng)的有效性,教師運(yùn)用智學(xué)網(wǎng)智能批改系統(tǒng)對(duì)某區(qū)八年級(jí)627份英語(yǔ)作文實(shí)行人機(jī)背靠背批閱。基于前期對(duì)所有試卷處理的數(shù)據(jù),系統(tǒng)先抽取了100份試卷作為定標(biāo)交由骨干教師批閱,形成專家評(píng)分標(biāo)準(zhǔn),再交由計(jì)算機(jī)進(jìn)行自我學(xué)習(xí),最后由計(jì)算機(jī)開展大面積評(píng)閱。
本次考試共有 627 份有效人機(jī)共評(píng)試卷,人機(jī)分差的分布如圖 1 所示。將同一份試卷的機(jī)器分與人工分進(jìn)行對(duì)比,其中評(píng)分完全一致的占比39.39%,分差1~3分的占比 50.40%,分差4~5分的占比 8.45%,分差在 5 分以上的僅占 1.76%。總體均分差距較小,人工閱卷均分為4.28分,機(jī)器閱卷均分為4.18分。
通過人機(jī)批閱分差結(jié)果對(duì)比分析,我們發(fā)現(xiàn)計(jì)算機(jī)批改與人工批改一致率較高,顯示人工智能評(píng)分具有較高的可信度和準(zhǔn)確度,均分分差為0.1分,也在理想的分差范圍內(nèi),證明人工智能能夠客觀、高效、穩(wěn)定地完成批改任務(wù)。
二、反饋與評(píng)價(jià)
為進(jìn)一步探討人工智能批改系統(tǒng)在語(yǔ)言、語(yǔ)法和篇章結(jié)構(gòu)等方面對(duì)學(xué)生英語(yǔ)寫作的指導(dǎo)意義,對(duì)于同一道作文題,教師借助句酷批改網(wǎng)和網(wǎng)易有道AI作文批改系統(tǒng),對(duì)兩篇不同層次的英語(yǔ)作文的批改分?jǐn)?shù)和反饋信息進(jìn)行了對(duì)比。
原題重現(xiàn)(總分15分):新科技推動(dòng)著社會(huì)的發(fā)展。當(dāng)我們看一些關(guān)于未來的電影時(shí),會(huì)看到具有奇異功能的機(jī)器人幫我們做各種各樣的事情。對(duì)未來十年的生活,你一定有許多期待。請(qǐng)你寫一篇短文,內(nèi)容必須包含以下寫作要點(diǎn)。
1.What do you want to be in ten years?
2.Something about your family or your free time activities in ten years.
3.What should you do to achieve your dreams?
(一)程度較好作文的評(píng)分與反饋
對(duì)于書寫工整、語(yǔ)法錯(cuò)誤少、語(yǔ)言表達(dá)流暢的作文(如圖2),三種人工智能批改系統(tǒng)的評(píng)分(智學(xué)網(wǎng)13分,網(wǎng)易有道AI12.5分,句酷批改網(wǎng)12.5分)都比較接近人工雙評(píng)結(jié)果(14分),人工智能評(píng)分與人工評(píng)分吻合度較高。此外,網(wǎng)易有道AI和句酷批改網(wǎng)還給出了評(píng)價(jià)報(bào)告以及較為詳細(xì)的修改建議。
網(wǎng)易有道AI作文批改系統(tǒng)的評(píng)價(jià)報(bào)告與修改建議如下:
文章字?jǐn)?shù)基本滿足該考試字?jǐn)?shù)要求;詞匯量較為豐富,能使用一定數(shù)量的高級(jí)詞匯;邏輯性不錯(cuò),上下文關(guān)系銜接較為緊密;單詞拼寫基本正確,詞匯基礎(chǔ)扎實(shí);語(yǔ)法錯(cuò)誤少,有一定的語(yǔ)法功底;使用了以下高級(jí)詞匯(高中:opinion, less, pollution四級(jí):usually, favorite, learning),你真厲害。
修改建議:
I will study hard and try my best in learning.
介詞用法錯(cuò)誤,建議將in改為at。
句酷批改網(wǎng)的評(píng)價(jià)報(bào)告與修改建議如下:
作者詞匯基礎(chǔ)扎實(shí),拼寫也很棒;文章層次清晰分明,但是文中很少使用過渡詞和銜接詞;如若適當(dāng)增加一些從句的使用,文章會(huì)取得更好的成績(jī)。
修改建議:
[近義詞表達(dá)學(xué)習(xí)] usually的同義表達(dá)有for the most part;
[推薦表達(dá)] the human race/humanity/humankind與human意思相近,可參考學(xué)習(xí);
[學(xué)習(xí)提示]易混詞匯:place, position, post," situation均有“職位”之意;
[學(xué)習(xí)提示]易混詞匯:different, various, diverse均含“不同的”之意;
[推薦表達(dá)] or my part/from my own perspective與In my opinion意思相近,可參考學(xué)習(xí);
[推薦表達(dá)] be dissimilar from與be different from意思相近,可參考學(xué)習(xí)。
(二)程度中等作文的評(píng)分與反饋
對(duì)于程度中等、語(yǔ)法錯(cuò)誤較多、書寫潦草的作文(如圖3),人工評(píng)卷和人工智能批改系統(tǒng)則有一定的分歧:人工雙評(píng)12分,智學(xué)網(wǎng)9分,網(wǎng)易有道AI10.5分,批改網(wǎng)11分。
網(wǎng)易有道AI作文批改系統(tǒng)的評(píng)價(jià)報(bào)告與修改建議如下:
文章字?jǐn)?shù)基本滿足該考試字?jǐn)?shù)要求;詞匯量較為豐富,能使用一定數(shù)量的高級(jí)詞匯;文章較為流暢,建議更多地使用銜接詞匯;存在少數(shù)拼寫錯(cuò)誤,詞匯基礎(chǔ)較為扎實(shí);存在一些語(yǔ)法錯(cuò)誤。
修改建議:
賓語(yǔ)冗余,建議刪除years;
大小寫錯(cuò)誤,建議將zhong修改為Zhong;
代詞缺失,建議將help修改為that help;
疑似拼寫錯(cuò)誤,建議將mountian修改為mountains、將swiming修改為swimming;
動(dòng)詞時(shí)態(tài)錯(cuò)誤,建議將make修改為making;
名詞單復(fù)數(shù)錯(cuò)誤,建設(shè)將robot修改為robots;
限定詞缺失,建議將environment修改為the environment。
句酷批改網(wǎng)的評(píng)價(jià)報(bào)告與修改建議如下:
句法知識(shí)很棒,若增加一些從句的使用,文章會(huì)更出色;文中詞匯表達(dá)靈活多樣,請(qǐng)繼續(xù)保持,高級(jí)詞匯積累也做得很棒;文章組織結(jié)構(gòu)良好。
修改建議:
[推薦表達(dá)] argue/claim/assert/hold the view that與I think意思相近,可參考學(xué)習(xí);
[推薦表達(dá)] do sb. a favor與help意思相近,可參考學(xué)習(xí);
[拓展辨析]動(dòng)名搭配help people在語(yǔ)料庫(kù)中出現(xiàn)過 811次;
[搭配錯(cuò)誤]表達(dá)不規(guī)范,建議將Maybe sb./sth. will do sth.改為sb./sth. may do sth.;
[句子錯(cuò)誤]請(qǐng)檢查There will be robots help,疑似雙謂語(yǔ)錯(cuò)誤;
[拼寫錯(cuò)誤]請(qǐng)檢查mountian,確認(rèn)拼寫正確;
[拼寫錯(cuò)誤]請(qǐng)檢查swiming,確認(rèn)拼寫正確;
[名詞錯(cuò)誤]請(qǐng)檢查robot,該處名詞一般使用復(fù)數(shù)形式;
[動(dòng)詞警示]請(qǐng)檢查make,確認(rèn)動(dòng)詞用法正確;
[冠詞警示]冠詞缺失,請(qǐng)檢查environment;
[詞語(yǔ)錯(cuò)誤]語(yǔ)法錯(cuò)誤,be fresher than不規(guī)范,建議修改。
對(duì)這兩篇程度不同的作文,筆者也組織教師進(jìn)行了人工雙評(píng)。前一篇作文的總體評(píng)價(jià)為“作者能根據(jù)寫作要點(diǎn)謀篇布局,圍繞未來的職業(yè)、未來的活動(dòng)、實(shí)現(xiàn)夢(mèng)想的路徑三個(gè)方面展開描寫,全文字跡工整,內(nèi)容豐富,語(yǔ)法錯(cuò)誤少,但第二個(gè)要點(diǎn)的描述不夠具體,需要充實(shí)完善”。后一篇作文的總體評(píng)價(jià)為“作者根據(jù)總—分—總的結(jié)構(gòu)謀篇布局,文章結(jié)構(gòu)清晰,首尾呼應(yīng),全文字跡較工整,有少量拼寫和語(yǔ)法錯(cuò)誤,建議加強(qiáng)詞匯學(xué)習(xí)和必要的語(yǔ)法訓(xùn)練”。從反饋評(píng)價(jià)看,智能批改系統(tǒng)都能夠從詞匯、句型、語(yǔ)法等方面給出總體評(píng)價(jià)和修改建議。由于擁有大型語(yǔ)料庫(kù),句酷批改網(wǎng)和網(wǎng)易有道AI作文批改系統(tǒng)能對(duì)單詞拼寫、固定搭配和語(yǔ)法使用提出適當(dāng)?shù)男薷慕ㄗh,但與人工評(píng)價(jià)的反饋相比,智能批改系統(tǒng)缺乏對(duì)內(nèi)容是否切題的精準(zhǔn)檢測(cè),也無法給出相關(guān)主題的修改建議。
三、優(yōu)勢(shì)與不足
通過上述應(yīng)用實(shí)踐,我們發(fā)現(xiàn)人工智能批改系統(tǒng)在幫助教師減負(fù)增效、對(duì)學(xué)生進(jìn)行個(gè)性化批改以及提升學(xué)生自主學(xué)習(xí)能力方面有較大的應(yīng)用價(jià)值,但同時(shí)在理解文章內(nèi)容方面存在不足,也難以給出高層次評(píng)價(jià)。
(一)三大優(yōu)勢(shì)
一是實(shí)現(xiàn)了英語(yǔ)作文批改的減負(fù)增效。應(yīng)用實(shí)踐證明,人工智能批改確實(shí)能減輕教師的工作量,提高工作效率。以前5分鐘批閱一份試卷,現(xiàn)在10分鐘可以批閱1000份試卷,提高了作文批改的時(shí)效性。同時(shí),人工智能還可以明確地指出英語(yǔ)作文中大部分比較基礎(chǔ)的語(yǔ)法錯(cuò)誤,并借助大數(shù)據(jù)分析系統(tǒng)對(duì)學(xué)生數(shù)據(jù)進(jìn)行分析,整理學(xué)生寫作中的亮點(diǎn)與不足形成分析報(bào)告,輔助教師開展有針對(duì)性的試卷講評(píng),從而更好地幫助學(xué)生提升寫作能力。
二是實(shí)現(xiàn)了英語(yǔ)作文個(gè)性化批改。對(duì)于同一個(gè)主題的作文,學(xué)生的行文與表達(dá)各有千秋,錯(cuò)誤類型也千差萬別。面對(duì)當(dāng)前大班額的現(xiàn)狀,教師無法做到全批全改。而人工智能通過將學(xué)生作文與語(yǔ)料庫(kù)進(jìn)行對(duì)比和智能識(shí)別,對(duì)詞匯、句法搭配等方面進(jìn)行逐句點(diǎn)評(píng),對(duì)詞語(yǔ)、句子、語(yǔ)法、搭配、冠詞等方面的錯(cuò)誤進(jìn)行標(biāo)識(shí),并提出個(gè)性化的修改意見[3],這將更加有效地幫助學(xué)生提高英語(yǔ)寫作能力。
三是提升了學(xué)生的自主學(xué)習(xí)能力。人工智能批改對(duì)標(biāo)點(diǎn)符號(hào)、字母大小寫以及單詞拼寫要求較高,這有利于引導(dǎo)學(xué)生更多地關(guān)注寫作細(xì)節(jié),培養(yǎng)良好的寫作習(xí)慣和嚴(yán)謹(jǐn)?shù)膶W(xué)習(xí)態(tài)度。學(xué)生的作文一經(jīng)提交就能得到智能批改系統(tǒng)的詳細(xì)反饋,有助于提高學(xué)生英語(yǔ)寫作的積極性。
(二)兩點(diǎn)不足
一是智能批改系統(tǒng)難以真正理解作文內(nèi)容。人工評(píng)閱作文時(shí),評(píng)卷教師能夠根據(jù)作文的主題思想及情感真正讀懂作文。智能批改系統(tǒng)則是通過提取的典型特征從側(cè)面評(píng)估學(xué)生的寫作情況,在實(shí)際的英語(yǔ)表達(dá)中語(yǔ)言特征有很多,而智能批改系統(tǒng)從文中提取的典型特征有限,因此,智能批改的分?jǐn)?shù)和評(píng)價(jià)并不能準(zhǔn)確反映一篇作文的真實(shí)水平。
二是智能批改系統(tǒng)難以做出高層次評(píng)價(jià)。研究發(fā)現(xiàn),受技術(shù)限制,人工智能對(duì)作文的評(píng)價(jià)主要集中在詞匯和語(yǔ)法等基本語(yǔ)言知識(shí)層面,如單詞拼寫錯(cuò)誤、字母大小寫、語(yǔ)法錯(cuò)誤、語(yǔ)言表達(dá)流暢度、高級(jí)詞匯的應(yīng)用、復(fù)合句的使用等方面,缺乏對(duì)篇章的結(jié)構(gòu)性、邏輯性、連貫性以及文章內(nèi)容等高層次評(píng)價(jià)[4],無法深入至英語(yǔ)學(xué)科核心素養(yǎng)的文化意識(shí)和思維品質(zhì)等層面的考查,也無法解決英語(yǔ)作文跑題的評(píng)分問題。
四、反思與啟示
(一)帶給教師的啟示
在英語(yǔ)教學(xué)中,英語(yǔ)教師面臨著時(shí)間緊張、教學(xué)任務(wù)繁重的壓力,難以對(duì)學(xué)生作文進(jìn)行全面有效的反饋。教師可以借助智能批改系統(tǒng)來減輕作文批改的工作量[5],提高寫作教學(xué)的實(shí)效性,并且還能在智能批改的基礎(chǔ)上,根據(jù)系統(tǒng)統(tǒng)計(jì)出的各項(xiàng)數(shù)據(jù)對(duì)作文進(jìn)行個(gè)性化反饋。教師可利用智能批改系統(tǒng)在詞匯、語(yǔ)法分析上的優(yōu)勢(shì)對(duì)學(xué)生作文中的語(yǔ)言錯(cuò)誤進(jìn)行修改,留出更多精力對(duì)文章內(nèi)容和篇章結(jié)構(gòu)進(jìn)行分析和評(píng)價(jià)反饋,逐步培養(yǎng)學(xué)生的語(yǔ)篇意識(shí)。
(二)帶給學(xué)生的啟示
學(xué)生應(yīng)積極發(fā)揮智能批改系統(tǒng)在詞匯和語(yǔ)法批改方面的優(yōu)勢(shì),有效減少基本的單詞和語(yǔ)法錯(cuò)誤,同時(shí)從教師批改的反饋中改進(jìn)語(yǔ)言表達(dá)、篇章結(jié)構(gòu)處理等,逐漸培養(yǎng)自己謀篇布局、審題立意的能力。寫作是培養(yǎng)英語(yǔ)能力中最重要的環(huán)節(jié)之一,學(xué)生應(yīng)借助智能批改系統(tǒng)堅(jiān)持寫作、積極反思、不斷修改,促進(jìn)自身英語(yǔ)寫作能力的可持續(xù)發(fā)展。
(三)帶給智能批改系統(tǒng)開發(fā)者的啟示
智能批改系統(tǒng)應(yīng)及時(shí)更新語(yǔ)料庫(kù),認(rèn)真研究學(xué)生的改錯(cuò)信息,增加評(píng)價(jià)維度,提高智能批改的信度。研究得知,智能批改系統(tǒng)對(duì)英語(yǔ)寫作能力中等和稍弱的學(xué)生幫助更大。他們可以通過系統(tǒng)反饋修正作文中的詞匯、語(yǔ)法錯(cuò)誤,減輕了教師更正學(xué)生作文中機(jī)械性錯(cuò)誤的負(fù)擔(dān)。但智能批改系統(tǒng)對(duì)于英語(yǔ)寫作能力較強(qiáng),想要從作文內(nèi)容邏輯、篇章結(jié)構(gòu)上有所突破的學(xué)生來說效果欠佳,這給智能批改系統(tǒng)的進(jìn)一步開發(fā)改進(jìn)帶來了更大的挑戰(zhàn)。
隨著人工智能技術(shù)的進(jìn)一步發(fā)展,我們相信將會(huì)有更多更高效的英語(yǔ)作文智能批改系統(tǒng)面世。一方面,人工智能的使用能夠降低人工評(píng)閱的主觀性,極大地提高廣大教師的工作效率,讓教師有更多時(shí)間去關(guān)注學(xué)生作文的內(nèi)容、邏輯、結(jié)構(gòu)和思想,為英語(yǔ)寫作教學(xué)與研究提供新的思路和方法;另一方面,人工智能能夠及時(shí)從詞匯、語(yǔ)法等方面為學(xué)生提供個(gè)性化反饋,幫助學(xué)生發(fā)現(xiàn)自身存在的問題。但是,到目前為止,人工智能評(píng)分系統(tǒng)還只是輔助教學(xué)的一種工具,不能完全代替教師,只有人機(jī)結(jié)合、多元評(píng)價(jià),才能真正有效地對(duì)英語(yǔ)作文進(jìn)行評(píng)判[6],培養(yǎng)學(xué)生的寫作積極性和自主學(xué)習(xí)能力,從而提升其英語(yǔ)寫作能力。
參考文獻(xiàn)
[1] 夏春來.批改系統(tǒng)用于高中英語(yǔ)寫作多維評(píng)價(jià)的實(shí)踐[J].中小學(xué)外語(yǔ)教學(xué)(中學(xué)篇),2016(11):44-48.
[2] 汪赤霞.基于“批改網(wǎng)”的線上線下融合的初中英語(yǔ)寫作教學(xué)研究[J].福建基礎(chǔ)教育研究,2020(11):63-67.
[3][4][5]林鋅.基于批改網(wǎng)初中英語(yǔ)作文教學(xué)策略的實(shí)踐研究[C]//2020科教創(chuàng)新學(xué)術(shù)研討會(huì)論文集(第二輯).[出版者不詳],2020:248-250.
[6] 吳艷華.英語(yǔ)寫作智能評(píng)閱系統(tǒng)對(duì)比研究——以iWrite和批改網(wǎng)為例[J].校園英語(yǔ),2020(40):69-70.
(作者高友明系江西省南昌市東湖區(qū)教師發(fā)展中心中小學(xué)英語(yǔ)教研員;李愛華系江西省南昌市濱江學(xué)校英語(yǔ)骨干教師)
責(zé)任編輯:牟艷娜