沈 晨,王超杰,梁 辰
(1.上海市教育考試院,上海 200433;2.江蘇大學,江蘇 鎮江 212013;3.朗鷹教育科技,上海 200040)
數字化和信息化一直是教育教學改革的重要方向之一。隨著社會進入大數據時代,越來越多的中、小學采用互聯網智能教學管理平臺作為日常課堂教學與管理的配套和補充。相較于傳統“一對多”的課堂授課模式,互聯網智能教學管理平臺可以利用人工智能及專業評價技術在課堂內外和考前、考中、考后等多個階段對學生的學習效果進行“一對一”的評測,并根據評測結果對學生進行針對式的反饋并輔以個性化訓練。這一方面減輕了任課教師在課后進行人工評測的工作負擔,使其能夠將精力集中于課程內容的準備和課堂教學質量的提升;另一方面,通過大數據技術和信息化平臺的綜合分析,可以更加精準地評價不同教學班級之間學生學習效果和教師教學質量的差異性,有助于教育管理部門針對性地提出改進方案,從而實現“教、評、管”一體化的目標。因此,引入互聯網智能教學管理平臺既是目前中、小學教育的主流發展趨勢,也是教學數字化和信息化改革的必經之路,也是教育數字化轉型中的重要一環。本文將以上海市初中學業水平考試(外語聽說測試)為例,介紹互聯網智能教學管理平臺在“減負增效”大背景下,推動教育改革和教學質量提升方面的積極作用和重要意義。
近十年來,互聯網智能教學管理平臺得到了快速的發展,其在教學評價中發揮的作用正逐漸被各級教育管理者所認可。江春(2019)[1]對高校教學管理工作中的創新發展需求進行了分析,探討了信息化平臺在相應管理中創造的價值,提出應用信息化平臺來實施高校教學管理工作創新和改革;劉暢(2020)[2]也認為互聯網智能教學管理平臺有助于推動高等院校教學管理創新發展,增進我國高校教學轉型的動力;楊鑫(2021)[3]探討了基于大數據教學管理平臺的功能和構成,分析了教學信息化建設的管理現狀,并提出了相應的應對措施;居偉(2021)[4]以揚州工業職業技術學院為例,研究了網絡教學管理平臺在高職院校成人高等教育中的應用。在中學教育的應用中,朱笑利(2021)[5]研究了智能教學管理平臺在高中實驗教學中的應用,通過實驗資產信息化管理模塊和實驗教學信息化管理模塊兩部分,更好地實現對實驗設備資源的管理,以使其更好地服務于實驗教學。
互聯網智能教學管理平臺可以從課堂教學、課后作業、備考鞏固、考試檢測、管理評價等多個環節對學生的學習效果進行訓練、跟蹤、反饋和評價。在考前模擬訓練中,平臺通過虛擬仿真的方式盡可能地模擬真實考試環境,使學生能夠提前熟悉考試流程。這對于外語聽說測試等使用機考方式進行的人機交互式考試來說尤為重要,避免考生因不熟悉機考界面、考試流程、答題交互等而緊張,無法在正式考試中發揮出真實水平。另外,根據學生在考前模擬訓練中反饋的結果,平臺基于長期積累的大數據題庫可以對學生進行個性化的針對性訓練,幫助學生進一步查漏補缺。在正式考試的過程中,互聯網智能教學管理平臺可以與教育考試院等當地教育主管部門進行合作,協助考試流程的標準化規范運行。例如,在考試過程中通過軟硬件結合的方式對考生狀態進行智能化實時監控,避免各種舞弊行為的出現。這既可以減少監考過程中的人力成本,同時增加了考試的公平、公正性。在考試結束后,互聯網智能教學管理平臺可以采用人工智能技術進行人工智能自主電子閱卷,同時對全部考生的測試結果進行快速高效地系統性分析,從而可以整體評價學生的學習效果,為當地教育主管部門接下來的教育改革措施提供決策依據。可以說,互聯網智能教學管理平臺的應用對于推動教育改革和教學質量提升具有十分重要的作用。
在互聯網智能教學管理平臺這一領域,國內已初具規模,已形成若干專業水平高、綜合實力強的領軍平臺,例如上海朗鷹教育科技的“輕松英語”智慧教學管理平臺。經過十余年的潛心發展和持續積淀,該平臺已成為國內教育考試智能評測及教學智能管理應用領域的先行者和技術服務方,與北京、上海、深圳等省市級教育主管部門進行了深度合作,共同推動教育教學改革的發展。這一類平臺的作用和意義在于可提供多種測評和教學管理服務,包括標準化考場建設、模考和訓練系統建設等新基建領域,高利害考試、大型模擬考、日常區校考的考場環境檢查,試卷制作,試卷AI智能批閱評價等技術支持服務領域,還包括智能課堂教學與互動、作業智能推薦、教學研究與質量監測評價等教育教學領域。
近年來,英語聽說訓練得到了學生和家長越來越多的重視。為了擺脫過去“啞巴”式英語教學的方式,讓英語教學正確地回歸語言交流應用的本質,全國各地教育主管部門在新一輪的教學改革中加大了英語聽說測試在學生總評成績中的比重。作為國際化大都市和全國教育改革試點地區,上海市積極響應國務院頒布的《關于深化考試招生制度改革的實施意見》和教育部頒布的《關于進一步推進高中階段學校考試招生制度改革的指導意見》,在2018年3月出臺了《進一步推進高中階段學校考試招生制度改革實施意見》,并在2019年4月公布了《上海市初中學業水平考試實施辦法》和《上海市初中學生綜合素質評價實施辦法》兩個中考改革配套文件,進一步細化落實了中考改革方案。其中,一項最為重大的改革是在外語科目中增設聽說測試,并采用人機對話的方式進行考核,具體包括朗讀、交際應答、聽后復述和話題表達四種題型,滿分為10分,測試總時長為10分鐘。2021年5月,上海市進行了首次初中學業水平外語聽說測試,共計有8萬多名學生參加。
對于本次考試的結果,上海朗鷹教育科技與上海市教育考試院共同對數據進行合作梳理與研究。我們從多個維度對其進行數據分析,并提出相應改進方案。數據來源為上海市教育考試院。具體來說,圖1展示了本次考試學生在各個題型中的平均得分和標準差情況。可以明顯看出,在四個題型模塊中,隨著對口語表達能力要求的提升,學生的平均得分率也在不斷下降,同時刻畫學生得分差異性的指標——標準差在不斷提升,表明優秀學生和普通學生在得分率上的差距進一步拉大。通過統計學t檢驗,發現各個題型之間學生的得分情況并非是由隨機誤差造成的區別,而是存在著顯著性的統計學差異性。這說明在今后的外語教學中,應當更加加強對學生口語表達能力以及英語思維能力的教學與訓練。

圖1 各題型平均得分和得分標準差
圖2展示了各分數段考生人數分布情況,可以發現考生成績呈現明顯的偏態分布,大部分學生取得了8分以上的成績,總體平均分為8.2分。作為改革試點后的第一次外語聽說測試,考生展現了一定的適應性。這也為教育主管部門積累了數據和經驗,對于未來考試的命題難度選擇提供了較高的參考價值。

圖2 各分數段人數分布
圖3顯示了本次考試考生的若干描述性統計情況,包括滿分率、優良率、及格率。可以看到,滿分率接近6%,這比某些區級一模二模的滿分率要高。優良率是取得分率在80%(不含)到100%之間的考生人數,有超過七成的考生達到優良,說明大部分考生經過模擬訓練后能表現出良好的聽說能力。另外,將近九成考生達到及格線,這也符合學業水平考試的初衷。以上結果既體現了本次考試的選拔作用,又符合了初中畢業學業終結性評價的題中之意。

圖3 滿分率、優良率、及格率
表1和圖4反映了各檔位考生數的占比和分布情況。這里按照考生成績劃分為ABCDE五個檔位。可以看出,A檔考生占比最多,達到44.85%;E檔考生超過十分之一,仍然有提升的空間。基于互聯網智能教學平臺,可通過翔實的數據分析結果有效觀測學生使用情況,以客觀、精準、智能的方式來進行考試后效觀測,讓考試起到精準的反撥教學效應(washback effect),而不是讓任課老師憑感覺來做出教學決策。教師也可以以此來不斷跟蹤學生學情,分析比較歷次考試結果,觀測進步退步情況,用智能多元評價來不斷優化教學。

表1 各檔位考生數占比

圖4 各檔位考生數分布
表2顯示了本次考試的全距、峰度、偏度。全距反映了最高分和最低分的差距。峰度和偏度是反映數據分布的參考值,峰度指數據分布平峰或尖峰的程度,正態分布其參考值是3,低于3為平峰,在這里可以理解為各分數段的人數較分散,大于3則為尖峰,在這里可理解為某一分數段的人數較集中。本次考試的峰度達到4.38,說明高分考生較多,這和A檔考生達到44.85%比較吻合。偏度是反映不對稱分布的偏態方向和程度的統計分析指標。當偏度值大于0,表示正偏,這里可理解為低于平均分的考生較多,偏度小于0,則為負偏,這里可理解為高于平均分的人較多。本次考試的偏度達到-2.14,為負偏,同樣說明高于平均分的考生比較多。

表2 全距、峰度、偏度
表3反映了本次考試學生成績的四分位情況,即按照考生成績降序排列后,分別出現在25%、50%、75%位置的分值,即進行分值切分。該數據也可以和眾數在一起看。本次考試分值的眾數是9.5,說明得9.5分的考生人數最多。通過以上這些數據,可以從多維度有效觀測考試數據,以評促教,以評促學,達到“教、學、管”一體化的目標。

表3 四分位分值
互聯網智能教學管理平臺的出現極大地推動了教學信息化和數字化改革的進程,特別是對于外語聽說測試等機考類型的非標準化測試,其從考前訓練、考中監控、考后評價等多個維度為考試提供了綜合性解決方案,對于進一步提升教學質量和學生學習效果具有重要意義。通過教學管理平臺,教育行政部門、學校管理者、教研員、一線教師等教育教學行政主體可以更精準、更客觀、更智能地實施教學、評價和管理,避免憑感覺、拍腦袋進行教學決策和考試后效觀測。在人工智能和大數據時代,要切實加強互聯網智能教學管理平臺的使用。這也符合“雙減”政策精神和《義務教育課程標準(2022年版)》的題中之意。