郭晨潔 石蘊玉 黃澤鈺 徐錦浩



摘要:隨著國家素質教育的改革,上海市開展了寫字等級考試,有助于檢測學生的書寫水平。隨著參與考試的中小學生人數逐漸增多,為更好地解決人力資源消耗較大,花費時間較長等一系列問題,設計和開發了寫字等級考試自動評閱軟件。該軟件基于python環境開發,并運用了TensorFlow等技術,用戶可進行注冊或登錄個人信息,上傳試卷圖片,軟件自動進行評閱并打分,隨后產生分數記錄和建議,可以方便教師對寫字考試的閱卷工作,也可用于學生對寫字水平的自測。
關鍵詞:OCR;自動閱卷;成績查詢;MySQL;TensorFlow;pyqt5
中圖分類號:TP311? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)10-0081-02
1 引言
當今社會,越來越注重學生素質能力的培養,國家也對此投入改革,對九年義務教育的中小學生的書寫能力有了新要求,上海市規定義務教育階段在籍的五年級和九年級學生(不含民辦隨遷子女小學、珠峰中學、成佳學校)均需參加寫字等級考試。該考試性質為學業水平考試,成績將計入《上海市學生成長記錄冊》,非常重要。隨著參與學生的人數增多,考試越來越受學生家長的重視,對于教師評閱打分的要求逐步攀升,但閱卷的工作效率并不夠高效,人力花費較大,教師工作壓力大導致易出現評閱錯誤等各類問題也隨之出現。導致出現問題的原因在于評閱過程的相對煩瑣和對高效的要求提升。因此,如果把整個過程信息化、流程化、規范化地轉移到計算機軟件上,適應互聯網時代的潮流趨勢,使用軟件進行自動評閱以此輔助教師閱卷,將會大大提高評分閱卷的工作效率,節省不少人力和時間。
2 軟件分析
通過需求調研與分析,對軟件的實際需求有更進一步的了解,可以得出軟件實際使用的用戶角色主要為教師與學生,軟件所需要的主要為用戶管理、作品圖片評閱打分、錯誤指導以及成績查詢四個功能。
3 軟件設計
3.1 軟件功能分析及設計原則
根據調研階段對軟件的分析,可初步確定軟件的功能設計。再進一步結合自己的設計原則,即可明確軟件的重點研發方向與主要設計目標,分析與設計原則在此一一說明。
3.1.1 評分模型正確率足夠高
只有單個文字圖片的評分正確率足夠高,才可以保障軟件最后的評分效果。因此使用TensorFlow2.0訓練評分模型,另一方面,搜集了考試范圍內所有可能出現文字的標準范例圖片作為數據集中的訓練集部分。
3.1.2 錯誤指導報表清晰明確
為了錯誤顯示足夠清晰明確,采用EXCEL表格的形式進行可視化展示。
3.1.3 成績的快速精確查詢
用戶的歷史成績均存儲在軟件內部的數據庫中,成績的查詢即是對數據庫的查詢[2]。查詢快速精確的關鍵在于數據庫索引的創建,創建高效的索引是數據庫的設計原則。
3.2 軟件架構設計
軟件架構[3]分為數據讀取、數據處理以及數據顯示三個層面。數據讀取:用戶登錄賬號后上傳作品圖片到一個由軟件指定的文件夾暫存。數據處理:對文件夾中暫存的圖片使用OCR識別[4]進行提取文字,導出到指定文本文檔里,作為第一道檢測并打分。實現對圖片的處理及分割,并將分割后的圖片導入到指定文件夾。收集標準樣本并整合出一個數據集,用機器學習[5]的方式從義務教育課本搜集數據集作為標準進行訓練。通過TensorFlow訓練模型對單個文字作品打分。根據詳細的占分權重進行最終的評分,導出分數到EXCEL表格并給出錯誤提示。軟件架構如圖1所示。
3.3 軟件功能模塊設計
寫字考試自動評閱軟件使用PYTHON作為開發平臺,根據功能的不同將系統分為用戶管理、數據導入、評閱打分以及數據顯示四個模塊。軟件功能模塊結構圖如圖2所示。
3.3.1 用戶管理模塊
學生教師登錄或注冊賬號。實現用戶登錄注冊,運行環境:Python:3.6.5、MySQL[6]:5.7、PyMySQL:0.9.3。數據庫表:user表,存放用戶名和密碼、user _locked表:存放被鎖定的用戶名。
3.3.2 數據導入模塊
方式:本地選擇圖片路徑上傳。
3.3.3 評閱打分模塊
結合傳統技術與深度學習技術,以字和篇章作為評分維度。OCR識別的為第一道檢測,與數據集匹配對單個字的圖片評分為第二道檢測,以此為基礎進行評分。
3.3.4 數據顯示模塊
顯示并記錄分數歷史數據,提供糾錯建議。
4 軟件功能實現
4.1 用戶管理模塊的實現
首次使用此軟件,可點擊注冊鍵,進入注冊界面后即可填寫注冊賬號(推薦使用手機號)與注冊密碼,點擊確定鍵即注冊完成。注冊完成后的用戶在登錄界面使用賬號密碼進行登錄。
4.2 數據導入模塊的功能實現
軟件登錄成功后進入到數據導入界面,點擊“上傳作品”鍵瀏覽并添加電腦任意文件,選擇要添加的圖片。
4.3 評閱打分模塊的實現
前面兩個模塊已為評閱打分模塊做好了前期準備,只需點擊“開始評分”鍵軟件即可按照“登錄->選擇毛筆/硬筆->上傳圖片->灰度化處理->OCR識別->文字匹配->第一次扣分->圖片分割->TensorFlow評分->二次扣分->導出結果”這一流程自動進行評分,評分完成前無需與用戶進行交互。
4.4 數據顯示模塊的實現
軟件記錄各個用戶的歷史評分成績并存儲在數據庫中,方便后續滿足用戶查詢歷史成績這一功能需求。在每次評分完成后也會顯示詳細的失分情況。成績展示如圖3所示。
5 結束語
此軟件開發[7]完成后,一方面有效地改善由于人工評閱工作效率較低,主觀因素影響較大等因素對寫字等級考試學生成績的干擾。自動閱卷[8]大大減少了教師的工作量,可以使教師有效的利用時間,提高教師的工作效率。另一方面使學生日常練習寫字時有一個良好的成績評測軟件,有利于發現錯誤,有效地進步。軟件記錄歷史寫字作品成績這一功能,更是使學生的成績變化更加的可視化。加強數據庫檢索功能及配置的優化是后續開發維護過程中主要對象,以此來實現軟件更完備的檢索功能。本軟件實際應用價值高,切實解決一系列問題,因此推廣的必要性較高。
參考文獻:
[1] 陳芳.義務教育階段寫字等級考試的上海實踐與思考[J].上海課程教學研究,2020(6):36-41.
[2] 馮麗敏,楊艷,鐘穎莉.基于相關查詢的關鍵字搜索優化技術[J].計算機研究與發展,2013,50(S1):272-280.
[3] 呂向東,姜國華,王懷江.一種列控運行數據智能診斷系統的軟件架構設計[J].鐵路通信信號工程技術,2020,17(10):7-10,18.
[4] 唐子清,姚儉.基于深度學習的數字識別方法研究[J].軟件導刊,2020,19(9):228-232.
[5] 解京璐,馬媛,吳家鑫,等.基于深度學習的腐壞蘋果圖像識別系統的設計[J].南陽理工學院學報,2020,12(4):66-70.
[6] 劉倩倩.基于PHP和MySQL的網站設計與實現[J].中小企業管理與科技(下旬刊),2020(10):162-163.
[7] 周維,嚴小峰,鄒波.基于模型的BMS應用層軟件開發與測試[J].汽車零部件,2020(10):65-72.
[8] 彭上觀,鹿洪峰.可以積極穩妥地推進高考電腦閱卷——兼談對電腦閱卷的若干認識[J].教學與管理,2006(22):76-78.
【通聯編輯:代影】