伍 輝
(湖北開放大學,武漢 430074)
對于大規模考試而言,試卷的批改是一項非常繁瑣的工作,需要大量的人力和時間。考試閱卷方式經歷了從傳統的人工方式、光學字符識別(OCR)自動化閱卷、人工智能輔助閱卷等新興閱卷方式的變革。傳統的試卷批改方式主要依賴于人工,存在著效率低下、易出錯等問題。自動化閱卷是指使用光學字符識別(OCR)技術和計算機程序對答題卡進行掃描和分析,以實現快速、準確閱卷。自動化閱卷方式最早應用于選擇題閱卷,后來逐漸擴展到填空題和簡答題等其他類型的題目。自動化閱卷的優點是速度快、準確率高、成本低,但對于一些開放性問題如簡答、作文等,則存在一定的局限性。人工智能輔助閱卷是指將人工智能技術與人工閱卷相結合,以提高閱卷效率和準確率,通常可使用計算機視覺、自然語言處理(NLP)技術,對開放性問題進行自動分析和評估,然后再由人工閱卷員進行最終的評分。
目前,自動閱卷系統已經得到廣泛應用。一般自動閱卷系統通常是基于中心化的服務器架構,試卷數據需要通過網絡傳輸至服務器進行處理和評分。然而,這種架構存在著一些缺點,比如網絡延遲、帶寬瓶頸和數據安全等問題。近年來,隨著邊緣計算技術的發展,邊緣計算已經成為了解決這些問題的有效手段。本文提出了一種基于邊緣計算的智能閱卷系統,部署在邊緣節點實現試卷的采集、處理和評分,使用區塊鏈技術確保試卷數據的安全性和不可篡改性。
基于邊緣計算和區塊鏈技術的閱卷系統已有一些研究。例如,張育中[1]提出了一種基于計算機視覺的自動閱卷方法,蔚佳璇[2]對基于短文本相似度及通順度的中文自動閱卷技術進行了研究。張俊英[3]、李莉[4]認為區塊鏈技術憑借其安全、透明、不可篡改等特點,為考試誠信體系的建立、確保教育評價公平性和有效性,提供了可行的底層技術框架。騰訊公司胡益清[5]提出了一種采集圖像進行自動閱卷的方法。張娟[6]提出了基于區塊鏈的遠程教育考試系統。這些研究大多從考試閱卷的單一技術出發進行研究,而系統性進行設計和實現智能閱卷系統架構的研究很少。
邊緣計算是一種將計算和數據存儲靠近數據源頭的計算模式。與傳統的云計算架構不同,邊緣計算將計算和數據處理移動到離數據源頭更近的邊緣設備上,可以提高數據傳輸和處理的效率[7]。因此,將智能閱卷系統與邊緣計算相結合,可以提高系統的性能和效率。基于邊緣計算的智能閱卷系統采用了去中心化的架構,將計算和存儲資源分布在邊緣節點上,將數據處理和評分的任務盡可能地向邊緣推進,從而減少了數據傳輸的延遲和帶寬消耗。邊緣計算可以將智能閱卷系統部署在更接近用戶的地方,例如考場、學校或機構,提高了系統的響應速度和可用性,并減少了對云計算資源的依賴。此外,試卷數據的安全性和不可篡改性也是智能閱卷系統需要考慮的重要問題。區塊鏈技術是一種分布式的、去中心化的數據庫技術,采用智能合約、鏈式存儲結構和共識機制,具有不可篡改、安全可靠等特點,可以保證試卷數據的安全性和不可篡改性[8]。區塊鏈網絡最初被應用于數字貨幣領域,如比特幣,但現在已經擴展到了各種領域,如供應鏈管理、物聯網、醫療保健和版權管理等。
基于邊緣計算的智能閱卷系統整體分為云、邊、端3部分,其中云為區塊鏈網絡、邊包括邊緣節點部署智能閱卷系統、端主要是圖像采集端。系統架構如圖1所示。
圖1 系統架構圖
在本文提出的智能閱卷系統中,云是由一系列區塊鏈節點組成的去中心化的區塊鏈網絡,由許多計算機節點組成,在這些節點之間共享和維護一個共同的賬本。每個節點都有權參與到賬本的維護和更新中,而且所有節點都必須達成共識才能進行交易確認和賬本更新,因此區塊鏈網絡具有高度的安全性和可信度。區塊鏈網絡的核心特點是使用了加密算法和共識機制來保障數據的安全性和可靠性。每一個區塊都包含了前一個區塊的哈希值,這樣就形成了一個不可篡改的區塊鏈。由于區塊鏈網絡沒有中心化的控制機構,因此可以避免單點故障和篡改風險,從而保證了數據的安全性和可信度。試卷數據通過區塊鏈存儲,可以保證試卷數據的安全性和不可篡改性[5]。試卷數據存儲在區塊鏈上的每個區塊中,每個區塊包含一個或多個交易,每個交易包含試卷數據和交易簽名等信息。本系統區塊鏈網絡采用了私有鏈(Private Blockchain)的方式。私有鏈是一種基于區塊鏈技術的封閉式網絡,只有特定的組織或個人能夠參與其中,而且這些參與者需要經過身份驗證才能加入網絡。私有鏈的數據和交易信息只能被授權的參與者讀取和驗證。
邊即邊緣節點是指位于網絡邊緣的計算設備。本智能閱卷系統中,邊緣節點主要用于存儲試卷數據和實現試卷的分發和處理。目前流行的邊緣計算設備有很多,以下是一些常見的邊緣設備。
Raspberry Pi:一種低成本的單板計算機,主要用于教育和娛樂等領域。
NVIDIA Jetson:一種高性能的嵌入式計算平臺,主要用于深度學習和人工智能等領域。
Intel Movidius:一種基于神經網絡的邊緣計算設備,可以在邊緣設備上進行深度學習和人工智能的計算。
Qualcomm Snapdragon:一種基于ARM 架構的處理器,主要用于移動設備和邊緣計算領域。
Atlas 200DK:是華為公司推出的一款AI 開發者套件[9],它基于華為自研的昇騰系列AI 邊緣計算芯片,華為Atlas 200DK 搭載了2 顆昇騰310 AI 芯片,每顆芯片包含16 個Da Vinci 核心,總計32 個Da Vinci 核心。這些核心可以并行計算,提供高達256TOPS 的計算能力,可以支持各種復雜的邊緣計算和人工智能應用。Atlas 200DK 配備了8 GB 的LPDDR4 內存和16 GB 的eMMC 存儲,可以滿足較大規模的AI 模型和數據的存儲需求。
考慮性能、價格及開發的便利性,本系統采用了華為Atlas 200DK 作為邊緣計算設備。使用Mind Studio、ModelArts 模型訓練平臺作為開發工具,可以快速搭建和部署圖像識別、自然語言處理技術的人工智能應用。
圖8的方案鏈長與平均得分顯示出大致的線性關系,表明持續的修改會使方案質量得到提高,但修改行為不一定是在同一個設計師手里完成的。
華為Atlas 200DK 提供了豐富的接口和擴展性,包括1 個高速USB 3.0 接口、1 個千兆以太網口、1 個HDMI 接口、1 個MIPI CSI 接口、1 個MIPI DSI 接口和1 個mini-PCIe 接口等。這些接口可以連接各種外部設備和傳感器,擴展華為Atlas 200DK 的功能和應用場景。本系統選用采用Raspberry Camera V2 攝像頭行試卷圖像的采集。該攝像頭可以通過FFC 排線或網線連接到Atlas 200 DK 上,800 萬像素,最高幀率可達60 fps,可滿足實時采集試卷圖像的需求[10]。
智能閱卷系統是指部署在邊緣節點上的負責閱卷的程序。當試卷數據將被上傳到邊緣節點上的智能閱卷系統上。智能閱卷系統將試卷數據進行解析,提取出試卷的答案等信息,并進行自動評分。評分結果將被存儲在區塊鏈上,并最終生成成績單。
部署在邊緣節點的智能閱卷系統核心部分是利用圖像處理與識別的技術進行答題卡采集,對客觀題部分自動判分,對主觀題部分智能通過自然語言處理和語義分析算法自動進行分析和評分。主要工作流程如圖2 所示。
圖2 智能閱卷系統工作流程
使用圖像采集端對答題卡進行圖像采集,獲取高清晰度、高對比度的答題卡圖像。為了減少干擾和提高識別率,應該避免拍攝角度過大、光線不足等情況,本系統采用專利授權的一種3D 圖像識別裝置進行采集[11]。
對采集到的答題卡圖像進行預處理,包括圖像校正、去噪、圖像增強及切割等處理,以提高后續的答案識別準確率。將答題卡中的各個選項區域進行切割,主觀題部分轉換為文字,方便后續的分析和判斷。
根據答題卡的設計和規則,可以對試卷的文本和圖像信息進行處理和分析,對客觀題部分使用圖像識別技術,進行正確答案的匹配。客觀題判分樣例如圖3 所示。
對于主觀題部分,先利用光學字符識別技術,將圖像中的答案轉換成可處理的文本格式。對于開放性問題的答案,需要進行自然語言處理和語義分析,將答案轉換成可處理的結構化數據。這一步通常包括分詞、情感分析、主題提取等操作。
數據采集:收集試卷的相關信息,包括試題、答案和評分標準等。
數據清洗和預處理:對采集到的數據進行清洗和預處理,包括去除無用信息、標準化數據格式、去除噪聲等。
特征提取:對試題進行特征提取,提取問題的關鍵詞、主題、語法結構等信息,以便后續的分析和評估。
模型訓練:使用自然語言處理算法建立模型,并使用訓練數據對模型進行訓練。可以使用文本分類、文本相似度計算、情感分析等模型。
模型評估:使用測試數據對模型進行評估。可以使用準確率、召回率、F1 值等指標進行評估。
部署應用:將訓練好的模型部署到實際應用中,將答卷內容進行分詞、去除停用詞等預處理操作,對試卷的開放性問題進行自動分析和評估。
對識別和判分結果進行反饋和優化。反饋可以包括學生的答題情況、評分結果的準確性等信息,可以用于提高模型的準確性。優化可以包括模型調整、特征選擇、數據增強等方法,以進一步提高系統性能。
基于邊緣計算和區塊鏈技術的智能閱卷系統采用了邊緣計算、區塊鏈和圖像識別、自然語言處理等技術,能夠實現試卷數據的安全存儲、自動評分和成績單生成等功能。實驗結果表明,該系統可以快速地對大量的答卷進行評分,具有較高的性能,同時可以減少主觀性對評分的影響,提高評分的公正性和客觀性,也具備較高的安全性。基于邊緣計算的智能閱卷系統是一個具有潛力的方向,可以為大規模考試提供更快速、更可靠和更安全的閱卷服務。未來,隨著邊緣計算技術的不斷發展和普及,基于邊緣計算的智能閱卷系統將會得到更廣泛的應用和推廣。同時,我們還需要在處理能力、網絡連接、數據同步和隱私保護等方面進行更深入的研究和探索,以更好地滿足用戶的需求和保障數據的安全性和隱私性。