一種答題卡客觀題識(shí)別算法

2019-11-13 07:12:18要曙麗王少榮

圖學(xué)學(xué)報(bào) 2019年5期

要曙麗，王少榮,2，蓋孟，王震

一種答題卡客觀題識(shí)別算法

要曙麗1，王少榮1,2，蓋孟2,3，王震4

(1. 北京林業(yè)大學(xué)信息學(xué)院，北京 100083；2. 北京市虛擬仿真與可視化工程技術(shù)研究中心，北京 100871；3. 北京大學(xué)信息科學(xué)技術(shù)學(xué)院，北京 100871；4. 沈陽(yáng)理工大學(xué)藝術(shù)設(shè)計(jì)學(xué)院，遼寧沈陽(yáng) 110159)

在保證閱卷質(zhì)量的前提下，網(wǎng)上閱卷系統(tǒng)不僅極大地減少了教師的工作量，而且降低了對(duì)試卷紙張質(zhì)量的要求，節(jié)約能源。但是，網(wǎng)上閱卷系統(tǒng)中的客觀題識(shí)別效果對(duì)答題卡圖像質(zhì)量和排版有很強(qiáng)的依賴。為此，提出一種魯棒的客觀題識(shí)別算法。首先，考慮到用戶填涂時(shí)可能偏離填涂區(qū)域，或者用戶圖像和模板圖像位置匹配出現(xiàn)的誤差，提出了滑動(dòng)窗口策略重新定位實(shí)際的填涂區(qū)域，消除相關(guān)的偏差。然后，通過(guò)分析各選項(xiàng)的直方圖，并引入加權(quán)平均灰度消除單個(gè)選項(xiàng)中填涂不均勻的影響。對(duì)同一題下的每個(gè)選項(xiàng)進(jìn)行比較，使得識(shí)別算法有很強(qiáng)的局部適應(yīng)性，克服使用全局識(shí)別策略帶來(lái)的參數(shù)選擇困難。實(shí)驗(yàn)結(jié)果表明，該算法兼容性好，可以適用于不同排版類型的答題卡客觀題識(shí)別，魯棒性強(qiáng)，識(shí)別精度高，適用于各種掃描質(zhì)量和不同填涂質(zhì)量的答題卡。

網(wǎng)上閱卷系統(tǒng)；客觀題識(shí)別算法；滑動(dòng)窗口；加權(quán)平均灰度

傳統(tǒng)的手工閱卷方式成本高、效率低且閱卷誤差大，網(wǎng)上閱卷方式不僅快速準(zhǔn)確，而且可以方便地記錄和匯總考生數(shù)據(jù)[1]。客觀題識(shí)別算法是網(wǎng)上閱卷系統(tǒng)的核心算法之一。大部分的網(wǎng)上閱卷系統(tǒng)對(duì)答題卡圖像質(zhì)量等有嚴(yán)格要求[2]；當(dāng)答題卡圖像噪聲較多，或者存在填涂不均勻、擦除不干凈等情況時(shí)，其識(shí)別算法的正確率會(huì)大大降低。劉志方[3]將系統(tǒng)通過(guò)設(shè)置同步頭等方法輔助識(shí)別，但對(duì)答題卡的排版有嚴(yán)格的要求。

為了解決以上問(wèn)題，本文提出一種魯棒的客觀題識(shí)別算法。考慮到用戶填涂時(shí)可能偏離填涂區(qū)域，或者用戶圖像和模板圖像位置匹配出現(xiàn)的誤差，滑動(dòng)窗口算法的策略重新定位考生的填涂區(qū)域，消除相關(guān)的偏差。在識(shí)別過(guò)程中，已有算法往往通過(guò)計(jì)算填涂比例來(lái)進(jìn)行判別，通過(guò)分析選項(xiàng)區(qū)域的直方圖，并引入加權(quán)平均灰度，以消除單個(gè)選項(xiàng)中填涂不均勻的影響。對(duì)同一題下的每個(gè)選項(xiàng)進(jìn)行比較，使得該算法有很強(qiáng)的局部適應(yīng)性，克服使用全局識(shí)別策略帶來(lái)的參數(shù)選擇困難。

本文算法具備以下優(yōu)點(diǎn)：①兼容性好，可以適用于不同排版類型的答題卡客觀題識(shí)別。②識(shí)別準(zhǔn)確率高，魯棒性好，適用于各種掃描質(zhì)量和不同填涂質(zhì)量的答題卡。

1 相關(guān)工作

本文將制作模板的答題卡圖像定義為模板圖像，將需要識(shí)別的考生填涂的答題卡圖像稱為用戶圖像。

答題卡客觀題的識(shí)別流程主要包括答題卡格式描述文件的載入、用戶圖像矯正、填涂識(shí)別等。

1.1 答題卡格式描述文件的制作

制作答題卡格式描述文件需要用戶手動(dòng)設(shè)置答題卡信息。文獻(xiàn)[3]需要用戶手動(dòng)標(biāo)定答題卡的定位信息和填涂信息，用戶通過(guò)鼠標(biāo)左鍵點(diǎn)擊和拖曳實(shí)現(xiàn)框選區(qū)域的功能。阮少林[4]制作答題卡模板時(shí)，首先將卡片上所有的填涂區(qū)域全部填涂，然后掃描輸入，對(duì)輸入圖像進(jìn)行預(yù)處理，提取所有的目標(biāo)點(diǎn)；手動(dòng)分類劃分題組。

1.2 用戶圖像的矯正

圖像矯正操作是答題卡正確識(shí)別的前提。文獻(xiàn)[3]基于圖像的偏轉(zhuǎn)角度進(jìn)行糾偏，首先計(jì)算偏轉(zhuǎn)量，然后矯正圖像。吳軍[5]介紹了基于圖像傾斜角的矯正算法，提出了全新的邊界特征點(diǎn)檢測(cè)算法和邊界傾斜角度故計(jì)算法。白士御[6]提出了一種基于連通域分析和Hough變換的傾斜校正方法，通過(guò)連通域分析預(yù)估傾角，以較長(zhǎng)的連通域?yàn)橐罁?jù)劃分出文本區(qū)域，結(jié)合經(jīng)邊緣檢測(cè)處理后的版面區(qū)域，以不同角度步長(zhǎng)分別進(jìn)行Hough變換，得到最終精確的傾角。在已有模板圖像的信息，文獻(xiàn)[3]取用戶圖像中3個(gè)定位塊的中心坐標(biāo)和模板中對(duì)應(yīng)區(qū)域的中心位置求其坐標(biāo)變換矩陣，然后對(duì)用戶圖像進(jìn)行幾何變換來(lái)進(jìn)行矯正。

1.3 填涂區(qū)域的判斷

判斷考生選擇結(jié)果有2種方式：判斷填涂點(diǎn)和判斷考生手寫的英文字符。對(duì)于不同的填涂點(diǎn)識(shí)別算法，填涂率都是判斷某區(qū)域是否填涂的重要指標(biāo)。文獻(xiàn)[4]通過(guò)給定一個(gè)閾值，計(jì)算二值圖像中某區(qū)域中黑色像素的數(shù)量與該區(qū)域面積的比值，通過(guò)比較該值和閾值來(lái)判斷是否填涂。相對(duì)于僅依靠圖像的灰度信息或填涂面積等單一信息進(jìn)行判斷的算法，文獻(xiàn)[3]提出了基于圖像綜合特征的填涂點(diǎn)識(shí)別算法。先對(duì)圖像進(jìn)行灰度級(jí)形態(tài)學(xué)和自適應(yīng)二值化等預(yù)處理操作以后，然后去除圖像中干擾輪廓，再根據(jù)選項(xiàng)的平均灰度、灰度和、填涂面積和方差等信息計(jì)算出評(píng)價(jià)指標(biāo)，最后再根據(jù)評(píng)價(jià)指標(biāo)進(jìn)行填涂結(jié)果的判斷。識(shí)別手寫字符方法的一般流程為：首先定位答題區(qū)域，然后利用神經(jīng)網(wǎng)絡(luò)分類器識(shí)別英文字符。SIMONYAN和ZISSERMAN[7]提出VGG卷積神經(jīng)網(wǎng)絡(luò)，更精確地完成圖像分類工作。SZEGEDY等[8]提出一個(gè)22層深的網(wǎng)絡(luò)GoogLeNet，提高了網(wǎng)絡(luò)識(shí)別率。HE等[9]提出了深度為VGG網(wǎng)絡(luò)的8倍，但仍然具有較低的復(fù)雜度的ResNet。本文通過(guò)識(shí)別填涂點(diǎn)完成選項(xiàng)判斷工作。

2 算法概要

本文使用的答題卡格式描述文件通過(guò)用戶交互制作而成。答題卡格式描述文件主要包括定位塊的位置信息和客觀題組織結(jié)構(gòu)的信息。

圖1為答題卡識(shí)別流程，首先載入答題卡格式描述文件，自動(dòng)識(shí)別輸入的用戶圖像。算法同時(shí)接收一張答題卡的正、反面2張圖像作為輸入，在閱卷之前，首先判斷用戶圖像的正反面，同時(shí)調(diào)整圖像的上下方向；然后根據(jù)定位塊信息完成矯正操作，最后根據(jù)答題卡格式描述文件中的客觀題區(qū)域進(jìn)行填涂識(shí)別，輸出判斷結(jié)果。

圖1 答題卡識(shí)別流程

3 答題卡識(shí)別

答題卡識(shí)別時(shí)，根據(jù)制作好的答題卡格式描述文件對(duì)用戶圖像的對(duì)應(yīng)區(qū)域進(jìn)行識(shí)別。一組用戶圖像包括一張答題卡的正、反面2張圖像，由于人工因素和掃描儀設(shè)置，這2張圖像的正反順序和上下方向都可能出現(xiàn)錯(cuò)誤。因此，輸入2張圖像后，首先需要完成正反面和上下方向的判斷，然后根據(jù)定位塊信息進(jìn)行矯正，完成客觀題判斷。

3.1 答題卡格式描述文件

答題卡格式描述文件的制作是答題卡客觀題識(shí)別的首要問(wèn)題[3]，主要通過(guò)用戶交互編輯完成。

圖2為答題卡格式描述文件的部分信息。其中紫色矩形框區(qū)域?yàn)闃?biāo)題，標(biāo)題只出現(xiàn)一次，且位于答題卡第一頁(yè)，因此本文使用標(biāo)題完成答題卡正反面判斷；紅色矩形框?yàn)槎ㄎ粔K，用于用戶圖像矯正；藍(lán)色矩形框?yàn)轭}號(hào)，綠色矩形框?yàn)檫x項(xiàng)，黃色矩形框?yàn)榭陀^題的一道小題，包含題號(hào)和選項(xiàng)。

圖2 答題卡格式描述文件的部分信息

3.2 正反面判別

如圖2所示，比較標(biāo)題區(qū)域與其他區(qū)域的字號(hào)，標(biāo)題區(qū)域的字號(hào)明顯相對(duì)較大，故可通過(guò)檢測(cè)標(biāo)題完成答題卡正反面的判斷，同時(shí)調(diào)整用戶圖像的方向。答題卡格式描述文件中保存有模板圖像的長(zhǎng)寬信息和標(biāo)題矩形r。標(biāo)題檢測(cè)算法如下：

(1) 將當(dāng)前圖像旋轉(zhuǎn)調(diào)整到與模板圖像具有相同的長(zhǎng)寬比，在模板圖像上截取矩形r：將矩形r的坐標(biāo)往左右各擴(kuò)張個(gè)像素的長(zhǎng)度，往上下各擴(kuò)張個(gè)像素的長(zhǎng)度(=50，=30)。

(2) 截取r區(qū)域圖像，首先進(jìn)行二值化和反相操作，然后檢索輪廓，計(jì)算輪廓的包圍盒并將包圍盒從左到右排序。自左側(cè)的包圍盒開(kāi)始，當(dāng)2個(gè)包圍盒的距離不超過(guò)閾值時(shí)，合并包圍盒；最終，在方向形成一個(gè)矩形r圖3(a)中藍(lán)色矩形框?yàn)楦鱾€(gè)輪廓的包圍盒，紅色矩形框?yàn)?i>r。

(3) 圖3(b)中紅色矩形框即為上述的r。由于噪聲影響，紅框所示的r與r形態(tài)差距較大。因此，當(dāng)r.h/r.h≥時(shí)，重新計(jì)算r.b：將包圍盒的下邊界由低到高排序，計(jì)算隊(duì)列中從1/3到2/3的平均值作為r.b。結(jié)果如圖3(c)所示。

(a) 輪廓包圍盒和初始的r檢測(cè)結(jié)果圖

(b) 存在噪聲的r檢測(cè)結(jié)果圖

輸入一張答題卡的正反面2張圖像，存在4種可能的組合，計(jì)算每種組合下的r，存入隊(duì)列l。通過(guò)綜合比較r和r的屬性，將與r相似度最高的r所在組合作為正確結(jié)果。相似度計(jì)算過(guò)程如下：

(1) 基于矩形圖像的特征，需計(jì)算2個(gè)圖像的高度、寬度、位置偏差和灰度均值的差值，分別用d，d，d，d表示，即

其中，g為圖像的平均灰度。

(2) 定義式(6)的相似度函數(shù)，w(=0,1,2,3)是平衡條件(1)中多個(gè)度量的權(quán)重。也就是選擇值最小的r作為用戶圖像的標(biāo)題區(qū)域，即

其中，和分別為用戶答題卡上點(diǎn)的和坐標(biāo)；(，)為圖像在點(diǎn)的像素值；，，，分別為矩形的左、右、上、下邊界。

3.3 圖像矯正

3.3.1 定位塊的尋找

答題卡格式描述文件中保存了多個(gè)定位塊b(=1,···,)，設(shè)r為每個(gè)定位塊的最小外接圓半徑。在用戶圖像中，在以b的中心為中心，r+(=50)為半徑的圓形區(qū)域中提取對(duì)應(yīng)的定位塊。將該區(qū)域內(nèi)符合條件的所有定位塊都?jí)喝攵ㄎ粔K候選隊(duì)列l。本文結(jié)合輪廓檢測(cè)和區(qū)域檢測(cè)2種途徑提取定位塊，具體步驟如下：

步驟1.采用文獻(xiàn)[3]提出的定位塊識(shí)別算法：對(duì)上述區(qū)域圖像執(zhí)行二值化和形態(tài)學(xué)操作，然后進(jìn)行輪廓查找，判斷輪廓是否為矩形，如果符合條件，則將其存入l。

步驟2. 對(duì)于圖4所示的用戶圖像的定位塊灰度不均勻或與其他元素粘連，無(wú)法獲取其完整輪廓的情況，步驟1無(wú)法處理。因此，本文繼續(xù)執(zhí)行模板匹配算法在該圓形區(qū)域上尋找與定位塊圖像最相似的區(qū)域，將該區(qū)域的矩形數(shù)據(jù)壓入l。

通過(guò)以上2個(gè)步驟之后，可尋找該區(qū)域上所有可能的定位塊。

(a) 標(biāo)定塊不均勻情況

(b) 標(biāo)定塊與其他元素粘連情況

圖4 特殊定位塊圖像

3.3.2 定位塊的匹配及選擇

每個(gè)定位塊b均得到候選列表l，因此可能存在多種組合。在執(zhí)行矯正操作之前，需要對(duì)模板中的每個(gè)定位塊從用戶圖像中選擇相應(yīng)的定位塊進(jìn)行匹配，定位塊匹配算法流程如下：

(1)l長(zhǎng)度為1的b存在唯一確定的組合，將匹配結(jié)果保存到集合；

(2) 對(duì)剩余的候選列表大于1的定位塊：對(duì)于中的每一個(gè)元素，計(jì)算定位塊相對(duì)于模板定位塊在和方向的平均偏移值。將當(dāng)前定位塊的位置減去偏移值得到其應(yīng)該存在的位置，從候選列表中選擇與該位置最接近的定位塊作為匹配結(jié)果；

(3) 如果初始時(shí)不存在唯一匹配的情況，每個(gè)b選擇與其最接近的定位塊作為正確匹配。

算法得到集合之后，如果集合的長(zhǎng)度大于3，如圖5所示，需要從中選取不在同一直線上的3組定位塊。

圖5 4個(gè)定位塊的答題卡圖像

部分答題卡的定位塊個(gè)數(shù)存在小于3的情況，或者，由于印刷原因，定位塊被遺漏或者濃度很低，實(shí)際用于矯正的定位塊數(shù)量會(huì)少于3個(gè)。因此，本文根據(jù)集合的長(zhǎng)度選擇不同的矯正算法。

3.3.3 圖像矯正

本文根據(jù)對(duì)答題卡圖像執(zhí)行矯正操作進(jìn)行討論：

(1) 當(dāng)=3時(shí)，本文采取仿射變換方法來(lái)實(shí)現(xiàn)圖像矯正[3,10]。

(2) 當(dāng)=2時(shí)，假設(shè)模板和用戶圖像之間的變換只包含縮放和平移，即

根據(jù)式(7)，利用最小二乘法，解線性方程組，即

在得到，t和t的值之后，構(gòu)造轉(zhuǎn)換矩陣，將當(dāng)前的用戶答題卡圖像轉(zhuǎn)換成矩陣與轉(zhuǎn)換矩陣相乘，則可以得到矯正之后的圖像。

(3) 當(dāng)=1時(shí)，可以假設(shè)模板和用戶圖像之間只包含平移變換，即

其中，和分別為用戶答題卡上點(diǎn)的和坐標(biāo)；和分別為模板答題卡上對(duì)應(yīng)點(diǎn)的和坐標(biāo)；為和方向的伸縮量；t和t分別為點(diǎn)在和方向的平移量；、分別為和方向的偏移量。

3.4 客觀題自動(dòng)識(shí)別

經(jīng)過(guò)矯正后的用戶圖像中的客觀題區(qū)域與模板圖像的基本一致，但依然可能存在一定偏差，因此首先采用滑動(dòng)窗口算法消除誤差，然后計(jì)算該區(qū)域圖像的灰度指標(biāo)，綜合判斷考生的填涂結(jié)果。

3.4.1 填涂區(qū)域定位

為了消除用戶圖像與模板圖像中選項(xiàng)的坐標(biāo)位置可能存在的偏差，本文提出一種消除偏移影響的滑動(dòng)窗口算法。滑動(dòng)窗口算法如下：

(1) 以答題卡格式描述文件中的選項(xiàng)位置作為初始窗口(圖6(a)中綠色矩形區(qū)域)，計(jì)算該窗口在和方向可移動(dòng)的最大距離，本文取值為相鄰選項(xiàng)之間相距最近的橫向距離和縱向距離。搜索窗口為(圖6(a)中藍(lán)色虛線框)。

(2) 如圖6(a)所示，初始窗口首先在方向上移動(dòng)，尋找灰度總和最小的區(qū)域，作為下一步檢測(cè)的初始窗口，即棕色矩形框包圍區(qū)域。

(3) 如圖6(b)所示，控制尋找到的棕色窗口在方向上下移動(dòng)，尋找灰度總和最小的區(qū)域，定位到黃色矩形框所在位置。

(4) 計(jì)算圖6(c)中黃色窗口區(qū)域的平均像素值g，從窗口邊緣向內(nèi)進(jìn)行次(=2)收縮操作，若第層的像素平均值小于g，則停止收縮；直到=。4邊都停止收縮得到的窗口即為本文所求的實(shí)際填涂區(qū)域，也就是圖6(c)中紅色矩形框包圍的區(qū)域。

(a) 初始窗口

(b)方向移動(dòng)結(jié)果

結(jié)果如圖7所示，綠色矩形框?yàn)榇痤}卡格式描述文件上選項(xiàng)所對(duì)應(yīng)的參考位置，紅色矩形框?yàn)楸疚乃惴ǖ挠?jì)算結(jié)果。面對(duì)不同情況，本文提出的滑動(dòng)窗口算法都可以定位到考生實(shí)際的填涂區(qū)域。

圖7 填涂區(qū)域定位結(jié)果

3.4.2 填涂區(qū)域的簡(jiǎn)單灰度特征

選項(xiàng)是否被填涂主要由此區(qū)域內(nèi)數(shù)量最多的同類像素的灰度特征決定，由于考生填涂不均勻，所以本文統(tǒng)計(jì)選項(xiàng)的256色圖像的直方圖，計(jì)算圖像中像素聚集區(qū)間的灰度特征。

本文首先將修正的填涂區(qū)域灰度圖像分成個(gè)等級(jí)(=12)，統(tǒng)計(jì)各個(gè)等級(jí)內(nèi)的像素?cái)?shù)量。為了消除噪聲的影響，統(tǒng)計(jì)包含像素最多的灰度等級(jí)及其相鄰等級(jí)中的灰度總和g與像素個(gè)數(shù)g，計(jì)算像素平均值g=g/g。

圖8為一組截自用戶答題卡的4個(gè)選項(xiàng)，其屬于同一選擇題。圖9為圖8選項(xiàng)對(duì)應(yīng)的直方圖，圖中藍(lán)色豎線為g所在區(qū)間。其中橫軸代表灰度等級(jí)，縱軸代表像素?cái)?shù)量；圖中每個(gè)柱子的寬度為(=256/)，高度為該灰度等級(jí)內(nèi)像素?cái)?shù)量。選項(xiàng)A，C，D都為未填涂的選項(xiàng)，直方圖集中在230~255像素區(qū)間內(nèi)；選項(xiàng)B為填涂項(xiàng)，像素主要分布在60~80區(qū)間。

圖8 選項(xiàng)樣例

圖9 統(tǒng)計(jì)直方圖

3.4.3 填涂區(qū)域的加權(quán)灰度特征

由于考生具有不同的填涂習(xí)慣，因此被填涂區(qū)域的g處于跨度較大的灰度區(qū)間，如圖10所示。因此，如果把g作為選項(xiàng)是否被填涂的度量，則當(dāng)選項(xiàng)滿足條件g≤(≥185)，則認(rèn)為該選項(xiàng)被填涂。但是，圖11中已經(jīng)被擦除的選項(xiàng)B的g<185，此種情況下此度量難以完成正確的判斷。

圖10 考生填涂的原圖像和選項(xiàng)gm的可視化

(a) 考生擦除選項(xiàng)B (b) 選項(xiàng)gm的可視化

同時(shí)，上述算法計(jì)算得到的g值可能比考生實(shí)際填涂的灰度值低很多，因而不能反映選項(xiàng)的填涂情況，如圖10(a)的A選項(xiàng)，視覺(jué)判斷其g不能表示經(jīng)過(guò)用戶填涂的A選項(xiàng)。

因此，本文引入新的選項(xiàng)填涂識(shí)別度量：帶權(quán)重的灰度均值g和帶權(quán)重的前景比例r。

具體的計(jì)算過(guò)程如下：

(1) 對(duì)選項(xiàng)區(qū)域進(jìn)行二值化操作，搜索輪廓，將輪廓包圍的像素面積小于等于的區(qū)域中的所有像素的像素值的灰度降低(=3)，此步驟填補(bǔ)用戶填涂不均勻?qū)е碌目障丁⑻畛浜蟮亩祱D像的黑色像素的比例作為前景比例r，白色像素的比例作為背景比例r。

圖12為圖8各個(gè)選項(xiàng)r可視化的圖像，圖13為圖8各個(gè)選項(xiàng)r可視化的圖像。

圖12 選項(xiàng)rf的可視化圖像

圖13 選項(xiàng)rb的可視化圖像

(2) 根據(jù)圖像的灰度值，采用分段線性的方式計(jì)算選項(xiàng)中各個(gè)像素的權(quán)重，即

(3) 根據(jù)，計(jì)算選項(xiàng)的g，即

其中，和分別為用戶答題卡上點(diǎn)的和坐標(biāo)；(，)為圖像在點(diǎn)的像素值；為圖像的寬度；為圖像的高度。

(4) 統(tǒng)計(jì)選項(xiàng)區(qū)域內(nèi)像素值小于g的像素所占比例，此值為r。

圖14為圖8各個(gè)選項(xiàng)r可視化的圖像，圖15為圖8各個(gè)選項(xiàng)g可視化的圖像。

圖14 選項(xiàng)rwf的可視化圖像

圖15 選項(xiàng)gwm的可視化圖像

結(jié)果如圖16所示，可以明顯觀察到圖16(b)中4個(gè)選項(xiàng)的灰度與圖10(a)中原圖像的4個(gè)選項(xiàng)的灰度相近；而r又體現(xiàn)了填涂區(qū)域和未填涂區(qū)域的前景比例的差別。

(a) 選項(xiàng)r的可視化

(b) 選項(xiàng)g的可視化

圖16 圖10中(a)組的參數(shù)信息

3.3.4 填涂結(jié)果判定

設(shè)客觀題題目個(gè)數(shù)為n。對(duì)客觀題的選項(xiàng)完成上述操作之后，將所有選項(xiàng)按照g從小到大排序，將前n個(gè)選項(xiàng)作為統(tǒng)計(jì)數(shù)據(jù)，計(jì)算其平均灰度作為圖像的前景值g。

若g大于等于某個(gè)給定閾值(本文取240)，即整體選項(xiàng)的前景像素接近255，那么將所有選項(xiàng)都判定為未填涂。

在判斷填涂結(jié)果時(shí)，本文以一個(gè)小題為單位，橫向比較該題目下的所有選項(xiàng)以判斷考生的填涂結(jié)果。算法如下：

算法1.將此題目中的每個(gè)選項(xiàng)逐個(gè)判斷，當(dāng)選項(xiàng)的r≥0，直接認(rèn)為該選項(xiàng)未被填涂；當(dāng)r≥1，將該選項(xiàng)的識(shí)別標(biāo)記記作1。本文0=0.43，1=0.4。

算法2.將>0的選項(xiàng)根據(jù)g從小到大排序，去除序列中g>T0的選項(xiàng)，然后將第一個(gè)選項(xiàng)的r和g保存，分別用′和′表示。若選項(xiàng)滿足g–′≤D0且′–r≤D0或者′<r的條件，則將此選項(xiàng)視作填涂項(xiàng)。更新′為填涂項(xiàng)r的平均值。本文T0=180，D0=30，D0=0.12。

填涂判斷結(jié)果如圖17所示，矩形框選中的區(qū)域代表算法將此選項(xiàng)判定為填涂項(xiàng)。針對(duì)上述的用戶圖像，本文算法的識(shí)別結(jié)果全部正確。

(a) 填涂過(guò)淺的識(shí)別效果

(b) 填涂未滿的識(shí)別效果

(d) 涂擦不干凈的識(shí)別效果

(e) 填涂區(qū)域過(guò)大的識(shí)別效果

(f) 卷

(g) 卷面存在折痕干擾的識(shí)別效果

4 結(jié)果和討論

本文的測(cè)試圖片由四川生學(xué)教育科技有限公司提供，所用答題卡圖像均為考試實(shí)際掃描得到的圖像。

程序的運(yùn)行環(huán)境為：Windows10×64，Intel i7 8700，16 G RAM。對(duì)于分辨率為3105×2163的圖像，識(shí)別速度大約6張/秒。

本文在5套不同掃描質(zhì)量的答題卡圖像的數(shù)據(jù)集上測(cè)試系統(tǒng)的識(shí)別準(zhǔn)確率。測(cè)試數(shù)據(jù)集來(lái)自不同學(xué)校，使用不同掃描儀；包含紙張、印刷質(zhì)量、填涂質(zhì)量各不相同的答題卡。本文算法都能得到99.98%以上的識(shí)別率。表1為四川省三臺(tái)高中高二2018年9月的月考的各科目的答題卡識(shí)別結(jié)果統(tǒng)計(jì)。

表1 四川省綿陽(yáng)市三臺(tái)縣三臺(tái)高中高二2018年 9月月考的答題卡識(shí)別結(jié)果統(tǒng)計(jì)表

(注：PN為答題卡總數(shù)；TN為題目總數(shù)；PE為識(shí)別錯(cuò)誤的答題卡數(shù)目；TE為識(shí)別錯(cuò)誤的題目；PER為識(shí)別錯(cuò)誤的答題卡所占比例；TER為識(shí)別錯(cuò)誤的題目所在比例；Acc為識(shí)別正確率，即正確識(shí)別的答題卡比例)

db_1到db_5表示5次考試的數(shù)據(jù)集，分別為三臺(tái)高一2018年12月、三臺(tái)高二2018年12月、三臺(tái)高三2018年12月、綿陽(yáng)一診和三臺(tái)高三2019年2月考試產(chǎn)生的數(shù)據(jù)集。GS，LZF，LSQ，ZY，ZL表示文獻(xiàn)[2-3, 11-13]提出的答題卡自動(dòng)識(shí)別軟件。其中，LZF，GS和本文提出的識(shí)別算法都采用計(jì)算多個(gè)評(píng)價(jià)指標(biāo)綜合比較的方法；LSQ，ZY和ZL的識(shí)別算法都是通過(guò)比較選項(xiàng)內(nèi)黑色像素的數(shù)量和固定閾值的方法來(lái)判斷選項(xiàng)是否填涂，識(shí)別率很大程度上依賴于閾值的選取。因此，本文認(rèn)為綜合多個(gè)評(píng)價(jià)指標(biāo)的識(shí)別算法產(chǎn)生的結(jié)果可能更好。圖18為本文算法和上述2個(gè)系統(tǒng)的算法在5個(gè)數(shù)據(jù)集上各科目的平均識(shí)別率的曲線圖。其中，db_5的紙張印刷質(zhì)量比其他數(shù)據(jù)集差，所有算法的識(shí)別率均有所降低，但是本文算法的識(shí)別率仍然能夠達(dá)到99.98%以上。由圖5可見(jiàn)，本文算法具有較高的識(shí)別率且魯棒性強(qiáng)。

圖18 識(shí)別率的曲線圖

如圖19所示，當(dāng)遇到第49題的情況時(shí)，即考生在實(shí)際選擇的選項(xiàng)C中填涂較淺且填涂面積過(guò)小，同時(shí)，其他選項(xiàng)A存在擦除，2個(gè)選項(xiàng)的g和r計(jì)算結(jié)果在給定范圍內(nèi)，如圖19(b)和(c)所示。識(shí)別結(jié)果可能會(huì)出現(xiàn)錯(cuò)誤，算法將A選項(xiàng)也視為填涂項(xiàng)，圖19(a)中紅色矩形框表示識(shí)別錯(cuò)誤，也是下一步工作的研究重點(diǎn)之一。

(a) 填涂識(shí)別結(jié)果(b) rwf可視化(c) gwm的可視化

5 結(jié)束語(yǔ)

本文實(shí)現(xiàn)了一個(gè)答題卡客觀題的高效識(shí)別算法。首先根據(jù)答題卡格式描述文件完成正反面的判斷，執(zhí)行圖像矯正操作，然后使用滑動(dòng)窗口算法消除偏差，根據(jù)各選項(xiàng)區(qū)域的灰度特征完成客觀題區(qū)域的識(shí)別。實(shí)驗(yàn)結(jié)果證明了本文算法的有效性。

[1] ZHOU J X, YANG J C, SONG H B, et al. An online marking system conducive to learning [J]. Journal of Intelligent and Fuzzy Systems, 2016, 31(5): 2463-2471.

[2] 郭崧.答題卡圖像識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[D]. 沈陽(yáng): 遼寧大學(xué), 2017.

[3] 劉志方. 基于數(shù)字圖像處理的答題卡自動(dòng)識(shí)別軟件[D]. 廣州: 華南理工大學(xué), 2015.

[4] 阮少林. 網(wǎng)上閱卷中信息提取與識(shí)別技術(shù)研究[D]. 成都: 電子科技大學(xué), 2010.

[5] 吳軍. 掃描文檔圖像的處理方法的研究和應(yīng)用[D]. 濟(jì)南: 山東師范大學(xué), 2015.

[6] 白士御. 基于SVM的印刷體數(shù)學(xué)公式識(shí)別方法研究與系統(tǒng)設(shè)計(jì)[D]. 沈陽(yáng): 沈陽(yáng)工業(yè)大學(xué), 2015.

[7] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [EB/OL]. (2015-04-10). [2019-09-18]. https://arxiv.org/abs/1409.1556.

[8] SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions [C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York: IEEE Press, 2015: 1-9.

[9] HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition [C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York: IEEE Press, 2016: 770-778.

[10] 李春陽(yáng). 基于同源圖像配準(zhǔn)算法的研究及系統(tǒng)設(shè)計(jì)[D]. 長(zhǎng)春: 吉林大學(xué), 2016.

[11] 劉勝?gòu)?qiáng). 紙卷數(shù)字化和圖像識(shí)別在網(wǎng)上閱卷中的應(yīng)用[D]. 成都: 電子科技大學(xué), 2010.

[12] 趙洋. 基于OpenCV的網(wǎng)上閱卷技術(shù)的研究[D]. 濟(jì)南: 山東大學(xué), 2009.

[13] 張玲. 基于圖像工程的網(wǎng)上閱卷系統(tǒng)的研究與設(shè)計(jì)[D]. 濟(jì)南: 山東大學(xué), 2010.

A Novel Recognition Algorithm of Objective Questions for Exam Answer Sheets

YAO Shu-li1, WANG Shao-rong1,2, GAI Meng2,3, WANG Zhen4

(1. School of Information Science and Technology, Beijing Forest University, Beijing 100083, China; 2. Beijing Virtual Simulation and Visualization Engineering Center, Beijing 100871, China; 3. School of Electronics and Computer Science, Peking University, Beijing 100871, China; 4. Shenyang Ligong University, School of Art and Design, Shenyang Liaoning 110159, China)

Under the premise of ensuring the quality of the marking, the online marking system not only greatly reduces the workload of the teachers, but also lowers the requirement of high quality exam paper and saves energy. However, the results produced by automatic judgment by the online marking system for objective questions heavily depends on the image quality of high-speed scanning and layout of the exam answer sheets. This article proposes a robust recognition algorithm of objective questions for exam answer sheets. Firstly, considering the possibility that the user may deviate from the filling area, or the possible error in the match between the present image and template image, a sliding window strategy is proposed to relocate the practical filling area in order to eliminate the related deviation. Then the histogram of each option is calculated, and a weighted average intensity is introduced to remove the effect of the uneven filling between different options. The comparison between each option for the same question enables the recognition algorithm to have strong local adaptability. At the same time, this strategy overcomes the difficulty of parameter selection caused by the global recognition strategy. The experimental results show that owing to good compatibility, our algorithm is suitable for different typesetting types of exam answer sheets in the recognition of objective questions. In addition, the algorithm is characteristic of high recognition accuracy as well as strong robustness, thus applicable to exam answer sheets of varying scanning quality and different filling quality.

online marking system; recognition algorithm of objective questions; sliding window; weighted average intensity

TP 391

10.11996/JG.j.2095-302X.2019050900

2095-302X(2019)05-0900-08

2019-04-11；

定稿日期：2019-05-01

國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2017YFB1002705)；中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)基金(2015ZCQ-XX)；北京林業(yè)大學(xué)“北京市大學(xué)生科學(xué)研究與創(chuàng)業(yè)行動(dòng)計(jì)劃”項(xiàng)目(S201710022068)

要曙麗(1996-)，女，山西壽陽(yáng)人，本科生。主要研究方向?yàn)閳D形圖像處理、計(jì)算機(jī)視覺(jué)等。E-mail：shuliyao@outlook.com

王少榮(1975-)，男，江西永豐人，講師，博士。主要研究方向?yàn)閳D像處理、計(jì)算機(jī)圖形學(xué)等。E-mail：shaorongwang@hotmail.com