999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

試卷識別碼的集成設計與識別算法

2017-06-05 14:17:28呂書龍劉文麗
華僑大學學報(自然科學版) 2017年3期
關鍵詞:區域

呂書龍, 劉文麗

(福州大學 數學與計算機科學學院, 福建 福州 350116)

試卷識別碼的集成設計與識別算法

呂書龍, 劉文麗

(福州大學 數學與計算機科學學院, 福建 福州 350116)

設計一種可簡單書寫的數碼數字,并將其作為學號識別碼直接集成在試卷上,有效地實現試卷與學生的一一對應關系.分析紙質掃描試卷識別碼的識別算法,處理了識別中可能出現的多種異常情況,并將該設計和算法應用到選擇類試題答案的自動識別和批閱中.實測結果表明:所提出的集成設計,具有占用空間小、連寫簡便、識別快速、識別率高和低成本等特點.

網絡閱卷系統; 數碼數字; 識別算法; 集成設計

目前,大部分高校的全校性基礎課依然實行統考和手工流水閱卷,閱卷的公平性,試卷的質量分析,試卷及試題的統計分析、查卷,試卷存儲,專家評估等管理問題較為突出.商業網絡閱卷系統在全國性的大型考試中應用較好,但是對于各高校每學期數量眾多的考試而言,管理成本極高,推行困難.因此,如何在不改變現有考試模式和考生答卷習慣的前提下,研究適合高校運作的低成本、高效率的網絡閱卷系統是有意義的.在網絡閱卷系統的軟件掃描識別部分,最關鍵的基礎工作應該是識別考生身份的,實現考生與答卷的關聯.針對書寫比較規則的數字,一些學者給出了不同的識別方法和采集方式[1-6],取得一定成效.但在實際情況中,學生手寫的學號花樣百出,情況復雜,更需要靈活性和規范性的填寫設計,異常的預判和對應的措施等.本文提出將試卷識別碼、選擇題識別、試卷和答卷集成在一份試卷上的一體化試卷模式,并統一了學號識別碼和選擇題答案的識別算法.

1 數碼學號與一體化試卷版式設計

1.1 數碼學號的設計

學校分配給學生的學號都是由阿拉伯數字構成的,因此,學號可作為唯一的識別碼.由此提出了6點連線的書寫規則,每個數字通過6個點的連線構成,并形象地稱為數碼學號,如圖1所示.設計中給出6個點,直觀且便于構成7個連通區以待識別,另外,也可以規范學號的書寫,減少出錯.

圖1 數碼學號書寫規則Fig.1 Writing rules of digital student ID

經大量實際測試得到,每個數字的寬度和數字間的間隔相等,且寬度為4 mm,高度為8 mm.這樣的設計比較符合書寫習慣也容易識別,如果太高、太寬極易造成連線歪斜,而太窄、太小又不利于圖像處理,又影響識別的準確性.

1.2 試卷版式設計

試卷版式首頁和學生信息區新舊版對照示意圖,如圖2,3所示.由圖3(b)可知:在裝訂線外,新版學生信息除保留舊版所有的信息外,在右側增加了數碼學號區域.該區域上端留給手寫學號,下端用來書寫數碼學號,并在左側給出書寫范例.

該設計有如下兩個主要目的:1) 手寫學號為連寫數碼學號提供參照,大大降低書寫錯誤率;2) 如果機器識別失敗,還有機會通過手工識別加以糾正.

(a) 舊版 (b) 新版 圖2 試卷版式首頁示意圖Fig.2 Sketch map of examination paper

(a) 舊版

(b) 新版圖3 學生信息區示意圖Fig.3 Sketch map of student information area

對首次使用該版式的學生進行大量測試,結果表明,連寫完一個9位學號,平均用時40 s;而對熟悉該版式的學生而言,耗時不超過30 s.因此,數碼學號的引入對學生作答時間的影響可忽略.測試表明,平均書寫錯誤率低于1%,主要原因歸結為考試緊張和不按范例書寫.對于這個問題,一方面,可以在開考前提醒;另一方面,可在每個考場多備幾份空白卷以便更換.即使不更換,后期也可由人工識別處理.

因此,只需要對試卷版式和客觀題選項編碼作細微的調整,就可以將上述數碼學號的設計應用到選擇題上.將常規的選擇題選項數字化,比如選擇題中4個選項一般由(A,B,C,D)構成,為了便于識別處理,將這4個選項編碼映射成 (1,2,3,4);判斷題的錯與對也可以映射成(0,1).然后,在客觀題區域下方,留出空間作為客觀題的填涂區域,如圖4所示.

圖4 選擇題區域Fig.4 Area of multiple choice questions

2 識別算法及異常情況分析

2.1 識別流程與算法描述

數碼學號是實現考生與試卷自動關聯的唯一標示碼,它直觀易懂.總體上,每個數字可由6個點的適當連線構成,所有可能的7條連線定義成7個連通區域;然后,通過每個區域的連通性來實現數字的識別,如圖5所示.

圖5 連通區域和數字示意圖Fig.5 Connected regions and sketch maps of numbers

設基于連通性的數碼數字串含有n個數字,則識別流程有如下5個主要步驟.

步驟1 在掃描的試卷圖片中,提取數碼數字串所在區域位圖,進行合理的二值化.此時,位圖轉化成0~1數字矩陣(0代表白色,1代表黑色),記為MS.

步驟2 通過行掃描和列掃描,去掉矩陣MS外層多余的空白行和空白列,得到最小的外接矩陣,仍記為MS.

步驟3 從矩陣MS中依據設計尺寸提取每個數碼數字的子矩陣,并同樣通過行列掃描得到其最小的外接矩陣,記為Mi,i=1,2,…,n.

(a) 連通性 (b) 關鍵坐標點圖6 數字矩陣Mi的連通判定示意圖Fig.6 Sketch map of connection of digital matrix Mi

步驟4 數字矩陣Mi的連通判定示意圖,如圖6所示.將Mi矩陣行列各4等分,橫向自左向右依次為c0,c1,c2,c3,c4,其中,c0和c4為左右邊界;縱向自上而下依次為r0,r1,r2,r3,r4,其中,r0和r4為上下邊界.Mi矩陣的中心坐標為(c2,r2),左上角為(c0,r0),右下角為(c4,r4).理論上通過矩陣的關鍵行列坐標點附近的非零值可確定所在區域的連通性.若在矩陣Mi的行列坐標為(c0,r3)附近存在非零值則可判定圖6的區域1為連通.以此類推,行列坐標點(c0,r1),(c2,r0),(c4,r1),(c4,r3),(c2,r4),(c2,r2)附近的非零值可分別確定區域2到區域7的連通性,如圖6(a)所示.由于書寫難以達到理論上的橫平豎直,所以應分析關鍵坐標點鄰域中的非零值,如圖6(b)所示.

步驟5 由上述連通性的判定,再根據圖5的規則,可確定Mi所對應的數字.其對應規則為:區域1,2連通或區域4,5連通則判定為數字1;區域1,3,4,6,7連通則判定為2;區域3,4,5,6,7連通則判定為數字3;依此類推.若把區域的連通記為1,不連通記為0,則每個數字就對應了一個長度為7的0/1數字串,例如,“1100000”和“0001100”代表數碼數字“1”.

重復步驟3~5,可識別完所有子矩陣對應的數字,完成整個數碼數字串的識別.

2.2 異常情況及應對措施

在實際考試中,數字連寫不規范、掃描走紙發生傾斜都可能出現異常情況,包括但不限于以下6種異常情況:1) 連寫數字時,出現連線彎曲、越界、輕微涂改等;2) 連寫數字隨意、不完整或不規則;3) 采用鉛筆填涂時描線過淡,數字模糊;4) 識別區域有較多筆尖接觸導致的雜點;5) 掃描試卷可能出現小偏斜(偏斜度約1°)、折頁等;6) 學生忘記連寫學號.

異常情況1,4,5會導致提取的最小外接矩陣與標準尺寸不符;異常情況2,3導致連通性判別出錯;異常情況6導致無法識別.除了異常情況6必須人工介入外,其他幾種異常都可以在算法上進行自適應調整,以避免可能出現的誤判情況.文中引入關鍵點鄰域擴充、模糊識別和灰度閾值隨機提升3種措施,對算法進行完善和改進.

1) 改進1.關鍵點鄰域擴充.掃描試卷采用的分辨率為200 DPI,則4 mm對應的圖片像素大致為34 px,可保證在邊界和關鍵點處±4個像素的擴充鄰域不互相重疊,如圖6(b)所示.針對區域1,可將關鍵坐標點(c0,r3)放大到矩形區域(c0,r3-4,c0+4,r3+4),再通過統計該區域中像素1的占比或總量不小于8判定區域1的連通性,其他區域的連通可依此類推.經過修正后,可顯著消除異常情況1,4,5,可部分消除異常情況2,使得連通性判定更加合理穩健,數碼數字的識別率也得到大幅提升.

2) 改進2.引入模糊識別.比如區域1,2連通或區域4,5連通均可對應數字1;區域1,3,4,7連通可對應數字2.多個數字的模糊對應,如圖7所示.模糊識別部分消除了異常情況2中連寫數字的不完整情況.

圖7 模糊等價圖Fig.7 Fuzzy equivalence graph

3) 改進3.灰度閾值的隨機提升.部分考生采用鉛筆連寫數碼學號,由于描筆過淡,色彩對比不夠明顯,導致經典的OTSU算法[7-8]計算的平均灰度閾值偏小,使得二值化后的圖像信息損失較多,從而影響了連通性識別.用鉛筆填涂學號的二值化前后的圖像對比,如圖8所示.圖8中:經典OTSU算法得到的平均灰度閾值是209.灰度閾值為224時的二值化圖像,如圖9所示.

(a) 原圖 (b) 二值化后圖圖8 二值化前后的圖像對比示意圖Fig.8 Graph comparison before and after binarization process

圖9 提升閾值后的二值化圖像Fig.9 Binary image after lifting threshold value

由圖8,9的對比可知:選擇合適的灰度閾值對于二值化是非常重要的.經大量此類圖像的實測統計,經典OTSU算法得到的灰度閾值平均偏小10個灰度級,均方差約為2,故對OTSU算法的平均灰度閾值作簡單隨機調整,即

改進灰度閾值=OTSU平均灰度閾值+rnorm(10,2).

(1)

式(1)中:10和2分別為正態分布的均值和標準差;rnorm為正態分布隨機數的生成函數.

規則的手寫數字是系統順利運行的一個基本前提和保障,若結合手寫數字的識別算法[9-10],將有助于解決上述異常情況1~5.但系統需要實時高效地處理大量的試卷識別,故暫時未引入手寫識別的規則,上述處理方案是多方因素綜合考慮的權衡選擇.

3 實測結果與分析

掃描儀器:夏普MX-M753N數碼復合機,分辨率為200DPI,雙面掃描成JPG圖像, 掃描速度是每分鐘20份的A3幅面.主機性能:Intel(R)Core(TM)i5-3470CPU@ 3.2GHz,內存8.0GB;硬盤 1TB/7 200轉/64MB.測試工作:試卷圖片讀取,數碼學號區域提取,數碼學號識別,學號與學生信息表關聯.A3幅面的試卷正反面采用200DPI掃描成2張JPG圖像,每張圖片像素尺寸為3 307px×2 338px, 大小約為950KB,圖片尺寸是試卷尺寸的2倍,該尺寸圖片達到網絡閱卷清晰度的要求.

表1給出基本測試數據.由表1可知:數碼學號的識別耗時極少,主要時間耗費在讀寫JPG圖片,并轉成內存位圖上.對于規則的學號填涂,連通性算法的識別正確率可達100%.

表1 測試結果Tab.1 Test results

表1實測數據中,學號識別正確率不足100%,經統計分析,主要原因是書寫嚴重偏離書寫規范、胡亂涂改或空白不寫.這類問題的出現是小概率事件,但似乎又在每次考試中發生.因此,有必要加強考前培訓以降低此類問題出現的概率.另外,對于嚴重偏離書寫規范或有涂改的前提下,參考手寫數字的識別或機器識別來研究更穩健更智能的識別算法也未嘗不可.

4 結束語

所提出的試卷版式和數碼學號的設計,具有占用空間小,連寫簡便,識別快速,識別率高、成本低等特點,為網絡閱卷系統的實現與推廣奠定了堅實的基礎.網絡閱卷系統目前運行良好,后期將對智能識別算法、任務調度策略、系統安全性、網絡負載均衡、閱卷質量實時監控,以及試題和試卷的全方位的統計分析問題作進一步深入的探索和研究.

[1] 羅理,王峰.網上閱卷系統中八字碼識別方法的研究與實現[J].計算機與數字工程,2007,35(12):40-42.

[2] 鄧富強.特定區域數字識別系統的實現[J].電子技術與軟件工程,2015(15):103.

[3] 崔行臣,段會川,王金玲,等.數顯儀表數字實時識別系統的設計與實現[J].計算機工程與設計,2010,31(1):213-217.

[4] 范新南,郭建甲,蘇麗媛.基于數學形態學的數字儀表數碼識別快速算法[J].計算機測量與控制,2006,14(11):1589-1590,1593.

[5] 鞏玉濱,楊紅娟,張運楚,等.一種數顯儀表數字字符識別方法研究[J].山東建筑大學學報,2011,26(2):134-137,177.

[6] 馬禮,慈林林,張永梅,等.不規則數碼脫機識別技術[J].小型微型計算機系統,2003,24(5):940-942.

[7] OTSU N.A threshold selection method from gray-level histograms[J].IEEE Transactions on Systems, Man and Cybemetics,1979,9(1):62-66.

[8] 呂俊哲.圖像二值化算法研究及其實現[J].科技情報開發與經濟,2004,14(12):266-267.

[9] 柳回春,馬樹元,吳平,等.基于結構特征的手寫體數字識別算法[J].計算機工程,2002,28(11):28-29,60.

[10] 吳少泓,王云寬,孫濤,等.基于距離分布直方圖的數字識別算法[J].計算機應用,2012,32(8):2299-2304.

(責任編輯: 陳志賢 英文審校: 吳逢鐵)

Integrated Design and Recognition Algorithm of Identification Codes in Examination Paper

LYU Shulong, LIU Wenli

(College of Mathematics and Computer Science, Fuzhou University, Fuzhou 350116, China)

It designs a simple and easy-writing digital numbers and takes them as recognition identification codes integrated in the examination paper. This design effectively realizes the one-to-one correspondence between the student and his examination paper. It analyzes the recognition algorithm of the digital numbers in scanned examination paper, and solves several abnormal conditions in the recognition process. The design and recognition algorithm are also applied to the automatic identification and marking of objective questions. The experimental results show that the proposed design and recognition algorithm have the advantages of small occupied space, easy-writing, rapid recognition, high rate of recognition and low cost etc. Keywords:network-based scoring system; digital numbers; recognition algorithm; integrated design

10.11830/ISSN.1000-5013.201703020

2016-11-15

呂書龍(1977-),男,副教授,主要從事應用統計與軟件設計的研究.E-mail:wujispace@126.com.

國家自然科學青年基金資助項目(11301084); 福建省本科高校教育教學改革研究項目(JAS151395); 福州大學第九批高等教育教學改革工程項目(0360-52001024, 0360-52001069); 福州大學研究生優質課程建設項目(0480-52004634)

TP 311; TP 391

A

1000-5013(2017)03-0397-05

猜你喜歡
區域
分割區域
探尋區域創新的密碼
科學(2020年5期)2020-11-26 08:19:22
基于BM3D的復雜紋理區域圖像去噪
軟件(2020年3期)2020-04-20 01:45:18
小區域、大發展
商周刊(2018年15期)2018-07-27 01:41:20
論“戎”的活動區域
敦煌學輯刊(2018年1期)2018-07-09 05:46:42
區域發展篇
區域經濟
關于四色猜想
分區域
公司治理與技術創新:分區域比較
主站蜘蛛池模板: 国产日韩欧美在线视频免费观看 | 午夜日本永久乱码免费播放片| 日韩第九页| 又猛又黄又爽无遮挡的视频网站 | 亚州AV秘 一区二区三区| www.91在线播放| 在线99视频| 欧洲在线免费视频| 久青草免费视频| 国产人人射| 国产精品yjizz视频网一二区| 在线国产欧美| 亚洲热线99精品视频| 国产精品一区二区无码免费看片| 澳门av无码| 欧美在线国产| 午夜视频日本| 国产成人精品一区二区| 亚洲天堂久久新| 三上悠亚精品二区在线观看| 亚洲成人手机在线| 亚洲国产亚洲综合在线尤物| 丁香六月激情综合| 亚洲第一视频网站| 99视频只有精品| 91精品人妻一区二区| 最新精品国偷自产在线| 国产成人1024精品| 日韩中文无码av超清| 亚洲中文字幕av无码区| 中文无码精品A∨在线观看不卡| 国产中文一区二区苍井空| 精品少妇人妻一区二区| 91麻豆精品视频| 国产成人无码久久久久毛片| 青青草原国产av福利网站| 青青久在线视频免费观看| 欧美色伊人| 人妻丰满熟妇αv无码| 日a本亚洲中文在线观看| 在线无码av一区二区三区| 超碰aⅴ人人做人人爽欧美 | 国产呦精品一区二区三区下载| 国产精品浪潮Av| 中文字幕亚洲另类天堂| 亚洲AⅤ综合在线欧美一区| 欧美成a人片在线观看| 国产三级毛片| 亚洲免费福利视频| 日韩精品高清自在线| 亚洲综合色婷婷| 69av在线| 亚洲人成成无码网WWW| 高清无码手机在线观看| 国产你懂得| 91福利在线看| 久久国语对白| 青青草原国产一区二区| 成人综合久久综合| 欧美成人手机在线视频| 欧美成在线视频| 人妻精品久久无码区| 色妞www精品视频一级下载| 91精品伊人久久大香线蕉| 成年人国产网站| 欧美激情成人网| 二级毛片免费观看全程| 日韩av在线直播| 在线观看欧美国产| 亚洲中文字幕23页在线| 三上悠亚一区二区| 波多野结衣无码AV在线| 人妻21p大胆| 国产99视频精品免费视频7| 亚洲一区精品视频在线| 欧美一区福利| 亚洲精品波多野结衣| 亚洲欧美日韩动漫| 好久久免费视频高清| 亚洲成aⅴ人在线观看| 精品视频在线观看你懂的一区 | 亚洲综合片|