999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于投影算子的圖書索書號自動識別①

2018-04-21 01:38:33曹海青王丹煜姚志英鄭博一
計算機系統應用 2018年3期

曹海青, 王丹煜, 姚志英, 程 玥, 鄭博一

1(首都經濟貿易大學 信息學院,北京 100070)

2(北京物資學院 物流學院,北京 101149)

近年來隨著信息技術的迅猛發展,圖書館圖書自動存取技術得到快速發展. Suthakorn J等提出了通過機器人實現圖書館的自動化管理[1],此后諸多學者開始研究圖書館自動存取書機器人及其相關技術,其中圖書書脊和索書號的識別就是一個研究熱點. Spemcer G.Fowers等人利用書脊的顏色特征建立數據庫,在使用時通過提取所拍攝到的圖書書脊圖像顏色特征,然后與數據庫中顏色特征進行比對,從而進行書脊定位和索書號定位[2]. 胡小鋒等利用字符上下輪廓的凹凸特征檢測字符的近似寬度形成索書號字符切分路徑,并根據筆畫寬度對切分后的筆畫進行修復,實現對圖書索書號粘連字符的切分[3]. 方建軍等應用Canny算子進行書脊邊緣檢測,采用霍夫變換法查找書脊邊緣線段,實現索書號圖像的提取與分割,后來他們又應用小波分析和概率Hough變換進行書脊視覺識別[4,5]. 劉汝翠設計了一種結合深度學習中的SoftMax回歸算法和書脊圖像特征識別相結合的亂架檢測算法,實現自動高效的圖書亂架檢測[6]. XianZhi Du,Wael Abdalmageed和David Doermann應用M超平面和局部敏感哈希算法實現簽名的快速識別[7]. Hong Shao,Tianshu Yu和Mengjia Xu基于局部敏感哈希算法研究了一種快速的大規模簽名識別算法[8]. 綜上可知基于圖像和視覺處理技術的書脊檢測和索書號識別是目前圖書館自動存取書機器人中應用較為廣泛的技術,但這種技術的處理效果和效率受使用的環境、圖像容量和圖像質量的影響較大,影響了書脊和索書號識別的使用和推廣. 本文將研究一種簡單的投影算子,將其應用于書脊和索書號的識別,旨在改善書脊和索書號識別的效率和準確率,促進圖書館圖書自動存取技術的應用和推廣.

1 基于投影算子的書脊識別

圖書館自動存取書機器人實現從書架上自動存取圖書的前提條件是能書架上的成排書中準確識別出每一個書. 本文將應用投影算子實現對圖書書脊的識別.

1.1 投影算子

在高等代數中投影算子是從向量空間映射到自身的一種線性變換,投影變換將整個向量空間映射到它的一個字空間,并且在這個字空間中是恒等變換. 用數學語言描述如下:

若空間V有一個子空間W,算子P將所有V中的元素都映射到W中,且P在W上是恒等變換,即,使得,并且,則稱算子P是投影算子.

目前投影算子已經被廣泛應用于圖像處理、幾何圖形識別和圖形壓縮等領域[9-11]. 本文中將以二值化圖像為研究對象,以二值化圖像的內容為基礎構建一組n(n≥1)維的向量,定義投影算子P將n維向量的元素求和映射為一維向量. 用數學語言表述如下,設一個長為L寬為W的二值化圖像,將其分別定義為L個W維的列向量C(i,j)(i=1,2,…,L;j=1,2,…,W)和W個L維的行向量R(j,i)(i=1,2,…,L;j=1,2,…,W),本文分別設計列投影算子Pc和行投影算子Pr,其中列投影算子對列向量求和,行投影算子對行向量求和,即:

1.2 基于列投影算法的圖書書脊識別

圖書館自動存取書機器人利用視頻設備抓圖書彩色圖片經二值化處理結果如圖1所示,本文將圖1所示的二值化圖其長為130像素,寬為170像素,將二值化圖內容轉化為130個170維列向量C(i,j)(i=1,2,…,130;j=1,2,…,170),則列向量的元素由0和1組成,具體取值情況如式(3)所示.

其中source(i,j)表示二值化圖中第(i,j) 個像素點的像素值. 應用列投影算子Pc對列向量C(i,j)進行運算后所得的列投影向量為Ac(i)(i=1,2,…,130),列投影向量Ac(i)的取值情況如圖2所示,由圖可知曲線在AB段、BC段和CD段列投影向量Ac(i)的值也是經歷了由大變小再變大的過程,經研究分析可知造成列投影向量Ac(i)如此變化的原因是由于在AB、BC和CD段分別屬于不同圖書的書脊內容的投影,由于書與書之間以及書架和書之間的相互影響造成明顯的邊界效應,即在圖像進行二值化處理時書與書的邊界、書與書架的邊界處容易造成黑色集中的情況發生,而且在這些邊界點處列投影向量A的值呈現出由中間的最大值分別向其左右兩邊減少,在曲線中列投影向量的局部最大值點一般就是書與書之間的分界點,根據上述分析思路進行算法設計并對圖1所示的圖書圖片進行處理后定位到書脊的切分線如圖3所示,按照圖3所示的切分線間的區域即為圖書書脊區域,按照切分線進行書籍切分即可切分出圖中所包含的每一本圖書.

圖1 書架上圖書的二值化圖片

圖2 列投影向量Ac的變化情況

2 基于投影算子的索書號識別

通過上述研究我們應用列投影算子成功地識別出圖書的書脊,但在圖書管自動存取書機器人應用中,不僅要準確識別書脊,而且還需要精確識別出書籍所對應的索書號才能實現存取書的自動化. 接著我們將通過行投影算子和列投影算子進行圖書索書號的定位和切分,然后應用模板匹配的方法進行索書號的識別.

圖3 基于列投影的書脊檢測結果

2.1 基于投影算子的索書號定位

為了確定書脊圖像中索書號的位置,需分別確定索書號在圖像中行位置信息和列位置信息,接著我們將應用投影算子分別研究圖像內容中索書號的行位置和列位置信息.

2.1.1 基于行投影算子的索書號行位置信息定位

圖4為某一本圖書經過書脊定位后切分、二值化和區域去噪后的結果,圖4所示的圖像的長為42像素,寬為170像素,以此二值化圖內容為基礎構建170個42 維的行向量R(j,i)(i=1,2,…,42;j=1,2,…,170),向量的取值情況如式4所示,

其中source(j,i)表示二值化圖中第(j,i) 個像素點的像素值,則行投影向量Br(j)為:

圖4 含索書號的書脊二值化圖

行投影向量Br(j)的變化情況如圖5所示,在圖5曲線中BC、DE、FG、HI、JK、LM段內行投影向量Br(j)的值變化均從0增加到一定的值后又減少到0,經分析研究發現造成曲線如此變化的原因是由于索書號中內容在二值化圖中為黑色,不同內容間有明顯的白色間隙所造成的,為此可以根據行投影向量Br(j)的取值情況確定索書號在圖像中行位置信息. 圖4所示的圖書圖像中索書號的行信息定位情況如圖6所示,由圖6可知行投影算子可以很好地實現索書號行位置信息的定位.

圖5 行投影向量Br的變化曲線

圖6 索書號行位置信息的定位結果

2.1.2 基于列投影算子的索書號列位置信息定位

以圖4所示的圖書書脊二值化圖為基礎構建為42個170維的列向量C(i,j)(i=1,2,…,42;j=1,2,…,170),向量的取值情況如式6所示,

其中source(i,j)表示二值化圖中第(i,j)個像素點的像素值,則列投影向量Ac(i)為:

列向量Ac(i)的變化情況如圖7所示,由圖可知曲線在AB段和CD段列向量Ac(i)的值為零,在BC段列向量Ac(i)的值不為零,造成曲線產生上述變化的原因是由于BC段是由于圖書索書號的內容在二值化圖中為黑色才導致列投影向量Ac(i)的值才從零變化到大于零的某一個值,又從大于這個值變化到零,為此可以根據列投影向量Ac(i)的取值變化情況確定索書號的列位置信息. 圖4所示的圖書圖像中索書號的列信息定位情況如圖8所示,由圖8可知列投影算子可以很好地實現索書號列位置信息的定位.

2.2 索書號切分

在確定索書號的行位置信息和列位置信息后,根據行位置信息和列位置信息畫出包含索書號每一個元素的矩形框,具體如圖9所示,按照圖9種所示的矩形框個數,計算出索書號中所包含的元素的個數,并按照矩形框的位置將索書號內容切分成一個一個圖片實現索書號內容的切分.

圖7 列投影向量A的變化情況

圖8 索書號列位置信息的定位結果

圖9 索書號內容劃分結果

2.3 基于模板匹配的索書號識別

2.3.1 字符模板庫的構建

通過研究圖書索書號的內容發現索書號的組成元素包括26大寫英文字母、0到9共10個數字和諸如“.”、“/”和“-”等共 20 個符號. 由于本文采用的是基于圖像處理的方法進行索書號的識別,為此在研究中為這些字符構建了長為32個像素寬為16個像素的二值化圖像,作為識別中的標準模板字符,圖10中有元素F、元素U、元素3、元素1、元素8、元素、元素4、元素5和元素2的標準模板字符樣例.

圖10 字符模板樣例

2.3.2 索書號元素圖像歸一化處理

根據上述研究所切分的索書號元素的圖片因各個圖書管索書號采用的印刷字體、字體大小、是否加粗、印刷是否傾斜以及時間流逝印刷字的老化等原因,導致切分后所得索書號元素的圖片大小各不相同,為此在進行模板匹配之前需對切分所得索書號元素圖片進行歸一化處理,使歸一化后元素圖片的幾何尺寸為長32像素,寬16像素. 圖11為切分所得未進行歸一化處理的元素圖片和歸一化后元素圖片.

圖11 切分所得索書號圖片歸一化處理結果

2.3.3 基于歐氏距離的索書號識別

論文在研究過程中構建了56個組成索書號內容的元素字符模板二值化圖作為研究的字符標準模板庫,在圖書索書號識別時通過計算切分且歸一化處理的圖書索書號元素二值化圖與字符模板庫中所有模板的匹配度,取其中匹配度最大的字符模板對應的字符為最終的識別結果. 具體數學解釋如下: 首先在索書號識別系統中將根據每一個字符標準模板二值化圖內容構建16個32維的向量M(i,j,k) (i=1,2,…,56;j=1,2,…,16;k=1,2,…,32); 接著將以每個切分且歸一化處理待識別的索書號元素對應的二值化圖構建16個32維的向量N(j,k)(j=1,2,…,16;k=1,2,…,32),設d(i)為待識別的索書號元素二值化圖與第i個字符標準模塊的歐氏距離,則:

然后計算帶識別索書號元素二值化圖與字符標準模板的匹配度e(i),其中e(i) 表示與第i個字符標準模板的匹配度,且:

當d(i)=0時,; 當時,待識別的索書號元素即為第j個字符標準模板所對應的字符; 根據如上所述的方法即可識別出索書號的所有元素.

2.3.4 索書號識別的實例化驗證

為了檢驗本文的研究成果,我們規范如圖12所示的索書號識別流程. 通過進行大量案例測試發現基于投影算子的圖書書脊定位準確率達99.86%,索書號內容識別的準確率達99.73%,對于成排書架上單本圖書書脊的定位時間僅需0.1 s,索書號內容單個元素識別時間僅為0.02 s,與其他方法相比基于投影算子的書脊識別準確率、索書號識別準確性和性能均有極大的提高.

圖12 索書號識別流程

為了進一步驗證本文的研究成功,應用參考文獻[5]中方法測試本文方法對書脊的定位情況,其測試結果如表1所示,由表可知本文所研究的基于投影的書脊定位方法的準確定位率高于文獻[5]中的方法,且耗時平均不達文獻[5]中方法的1/10,值得進一步的研究和探索.

3 結論與展望

本文研究了一種簡單的投影算子,將其應用于圖書書脊識別和索書號的識別. 本文以書架圖書的二值化圖像為基礎構建了列向量,應用列投影算子對列向量進行處理,分析列投影向量曲線的變化情況進行圖書書脊識別; 以單本圖書書脊二值化內容為基礎分別構建行向量和列向量,應用行投影算子對行向量進行處理得到行投影向量,根據行投影向量曲線的變化情況識別出索書號的行位置信息,應該列投影算子對列向量進行處理得到投影列向量,根據列投影向量曲線的變化情況識別出索書號的列位置信息,根據行、列位置信息切分出索書號元素圖片,對切分所得元素圖片進行歸一化處理; 計算待識別元素圖片和每一個字符標準模板的歐氏距離和匹配度,則匹配度最大的字符模板所對應的字符即為識別結果; 經實驗驗證基于投影算子的圖書書脊識別和索書號識別的準確率高,識別速度快,可以改善圖書館自動存取書機器人的效率,促進圖書館自動化水平的提高.

表1 書脊定位性能比較

1Suthakorn J,Lee S,Zhou Y,et al. A robotic library system for an off-site shelving facility. IEEE International Conference on Robotics and Automation. Washington,DC,USA. 2002. 3589-3594.

2Fowers SG,Lee DJ. An effective color addition to feature detection and description for book spine image matching.ISRN Machine Vision,2012,2012: 945973.

3胡小鋒,陳超,葉慶泰. 圖書索書號粘連字符的切分. 上海交通大學學報,2005,39(4): 553-556,560.

4方建軍,趙強強. 圖書館在架圖書的索書號圖像提取與分割. 北京聯合大學學報,2015,29(1): 87-92.

5方建軍,杜明芳,龐睿. 基于小波分析和概率Hough變換的書脊視覺識別. 計算機工程與科學,2014,36(1):126-131.

6劉汝翠. 基于自動智能分類器的圖書館亂架圖書檢測. 現代商貿工業,2016,37(25): 172-174.

7Du XZ,Abdalmageed W,Doermann D. Large-scale signature matching using multi-stage hashing. 12th International Conference on Document Analysis and Recognition (ICDAR). Washington,DC,USA. 2013.976-980.

8Shao H,Yu TS,Xu MJ,et al. Image region duplication detection based on circular window expansion and phase correlation. Forensic Science International,2012,222(1-3):71-82. [doi: 10.1016/j.forsciint.2012.05.002]

9趙峰,楊健. 結合投影算子與小波變換的人臉識別方法. 計算機應用,2013,33(S1): 230-232.

10段汕,謝英華. 一種基于傾斜投影的圖像分析方法. 中南民族大學學報(自然科學版),2015,34(4): 103-108.

11趙知勁,張滇華. 基于斜投影算子的壓縮采樣匹配追蹤算法. 杭州電子科技大學學報,2014,34(1): 30-33.

主站蜘蛛池模板: 人人看人人鲁狠狠高清| 综合色在线| 操美女免费网站| a级毛片在线免费| 欧美亚洲一区二区三区导航| 亚洲色图欧美在线| 国产亚洲美日韩AV中文字幕无码成人 | 国产亚洲高清视频| 97青青青国产在线播放| 国产不卡一级毛片视频| 亚洲综合久久一本伊一区| 潮喷在线无码白浆| 免费观看国产小粉嫩喷水 | 国语少妇高潮| 亚洲AV无码久久天堂| 亚洲无码高清视频在线观看| 国产高清又黄又嫩的免费视频网站| 欧美区国产区| 亚洲国产精品一区二区第一页免| 天堂av高清一区二区三区| 四虎国产精品永久一区| 好吊日免费视频| 亚洲最新在线| 午夜啪啪网| 91啦中文字幕| 成人精品视频一区二区在线| 国产精品成人久久| 亚洲中文在线视频| 极品国产在线| 男人天堂亚洲天堂| 福利在线不卡一区| 亚洲欧美精品一中文字幕| 中文字幕亚洲无线码一区女同| 国产精品毛片一区| 国产主播福利在线观看| 国产成人久久777777| 无码电影在线观看| 高清无码不卡视频| 免费高清毛片| 97精品久久久大香线焦| 毛片免费在线视频| 欧美成人a∨视频免费观看 | 国产亚洲精品97AA片在线播放| 国产精品太粉嫩高中在线观看 | a国产精品| 欧美成在线视频| 黄色网站不卡无码| 国产91特黄特色A级毛片| 幺女国产一级毛片| 久草视频中文| 在线观看免费人成视频色快速| 国产成人免费视频精品一区二区| 国产欧美专区在线观看| 国产无吗一区二区三区在线欢| 蜜臀AV在线播放| 国产色偷丝袜婷婷无码麻豆制服| 欧美狠狠干| 免费A级毛片无码无遮挡| 亚洲第一成年免费网站| 久久婷婷五月综合97色| 五月激情综合网| 国产午夜无码专区喷水| 久久99国产综合精品1| 亚洲成人精品| 操操操综合网| 日韩高清中文字幕| 欧美一区二区丝袜高跟鞋| 亚洲人成网站18禁动漫无码| 成年人免费国产视频| aaa国产一级毛片| 2021最新国产精品网站| 99热这里只有成人精品国产| a毛片基地免费大全| 国产精品视频观看裸模| 国产精品夜夜嗨视频免费视频| 欧美亚洲日韩不卡在线在线观看| 国产永久免费视频m3u8| 日韩人妻无码制服丝袜视频| 久久国产亚洲欧美日韩精品| 亚洲成人一区在线| 精品在线免费播放| 亚洲色无码专线精品观看|