999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于權(quán)重規(guī)則的圖書館電子文檔圖像處理研究

2015-07-31 23:34:19宋路露
微型電腦應(yīng)用 2015年5期

宋路露

基于權(quán)重規(guī)則的圖書館電子文檔圖像處理研究

宋路露

數(shù)字圖書館的電子文檔圖像處理作為一個(gè)多學(xué)科交叉的研究熱點(diǎn),文檔圖像識別涉及到了眾多鄰域,包括人工智能、計(jì)算機(jī)視覺、圖像處理和模式識別等,主要研究了基于智能處理的文檔圖像識別算法,提出了一種結(jié)合權(quán)重規(guī)則的文檔圖像識別算法,通過計(jì)算文檔區(qū)域均值像素方差和熵,并由文檔分類器獲取權(quán)值的方法對文檔識別有著重要的作用。實(shí)驗(yàn)研究證明了方法的有效性。

文檔圖像處理;模糊系統(tǒng);圖像識別

0 引言

隨著圖書館資源管理的信息化和網(wǎng)絡(luò)化發(fā)展,文檔圖像資料成為圖書館信息資源的重要內(nèi)容。人們開始利用計(jì)算機(jī)來進(jìn)行圖書館電子文檔圖像資源的處理和管理。直到80年代,對圖書館的文檔圖像處理主要集中在文檔圖像檢測、文檔圖像分割、文檔辨識算法和單一形式的文檔識別[1-7]。

進(jìn)入21世紀(jì),基于視覺的文檔圖像識別取得了重大進(jìn)展,同時(shí)對文檔圖像識別進(jìn)行了初步探索。Swain 等人[8]將計(jì)算機(jī)視覺引入視覺處理系統(tǒng),使得在動(dòng)態(tài)環(huán)境中能夠進(jìn)行文檔信息識別。該視覺算法表明了多顏色對象的顏色直方圖可以作為大模型文檔數(shù)據(jù)庫中魯棒、有效、穩(wěn)定的目標(biāo)特征,在文檔圖像存在模糊、不同拍攝角度的情況下,可以實(shí)現(xiàn)多個(gè)文檔的有效識別。Itti等人提出基于顯著度的視覺注意模型實(shí)現(xiàn)快速文檔分析[9]。該文檔模型主要受早期原始人類視覺系統(tǒng)的行為和神經(jīng)結(jié)構(gòu)啟發(fā)而進(jìn)行設(shè)計(jì),先將多尺度文檔圖像特征合并到一個(gè)單一拓?fù)滹@著圖中,再利用動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)得到其位置達(dá)到降低顯著度的目的。該算法通過快速選擇環(huán)節(jié)使復(fù)雜文檔理解問題的計(jì)算有效性得到突破。Murase 等人[10]提出將文檔模型用于3-D目標(biāo)的視覺學(xué)習(xí)和識別。每個(gè)目標(biāo)的文檔模型在二維圖像空間中取決于其形狀、反射特性、場景中姿態(tài)和光照條件。形狀和反射特性對應(yīng)于對象內(nèi)在特征,一般條件下是不變的。姿態(tài)和光照條件則對應(yīng)于不同場景,常常是變化的。最后,通過流形中投影得到的精確位置得到文檔圖像中目標(biāo)特征。實(shí)驗(yàn)結(jié)果表明,對復(fù)雜文檔特征的目標(biāo)該算法可得到較好的辨識結(jié)果。

綜上所述,文檔圖像處理的研究經(jīng)歷了從特征提取及檢測、圖像分割的單一形式的目標(biāo)識別,到多類形式的文檔識別,以及最后的文檔理解等階段[11-16]。隨著信息技術(shù)的發(fā)展,結(jié)合實(shí)際的應(yīng)用需求,最終期望達(dá)到的目標(biāo)是:在不確定信息存在的條件下(文檔圖像光照的變化,不同噪聲對文檔圖像的污染,文檔圖像角度的變化等),能夠從文檔圖像中獲取有用的信息,設(shè)計(jì)有效的文檔圖像處理算法,在保障較高的檢測率和正確率前提下,對文檔圖像進(jìn)行識別和全局理解。實(shí)現(xiàn)該目標(biāo)的關(guān)鍵技術(shù)主要有:文檔圖像預(yù)處理、文檔特征提取、文檔圖像分類、文檔圖像分割和檢測、建立有效的文檔圖像理解等。

1 文檔圖像的特征處理和計(jì)算

信息熵可以說是系統(tǒng)有序化程度的一個(gè)度量,對數(shù)字圖像而言它可以解釋為圖像信號顏色分布的隨機(jī)性度量,因此可以作為圖像之間相似度的判據(jù)。所以我們需要給不同的區(qū)域賦予不同的權(quán)值。

1.1 文檔圖像的編碼

經(jīng)過對輸入圖像進(jìn)行預(yù)處理后,首先我們必須對圖像進(jìn)行LBP編碼,編碼后將圖像分成m個(gè)不同的區(qū)域Mj(j=0,1,…,m-1),從每個(gè)區(qū)域提取直方圖Ri,j,Ri,j的提取可以由下面公式獲得公式(1):

其中f(x,y)為編碼后的圖像,i表示第i個(gè)灰度級,n為直方圖灰度級數(shù),即灰度范圍,一般取256。Ri,j表示在區(qū)域J具有第i級灰度值得像素?cái)?shù)目。函數(shù)T{a}如下列公式所示如公式(2):

1.2 文檔圖像的信息熵

信息熵可以由H(X)來表示,X代表圖像,當(dāng)一幅圖像的所有像素均為同一個(gè)值時(shí),H(X)=0;當(dāng)一幅圖像擁有顏色空間的所有顏色,并且各種顏色出現(xiàn)的概率相等是H(X)值最大,可以用來描述二維圖像的不確定性,熵值越大表明子塊信息量越多,易于識別,賦以的權(quán)值越大。由上述所給知識,求取每個(gè)分塊區(qū)域各個(gè)像素點(diǎn)的概率,可以用頻數(shù)對其進(jìn)行估計(jì),如公式(3):

其中 T(a)函數(shù)參照公式(3),i表示像素點(diǎn)的灰度值。獲得的,可知第j個(gè)區(qū)域的熵值定義為公式(4):

從信息熵的描述可知,熵可以描述文檔圖像信息,因此,可以將各區(qū)域的熵值看做區(qū)域信息量大小,信息越豐富,則熵值越大,則該區(qū)域?qū)ξ臋n識別具有更大作用,應(yīng)該賦予更大的權(quán)值,各分塊權(quán)值如公式(5):

1.3 文檔圖像的像素方差

均值像素方差可以表現(xiàn)文檔圖像的區(qū)分度高低,比如純色的文檔圖片,其像素方差顯然為0,因此像額頭等其像素方差必定小,因此可以賦予較小的權(quán)重,像素方差越大,表明文檔圖像區(qū)分度高,因此必須強(qiáng)調(diào)其重要性,給以較大的權(quán)重。文檔子圖區(qū)域 j 均值像素方差2jσ可由公式獲得公式(6):

其中f(xj,yj)為經(jīng)過LBP編碼分塊后子區(qū)域 j 部分的文檔圖像表示,a表示子圖 j 像素寬度,b表示文檔子圖 j 像素高度,μj表示文檔子圖 j 部分的均值像素,如公式(7):

從均值文檔像素方差的描述可知,它可以描述文檔圖像像素是否平緩變化,若變化平緩,甚至只有一個(gè)取值,則說明其對識別貢獻(xiàn)不大,應(yīng)賦以較小的權(quán)值,反之,則賦以較大權(quán)值。

2 文檔圖像的識別處理框架

文檔圖像輸入包括文檔圖像預(yù)處理,預(yù)處理主要是對文檔圖像進(jìn)行噪聲濾波、歸一化等,通過這一步得到的文檔圖像用于進(jìn)行特征提取;特征抽取及選擇部分是識別中很重要的一部分,本文中特征提取采用的方法是專家規(guī)則與LBP結(jié)合的方式,通過對主要特征進(jìn)行加權(quán)來強(qiáng)調(diào)其識別的重要性以提高識別性能,首先,是對文檔圖像進(jìn)行LBP運(yùn)算,并對運(yùn)算后的文檔圖像進(jìn)行分塊,選取何種分塊大小最佳可以通過實(shí)驗(yàn)對比可知,然后,通過計(jì)算文檔圖像的信息熵和均值像素方差并設(shè)計(jì)模糊控制器求得的相應(yīng)文檔子塊權(quán)值并賦以到與其相對應(yīng)的區(qū)域,最后,串接成一個(gè)文檔特征向量。文檔分類器的作用主要是將獲得的文檔特征與文檔數(shù)據(jù)所擁有的特征進(jìn)行比對,文檔分類器選擇的是文檔卡方統(tǒng)計(jì),其結(jié)構(gòu)描繪如圖1所示:

圖1 文檔圖像識別系統(tǒng)結(jié)構(gòu)描述圖

算法流程圖有一個(gè)分塊編號問題,將結(jié)果LBP編碼后的文檔圖像進(jìn)行分塊,若分成m塊,則子塊序號可以從i=1到i=m,然后可以在區(qū)間[1,m]之間進(jìn)行循環(huán)判斷,直到i=m+1為止;當(dāng)計(jì)算出所有權(quán)值時(shí),就可以將這些權(quán)值賦值到相應(yīng)區(qū)域并將它們串接成一個(gè)向量,這個(gè)向量就可以作為識別的特征向量來應(yīng)用;最后,通過同數(shù)據(jù)庫的文檔特征向量進(jìn)行比對,通過分類器輸出文檔。

3 文檔圖像識別實(shí)驗(yàn)分析

在文檔圖像數(shù)據(jù)庫上進(jìn)行有效性驗(yàn)證。利用圖像數(shù)據(jù)庫中建立訓(xùn)練模型的訓(xùn)練和測試過程。識別結(jié)果的客觀評價(jià)采用的是多次識別實(shí)驗(yàn)的平均值(PSNR和SNR)。

為了比較多種噪聲的處理結(jié)果,本章采用了3種不同的噪聲類型用于圖像處理:1)高斯噪聲(方差波動(dòng)范圍:0.02-0.06);2)椒鹽噪聲(密度波動(dòng)范圍:2%-20%);3)混合噪聲:高斯噪聲(方差波動(dòng)范圍:0.01-0.05)和椒鹽噪聲(密度波動(dòng)范圍:2%-10%)混合。

在高斯噪聲、椒鹽噪聲和混合噪聲情況下,幾種處理算法的處理效果,如表1、表2和表3所示:

表1 高斯噪聲去噪結(jié)果的比較

表2 椒鹽噪聲去噪結(jié)果的比較

表3 混合噪聲去噪結(jié)果的比較

從中可以看出,模糊算法的去噪效果比其它的幾種去噪算法要好,其根本原因在于在3DFSVR系統(tǒng)結(jié)構(gòu)中嵌入了模糊域用于處理不確定信息比較合適。

為了驗(yàn)證基于模糊規(guī)則的文檔圖像識別算法性能,在文檔圖像庫上進(jìn)行了實(shí)驗(yàn)對比,同時(shí)選擇3種不同的參數(shù)進(jìn)行多次試驗(yàn)對比,如表4所示:

通過實(shí)驗(yàn)驗(yàn)證證明了模糊處理的文檔識別算法具有較好的識別率。

表4 文檔圖像庫上的識別率

4 總結(jié)

本文研究了基于模糊處理技術(shù)的圖書館電子文檔圖像管理方法,提出了一種基于模糊規(guī)則的文檔分類識別算法,首先,對文檔圖像進(jìn)行LBP編碼,然后,劃分文檔圖像,得到各區(qū)域的文檔直方圖特征向量,分別計(jì)算分塊區(qū)域的均值像素方差和熵值,把這兩個(gè)值作為模糊控制器的輸入獲取相應(yīng)分塊區(qū)域的權(quán)值并賦以之,最后,將待識別樣本的加權(quán)特征向量與文檔數(shù)據(jù)庫中的特征向量進(jìn)行類比。實(shí)驗(yàn)表明,基于模糊規(guī)則的文檔處理算法能有效的提高去噪率。

[1]Miura K., Kanehiro F., Kaneko K., Kajita S., Yokoi K.. Slip-Turn for Biped Robots [J]. IEEE Trans. on Robotics, 2013, 29(4): 875-887.

[2]Saab L., Ramos O.E., Keith F., Mansard N., Soueres P., Fourquet J.. Dynamic Whole-Body Motion Generation Under Rigid Contacts and Other Unilateral Constraints [J]. IEEE Trans. on Robotics, 2013, 29(2):346-362.

[3]Hong S., Oh Y., Kim D., You B.J.. Real-Time Walking Pattern Generation Method for Humanoid Robots by Combining Feedback and Feedforward Controller [J]. IEEE Trans. on Industrial Electronics, 2014, 61(1): 355-364.

[4]Sunkil Park, Ahra Lee, Myoung-Jun Jeong, et al. A disposable MEMS-based micro-biopsy catheter for the minimally invasive tissue sampling [J]. IEEE/RSJ International Conference on Intelligent Robots and Systems, 2005. (IROS 2005). pp: 2768-2773.

[5]Chen S.Y.. Kalman Filter for Robot Vision: A Survey[J]. IEEE Trans. onIndustrial Electronics, 2012, 59(11):4409-4420.

[6]Yongchun Fang, Xi Liu, Xuebo Zhang. Adaptive Active Visual Servoing of Nonholonomic Mobile Robots [J]. IEEE Trans. on Industrial Electronics, 2012, 59(1):486-497.

[7]Vapnik. V. N. The nature of statistical learning theory.[C]New York: Springer-Verlag, 1995.

[8]哈明虎,王超,張植明,等.不確定統(tǒng)計(jì)學(xué)習(xí)理論[M]. 北京:科學(xué)出版社,2010.

[9]Elattar E. E., Goulermas J. Electric load forecasting based on locally weighted support vector regression[J].IEEE Trans on. Systems, Man, and Cybernetics: Part C, 2010,40(4):438-447.

[10]Andreas B., Jamie A.W., Hans G., and Gerhard T. Eye movement analysis for activity recognition using electrooculography [J].IEEE Trans. on Pattern Analysis and Machine Intelligence, 2011, 33(4):741-753.

[11]Pasolli L., Notarnicola C. Prediction of axial DNBR distribution in a hot fuel rod using support vector regression models[J]. IEEE Trans.on Nuclear Science, 2011, 58(4):2084-2090.

[12]Tselios K., Zois E.N., Siores E., Nassiopoulos A., Economou G.. Grid-based feature distributions for off-line signature verificaiton [J]. IET Biometrics,2012, 1(1):72-81.

[13]Kumawat, P., Khatri, A., Nagaria, B.. Offline handwriting recognition using invariant moments and curve let transform with combined SVM-HMM classifier[J]. International Conference on Communication Systems and Network Technologies(CSNT), 2013, 144-148.

[14]Deng Cai, Xiaofei He. Manifold adaptive experimental design for text categorization[J]. IEEE Trans. on Knowledge and Data Engineering, 2012, 24(4):707-719.

[15]Li Dan, Liu Lihua, Zhang Zhaoxin. Research of text categorization on WEKA [J]. The Third International Conference on Intelligent System Design and Engineering Applications (ISDEA), 2013, 1129-1131.

[16]L. Fabien and B.Gerard. Switched and Piecewise Nonlinear Hybrid System Identification[J]. Hybrid Systems: Computation and Control, 2008, 4981:330-343.

Image Processing of Library Electronic Document Based on Weight Rule

Song Lulu
(Library of Guangdong University of Technology, Guangzhou 510006,China)

The image processing of digital library electronic document is regarded as an interdisciplinary research focus. The identification of document image involves many fields, including artificial intelligence, computer vision, image processing and pattern recognition. This paper mainly studies the identification algorithm based on intelligent document image processing, proposing a weight-rule-combining algorithm of document image identification. It obtains weight through the document classifier by calculating the document area mean pixel variance and entropy. This method plays an important role in document recognition. The experimental study demonstrates the effectiveness of the method.

Document Image Processing; Fuzzy System; Image Recognition

TN929.5

A

2015.01.27)

1007-757X(2015)05-0017-04

宋路露(1982-),女,廣東工業(yè)大學(xué),圖書館助理館員,大學(xué)本科,研究方向:圖書館信息化,數(shù)字圖書館,廣州,510006

主站蜘蛛池模板: 国产精品夜夜嗨视频免费视频 | 国产人成乱码视频免费观看| 国产又色又刺激高潮免费看| 青青国产成人免费精品视频| 亚洲人成高清| 国产无码精品在线播放| 国产精品无码久久久久AV| 女人18毛片一级毛片在线 | 日韩A级毛片一区二区三区| 国产精品3p视频| 亚洲bt欧美bt精品| 成人年鲁鲁在线观看视频| 免费国产一级 片内射老| a免费毛片在线播放| 亚洲一级毛片免费看| 国产在线视频自拍| 91精品国产一区自在线拍| 欧美一区二区三区欧美日韩亚洲| 114级毛片免费观看| 国产亚洲欧美在线视频| 亚洲高清无码精品| 人妻一本久道久久综合久久鬼色| 亚洲人在线| 茄子视频毛片免费观看| 不卡色老大久久综合网| 中文字幕永久在线观看| 99热精品久久| 久精品色妇丰满人妻| 99热这里只有精品5| 国产h视频免费观看| 在线一级毛片| 久久久久久午夜精品| 亚洲中文无码h在线观看| 亚洲美女AV免费一区| 国内精品免费| 日韩区欧美国产区在线观看| 露脸一二三区国语对白| 欧美午夜久久| 99一级毛片| 国产成人久久综合777777麻豆| 92午夜福利影院一区二区三区| 无码一区中文字幕| 国产人人干| 女高中生自慰污污网站| 国产成熟女人性满足视频| 成人在线观看不卡| 一本一道波多野结衣av黑人在线| 亚洲天堂成人在线观看| 丁香六月综合网| 爱爱影院18禁免费| 午夜爽爽视频| 亚洲黄网视频| 四虎在线高清无码| 九色最新网址| 日本午夜三级| 四虎影视国产精品| 欧美伊人色综合久久天天| 精品国产免费第一区二区三区日韩| v天堂中文在线| 热久久综合这里只有精品电影| 亚洲精品欧美日本中文字幕| 亚洲高清国产拍精品26u| a级毛片免费播放| 亚洲精品亚洲人成在线| 91国内在线视频| 亚洲浓毛av| 久精品色妇丰满人妻| 日日摸夜夜爽无码| 欧美日本在线观看| 日韩精品少妇无码受不了| 国内精自视频品线一二区| 亚洲第一成年网| 亚洲中文无码h在线观看| 99精品在线视频观看| 日本欧美精品| 91口爆吞精国产对白第三集| 欧美日本视频在线观看| 欧美三级视频在线播放| 国产成人一区| 免费观看欧美性一级| 亚洲美女高潮久久久久久久| 99在线观看免费视频|