999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BP神經網絡的手寫數字識別系統

2020-02-25 05:01:20黃一格張炎生
機電工程技術 2020年1期
關鍵詞:特征提取

黃一格,張炎生

(廣東海洋大學電子與信息工程學院,廣東湛江 524088)

0 引言

隨著我國人口逐年遞增,公民在填寫報表時產生的數據量也在同步上漲,其中大量數據由阿拉伯數字組成。因此,需要采取必要手段將手寫數字轉化成存在計算機里的文字。傳統的做法采用手工錄入,這種做法效率低且勞動力成本高。目前,主流的數據錄入方法采用光學字符識別(Optical Character Recognition,OCR)技術[1],OCR技術是指將采集得到帶有字符的數字圖像輸入計算機后經過處理,在輸出端得到存儲在計算機的字符的技術,手寫數字識別技術作為OCR技術的一個分支,其研究目的是將人書寫在紙上的阿拉伯數字轉換為計算機里的數字。由于數據信息主要由阿拉伯數字組成,如:郵政編碼、銀行票據等,因此處理此類信息的關鍵技術是手寫數字識別技術,所以對該技術的深入研究蘊含著巨大的應用價值和現實意義[2-3]。

本文在此背景下,提出了一種基于BP神經網絡的手寫數字分類識別模型。該模型在Matlab開發環境下實現[4],訓練時間較短,對手寫數字的識別精度較高。

1 BP神經網絡

BP神經網絡是一種采用了BP算法的多層前饋神經網絡模型,具備高度的非線性映射能力并且克服了簡單感知機的局限性,其拓撲結構如圖1所示[5]。隱含層是一個寬泛的概念,它指代了所有介于輸入層和輸出層之間的中間層,因此其數目可以是一或多個。

BP神經網絡的學習過程包括兩個階段:正向傳播和反向傳播。正向傳播時,輸入向量從輸入層輸入,輸入數據經過線性組合成為隱含層神經元的輸入值,隱含層內包括對輸入值的線性組合和非線性映射,隨后得到隱含層的輸出值,輸出層又對隱含層輸出值作出類似的運算,最后得到實際輸出。反向傳播采用BP算法,也稱為誤差反向傳播算法,BP算法實際上是一種根據求導鏈式法則計算梯度的算法。描述輸出誤差的數學表達式不統一,通常采用均方誤差描述。輸出誤差反向逐層傳遞,根據隱含層神經元的誤差對連接權值和偏置進行調整,經過一步步迭代后,最終輸出誤差降至可接受的區間內[6]。

圖1 BP神經網絡的拓撲結構

2 結合BP網絡技術對手寫數字識別

手寫數字識別系統的總流程如圖2所示,該系統由圖像處理、特征提取和分類識別3個模塊組成[7]。系統的輸入端為通過攝像頭或其他方式采集得到的原始RGB數字圖像,輸出端則是對這個原始圖像上手寫數字的識別結果。

圖2 系統流程圖

2.1 圖像處理

該模塊對輸入的原始圖像進行必要的預處理后進行字符分割[8],以采集得到的原始圖像(圖3)為例,其經過圖像處理模塊后效果如圖4所示。

圖3 原圖

圖4 圖像處理后效果圖

2.1.1 灰度轉換和二值化

采集的圖像通常是RGB彩色圖像,也就是說,一幅彩色圖像是由紅色(R)、綠色(G)、藍色(B)3種單色圖像組成的,需要將RGB圖像轉化為灰度圖像以確保后續操作成功,得到的灰度圖每一個像素像在每一個R、G、B分量上具有同等值,將RGB圖像進行灰度轉化通常采用如下公式:

圖像的灰度轉換調用gray=rgb2gray(I)函數實現,其中I為彩色圖像,gray為灰度圖像。其次對灰度圖像進行二值化,通過調用函數im2bw()實現。本文采用固定閾值法,閾值的給定要根據底色的灰度值來確定,一般情況下,圖像底色灰度值約為120~180,本文將閾值設定為120。

2.1.2 平滑去噪

在非理想情況下,采集的原始數字圖像可能摻雜了噪聲,此時需要將噪聲去除或者削弱其影響,以免對后續步驟造成較大的負面影響。最常見的噪聲是椒鹽噪聲,它在二值圖像中表現為在白色的背景中有若干孤立的黑點,或是在黑色的數字中包含白色的孤立點。常用的濾波方法有均值濾波、中值濾波、最大最小值濾波等,但這些方法不能夠很好地去除孤立點而且有可能破壞數字的輪廓。本文采用8鄰域濾波法,此方法不僅能有效去除孤立點,還能夠對字符內空缺白點進行填充,其原理如下:

(1)當二值圖像(i,j)處灰度值f(i,j)=0時,而(i,j)位置相鄰的8個鄰域的灰度值為1時,則令f(i,j)=1。

(2)當二值圖像(i,j)處灰度值f(i,j)=1時,而(i,j)位置相鄰的8個鄰域的灰度值為0時,則令f(i,j)=0。

2.1.3 圖像分割

由于分類識別是對每個數字的特征信息逐一識別的,所以要將每一個字符獨立分割出來。本文采用如下方法:首先對二值圖像進行水平投影,統計出每列白像素點之和,如圖5所示。可見,字符之間的縫隙產生了波谷,字符所在列產生了波峰,波峰的區間就是每個字符的左右邊界。同理,可以確定每個字符的上下邊界,于是便能從二值圖像中分割出獨立的字符。

圖5 各列白像素點之和

2.1.4 歸一化

由于分割后每個字符圖像的分辨率不同,而后續特征提取步驟要求輸出特征向量具有相同的維數,則需要對字符圖像進行歸一化處理。本文采用大小歸一化,就是將實際提取的字符圖像通過橫縱坐標的比例放縮,得到指定大小的圖像。此步驟通過調用函數BW=imresize(I,a×b),在本文中a=14,b=10。調用后可將字符圖像變為14×10的規格,采用最近鄰插值法。

2.2 特征提取

本文采用逐像素點特征提取法,即直接將圖像送入分類器進行分類識別,這種特征提取方法相對簡單而且不會因缺少數據而喪失其他特征。逐像素點特征提取法在Matlab中表現為對字符圖像進行逐行逐列掃描,將14×10的字符圖像矩陣重新排列成140×1的特征向量矩陣,通過調用指令feature=reshape(I,140,[])實現。

2.3 分類識別

2.3.1 初始參數的選取

連接權值的初始值通常選取大小介于[-1,+1]的偽隨機數,調用randn()實現;初始偏置設為全0;訓練次數為1 000;學習速率η為0.05。

2.3.2 各層神經元數目的確定

本文采用3層BP神經網絡,即中間層數為1。輸入節點數目取決于特征向量,由于本文訓練樣本采用14×10的點陣,采用逐像素點特征提取法,因此可以確定輸入層神經節點數為140。輸出節點數取決于目標向量,由于輸出模式有10種可能,本文采用10位數對輸出模式編碼,所以輸出節點數為10。對于隱含層節點數的確定,目前尚無確切的理論依據。節點數太少會導致“欠擬合”現象,識別精度不夠;節點數過多會造成“過擬合”現象,雖然擬合精度足夠高,但是模型的泛化能力不足。本文選擇如下經驗公式[9]:

式中:m為隱藏層節點;n為輸入層節點;I為輸出層節點;α為1~10之間的整數。已知n=140,I=10,令α=1,計算得m≈13。

2.3.3 BP神經網絡的學習算法

由于Sigmoid具有單調可微等優良特性,本文的選取Sigmoid函數作為神經元的激活函數,下面給出學習算法步驟[10]。

(1)將連接權值ωji初始化-1~+1之間的偽隨機數,偏置值θj初始化為0。

(2)輸入訓練樣本Xk(k=1,2,…,P),期望輸出為dk(k=1,2,…,P),對每個訓練樣本進行步驟(3)到步驟(5)的迭代。

(3)計算神經元的狀態和實際輸出:

(4)計算輸出誤差:

(5)修正連接權值和偏置值:

(6)當迭代次數滿足要求時,結束。

式中:ωji為前一層第i個神經元到本層第j個神經元的連接權值;okj為實際輸出;θj為本層第j個神經元的偏置值;f(·)為激活函數;η為學習率。需要說明,式(4)適用于輸出層,式(5)適用于隱含層。

3 實驗結果分析

本次實驗在Windows10 64bit intel(R) Core(TM)i7-8750H 2.20Ghz CPU 8GB RAM環境下使用Maltab2016a完成。使用100個訓練樣本對神經網絡進行訓練,訓練時間約為7.5 s,對驗證集的識別準確率約為92.5%,再對另外10張手寫數字圖片進行識別,識別結果如表1所示。

表1 識別結果

可見,對于書寫較為簡單的數字,如0、1等識別正確率為100%。而較為復雜的數字,如8、6等識別正確率較低。此外,由于不同筆者的書寫風格具有差異性,數字的傾斜度也不同;也有筆者書寫的數字5、6差別微乎其微。針對上述種種情況,可以考慮采用傾斜度矯正、圖像細化的方法以提高識別精度。

4 結束語

本文主要對手寫數字識別結合神經網絡方法的實現進行了探討與研究,并且采用MATLAB為開發環境,編寫了系統各個模塊。本文在BP神經網絡基礎上結合逐像素點特征提取法設計了手寫數字識別系統,該系統主要由圖像處理和分類識別兩大部分組成。對原始圖片進行圖像處理是分類識別的前期工作,特征提取是連接圖像與神經網絡的橋梁。分類識別是整個系統的核心,本文采用具有代表性的三層BP神經網絡,在保證識別精度前提下又能保證簡短的訓練過程,性能較好。手寫體數字識別是近年來的研究熱點并且應用廣泛,特別是脫機手寫體數字識別在銀行票據認證、成績自動錄入等方面均有用途。

猜你喜歡
特征提取
特征提取和最小二乘支持向量機的水下目標識別
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
基于DNN的低資源語音識別特征提取技術
自動化學報(2017年7期)2017-04-18 13:41:09
Bagging RCSP腦電特征提取算法
一種基于LBP 特征提取和稀疏表示的肝病識別算法
基于DSP的直線特征提取算法
基于改進WLD的紋理特征提取方法
計算機工程(2015年4期)2015-07-05 08:28:02
淺析零件圖像的特征提取和識別方法
機電信息(2015年3期)2015-02-27 15:54:46
基于CATIA的橡皮囊成形零件的特征提取
主站蜘蛛池模板: 国产成人1024精品下载| 2020最新国产精品视频| 亚洲天堂网在线视频| 国内精品自在自线视频香蕉| 久久成人免费| 日本一区二区三区精品视频| 精品夜恋影院亚洲欧洲| 91国内外精品自在线播放| 91在线日韩在线播放| 欧洲av毛片| 综合久久五月天| 亚洲综合天堂网| 国产成人精品一区二区不卡| 在线观看亚洲成人| 一级毛片在线播放| 色综合天天娱乐综合网| 亚洲精品中文字幕无乱码| 99色亚洲国产精品11p| 欧美成人精品一级在线观看| 青草视频在线观看国产| 亚洲第一成人在线| 国产欧美日韩va| 精品国产免费人成在线观看| 国产99久久亚洲综合精品西瓜tv| 怡红院美国分院一区二区| 国产另类乱子伦精品免费女| 欧美日本在线播放| 亚洲91在线精品| 欧美激情视频二区三区| 成人午夜福利视频| 毛片网站在线播放| aⅴ免费在线观看| 亚洲人成人伊人成综合网无码| 欧美日本在线一区二区三区| 亚洲91精品视频| 欧美成人午夜视频| 成人91在线| 国产精品成人一区二区不卡| 亚洲欧美h| 无码'专区第一页| 国产精品成人不卡在线观看| 亚洲欧美成人在线视频| 日本国产一区在线观看| 91国内视频在线观看| www欧美在线观看| 欧美日韩一区二区三区在线视频| 国产人人射| 亚洲最大情网站在线观看| 怡春院欧美一区二区三区免费| 尤物亚洲最大AV无码网站| 国产区91| 久久久精品无码一二三区| 亚洲中文字幕在线精品一区| 国产成人一区在线播放| 日韩AV无码免费一二三区 | 四虎AV麻豆| 一区二区三区四区在线| 亚洲成肉网| 黄色网址免费在线| 亚洲色图欧美激情| 伊人91视频| 精品视频一区二区三区在线播| 国产精品自在在线午夜区app| 日韩一级二级三级| 亚洲日韩久久综合中文字幕| 无码丝袜人妻| 欧美三级日韩三级| 伊人狠狠丁香婷婷综合色| 国产91视频免费观看| 制服丝袜 91视频| 久久超级碰| 日本在线欧美在线| 亚洲精品成人片在线观看 | 天天综合网站| 亚洲精品男人天堂| 精品久久久久久久久久久| 欧美成人日韩| 国产欧美日韩免费| 人妻91无码色偷偷色噜噜噜| 欧美成人日韩| 欧美日韩国产在线观看一区二区三区| 伊人五月丁香综合AⅤ|