999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于概率神經網絡的手寫苗文識別研究

2019-01-04 08:09:04曾水玲
大理大學學報 2018年12期
關鍵詞:特征

丁 李,曾水玲

(1.吉首大學物理與機電工程學院,湖南吉首 416000;2.吉首大學信息科學與工程學院,湖南吉首 416000)

湘西苗族創造了 3種苗文〔1〕,“板塘苗文”“老寨苗文”和“古丈苗文”〔2〕。方塊苗文是一種借源文字,與漢字的結構和造字法上基本一致,造字法主要有形聲和會意,雙音符的不多,象形成分極少,大量地借用漢字標音。方塊苗文用來記錄和創作苗歌,苗歌主要是表達苗族人們在生產、生活、農耕、風俗傳統等各方面的情懷,留存下來的苗歌手稿有十幾萬字,為我們研究苗族的民族歷史、民族風俗和民族文學提供了寶貴的文字資料。

在信息化時代,專家需要將這些珍貴的苗文手寫文字的紙質載體錄入進計算機進行保存和傳播,對于文字的識別方法,前人已經探索出針對各種文字的識別體系〔3-7〕,而苗文方面,也有學者為苗文便于在計算機中生成和顯示,提出了方塊苗文動態構造方法〔8〕。隨著數字化社會的發展,傳統的手寫紙質載體需要轉型以適應現代化需要。為更高效地進行苗文的錄入和傳播,開發關于苗文的光學字符識別(optical character recognition,OCR)成為可供選擇的方向。所以,開發針對于苗文的識別系統是十分迫切和重要的工作,傳統的投影識別法雖然能達到識別苗文的目的,但輸入的識別特征矩陣巨大,雖然訓練效果不錯,但預測結果時,存在有過擬合的問題,使得系統的識別潛力沒有完全開發出來,本文工作一方面驗證PNN神經網絡對于方塊苗文圖像識別工作的可用性,另一方面就是為了通過簡化特征矩陣的辦法來挖掘識別系統神經網絡的潛在能力。

1 文字圖像預處理

手寫苗文文字樣本經過掃描儀進入計算機后,因紙張的厚度、光潔度和取樣設備質量的不穩定都會造成錄入后的數字圖像文字畸變,形成粘連、筆畫中斷和圖像噪點等干擾,所以在進行文字識別之前,務必要對帶有噪聲的文字圖像進行處理。圖像預處理方法有許多經驗成果〔9-10〕,其大體步驟包括文字圖像大小歸一化、灰度化、二值化、規范化等等。

1.1 文字圖像灰度化通過外設采集的圖像通常為彩色圖像,彩色圖像會夾雜一些干擾信息,灰度化處理的主要目的就是濾除這些信息。定義在RGB空間的彩色圖像,圖像內每一個像素點的顏色由Red、Green、Blue 3個分量共同決定。灰度化其實質是將原本由三維描述的像素點,映射為一維描述的像素點。灰度化方法有分量法、最大值法、平均值法、加權平均法。加權平均法的權值是根據人體生理學角度(人眼對綠色最敏感,對藍色最不敏感)所提出的,具有最理想的灰度化效果,公式權值如下:

本文采用加權平均法來處理原始圖像,處理結果見圖1。

圖1 灰度化后的圖像

1.2 文字圖像二值化經過灰度處理的彩色圖像還須經過二值化處理將文字與背景進一步分離開。所謂二值化,就是將彩色值圖像信號轉化成只有黑(0)和白(1)的二值圖像信號。二值化效果的好壞,會直接影響灰度文本圖像的識別率。二值化處理的具體經驗有很多〔11-12〕,方法大致可以分為局部閾值二值化和整體閾值二值化。本文參考基于k中心點聚類的圖像二值化方法〔13〕,采用局部閾值二值化,將方塊苗文圖像分割為互不相交的若干個w×w的小窗口,在每個窗口中求得所轄像素的灰度平均值,經添加懲罰項后作為初步閾值進行二值化處理,繼而對各小方塊進行二值化變換,各個閾值的計算公式如下:

若塊內的灰度值大于閾值T,則把該點的值置為1,否則將該點的值置為0,將圖像二值化能更進一步減少圖像中的信息量,減少無關信息的干擾。將灰度圖像二值化后結果見圖2。

圖2 二值化處理后的結果

1.3 規范化規范化主要分為位置規范化、大小規范化和筆畫細化處理,位置規范化和大小規范化在紙質文字轉化為數字圖像時,就已規范化,每個單體文字圖像像素為長寬各130像素。對于細化方面,細化是指對于一個給定的模式圖像,抽取其“中心骨架”的過程,細化算法可分為非迭代算法和迭代算法,而迭代算法又分為串行算法和并行算法,本文的細化處理是在不破壞原有結構配置和給定筆畫連接位置關系的基礎上,采取迭代掃描并刪減邊界像素點來完成。筆畫細化方法中經典的有基于標記的并行細化算法〔14〕,改進的有自動矢量化算法〔15〕。細化后的文字消減了很多手寫字體的個性化特征,為特征提取創造了有利條件。

在計算機圖像處理過程中,用黑底白字來處理矩陣更加方便,所以先將二值化后的圖像取反,取反后結果見圖3,之后再利用細化算法將其細化,具體方法:使用一個包含9個像素的3×3模板,9個像素點只取值0或1,因此模板有29=512種形式,給予每個模板一個編號0~511,編號等于模板中的像素加權和,像素權重見圖4。

圖3 取反效果圖

圖4 像素權重

把模板分成8個方向,輪流使用8個方向的模板,消去最外層像素點,不斷循環,直到剩下“骨架”為止。細化后結果見圖5。

圖5 筆畫細化效果圖

2 文字特征的提取

特征提取即對某一模式的組測量值進行變換,以突出該模式具有的代表性特征的一種方法。常見的文字特征類型分為統計類特征和結構類特征,統計類特征有像素點個數、灰度值統計類別等,而結構特征是如邊緣、角、區域、脊等代表性特征。

本文著重研究統計類特征中的像素特征,單個文字樣本的二值化矩陣通過規范化處理后,長和寬都為130像素,通過統計投影在行列的白點(1)數值個數能夠在一定程度上代表文字的特征屬性。

2.1 經典投影法經典的特征提取投影法是將文字圖像左下角置于直角坐標系原點,統計圖像中各種特性的像素點分別在X、Y軸上的投影數量,再以兩坐標軸上的特征點數量來組成特征矩陣,此矩陣的維數至少等于圖像X、Y軸上像素之和,本文中經典投影法的維數應是X軸上130像素加Y軸上130像素再加上一個標志種類的特征,一共261維特征向量。具體步驟如下:

1)對方塊苗文圖像的X軸和Y軸平均劃分成n=130份。

2)統計x=1的直線與方塊苗文二維表達式f(x)的交點個數rx1,統計x=2直線與f(x)的交點個數rx2,依次循環,直到統計到rx130停止。

3)依照步驟2)統計ry1到ry130。

4)構建特征矩陣:T130=[I,rx1,rx2,…,rx130,ry1,ry2,…,ry130],其中I為類別標識,定義為文字的類別。

2.2 改進后的投影法相對于文字的特征提取來說,圖像沒有其他圖像那么復雜,像素點中的信息相對更加簡化,采用經典投影法不但浪費計算機資源,甚至可能取得相反的效果即因系統過擬合導致識別率更低。針對方塊苗文的像素特點,本文將傳統的投影法特征提取加上一個對像素的組別劃分,不僅能簡化特征維數,更能減少資源的浪費。

在歸一化后的方塊苗文圖像上,像素為130×130的圖像,為了能夠無余量完全劃分,本文采用最大公約數的劃分方式,即根據130長寬的像素點,將其橫縱軸的130像素點平均分成65組(2像素點為一組)、26組(5像素點為一組)、13組(10像素點為一組)和2組(65像素點為一組)4種劃分方式。見圖6。分組后統計每個組內的白點(1)個數,即可組成特征向量。具體步驟如下:

前3步與上述步驟相同,不再贅述。

4)設2個像素點為一組,計算Rx1=rx1+rx2,Rx2=rx3+rx4,…,Rx65=rx129+rx130,以及Ry1=ry1+ry2,Ry2=ry3+ry4,…,Ry65=ry129+ry130。

5)構建特征矩陣T65=[I,Rx1,Rx2,…,Rx65,Ry1,Ry2,…,Ry65],其中I為類別標識,定義為文字的類別。

5像素點一組則以此類推,只須計算Rx1=rx1+rx2+rx3+rx4+rx5,Ry1=ry1+ry2+ry3+ry4+ry5以及統計T26=[I,Rx1,Rx2,…,Rx26,Ry1,Ry2,…,Ry26]即可。

根據上述步驟,最終得到T130,T65,T26,T13,T2共5種特征矩陣。

圖6 各種像素組的分類

3 實驗及結果分析

為了驗證普通投影識別法的可用性和改進后的投影法具有更加優秀的識別性能,下面利用上述所抽取的各種特征矩陣,結合PNN神經網絡,進行對比分析實驗。

3.1 PNN神經網絡方塊苗文識別系統的建立概率神經網絡(probabilistic neural networks,PNN)是一種基于Bayes分類規則與Parzen窗的概率密度函數估計方法發展而來的并行算法。這是一種訓練快速、結構簡潔的人工神經網絡。

PNN神經網絡是一種基于徑向基函數網絡發展而來的一種前饋型神經網絡,它的理論依據是貝葉斯決策理論,其作為徑向基網絡的一種,比較適合模式分類。PNN的層次模型見圖7。

圖7 概率神經網絡基本結構

3.2 PNN神經網絡與特征向量的結合PNN神經網絡共分4層,即輸入層、模式層、求和層和輸出層。

輸入層接收來自訓練樣本的特征,本文的特征向量是由預處理后樣本圖像的橫縱坐標上投影的白點(1)的數目組成,根據像素分組的不同,特征向量維數也不同,比如2像素組,將第一行與第二行中總的白點(1)個數統計在一起,作為一個特征值,由于文字圖像為130×130像素圖,即對于行來說就有65個特征項,將縱向特征項也加入進來,就有130個特征項,最后還須加入一列表類別的標志量,則2像素組的特征向量即為131維向量,其他向量組以此類推。將特征向量傳遞給網絡,其神經元的數量和樣本矢量數量相同。

模式層計算輸入特征向量與訓練中各個模式的匹配關系,模式層神經元個數等于各個類別訓練樣本數之和,該層每個模式單元的輸出為

式中Wi為輸入層到模式層連接的權值,δ為平滑因子。

圖8 PNN網絡訓練結果及誤差圖

第三層是求和層,是將屬于某類的概率累計,從而得到文字類別的估計概率密度函數。求和層單元的輸出與各類基于內核的概率密度的估計成比例,通過輸出層的歸一化處理,即能得到各類的概率估計。

輸出層神經元是一種競爭神經元,每一個神經元對應一個文字的類別,輸出層神經元個數等于參與分類的文字類別總數,它接收從求和層輸出的各類概率密度函數,概率密度函數最大的那個神經元輸出為1,即所對應的那一類即為待識別的文字模式類別,其他輸出神經元值全為0。

3.3 網絡的訓練預測以及結果分析選取樣本庫中400個手寫苗文字體共10種文字,其中300個作為訓練樣本,100個作為測試樣本。在MATLAB中通過 net=newpnn(p_train,t_train,spread)函數進行概率神經網絡的創建,其中p_train和t_train為抽取出的特征矩陣,多次測試后spread數值選取1.5能夠很好地保證PNN網絡神經元的一部分對輸入向量所覆蓋的區間產生響應,接著利用y=sim(net,p_train)函數進行已知數據的網絡訓練,利用y2=sim(net,p_test)進行未知數據的預測,net是構建的PNN神經網絡,p_train和p_test分別是訓練特征矩陣和預測的未知特征矩陣,網絡的訓練結果和預測結果見圖8~9。

圖9 PNN網絡預測結果

從圖8可知PNN網絡的訓練效果很好,訓練預測值和實際值基本完全吻合,誤差圖上的訓練誤差更是為0,這得益于spread值的正確選擇,過大或過小都會導致訓練出現誤差。

從圖9可知,橫坐標為樣本編號,縱坐標為文字種類編號,在100個預測樣本中,錯誤個數為8個。

經過多次測試運行,統計出平均識別率,得到在不同像素分類情況下PNN的識別率。見表1。除此之外,在以上結論的前提下(10像素組擁有最佳的識別效果)與PNN神經網絡相似的BP神經網絡以及LVQ神經網絡也使用相同的特征矩陣進行了識別工作,與其進行了橫向對比。為了對比的公平,BP神經網絡和LVQ神經網絡將采用相同的10像素組特征矩陣進行訓練和分類。

表1 經典組與各個像素分組的識別率(%)

對于BP神經網絡而言,10像素組的特征矩陣與PNN相同,是一個27維的特征向量,所以BP神經網絡輸入端設置為27個輸入神經元,輸出端和PNN神經網絡一樣設置為10個神經元(10個文字種類)至于隱含層,根據經驗公式取10較為穩定,學習率取0.1,在和PNN相同的400個文字樣本庫中選擇300個進行網絡訓練,剩下100個作為測試樣本,根據以上主要參數進行BP神經網絡的構建、訓練和識別。

對于LVQ神經網絡而言,同樣是在400個樣本中選擇300個進行網絡訓練,100個作為測試樣本,輸入依然是27維特征向量,輸出為10個種類的文字,迭代次數設置1 000,學習率設置0.01,訓練目標最小誤差設置0.06,根據以上主要參數進行LVQ神經網絡的構建、訓練和識別。

最終的對比見圖10。

圖10 改進前后的PNN神經網絡以及其他神經網絡的識別率對比

從表1中的結果來看,經典組有83.45%的識別率,說明PNN神經網絡的預測功能用于方塊苗文的識別是可行的。從其他分組的結果來看,130×130的樣本圖像大小下,實驗了130像素的所有公約數分組,網格從密集到稀疏,識別率逐漸升高,10像素組達到最優,之后識別率又下降到最低,從表中看出表現最好的10像素組的識別率比經典組的識別率高4.85%,具有很可觀的提升幅度,說明此種像素分類優化方案是可行的。圖10中與其他兩種神經網絡的橫向對比來看,PNN神經網絡本身的識別效果是優于BP神經網絡和LVQ神經網絡的,通過此種優化方案,挖掘出PNN神經網絡更多的識別分類潛力。

4 結論與展望

對于湘西方塊苗文的計算機識別分類,本文基于OCR技術、圖像提取處理技術、PNN神經網絡以及MATLAB軟件,針對提取的特征矩陣維數過大導致的限制了分類器的識別率問題,提出一套能提升分類器工作效果的解決方案——進行像素的分組,并探究了在不同像素組分類的情況下,PNN神經網絡的訓練結果和識別率的提升幅度,得到了最適合的像素組分類方式即10像素組分類方式,最大化平衡計算機資源與系統工作效率之間的關系。在接下來的工作中,我們一方面會繼續苗文正確率提升的研究,并解決識別率高低起伏較大的缺點,探索更加具有代表性的文字特征提取方案;另一方面也會在優化計算機系統的識別工作效率上進一步探索,改進分類算法來提高文字的識別效率。

猜你喜歡
特征
抓住特征巧觀察
離散型隨機變量的分布列與數字特征
具有兩個P’維非線性不可約特征標的非可解群
月震特征及與地震的對比
如何表達“特征”
被k(2≤k≤16)整除的正整數的特征
中等數學(2019年8期)2019-11-25 01:38:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
詈語的文化蘊含與現代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 欧美视频在线第一页| 国产精品白浆无码流出在线看| 午夜福利无码一区二区| 亚洲精品无码日韩国产不卡| 精品少妇人妻av无码久久| 国产香蕉在线视频| 无码精品一区二区久久久| 91系列在线观看| 毛片网站在线播放| 三级视频中文字幕| 欧洲高清无码在线| 免费看久久精品99| 欧美一区精品| 欧美中出一区二区| 久久永久视频| 日韩高清欧美| 2021国产v亚洲v天堂无码| 国产啪在线91| 亚洲国产精品国自产拍A| 69综合网| 日本国产在线| 国产在线自揄拍揄视频网站| 青草视频网站在线观看| 尤物午夜福利视频| 99在线视频精品| 亚洲成人在线网| 午夜视频在线观看免费网站| 无码日韩精品91超碰| 在线播放国产一区| 亚洲男人在线天堂| 2020国产免费久久精品99| 国产爽歪歪免费视频在线观看 | 精品无码日韩国产不卡av| 久久亚洲日本不卡一区二区| 国模私拍一区二区| 婷婷色一二三区波多野衣| 一级毛片免费不卡在线视频| 亚洲欧洲日产无码AV| 精品福利网| 国产理论一区| 老熟妇喷水一区二区三区| 国产成人凹凸视频在线| 亚洲国产天堂在线观看| 亚洲精品自产拍在线观看APP| 一级毛片在线播放| 国产成人91精品| 亚洲国产天堂在线观看| 亚洲欧美精品一中文字幕| 日本国产精品一区久久久| 无码国产偷倩在线播放老年人| 亚洲色图在线观看| 精品国产香蕉在线播出| 全色黄大色大片免费久久老太| 国模沟沟一区二区三区| 人妻一本久道久久综合久久鬼色| 97se亚洲综合不卡 | 亚洲天堂视频在线免费观看| 亚洲欧美一区二区三区蜜芽| 58av国产精品| 午夜福利视频一区| 国产乱人伦AV在线A| 免费毛片网站在线观看| 久久熟女AV| 国产拍揄自揄精品视频网站| 日本亚洲欧美在线| 伊人久久大香线蕉综合影视| 免费在线成人网| 国产精欧美一区二区三区| 亚洲天堂视频在线观看| 国产一二三区在线| 日韩av电影一区二区三区四区| 亚洲日韩精品伊甸| 久久精品女人天堂aaa| 免费在线播放毛片| 中日韩欧亚无码视频| 欧洲一区二区三区无码| 女同国产精品一区二区| 伊人久久精品亚洲午夜| 性激烈欧美三级在线播放| 欧美日韩成人在线观看| 色天天综合久久久久综合片| 狠狠色丁婷婷综合久久|