999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

手寫漢字圖像的特征矩陣提取

2020-08-07 14:40:56于萬波李耀升
現代計算機 2020年18期
關鍵詞:特征實驗

于萬波,李耀升

(大連大學信息工程學院,大連116000)

0 引言

圖像識別技術應用廣泛,近些年成為研究熱點[1-4]。而圖像的特征提取與匹配則是圖像識別的關鍵步驟,關于圖像的特征提取,近年來涌現出大量的特征提取與識別算法,圖像特征的種類也是十分的豐富;而各種語言的手寫字識別,作為一種較為特別的圖像識別,也成為了研究熱點,尤其是以手寫漢字做為研究對象進行的研究,如:Wang Yanwei 等人提出一種在分類前重新訓練數據集的方法,訓練集由位于分類邊界附近的樣本構成,并在HCL2000 和HCD 漢字數據庫上進行檢測,解決了對于自由筆跡,字符形狀和外觀樣本的變異性較大,不能嚴格滿足高斯分布,導致識別不準的問題[5]。Gao Xue 等人提出了一種新的用于手寫漢字識別的局部線性判別分析(LDA)方法,解決了傳統的LDA算法在用于無約束手寫漢字識別時,容易出現類分離問題和多模式樣本分布問題[6]。Bi Ning 等人將有效卷積神經網絡(CNN)模型GoogLeNet 用于手寫漢字識別,并進行了一些調整,實驗結果具有很高的準確性[7]。Chen Guang 等人提出了一種新的基于非線性歸一化的增強加權動態網格的特征提取方法,改善了手寫漢字識別系統的性能,具有很好的識別效果[8]。關于手寫漢字圖像特征提取的方面,具有一定的研究意義與價值。

本文研究的是手寫漢字圖像的特征提取,以矩陣的形式表述圖像特征,將從迭代和非迭代兩個方面入手,首先以迭代法作為切入點,基于迭代理論,利用迭代函數系統的特性,構造相關動力系統,生成迭代序列,對這些迭代序列進行分析研究并構造圖像特征矩陣,從中獲取一定的規律并用于手寫漢字圖像的識別探究。另外通過構造三維矩陣序列圖像,獲取手寫漢字圖像的特征矩陣,并以此實現手寫漢字圖像的匹配與識別。實驗探究使用的數據集為HCL2000 漢字庫,使用MATLAB 實現實驗仿真。

1 圖像數據的獲取及處理

依據HCL2000 漢字庫的數據特性可知,HCL2000漢字數據圖像按書寫者以文件形式存放。每個HCL文件包含一個512 字節的文件頭,記錄了該文件的作者等相關信息。各手寫漢字按區位碼的順序存放,每個漢字圖像為64×64 的點陣,在存儲過程中按比特存儲,壓縮為512 字節。所以,在獲取圖像數據的時候,需要對HCL 文件中的漢字數據進行解壓,使其還原為64×64 的點陣。在這里,根據北京郵電大學模式識別實驗室給出的HCL 文件讀取方法,使用MATLAB 進行實現,從而讀取出指定的手寫漢字圖像。每個圖像的灰度值大約有40-60 個,圖1、圖2 所示為數據集中第8個人、第12 個人所書寫的第31-60 個漢字。

圖1 第8個人書寫的第31-60個漢字

圖2 第12個人書寫的第31-60個漢字

由于圖像的本質就是一個矩陣,所以直接用漢字圖像矩陣代入corrcoef 函數計算相關系數,通過實驗發現,直接計算出的相關系數不能很好的表述兩幅圖像的相關性;所以在此不能直接使用圖像矩陣數據進行相關系數的計算。

接下來我們將嘗試利用迭代函數系統進行手寫漢字圖像的特征矩陣的提取與識別檢測。

2 基于迭代的特征矩陣提取與研究

2.1 迭代動力系統構造與分析

構造的如式(1)所示動力系統:

其中p1、p2 隨機給定(p1=p2=0.01*rand)。

讀取手寫漢字數據,解壓并存儲在二維數組中;確定實驗參數并進行迭代運算多次,保存、輸出迭代軌跡序列矩陣T;

通過實驗分析發現:由于手寫漢字圖像存在大面積的平坦區域,從而導致動力系統的混沌特性較差,系統容易收斂,所以當初值(u,v)比較少,迭代次數較多(m 較大)時得到的序列點較少,不能獲得較好的迭代軌跡序列。

接下來,我們考慮對漢字圖像進行一些相關處理,并對系統進行改進,以此來提高實驗效果。

2.2 圖像預處理

(1)給圖像加斜面

根據圖像的大小,初始化一個相同大小的斜面矩陣,加在目標圖像矩陣上,使其整體傾斜,減小其字體邊緣部分的像素差,效果如圖3 所示。

圖3 加斜面之后的漢字圖像與原圖像對比

使用加了斜面的圖像矩陣進行迭代演算,獲取迭代序列并記錄保存,分析迭代序列數據,進行識別計算,其實驗效果有了一定的提升。

(2)拉伸圖像,使其增高

接著來嘗試,將目標圖像的字體拉伸,擴大其輪廓,使其字跡加粗,減小空白區域,并對字體部分進行加高處理(思路源自刻章)[9]。

通過循環,將原圖像素點依次按照左、下、右、上的次序進行多次位移,將每次位移之后的圖像依次疊加起來,從而起到拓寬圖像字體并使其增高的效果,如圖4 所示。

圖4 移位疊加操后的圖像與原圖像對比

最后將疊加后的圖像放大至256×256 大小,然后對圖像矩陣進行歸一化處理,并使其像素值保持在1到255 之間,使用處理后的圖像與三角函數迭代式共同構造動力系統,進行下一步實驗操作。

2.3 識別優化

通過實驗發現,直接用三角函數表達式與圖像函數構造動力系統來實驗,效果并不是很好,用三角函數表達式作為迭代式,迭代賦值構造迭代矩陣T,用矩陣T 與圖像構造動力系統,這樣效果提升很多。然后我們考慮多個特征綜合來進行識別。

選取多個人書寫的同一個漢字,分別進行迭代實驗,將每次的特征矩陣綜合起來作為這一漢字的綜合特征,然后與目標圖像的特征矩陣進行相關系數的計算,發現實驗效果有所提升。

在這里,我們選取數據集中前10 個人的第2、3、4個漢字作為樣本數據,分別構造出這三個漢字的綜合特征矩陣,并與第10 個人所書寫的前六個漢字的特征矩陣進行相關系數的計算;實驗發現,其同一個漢字的相關系數最高能達到0.35 左右,不同漢字的相關系數普遍在0.2 以內,這能較好的體現兩幅漢字圖像的相關性(例如給定閾值0.3,規定大于0.3 的為相同漢字,小于0.3 的為不同漢字)。

具體實驗數據如表1 所示。

表1 多個漢字間的相關系數

接下來,我們嘗試擴大樣本數據,設計識別率計算算法,進行識別率相關探究。

2.4 識別率的計算及其分析

改進迭代方法,并設計識別率計算算法,提取多個人書寫的多個漢字圖像作為樣本數據,同一組為不同人寫的同一個漢字,獲取樣本數據的特征矩陣;確定每個漢字的訓練情況,構造綜合特征矩陣,并按數據集中漢字的存儲順序保存;使用樣本數據中所有漢字的特征矩陣分別與每個字的綜合特征矩陣計算相關系數,判斷每個漢字所產生的多個相關系數中,最大值的位置是否與本漢字的組數一致,若一致則說明識別成功。

算法1 迭代提取圖像特征

1)將式(2)做為迭代式,循環計算,得到迭代矩陣T;

2)確定樣本數據量,依次讀取樣本中每個漢字圖像,并對其進行加斜面、移位疊加操作;

3)利用迭代矩陣T 與漢字圖像構成迭代動力系統,提取樣本中每個漢字的特征矩陣T1,并按組別順序保存(同一個漢字為一組,分組順序與數據集中漢字排列順序一致);

4)訓練部分漢字:確定樣本數據中的每種漢字的訓練情況(選擇多幅圖像來構造這一漢字的綜合特征矩陣),將準備訓練的圖像數據循環代入迭代動力系統(同步驟3),得到每個漢字的綜合特征矩陣T2,按照漢字存儲的順序保存;

5)依次將樣本中所有漢字的特征矩陣與這些漢字的綜合特征矩陣進行相關系數的計算,每個漢字對應多個相關系數,若使相關系數最大的那個綜和特征的位置與漢字的組數一致,則說明識別成功;

6)記錄識別成功的漢字數目,與樣本漢字總數對比,計算識別率。

我們先來提取30 個人書寫的20 個漢字,共計600個漢字圖像,每個漢字訓練10 張圖像(即用10 個人書寫的同一漢字來構造綜合特征矩陣)運行程序后,識別出421 個漢字,識別率為70.17%;每個漢字訓練20張,可識別出477 張,識別率為79.5%;若每個漢字訓練30 張(即全部訓練),可識別出600 張,識別率為100%;為了保證實驗結果的準確性,我們繼續擴大樣本數據進行實驗。實驗數據如表2 所示。

表2 擴大樣本后的實驗數據

由這些實驗結果可以說明,基于迭代的手寫漢字圖像特征矩陣提取方法確實可行,所提取的特征矩陣能較好的表述圖像之間的相關性。

3 基于三維矩陣的圖像特征提取與識別

由于一個手寫漢字圖像的大小為64×64,所以在這里,我們使用64 個人書寫的同一個漢字,來構成64×64×64 的三維矩陣作為樣本數據,然后獲取一個人書寫的某一個漢字圖像,并對其進行一些相關處理,改變其結構使其成為64×64×64 的三維矩陣,然后與樣本中的矩陣進行相關性的計算,分析結果,進行手寫漢字的識別探究。

3.1 構造三維特征矩陣計算相關系數

算法2 迭代提取三維特征矩陣

(1)獲取64 個人所書寫的同一個漢字的圖像數據,并解壓為64×64 大小的矩陣;

(2)將所得的64 個64×64 矩陣糅合為64×64×64的三維矩陣,作為樣本數據并保存;

(3)獲取一個人的一個漢字圖像,并對其邊緣裁剪64 次,得到64 個64×64 的矩陣,并將其糅合為64×64×64 的三維矩陣;

(4)計算兩個三維矩陣的相關系數。

通過大量實驗結果表明,同一個漢字的相關系數大約在0.15~0.3 左右,不同漢字的相關系數基本小于0.15,初步判斷該算法可用于手寫漢字圖像識別的實際研究。

3.2 計算識別率

在上述算法2 的基礎上,做出一些改進,在這里我們選取30 個漢字構造三維矩陣并按漢字排列順序保存,作為樣本數據,然后選取其中一個漢字圖像作為目標,得到其三維矩陣,并與30 個樣本矩陣進行相關系數的計算,若使相關系數最大的樣本數據的位置與目標漢字的位置相同則說明識別成功。

算法3 利用三維特征矩陣進行識別

(1)讀取64 個人書寫的同一漢字數據,解壓糅合為64×64×64 的矩陣;

(2)重復第1 步驟30 次來獲取30 個漢字的數據,將每次得到的三階矩陣存入64×64×64×30 大小的數組中去,作為樣本數據;

(3)任意選擇10 個人,依次獲取其書寫的樣本中的30 的漢字數據,并進行相關處理;

(4)將所得的300 個漢字分別與樣本數據中的30個漢字計算相關系數,每個目標漢字可得到30 個相關系數,若相關系數最大的對應的樣本漢字在數據集中的位置與目標漢字所對應的位置相同,則說明識別成功;

(5)記錄識別個數,計算識別率。

下面我們來分析實驗過程,嘗試提高識別率。

3.3 識別效果及分析

為提高實驗效率,我們以30 個漢字作為樣本數據,以10 個人書寫的30 個漢字作為目標數據,來進行實驗,分析探究,提高識別率。

在上節實驗中,10 個人書寫的30 個漢字,識別率為80.67%。

(1)裁剪目標數據

為了讓目標漢字(64×64)與樣本數據(64×64×64)能更好的比較,在之前的算法中,我們將所獲取的目標漢字圖像進行邊緣裁剪,共裁剪64 次,將所得的64 個圖像數據糅合為與樣本同規格的數據來進行實驗比較,在這里我們從這一角度出發,多次調整目標數據的裁剪參數,找到識別效果最好的參數,以此來提高識別率,并在此基礎上對漢字圖像進行一次預處理,對其進行移位疊加操作。

(2)對圖像進行移位疊加

算法4 移位處理后提取特征

1)打開數據集文件,讀取漢字數據;

2)將漢字數據解壓為64×64 大小的矩陣;

3)初始化一個64×64 的矩陣temp,用來存放解壓后的漢字數據;

4)初始化一個64×64 的矩陣tempN;

5)移位疊加,操作如下:

①將圖像矩陣數據整體左移一位,賦給新初始化的矩陣(將temp 的2 到64 列賦給tempN 的1 到63 列);

②再將原圖像矩陣依次下移、右移、上移一個點位,然后每次都行平移的矩陣賦給tempN(依次疊加);

③重復步驟1、2 多次,每次平移的點位加1。6)用疊加后的圖像進行實驗操作;

此時的識別率為85.33%;優化實驗操作以及擴大樣本后的實驗結果如表3 所示。

表3 多組樣本的實驗數據對比

這些實驗結果說明,構造三維矩陣(序列圖像)作為漢字圖像的特征矩陣進行手寫漢字識別的方法確實可行,并且取得了較為不錯的實驗結果。

4 結語

目前比較常見的脫機手寫漢字識別主要是基于深度學習技術來進行的,而關于這方面的研究也涌現出大量的文獻報道,本文所提出的特征提取與識別的方法,與其他方法相比,具有系統結構復雜度低,運算成本小,樣本數據的獲取成本低等優點。

大多基于深度學習的方法,在獲取樣本數據的時候,需要進行大量的訓練才能達到滿意的程度,系統結構較為復雜,運行成本較高;我們在實驗探究過程中,通過迭代構造特征矩陣以及構造三維序列圖像矩陣等方法來獲取樣本數據,一定程度上降低了系統結構的復雜程度和運算成本,提高了實驗效率。

猜你喜歡
特征實驗
抓住特征巧觀察
記一次有趣的實驗
微型實驗里看“燃燒”
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
做個怪怪長實驗
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
主站蜘蛛池模板: 亚洲无码日韩一区| 午夜啪啪福利| 欧美国产三级| 四虎永久免费网站| 性激烈欧美三级在线播放| 狼友视频国产精品首页| 亚洲日韩精品欧美中文字幕| 色网站免费在线观看| 亚洲人成网站在线观看播放不卡| 亚洲高清中文字幕在线看不卡| 国产欧美视频综合二区| 国产成人无码AV在线播放动漫 | 国产精品大白天新婚身材| 怡红院美国分院一区二区| 国产精品专区第一页在线观看| 青青热久免费精品视频6| 天天操精品| 成人韩免费网站| 久久久精品久久久久三级| 国产精品护士| 91精品免费久久久| 日本草草视频在线观看| 一本视频精品中文字幕| 亚洲人成色在线观看| 欧美成在线视频| 国产99精品视频| 国产一区自拍视频| 亚洲IV视频免费在线光看| 亚洲大尺码专区影院| 亚洲丝袜第一页| 日本在线欧美在线| 欧美在线视频不卡第一页| 99一级毛片| 色窝窝免费一区二区三区 | 精品免费在线视频| 四虎国产精品永久一区| 久久国产成人精品国产成人亚洲| 欧美午夜视频| 伊人91在线| 国产精品无码作爱| 国产在线拍偷自揄拍精品| 无码综合天天久久综合网| 中文国产成人久久精品小说| 狼友av永久网站免费观看| 亚洲婷婷在线视频| 手机永久AV在线播放| 四虎亚洲国产成人久久精品| 亚洲第一视频区| 五月天香蕉视频国产亚| 久久精品一卡日本电影 | 中国国产A一级毛片| 免费不卡在线观看av| 黄色污网站在线观看| 91精品国产一区| 日本成人精品视频| 亚洲无码视频图片| 亚洲一区二区约美女探花| 国产精品自在在线午夜区app| 日韩a级毛片| 亚洲首页在线观看| 91精品国产福利| 久久久久夜色精品波多野结衣| 国产精品99在线观看| 88av在线| 中文字幕无码av专区久久| 青青草原国产精品啪啪视频| 久久精品丝袜高跟鞋| 国产成人无码久久久久毛片| 国产精品成人AⅤ在线一二三四 | 国产系列在线| 精品视频在线一区| 一级一级一片免费| 久久天天躁夜夜躁狠狠| 婷婷伊人久久| 亚洲欧美日韩视频一区| 亚洲一区二区在线无码| 欧美性爱精品一区二区三区| 国产高潮视频在线观看| 妇女自拍偷自拍亚洲精品| 欧美激情第一区| 无码国产偷倩在线播放老年人| 嫩草在线视频|