999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ResNet網絡的東巴象形文字識別研究

2021-06-08 12:30:01謝裕睿董建娥
計算機時代 2021年1期
關鍵詞:特征提取

謝裕睿 董建娥

摘? 要: 東巴象形文字是古代納西族創造的文字,是世界文明的瑰寶。針對東巴象形文字傳播的局限性,提出了基于圖像處理和深度學習識別東巴文字的方法。文章通過構造恒等殘差塊和卷積殘差塊來搭建20層ResNet模型,采用隨機梯度下降算法反向調整下一輪迭代的卷積層權值,經過訓練自動得到圖像相關特征參數并進行識別。實驗結果表明,該算法識別東巴文字的平均準確率達93.58%,具有較高的識別精度,取得了較好的識別效果,本研究可為東巴文字的保護工作提供參考和方法支持。

關鍵詞: 東巴象形文字; 二值化; relu激活函數; ResNet; 隨機梯度下降; 特征提取

中圖分類號:TP391????????? 文獻標識碼:A???? 文章編號:1006-8228(2021)01-06-04

Research on Dongba hieroglyph recognition using ResNet network

Xie Yurui, Dong Jian'e

(College of Big Data and Intelligent Engineering, Southwest Forestry University, Kunming, Yunnan 650224, China)

Abstract: Dongba hieroglyph, created by the ancient Naxi minority, is a treasure of world civilization. In view of the limitation of Dongba hieroglyph communication, a method of recognition of Dongba characters based on image processing and deep learning is proposed. In this paper, the 20-layer ResNet model is built by constructing the identity residual block and the convolution residual block, and the convolution layer weight of the next iteration is reversely adjusted by the stochastic gradient descent algorithm. After training, image related characteristic parameters are automatically obtained and identified. The experimental results show that the average accuracy of the algorithm in identifying Dongba characters is 93.58%, which has high recognition accuracy and achieves a good recognition effect. This study can provide reference and method support for the protection of Dongba hieroglyph.

Key words: Dongba hieroglyphic; binarization; relu activation function; ResNet; stochastic gradient descent; feature extraction

0 引言

東巴象形文字在唐朝初期開始出現,主要刻在木石上,屬于古老的文字體系。現如今,世界上僅有這一種象形文字仍在使用中,被譽為文字中的“活化石”。東巴文字是古代納西族社會歷史發展的縮影,具有重要的人文價值[1]。由于時代變遷、社會環境等因素的影響,現在能翻譯東巴經典文學的僅有少數東巴祭司和研究學者,東巴文字的傳播存在局限性[2]。因此,研究利用現代信息化技術識別東巴文字的方法具有重要的意義。

王海燕、王紅軍等人針對東巴文字的五個拓撲特征(孔數、塊數、三叉點數、四叉點數、端點數)進行統計,結合TTF字庫文件進行文字的錄入和顯示[3]。徐小力、蔣章雷等人結合拓撲特征與投影法,對東巴文字進行特征提取[4]。楊玉婷、康良厚等人在離散曲線演化算法的基礎上,提出了適用于東巴文字特征曲線的二次簡化算法[5]。目前在計算機識別領域中,對東巴文字的研究大多集中在特征提取,針對不同的數據集需要重新構造不同特征,不具有通用性。本文基于深度殘差網絡(Deep Residual Network,ResNet)[6],以圖像處理技術為主要手段,建立了東巴象形文字識別系統。

1 數據集構造及預處理

1.1 數據集構造

由于東巴文字沒有形成統一標準的數據集,本文使用的圖像數據集均來自人工整理,共整理出536個單字,并進行人工標注注釋,將其分為家畜、動作、植物、稱謂、方位、時令、用具、形態、天文、飲食共十大種分類。在經過圖像預處理后,擴充得到最終實驗數據集,隨機取其中的80%作為訓練集,剩下的20%作為測試集。部分東巴文字數據集如圖1所示。

1.2 圖像預處理

在進行圖像采集的過程中,由于紙張表面的磨損程度不同及光照因素的影響,導致采集得到的圖像有部分干擾噪聲,需要對圖像進行二值化預處理,以減少孤立的黑色像素點。本文使用的方法是最大類間方差法,從最小灰度值遍歷到最大灰度值,計算圖像的前景和背景的灰度分布均勻方差,尋找最佳分割閾值[7]。經過二值化處理后,東巴文字字符與圖片背景對比明顯,消除原背景的干擾噪聲,更便于后續深度學習的訓練,效果如圖2所示。

2 基于ResNet網絡的東巴文字識別

2.1 殘差模塊

本文所采用的的深度學習算法為殘差神經網絡,殘差(即殘差單元)是指包含一個快捷連接(shortcut connection)的多層網絡,網絡的優化變得更容易[8]。假設x被作為初始數據直接從輸入傳到輸出,H(x)表示預期輸出,根據圖3所示的殘差結構可知輸出H(x)=F(x)+x,那么實際學習目標F(x)=H(x)-x,F(x)表示殘差映射單元。

殘差模塊可以分為恒等殘差塊與非恒等卷積殘差塊,在做卷積操作時,若輸入數據維度與輸出數據維度相同,則可以直接使用如圖3所示的恒等殘差塊進行學習。若輸入與輸出數據的維度不匹配時,快捷連接上需要增加一個1*1的卷積,其作用是進行維度匹配,不參與網絡層數運算。

2.2 relu激活函數

激活函數在一個感知器中起著重要作用,為了增強網絡的學習能力,使用的激活函數通常是一個連續并可導的非線性函數。同時為了使得訓練的效率和穩定性不受到影響,激活函數的導函數的值域要合理地控制在一個合適的區間內,不能過大或過小。常見的激活函數有:sigmoid函數、logistic函數、tanh函數、relu函數等[9],本文使用的是relu函數。

relu(Rectified Linear Unit,修正線性單元)函數,也叫rectifier函數,在當前階段的深度學習領域使用占比最多[10]。因為ReLU函數的圖像特性導致該激活函數的收斂速度比其他激活函數快得多,其在整個正無窮區間都是單調遞增的線性函數,不存在梯度消失的問題。使用relu函數的網絡學習速度更快,訓練的時間更短,只需要一個閾值便可以得到激活值,不需要對輸入進行歸一化處理來防止梯度飽和。

2.3 隨機梯度下降算法

為使神經網絡的誤差盡量小,損失函數要取到最小值,這個過程可以近似看作求取損失函數最優解的過程。對損失函數最小值的尋找方向一定是其下降幅度最大的方向,即損失函數初始點位處梯度向量的方向。在訓練輪數進行不斷迭代的過程中應用隨機梯度下降法,得出最小化的損失函數以及訓練模型的參數值,反向調整卷積核的輸入權值[11]。隨機梯度下降算法的相關計算公式如式⑴、⑵、⑶所示,公式的參數意義如表1所示。

[g(?)=j=0n?jj] ⑴

[h(?)=12mi=1m(yi-g?(xi))2] ⑵

[?:=?-η??h(?)]? ⑶

首先給網絡參數權重設置一個初始值,讓損失函數向著最大變化方向更新權重。學習率取值太小會使得網絡收斂速度過慢,反之會導致迭代過快而錯過最小值。合適的學習率能使得網絡快速收斂,并穩定找到最優解。本文經過多次實驗,最后將學習率設置為0.01。

2.4 ResNet模型構建

ResNet可以解決隨著網絡層數加深出現的網絡飽和、識別率下降的問題,在網絡達到最優性能時,多余的網絡層做恒等映射來解決梯度消失問題[12]。本文構建ResNet網絡的層數為20層,由五大部分組成,結構組成如圖4所示。

⑴ 第一部分將輸入數據通過一個卷積層進行特征提取,批量歸一化固定每層訓練的均值和方差,從而穩定訓練,激活函數通過數值優化學習網絡參數,采用最大池化突出輸入圖像所包含的紋理特征。此時網絡層數為1層,通道數為64。

⑵ 第二部分是由3個恒等殘差塊組成,輸入和輸出的維度沒有變化,網絡層數為6層,輸出通道數仍為64。

⑶ 第三部分先經過一個卷積殘差塊進行升維的處理,再經過兩個恒等殘差塊,網絡層數為6層,輸出通道數變為128。

⑷ 第四部分與第三部分結構相同,升維處理后通道數為256;

⑸ 第五部分使用全局平均池化,將數值平均成標量,使用局部連接提取的圖像特征將在全連接層中失去原有的三維結構,被展開成一維的特征向量輸出。

3 實驗結果與分析

3.1 實驗參數

設置初始學習率為0.01,權重衰減為0.0001、迭代次數為79次。在訓練過程中,使用交叉熵作為損失函數,反向傳播通過隨機梯度下降算法調整下一輪迭代的卷積層權值,保存模型在此過程中性能最好的參數權重。

3.2 實驗結果

通過訓練驗證,本文構建的ResNet模型識別準確率曲線如圖5所示,損失函數曲線如圖6所示。

從圖5可以看出訓練剛開始時識別準確率提高的很快,且驗證數據集與訓練數據集同步上升,隨著迭代次數的加深,準確率逐漸趨近于98%。由圖6損失函數曲線圖可看出訓練數據集和驗證數據集的損失函數隨著訓練次數加深在逐漸變小,并逐漸趨近于0,由此可以得出:模型訓練結果較為理想。獲取文字標簽,選擇非訓練數據集中的圖像對訓練完成的模型進行隨機測試,最終輸出識別結果,部分識別率統計如表2所示。

據表2中的隨機測試錯誤樣本數可知識別錯誤率較低,本文通過對536個單字中的94個東巴文字(共385個測試樣本)進行測試,統計最終平均識別準確率為93.58%,驗證了殘差神經網絡的良好性能。

4 結束語

本文研究了基于深度學習的東巴象形文字識別方法,描述了對東巴文字印刷體的圖像預處理、殘差神經網絡識別的過程。與傳統機器學習方法相比,本文使用的算法可以自動提取圖像的特征參數,具有更客觀的訓練與識別過程,識別效果較好。在實際應用中,東巴文字圖像復雜度高,故本研究需要繼續擴大東巴文字的數據庫,在東巴文字不同復雜組合等方面做進一步深入研究。

參考文獻(References):

[1] 胡靜.甲骨文與東巴文指事字比較研究[J].現代語文(語言研究版),2017.3:79-81

[2] 李四玉.納西族非物質文化遺產研究綜述[J].文山學院學報,2018.31(4):57-63

[3] 王海燕,王紅軍,徐小力.基于拓撲特征的納西東巴文象形文字輸入方法研究[J].中文信息學報,2016.30(4):106-109

[4] 徐小力,蔣章雷,吳國新等.基于拓撲特征和投影法的東巴象形文識別方法研究[J].電子測量與儀器學報,2017.31(1):150-154

[5] 楊玉婷,康厚良,廖國富.東巴象形文字特征曲線簡化算法研究[J].圖學學報,2019.40(4):697-703

[6] He K, Zhang X, Ren S, et al. Deep residual learning for image recognition[C] //Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2016:770-778

[7] 劉麗霞,李寶文,王陽萍等.改進Canny邊緣檢測的遙感影像分割[J].計算機工程與應用,2019.55(12):54-58,180

[8] 王曉紅,劉芳,麻祥才.基于深度殘差學習的彩色圖像去噪研究[J].包裝工程,2019.40(17):235-242

[9] 安麗娜,蔣銳鵬.基于卷積神經網絡的手寫數字識別研究[J].無線互聯科技,2019.16(20):31-32

[10] Bjarne Grimstad,Henrik Andersson. ReLU networks as surrogate models in mixed-integer linear programs[J]. Computers and Chemical Engineering,2019.131.

[11] 王功鵬,段萌,牛常勇.基于卷積神經網絡的隨機梯度下降算法[J].計算機工程與設計,2018.39(2):441-445,462

[12] 段祎林,馬儇龍,賈端.基于ResNet驗證碼混淆風格的遷移學習方法[J].西安石油大學學報(自然科學版),2019.34(6):121-125

收稿日期:2020-08-25

基金項目:云南省農業基礎研究聯合專項青年項目(2018FG001-101);云南省農業基礎研究聯合專項青年項目(2017FG001-074)

作者簡介:謝裕睿(1998-),女,江蘇淮安人,本科生,主要研究方向:圖像處理。

通訊作者:董建娥(1983-),女,陜西漢中人,碩士,講師,主要研究方向:信息安全、信號與信息處理。

猜你喜歡
特征提取
特征提取和最小二乘支持向量機的水下目標識別
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
基于DNN的低資源語音識別特征提取技術
自動化學報(2017年7期)2017-04-18 13:41:09
Bagging RCSP腦電特征提取算法
一種基于LBP 特征提取和稀疏表示的肝病識別算法
基于DSP的直線特征提取算法
基于改進WLD的紋理特征提取方法
計算機工程(2015年4期)2015-07-05 08:28:02
淺析零件圖像的特征提取和識別方法
機電信息(2015年3期)2015-02-27 15:54:46
基于CATIA的橡皮囊成形零件的特征提取
主站蜘蛛池模板: 五月六月伊人狠狠丁香网| 亚洲天堂免费| 亚洲天堂视频在线播放| 精品少妇人妻无码久久| 国产一区二区福利| 亚洲国产精品久久久久秋霞影院| 91免费国产高清观看| 亚洲一区第一页| 97人人模人人爽人人喊小说| 日本爱爱精品一区二区| 日韩中文欧美| 国产精品女人呻吟在线观看| 国产精品污视频| 国产精品爆乳99久久| 欧美亚洲欧美| 精品天海翼一区二区| 永久免费精品视频| 全部免费特黄特色大片视频| 亚洲av无码久久无遮挡| 精品国产美女福到在线不卡f| 亚洲天堂免费在线视频| 国产高清在线精品一区二区三区| 亚洲综合经典在线一区二区| 9cao视频精品| 免费不卡在线观看av| 亚洲色偷偷偷鲁综合| 成人自拍视频在线观看| 91毛片网| 国产精品太粉嫩高中在线观看| 中文字幕永久在线观看| 91久久国产热精品免费| 色悠久久久久久久综合网伊人| 国产91精选在线观看| 久久亚洲国产一区二区| 欧美自拍另类欧美综合图区| 91精品网站| 久久婷婷六月| 国产国产人成免费视频77777 | 激情国产精品一区| 刘亦菲一区二区在线观看| 中文字幕资源站| 国产精品福利在线观看无码卡| 欧美无专区| 亚洲黄色网站视频| 国产www网站| 91在线日韩在线播放| 九色在线观看视频| 国产欧美日韩精品综合在线| 国产乱子精品一区二区在线观看| 亚洲综合天堂网| 国产欧美日韩精品综合在线| 久久6免费视频| 久久这里只有精品8| 国产日韩AV高潮在线| 婷婷亚洲视频| 日韩一区二区在线电影| 日本午夜影院| 毛片网站免费在线观看| 尤物亚洲最大AV无码网站| 丁香五月激情图片| 欧美一区二区三区欧美日韩亚洲| 91国内在线视频| Jizz国产色系免费| 国精品91人妻无码一区二区三区| 2020精品极品国产色在线观看| 国内99精品激情视频精品| 99久久精品无码专区免费| 亚洲av成人无码网站在线观看| 五月六月伊人狠狠丁香网| 国产在线视频二区| 亚洲国产日韩一区| 国模粉嫩小泬视频在线观看| 国产主播喷水| 国产一区在线视频观看| 亚洲精品成人片在线观看| 婷婷色一二三区波多野衣| 亚洲国产精品久久久久秋霞影院| 日本在线视频免费| 欧美成人手机在线观看网址| 久久亚洲国产最新网站| 亚洲国产亚综合在线区| 国产理论一区|