李穎
(長春工業大學人文信息學院,吉林長春,130122)
人工神經網絡技術已經成功應用于語音識別,自然語言處理,計算機視覺等多個領域。卷積神經網絡就是模擬視覺神經系統[1]而產生的,主要在自然語言處理、計算機視覺領域有應用。卷積神經網絡是科研人員不斷研究高等動神經元特征的智慧結晶,通過參考量子理論在廣義維度上共享特征參數,顯著縮小了模型存儲占比。傳統意義上卷積神經網絡[2]主要是先通過提取一些特征點,然后再通過數學統計模型表示圖像,多用于解決分類問題。本文將卷積神經網絡應用于信息圖像處理,最終實驗證明卷積神經網絡在大規模的圖像數據集處理上著有非常好的效果。
卷積神經網絡在數據處理過程中最精要的環節就是卷積計算[3]。它處理的圖像數據通常都是以BMP 格式存儲的,是全球非動態圖片儲存組織規定的格式,特點是不經過壓縮而按圖片本來大小存盤,故需要存儲空間大的硬件系統。
因此本文經過篩選后遴選出GE 系統,是CPU 的進階版,該系統具有快速的像素掃描能力,非常適用于圖像處理。并且具有處理多格式圖像轉換能力,對多維度圖像傳輸可以多層并行,從而為電子信息圖像處理奠定扎實的基礎。
該算法實現電子信息圖像處理包括圖像識別、圖像標注、圖像分割三個階段。
圖像識別技術[4]分為三個部分:圖片權重分析、特征提取和集合創建。圖片權重分析是為了保留圖像中的關鍵信息,便于對圖像進行特征提取。圖像權重分析的方法有:圖像灰度化、中值縮減化等。特征提取是對目標圖片的一種精簡描述。在結構基礎上,使用簡化的卷積神經網絡結構做特征提取器。集合創建部分是按不同的圖片特征將具有相似參數的圖片組成集合,創建方法如式(1)。

其中w 為灰度值,u 為聚類參數,d 為比較值,dfinal為最終比較值,s 為網絡神經元函數。卷積層和池化層在輸入圖像中的局部空間結構中提取特征比較值,包了整個圖像中全局的特征信息,而后面的全處理層的作用是在更加抽象比較值中進行運算比較進行圖像識別。
使用2.1 中算法提取圖像的抽象語義特征,然 后 使 用(2)完成實現對圖像的分類標注。

(2)式中φ 為高斯平滑常數,k 為提取的權值,x 為圖片所含紋理特征,y 為圖片的色彩參數特征。每個神經元只需要對圖像的局部特征進行感知,將這些局部的特征進行組合得到圖片的全局特征。其實這也是受人類視覺神經系統的啟發,人類在識別圖像時,大腦皮層的神經只對局部的刺激做出反應,說明人類對圖像的認知也是從局部到整體的過程[5]。此算法的優勢在于權值共享:卷積神經網絡使用(2)式提取圖像中的特征,一個探頭在權值較高的區域上滑動提取一小塊紋理特征,多個卷積核就包含了圖片所有的紋理特征,色彩特征同理。之所以稱之為“權值共享”,是因為一個卷積核在圖像的某一區域進行特征標注,該區域的特征可以用在其他的圖像處理過程中,或者說圖像的特征標注與環節無關。通過權值共享能大大降低圖像標注的訪問量。其提取的特征具有很好的泛化性能,能夠應用到新的圖像標注任務中。
在圖像中區分出要分析和辨別的目標,需要把這一部分提取出來,這就是圖像分割。分割網絡是一種卷積編碼器-解碼器網絡,輸入是原始的RGB 圖片,最后經過softmax函數輸出網絡預測每一個像素點屬于哪一個類別的概率值,即圖像分割的結果;使用 Fast-Seget 網絡結構完成圖像分割,算法如(3)所示:

(3)式中,O 代表像素的權重,f 為語義分割函數,βdown 為圖像切割的邊緣值,卷積神經網絡的邊緣檢測分割法中,池化算子對分辨率特征加以平滑精細處理,可以減少對于重要特征像素忽略,能夠對邊緣進行更加全面的檢測,采用這種方法檢測出的邊緣,對比度適中,空間結構完整,同時還可以避免圖片拍攝過程中混入的噪音干擾。
文字識別和人臉識別方面在電子信息圖像處理中屬于兩個特殊方面,也是現在大數據背景下的研究熱點。卷積神經網絡技術因其仿生優勢在這兩方面的運用有著得天獨厚的優勢,因此研究卷積神經網絡在這兩方面的應用十分重要。
文字識別是將特征采集、文字處理、人工智能與一體的新技術,需要快速地在圖片中把文字和非文字信息區分開來,智能識別能夠精確的對相似文字進行分辨,減少識別誤差。原始文字識別方法存在大量相近字混淆,將非文字符號識別為文字,對手寫體識別無法識別等現象,后期往往需要人工輔助修改,非常浪費時間。
本文借助已有的國家圖書館建立的文字數據庫,對每個文字各種筆體使用Fisher 算法進行特征獲取,最后對提取的特征使用多維坐標系進行標記集合。然后將卷積神經網絡結構的全處理層之前的一個池化層細化成通量池化層(Apatial Same Pooling)即ASP。ASP 能夠將輸入的隨機的文字圖提取出相同大小的特征向量,不受輸入文字圖像面積的影響,從而在圖片處理上減少了同質化切割的步驟,改變了同質化切割導致的文字變形以及丟失等識別誤差。后續的過程就是將提取的特征向量與國家文字數據庫儲存的已有文字進行特征比對,鎖定出近似選項,而后進行相似度函數計算,最終將相似度最高的文字作為識別結果。
卷積神經網絡模仿了自然人辨識他人身份的過程,即先對整體樣貌輪廓進行辨識,再將面部中具有代表性的五官特征與記憶提供的已知面相進行比對,通過相似度完成判斷。采用深度卷積神經網絡進行人臉驗證和識別,就是依靠骨骼走向描述過程和五官輪廓識別過程的有機組合進行來完成身份判定。其骨骼走向描述過程實現了身份識別的整體約束,五官輪廓識別過程實現了特征的抓取和跳出模糊識別的誤區。這非常適合于在火車站等人流量大,識別精準度要求高的地方。首先,運用基于骨骼走向描述的Tepid 網絡來提取人臉骨骼圖像特征。Tepid 網絡將根據人臉圖像的對比度制作骨骼模型,對每一塊面部區域都需要運用卷積網絡進行控制,防止各個面部區域的骨骼特征數據丟失。基于五官輪廓的人臉識別方法應用卷積神經網絡以局部特征算法描述人臉的五官細節特征,而以卷積神經網絡捕捉局部特征的配對關系來回溯整體特征,即以局部特征的集合作為整體特征。對于不同人的兩張圖像,其五官特征和骨骼走向皆不相同,可以較為輕松的做出身份判別。一個人在不同年齡拍攝的兩張圖片(拍攝角度相似)也不會影響該種方法的人臉識別,因為其骨骼走向特點不會變化。
對于人臉識別和文字識別,選取一男一女在四個年齡段的圖片和四組結構類似的漢字圖片。分別用本文方法和傳統圖片處理方法進行相似度評定,若對于不同年齡的面部識別相似度高和相似文字測定的相似度低,則說明該方法具有較高的識別能力。實驗結果如表1,表2 所示。

表1 對不同年齡的同一人面部識別程度

表2 對相似字的相似度測定
由實驗結果可得,本文提出的卷積神經網絡電子信息圖像處理方法能夠很好的辨別出無論男性女性,在不同年齡段下同一人的圖片,也對結構相近的不同文字之間的細小差異十分敏感。此實驗證明了卷積神經網絡在圖像處理領域的優越性。