胡菡靜+王小妮+王磊+李翠
【摘要】 圖像識別技術的方法主要分為統(tǒng)計模式識別方法、句法模式識別方法、模糊模式識別方法以及神經網絡識別方法,本文在概述圖像識別基本概念及基本技術的基礎上,著重對圖像識別中神經網絡識別方法進行分析。
【關鍵詞】 圖像識別技術 神經網絡識別
模式識別研究的目的是用機器來模擬人的各種識別能力—比如說模擬人的視覺與聽覺能力,因此圖像識別的目的是對文字、圖像、圖片、景物等模式信息加以處理和識別,以解決計算機與外部環(huán)境直接通信這一問題。可以說,圖像識別的研究目標是為機器配置視覺“器官”,讓機器具有視覺能力,以便直接接受外界的各種視覺信息。
一、圖像識別系統(tǒng)
一個圖像識別系統(tǒng)可分為四個主要部分:被識圖像、圖像信息獲取、圖像預處理、圖像特征提取、分類判決。
二、圖像識別方法
圖像識別的方法很多,可概括為統(tǒng)計(或決策理論)模式識別方法、句法(或結構)模式識別方法、模糊模式識別方法以及神經網絡識別方法。重點介紹神經網絡識別方法。
2.1神經網絡識別方法
2.1.1人工神經網絡的組成
人工神經網絡(簡稱ANN)是由大量處理單元經廣泛互連而組成的人工網絡,用來模擬腦神經系統(tǒng)的結構和功能。而這些處理單元我們把它稱作人工神經元。
2.1.2人工神經網絡的輸出
2.1.3人工神經網絡的結構
人工神經網絡中,各神經元的不同連接方式就構成了網絡的不同連接模型。常見的連接模型有:前向網絡、從輸入層到輸出層有反饋的網絡、層內有互聯(lián)的網絡及互聯(lián)網絡。
2.1.4 學習算法
1)感知器模型及其算法
算法思想:首先把連接權和閾值初始化為較小的非零隨機數,然后把有n個連接權值的輸入送入網絡中,經加權運算處理后,得到一個輸出,如果輸出與所期望的有較大的差別,就對連接權值參數按照某種算法進行自動調整,經過多次反復,直到所得到的輸出與所期望的輸出間的差別滿足要求為止。
2)反向傳播模型及其算法
反向傳播模型也稱B-P模型,是一種用于前向多層的反向傳播學習算法。
算法思想是:B-P算法的學習目的是對網絡的連接權值進行調整,使得調整后的網絡對任一輸入都能得到所期望的輸出。學習過程包括正向傳播和反向傳播。正向傳播用于對前向網絡進行計算,即對某一輸入信息,經過網絡計算后求出它的輸出結果;反向傳播用于逐層傳遞誤差,修改神經元之間的連接權值,使網絡最終得到的輸出能夠達到期望的誤差要求。
B-P算法的學習過程如下:
第一步:選擇一組訓練樣例,每一個樣例由輸入信息和期望的輸出結果兩部分組成;第二步:從訓練樣例集中取出一樣例,把輸入信息輸入到網絡中;第三步:分別計算經神經元處理后的各層節(jié)點的輸出;第四步:計算網絡的實際輸出和期望輸出的誤差;第五步:從輸出層反向計算到第一個隱層,并按照某種原則(能使誤差向減小方向發(fā)展),調整網絡中各神經元的權值;第六步:對訓練樣例集中的每一個樣例重復一到五的步驟,直到誤差達到要求時為止。
3)Hopfield模型及其學習算法
它是一種反饋型的神經網絡,在反饋網絡中,網絡的輸出要反復地作為輸入再送入網絡中,使得網絡具有了動態(tài)性,因此網絡的狀態(tài)在不斷的改變之中。
算法思想是:
(a) 設置互連權值
其中xis是s類樣例的第i個分量,它可以為1或0,樣例類別數為m,節(jié)點數為n。
(b) 未知類別樣本初始化。 Yi(0)=Xi 0≤i≤n-1
其中Yi(t)為節(jié)點I在t時刻的輸出,當t=0時,Yi(0)就是節(jié)點I的初始值,Xi為輸入樣本的第I個分量。
(c) 迭代直到收斂
f為閾值型激發(fā)函數。該過程一直迭代到不再改變節(jié)點的輸出為止。這時各節(jié)點的輸出與輸入樣例達到最佳匹配。
總結:每一種識別方法都有自己的優(yōu)缺點,我們在今后的工作中需要把人工神經元網絡與各種已有技術以及人工智能中的專家系統(tǒng)、不確定推理方法結合起來,深入掌握各種工具的效能和應用的可能性,互相取長補短,開創(chuàng)模式識別應用的新局面。