聶莉娟
(金肯職業技術學院,江蘇 南京 210000)
伴隨著現代計算機技術及信息化技術的快速發展,圖像識別技術受到了更多領域的關注。圖像識別技術的產生以及更新成為當下十分重要的發展方向,同時表現出了良好的發展前景,在信息收集、醫療以及產品安全等方面,都已經開始廣泛運用圖像識別技術,發揮了非常大的作用。簡單來說,圖像識別技術即是依托于計算機結合對象目標處理系統前端捕獲圖片,在現代人們日常生活中也有著普遍的運用,比如說條形碼識別、指紋識別等。另外,隨著我國全面進入到信息化時代,圖像識別技術成為了一項十分重要的技術手段,作為時代發展下的產物,圖像識別技術運用的主要價值是依托于計算機取代傳統人工勞作,進而完成對龐大物理信息的處理。在現代計算機技術水平不斷提升的背景下,圖像識別技術的運用價值也越來越大。為此,從人工智能視域出發探究圖像識別技術十分有必要。圖像識別技術在實際運用過程中,首先獲取相關信息,之后對獲取的信息進行預處理,緊接著提取信息特征并進行選擇,最后實現分類決策及分類器設計功能。本文重點對圖像識別技術的流程進行分析和探究。
圖像識別主要指依托于計算機對目標圖像進行處理,之后準確識別相關圖像信息的計算機技術[1]。一般來說,在進行圖像識別時,主要分為以下幾個步驟:即圖像采集、圖像預處理、特征提取以及圖像識別[2]。
通俗來說,圖像采集即針對識別目標建立數字化圖像,要保證圖像采集工作的順利完成,通常需要利用多個采集設備進行協作。現階段,在進行圖像采集時,一般使用的圖像采集設備為CCD,CMOS攝像機等,攝像機通過鏡頭中的光感部件得到目標物體圖像的模擬信號,緊接著利用A/D轉化實現模擬圖像向數字圖像的轉變,最后通過相應的解編碼將數據信息傳輸到計算機中完成圖像處理[3]。在進行圖像識別中,圖像采集品質直接關系到最終的識別效果,所以在完成圖像的采集之后,需要對圖像品質進行評估,重點衡量圖像的清晰度、對比度以及噪點等多個因素,而圖像的這些因素往往受到CCD,CMOS攝像機傳感器精密性的影響。相比較于其它圖像采集方式,通過CCD,CMOS攝像機開展的圖像采集擁有像素密集性好、噪點低等優勢,同時還能夠支持動態對比度調整,也能夠有效簡化后期的圖像處理流程,因此在現階段圖形處理中有著非常廣泛的應用。圖1為CCD攝像機,該攝像機一般適用于規模較大、穩定性高的攝像環境中,相應的CMOS攝像機通常使用在規模較小的設備中,比如說智能手機、筆記本電腦等。

圖1 CCD攝像機
圖像預處理是獲取圖像特種的重要組成部分。因為在實際圖像采集過程中,會受到外界環境以及圖像采集設備等因素的影響,使得導入到計算機中的圖像會產生較大的偏差,常見問題有圖像亮度較低、對比度較差以及噪點多等[4]。圖像預處理能夠有效解決這樣的問題,可以實現對采集數字圖像的不同轉化,對圖像進行相關處理,為改善后期圖像算法速度奠定基礎。第一步降低采集圖像的噪聲,圖像噪聲的降低主要是通過不同的濾波來實現的,比如說常見的線性濾波、中值濾波等,該環節的工作原理是借助圖像的灰度連續性特征,將圖像中的任意一個像素當作是由多個像素平均合成的,從而使得圖像中的各個噪聲被平均,完成噪聲處理工作。第二步,開展圖像分割工作。圖像分割的主要目的是將圖像中可識別區域與不可識別區域分離開來,在多數情況下,要求識別的圖像僅僅是整個圖像中的局部,因此為了提高圖像識別的準確度與效率,要提前對圖像進行分割處理,圖2為分割圖像示意圖。通常情況下圖像分割能夠通過多種途徑實現,如一般分割、語義分割以及Kmeans分割等,其中Kmeans分割擁有較高的智能性,能夠自主完成分類[5]。

圖2 分割圖像示意
特征提取表示為將圖像中涵蓋的所有信息轉變成相應的計算機向量特征,通常情況下,特征能夠準確反映圖像的各項信息,是圖像識別中至關重要的一部分。根據圖像的不同,其表現出的特征也有較大差異,從圖像粒度層面來劃分,可以將圖像特征劃分成結構性特征與淺層特征[6],其中,淺層特征通常表示為靠近圖像邊緣的像素特征;而結構性特征通常較為復雜,同時相互之間的關聯性也非常強,可以更好地識別出圖像中的目標。淺層特征主要涵蓋了識別目標的外形、顏色、紋理以及大小等信息,該部分特征信息相互獨立,同時較為簡單,一方面可以通過淺層特征來確定圖像,另一方面也可以基于淺層特征形成結構性特征。在實際開展特征提取時,應當要先進行特征的過濾,依托于相應算法挖掘出真實特征,并且刪減掉無意義的特征。
完成特征提取工作之后,目標圖像的全部信息都有與之相對應的特征向量,圖像識別的最終目的便是完成對未識別目標圖像特征向量的識別[7]。通常來說,計算機視覺系統要在非常有限的時間內完成對圖像的反饋,同時要將目標圖像與數據庫中龐大的圖像信息進行比對,當未識別圖像特征較為繁瑣時,不僅會消耗較長的時間,同時對計算機軟件與硬件配置要求都非常高。現階段,主流圖像識別技術有模板匹配法、神經網絡法、貝葉斯法等,在這些方法中絕大部分均是以人工智能技術為載體,在選取圖像識別方法時,需要依照具體圖像特征進行確定,當下還沒有一種能夠全面滿足各種圖像特征的圖像識別方法。
基于人工智能開展的圖像識別技術,其顯著優勢便是能夠提高圖像處理過程的智能化水平,與傳統圖像處理方式不同的是,基于人工智能的圖像處理技術可以實現圖像的智能化選取及分析[8]。在現代人們生活當中,基于人工智能的圖像識別技術也有著廣泛的運用,比如說人臉識別解鎖系統,該系統功能的實現主要是依托于人工智能識別系統中的智能識別功能,利用人臉識別技術識別各種人臉信息并進行儲存,緊接著將不同人臉特征信息挖掘出來,并將其視為安全密碼,當人們運用人臉進行解鎖時,通過與數據庫中的人臉特征信息進行比對,即可完成自動解鎖,這種功能的實現也是建立子人工智能中的圖像識別技術基礎上。通過將人工智能運用到圖像識別中,一方面可以實現簡單的圖像識別,另一方面也可以實現圖像信息的自動處理、存儲以及特征提取等,這些圖像處理操作在以往圖像識別中幾乎不可能完成。
圖像識別技術的運用不單單擁有智能化優勢,同時也表現出了較高的便捷化,依托于對圖像識別技術的廣泛運用,給人們日常生活與工作帶來了極大的便利。通過圖像識別技術的運用,在以往十分困難的圖像處理過程都可以變得十分簡單,比如說現代十分流行的智能手機人臉解鎖、刷臉支付等,使用者不再需要記憶各種密碼,同時雙手也不需要進行任何操作,就能夠完成手機的解鎖、線上支付以及刷臉開門等。換言之,依托于基于人工智能的圖像識別技術,可以為人們生活與工作帶來較大的方便,很好的解決了一些傳統人們生活中不好解決的問題,為此從圖像識別技術的功能性層面來審視,基于人工智能的圖像識別技術表現出了非常高的實用性,同時該技術慢慢變得大眾化、普遍化,所能夠實現的功能也趨向于簡便與實用。
模式識別是基于人工智能的圖像識別技術中的關鍵性模型,這種模型的創設是以海量數據信息為載體的[9],換言之模式識別的產生是建立在人們已經掌握的圖像識別技術與大量實踐研究經驗的基礎上,緊接著利用計算機電腦的一系列計算過程來達成和數學原理的緊密融合,進而可以自主的進行目標圖像特征識別,并在識別的同時產生客觀、公正的評價。正常情況下,模式識別能夠劃分為兩個過程,分別是實現過程與學習過程,其中學習過程主要表現為將圖像數據信息存儲到相應的數據庫中,該過程的實現需要建立在圖像信息采集的基礎上,之后按照計算機存儲水平與識別特性完成對獲取圖像信息的分類與識別工作,最后產生可以進行圖像識別的計算機程序。而實現過程一般表示為圖像和模板之間的匹配程度,識別過程也是建立在該過程之上。在進行實際運用時,計算機識別與人腦識別有著非常大的區別,然而計算機能夠依托于已有的數據來完成圖像信息的識別與匹配,假如可以依照某種規律順利實現匹配,則表明圖像識別可以成功完成,然而該識別過程表現出了較強的限制性,難以有效辨別特征相似的情況,極易產生誤差。
為了更好地探究基于非線性降維的圖像識別技術,首先應當要掌握什么是神經網絡。神經網絡技術一般表示為將傳統圖像識別技術和現代神經網絡算法聯系起來的一種新型圖像識別技術,神經網絡的計算過程主要是模仿人腦中的某項特征開展的,實際上神經網絡并不是原原本本的依照人類的神經網絡進行的,更多的是依托于對人類神經網絡的抽象、簡化以及模擬來優化計算結構,從而改善計算速度。
基于神經網絡的圖像識別計算,其實現原理主要是依托于神經網絡學習算法,在使用神經網絡實施圖像識別過程中,先要對圖像的色彩等進行預處理。為了有效提高基于神經網絡的圖像識別效率與準確率,還應當要面向圖像識別的領域及目標開展相應的神經網絡設計,重點涵蓋了輸入與輸出層設計、隱含層設計、初始權值的確定以及期望誤差的確定等部分[10]。各個部分設計完成之后,還應當要對設計完成的神經網絡進行實踐訓練,從而確保其能夠很好的滿足圖像識別需求。筆者以MATLAB 9.3軟件為平臺,通過函數newff構建一個雙層網絡,涵蓋了1個輸出神經元、9x9個輸入以及18個單元的隱含層,學習函數選擇learngdm,設定學習速率為0.009~0.5。緊接著開展實驗,筆者書寫26個英文大寫字母進行實踐識別,如表1所示為識別結果,圖3為隱含層為18時的神經網絡訓練誤差指標與時間曲線圖。可見,基于神經網絡的圖像識別技術能夠很好的完成字母識別,并能夠延伸到相關應用中。

表1 隱含層不同節點數下的識別結果

圖3 隱含層為18時的神經網絡訓練誤差指標與時間曲線圖
基于神經網絡的圖像識別技術與非線性降維圖像識別技術都是當下常用的技術方式。對以往計算機開展的圖像識別技術進行分析可以看出,傳統圖像識別技術一般是高維識別技術,正因為擁有高維特性,使得計算機在進行圖像識別過程中面臨著較大的負擔,會降低圖像識別的效率與品質,通過非線性降維圖像識別技術的運用就可以很好的完成圖像識別的降維,解決傳統圖像識別中的問題。
在以往非線性降維圖像識別技術還未研制出來時,使用較為普遍的是線性降維圖像識別技術,該技術擁有使用簡單、操作便捷的優勢,然而在具體運用時,基于線性降維的圖像識別技術會導致計算十分復雜,不僅消耗時間較長同時也消耗了大量的空間資源,無法滿足現代圖像識別領域應用需求。而基于非線性降維的圖像識別技術可以在維持圖像原本架構的基礎上完成降維工作,從而有效推動了圖像識別效率與精度的提升。比如說人臉識別系統中,在以往該系統識別速度較慢、成功率較低,這是因為該圖像識別是在高維環境下進行的,而通過非線性降維圖像識別技術的運用,可以很好的提高自身的緊湊性,極大改善了人臉識別系統的工作速度。
圖像識別技術在我國許多行業領域中有著非常廣泛的運用,并發揮了十分重要的價值,擁有良好的發展前景。在將來圖像識別技術將會獲得進一步的發展,可以更加智能化的融入到人們的平時生活中,從社會發展層面來看,加強對圖像識別技術的研究有助于提高其社會和經濟價值,基于人工智能的圖像識別技術也將成為未來必備的關鍵性技術之一。