李嘯天
摘 要:本文概述了圖像識別技術的一般流程,分析比較了圖像識別技術的技術特點與優缺點,概括了圖像識別的應用,并對圖像識別技術的重要步驟與原理進行了舉例和講解。
關鍵詞:圖像識別;圖像區域分割;特征提??;匹配
中圖分類號:TP3 文獻標識碼:A 文章編號:1671-2064(2018)14-0050-02
1 引言
圖像識別技術是目前應用十分廣泛的一項技術,它以圖像的形狀、顏色特征為基礎,通過聚類的思想和方法從中獲取圖像的信息,進而實現圖像的識別。近幾年,圖像識別的研究與應用日益增多,尤其體現在生物識別與衛星云圖識別方面。生物識別譬如指紋識別、人臉識別、虹膜識別及視網膜識別具有非常良好的發展前景;條碼、二維碼的掃描,翻譯軟件常使用的文字識別及圖片文字錄入,車牌捕捉,蘋果充值卡所用的文字掃描等技術,也是圖像識別在日常生活中的常見應用。圖像識別研究不斷拓展和深入,其應用領域會愈加廣泛。圖像識別需要經過預處理、區域分割、特征提取等步驟,其算法種類繁多而且不同算法間差別巨大,但一般流程基本相同。本文將會以其一般流程為基礎,對圖像識別技術的技術特點與技術原理進行簡要介紹。
2 圖像識別的一般流程
2.1 圖像的采集
圖像識別的第一步是使用合適的方法采集圖像,通過計算機進行下一步的處理操作。
2.2 預處理
圖像的預處理也是圖像識別的必要步驟。圖像預處理能夠加大算法的精簡度與可行度,提高識別算法運行的效率,增強特征提取和特征匹配的精確度。預處理主要分為圖像增強、二值化和細化三個步驟。圖像增強能恢復圖像的原結構,為算法運行提供較好的環境,也能夠提高圖像質量;二值化是將輸入的灰度圖像轉化為二值圖像;細化是在二值化的基礎上,將不是很均勻的二值圖像轉化為一像素寬的點線圖像,以便實現算法。
2.3 圖像區域分割
經過預處理后的圖像已經可以開始識別,但還不適宜直接處理。圖像作為一個整體,具有我們需要和不需要的部分,尤其是所需的目標部分和它的背景融成一體,不利于算法處理。因此我們先將輸入的圖像劃為幾個對應目標部分的區域,稱為感興趣區,再利用目標與背景的經驗區別來進行標識與定位,經過一次或多次運算,將目標部分與背景和無用部分分離。感興趣區包含了分區與分區的描述信息,特定的特征可以區別不同目標部分和非目標部分,其中可用的特征差別有灰度、色調、紋理和頻譜特征等等。因為特征具有特定性,所以這種分割方法還不具有通用性。目前大部分航空航天、軍事、醫用、通訊技術和工業自動化等的圖像識別技術都使用了圖像區域分割技術。
2.4 特征提取
圖像的原始特征數量可能很大,這時可以通過映射或變換的方式在低維空間中表示樣本特征。特征提取能夠用數值形式表達目標圖像的特征,在設計算法時應注意盡可能地保留真實特征,濾去無用的特征。
2.5 判斷匹配
圖像的判斷、分類與匹配是圖像識別技術最需要,也是最熱門的一個研究方向。在圖像識別的處理系統中,輸入的圖像可能要和成百上千的其他圖像進行匹配,為了降低運算量和提高算法精確度與可行性,需要精確及通用的方法對圖像進行分類。圖像匹配則是基于預處理、區域分割和特征提取,通過查找其共有特征來比對二者相似程度,從而判斷圖像是否一致。當前,細節匹配算法是主流的匹配算法,如利用紋理特征進行圖像識別。尋找具有更強表達圖像特征能力的圖像識別方式及其算法,至今仍是圖像識別和人工智能領域的熱點。
3 圖像識別的技術特點和優點
3.1 圖像識別技術的特點
3.1.1 信息量大
相對于文字信息,圖像信息占用內存更大,頻帶更寬。計算機對圖像進行存儲和處理通常以二維的形式進行,圖像的輸入、傳輸、存儲和處理過程,都需要計算機性能與存儲量等相關方面的技術支持。
3.1.2 關聯性大
關聯性是指計算機系統本身與圖像的像素(或圖像信息)之間的關聯,很多時候只有通過壓縮技術才可以實現圖像的分類匹配。尤其是(客觀上)三維的圖像,圖像本身當然不具備三維物體的特質,無法再現其三維幾何信息,此時應進行適當的假設與重新測量,利用映射或變換等方式,引導識別解決問題。
3.1.3 人為因素大
后期的圖像處理及修正可能需要人為處理和評價。人容易受到光線環境和知識限制等的影響,有時不能保證圖像識別的精確性。因此為提升圖像識別的質量,現在正致力于讓計算機對人的視覺進行模仿,模仿人對圖像進行評價的方式。
3.2 現有圖像識別技術的優點
3.2.1 精確度高
計算機掃描儀可以實現32位圖像像素的數字化處理,提高了圖像識別技術的精確度。
3.2.2 表現性高
圖像識別處理過程中,計算機可以對幾乎任何情況下的圖像進行圖像還原,能夠對儲存、輸入等相關因素進行準確處理,保證處理的像素信息。
3.2.3 靈活性高
在圖像輸入時,無論是顯微鏡下的亞微觀圖像還是天文望遠鏡下的小視角圖像,計算機都能以客觀情況為依據進行放縮,并以線性的運算和數學處理實現識別處理。圖像識別技術利用二維數據對圖像的某些顏色特征進行組合,從而實現高質量顯示圖像,整個識別過程統一而又靈活。
4 圖像識別技術的關鍵步驟
4.1 圖像區域分割方式
4.1.1 利用灰度值
目前最常用的、效率最高的區域分割方式就是利用目標區域和非目標區域的灰度值,進而識別圖像。例如,設定合適的閾值,對圖像的每一個像素點的灰度值與閾值進行大小比較,將圖像的像素歸類為灰度值較大與較小的兩部分,這樣的方法適用于圖像只有目標和背景的情況。但如果直接從具有多目標的原圖中提取灰度特征,則容易輸入大量的偽特征信息。
4.1.2 區域生長與分裂合并
區域生長的具體過程為:從每一個圖像的像素開始,一步步合并形成感興趣區。分裂合并則是從整個圖像出發,逐步執行分裂和合并兩個步驟,最終分割形成感興趣區。這兩種方法能夠考慮像素在“空間”中的連續性和臨接性,能夠有效消除單像素灰度的干擾,且具有很好的魯棒性。
4.1.3 利用邊緣
不同區域之間往往在邊緣處灰度值變化非常劇烈。可以先找到目標與非目標區域的邊緣點,再逐步構成輪廓,最后找出感興趣區。
4.2 使用局部細節特征進行特征提取
直接提取灰度特征的方法和直接利用灰度值分割圖像的方法具有相似性,效率高但易輸出偽特征信息。若采取模仿人類的做法,即采用邊緣區域規劃全圖特征,提取方向圖、奇異點進行分類的方法,則具有很好的魯棒性,但在圖像質量較差時結果不可信。
目前業界常利用特定的局部細節特征進行特征提取,大致的算法如下:
我們采用一個3×3的框架來進行圖像端點和分支點的特征提取,用A表示需要檢測的目標像素,鄰域點用到表示,這八個像素的灰度值則用到表示(表1)。
若A為端點,則鄰域點的特征公式為:
若A為分支點,則鄰域點的特征公式為:
通過這樣的方法,圖像特征點被確定,與此同時,圖像的類別和位置信息也能夠得到確認和記錄。
4.3 細節匹配
現在最常用的圖像匹配方式是細節匹配,算法步驟如下:
模板細節點模式的細節點(具有特定特征)特征向量集合如下:
輸入細節點模式的細節點特征向量集合如下:
M有m個細節點,N有n個細節點,尋找M、N中點的最佳對應關系,并按照此關系下對應的細節點數目,可得匹配理論分值,與閾值比較。若,則說明兩模式匹配,若,則兩模式不匹配。
5 結語
圖像識別技術的原理依據人類對圖像的識別原理不斷發展而來,本質上并不深奧,只是計算機所需要處理的信息十分復雜。圖像處理技術其實是運用程序,使模擬在人類腦海中進行的圖像識別過程的算法得以實現。目前,利用計算機實現圖像識別主要是利用圖像特征的描述對其進行處理。圖像識別技術以其廣泛的應用與研究領域,必將會在日新月異的當代社會中更好地嶄露頭角,創造更多的經濟與社會價值。
參考文獻
[1]張家怡.圖像識別的技術現狀和發展趨勢[J].電腦知識與技術:學術交流,2010,06(7X):6045-6046.
[2]于麗穎.圖像識別方法技術分析與應用[C]//中國煤礦信息化與自動化高層論壇,2014.
[3]陳云平.數字圖像識別在人臉檢測中的應用[J].計算機時代,2012,(5):37-38.
[4]翁和王.關于人工智能中的圖像識別技術的研究[J].信息通信,2016,(10):191-192.
[5]劉芳.計算機智能化圖像識別技術的理論性探究[J].信息系統工程,2017,(4):16-16.