石鐵山
摘 要:近年來,伴隨著圖像處理技術的飛速發展,圖像識別技術被廣泛應用在各個領域中,發揮著越來越重要的作用。圖像識別技術作為一種建立在信息技術基礎上的技術,其主要是借助計算機替代人工,快捷地處理各種物理信息。本文就人工智能中的圖像識別技術進行簡單探討。
關鍵詞:人工智能 圖像識別 技術
中圖分類號:G64 文獻標識碼:A 文章編號:1672-3791(2018)12(c)-0015-02
伴隨著計算機技術和微電子技術的快速發展,推動了圖像識別技術的產生和發展,并逐漸成為人工智能領域中重要的組成部分,并廣泛地運用于面部識別、指紋識別、醫療診斷、衛星云圖識別等領域中,發揮重要作用。
1 圖像識別技術概述
1.1 圖像識別技術的含義
圖像識別技術主要指的是通過對比存儲的信息(存儲在記憶中的信息)和當前信息(進入感官的信息)從而識別圖像的一種技術。圖像識別技術是建立在圖像描述的基礎上,而描述主要指的是通過符號或者數字等對景物中或者圖像中的相關特征予以描述,甚至描述目標相互之間的關系,從而獲得目標特征以及相互之間關系的一種抽象表達。在應用圖像識別技術提取圖像或者景物中的個性特征時,可以借助模板匹配模型。在具體應用實踐中,特別識別除了要弄清識別的對象具有是什么樣的物體外,還應該明確其所在的位置和姿態。當前圖像識別技術已經被廣泛應用的各個領域中,例如交通領域中的車牌號識別、交通標志識別;軍事領域中的飛行物識別、地形勘察;安全領域中的指紋識別、人臉識別等。
1.2 圖像識別技術的原理
眾所周知,人眼才能產生視覺效果,可見人的眼睛具有很強的圖像識別能力。當圖像所處的位置、角度、距離等發生改變時,視覺效果也會相應改變,在人眼視網膜上形成的圖像形狀和大小也會相應改變,但是這并不會影響人們對圖像的判斷。圖像識別作為人工智能中重要的構成部分,該技術的原理其實跟人眼識別的原理存在相似性,都是基于圖像具有明顯的特征。圖像特征作為圖像識別的重點,以英文大寫字母“A”為例,該字母有一個突出的尖角,O存在一個圈,而Y可以看作是有鈍角、銳角、線條共同構成,通過捕捉和識別這些特殊信息,便可以實現圖像的識別。另外,客觀地判斷圖像的性質和內容,并對其代表的含義進行分析。圖像識別技術更為貼切地模仿人眼識別圖像的原理,縮小該技術和人眼識別效果二者的差異,借助專門的計算機程序,模擬人類對圖像的識別過程,從而獲得更多涉及圖像識別的模型。當計算機捕捉到某個圖像時,假如該圖像特征能夠匹配到人記憶中的感官刺激,便可以成功識別出該圖像[1]。
2 人工智能中圖像識別技術的過程
由于圖像識別技術的產生是基于人工智能的基礎上,所以計算機圖像識別的過程與人腦識別圖像的過程大體一致,而計算機圖像識別僅僅是通過科技和技術的形式展現出來,歸納起來,該過程主要包括4個步驟:第一,獲取信息數據。獲取信息數據是圖像識別的前提,獲取數據主要是借助各種傳感器將光、聲音等特殊信號轉變成電信號,以獲得相應的信息和數據,在圖像識別技術中,獲取的信息通常為圖像的特征以及特殊數據,并且保證這些數據和信息能夠用于區分不同圖形的特征,并將其存儲在計算機數據庫中,以便為接下來識別做準備。第二,預處理信息數據。這一過程的操作主要包含對圖像去噪、變換、平滑等,主要目的是凸顯圖像的特征和重要信息。第三,抽取和選擇特征。抽取和選擇圖像的特征作為圖像識別技術中核心部分,特別是在識別這一模式下,對圖形的特殊提出了嚴格的要求,主要是因為抽取和選擇圖像特征質量直接影響著圖像最終是否能夠被成功識別,簡而言之這一過程就是提取不同圖像的特殊特征,提取不同圖形的特殊特征,選擇出能夠區分圖像的特征,然后有選擇地存儲這些特征,并讓計算機對這些特征進行記憶。第四,設計分類器并分類決策。該步驟乃圖像識別的最后一步,設計分類器主要指的是通過某種程度制定出一個識別規則,通過該規則能夠根據某種規律來識別圖像,從而提高圖像識別過程的辨識率,通過該規律能夠凸顯出相似的特征,從而提高圖像識別過程的辨識率,此后再通過識別特殊特征,最終實現對圖像的評價和確認[2]。
3 人工智能中的圖像識別技術的常見形式
3.1 模式識別形式
在人工智能的圖像識別技術中,最有效的模型便是模式識別,模式識別能夠在大量數據和信息的基礎上識別圖像。模式識別形式是相關領域研究者在總結多年實踐經驗和對圖像識別的認知基礎上,運用計算機開展相關計算,再應用數學原理進行推理,從而自動完成識別圖像的形狀、字符、格式、曲線等各個特征,在識別的同時評價這些特征。模式識別模式主要由兩個階段構成:一是學習階段,該階段的實質為存儲過程,即提前采集并存儲圖像特殊的特征、信息、樣本等,在利用計算機的存儲記憶功能按照既定的識別規律對這些熟悉聚合信息進行分類和識別,最后構成對應的圖像識別程序。二是實現階段,該階段要求圖像必須跟腦中的模板完全符合,這樣才能確保識別程序的完成,站在現實角度分析,計算機的識別功能和人腦識別功能存在較大的差異,對計算機而言,其在識別過程中可以按照之前存儲的特征、信息、數據等,將其與最新獲得的圖像信息作匹配,假如按照一定的規律二者可以成功匹配,那么證實該圖像已經被識別。值得注意的是:這種識別是有限的,因此假如某些特征非常相似,便很有可能識別錯誤。
3.2 神經網絡圖像識別形式
這種識別屬于一類比較新型的識別形式,神經網絡圖像識別形式是在傳統圖像識別的基礎上融合神經網絡算法。該形式中,神經網絡屬于人工神經網絡中最具代表性的類型,但是其并不是動物本身存在的神經網絡,而是人類模仿動物神經網絡后通過人工的形成產生的。在神經網絡圖像識別形式中,遺傳算法和BP網絡二者有機融合構成的神經網絡圖像識別是最具代表性的一類,并且被廣泛應用在各個領域中。運用神經網絡圖像識別形式對圖像識別時,通常需要先對圖像的特征進行提取,再將提取到的圖像所有特征映射到神經網絡上,通過這種方式對圖像識別分類。
3.3 非線性降維識別形式
對計算機圖像識別技術而言,其最大特征為異常高維,這主要體現于不管圖像其自身的分辨率高低,該圖形形成的數據信息大部分擁有多維性特征,如此一來便增加了計算機識別難度。如果要想提升計算機圖像識別的能力,降維是最直接也最有效的方式。降維又由兩類構成,一是線性降維;二是非線性降維。其中比較常見的線性降維方法有主成分分析(PCA)和線性奇異分析(LDA)兩類,線性降維最大優點為理解,不難理解,但是線性降維是對整體的數據集合開展處理,因此獲得的投影為最優低維度。但是在將線性降維運用在實踐中,發現運算的過程很復雜,并且需要占據較大的空間,耗費較長的時間。非線性降維是在線性降維的基礎上誕生的,這種圖像識別技術屬于一類高效的非線性特征提取方法。非線性降維識別形式能夠有效發現圖像的非線性機構,并且能夠在保證不破壞其基本結構的前提下實現降維,從而確保了計算機圖像識別盡可能在最低的維度上運行,極大地提升了識別的速率[3]。
4 結語
綜上所述,隨著科技的不斷發展和進步,圖像識別技術作為現代科技發展的產物,受到了社會各界的廣泛關注,并且逐漸被廣泛運用在各行各業中。本人堅信,在未來的發展中,圖像識別技術將不斷得到推廣和普及,造福人類。
參考文獻
[1] 張嘉豐.關于人工智能中圖像識別技術的研究[J].電子技術與軟件工程,2018(23):250-251.
[2] 孟廣仕.圖像識別技術在人工智能中的應用[J].信息與電腦:理論版,2018(12):152-153.
[3] 宋炯,柏松平,燕華.基于人工智能的圖像識別技術探討[J].科技傳播,2018,10(1):106-107.