宋炯+柏松平+王燕華
摘 要 在人工智能領域之中,眾多技術被研發和應用,其中圖像識別技術是基于人工智能的代表技術之一。現今我國的科技技術、電子信息技術都在不斷發展,人工智能中的圖像識別技術也在不斷更新,越來越多的領域關注并應用該技術,包括醫療診斷、信息識別、衛星云圖識別等等,基于人工智能的圖像識別技術能夠為各個領域的發展提供便利。本文對此展開探討。
關鍵詞 人工智能;圖像識別技術;應用
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2018)202-0106-02
現今計算機技術和信息技術日益發展,在此背景下圖像識別技術也越來越多的被人們關注。從現實發展角度來說,圖像識別技術的產生和更新是一種必然的趨勢,且在未來的發展中會有更廣闊的應用空間,無論是醫療、安檢、信息搜集、產品安全等等,都會更加依賴于圖像識別技術[ 1 ]。
圖像識別技術通常是指利用計算機對系統前端捕獲的圖片根據既定的目標對其進行處理,因此,人們在日常生活和工作中也會經常接觸到該技術,例如條碼識別、指紋識別等等,該技術給人們的生產安全提供了重要的保障,因此展開圖像識別技術的研究和探討是非常有意義的。
1 圖像識別技術的基本原理
人眼產生的視覺效果是一種非常神奇的現象,由此人眼對圖像的識別能力是很強的。當某個圖像距離、位置、角度發生改變時,人的感官也會隨之發生變化,圖像在人眼視網膜上的成像也會相應發生大小和形狀的改變,但這種改變不足以影響人們對圖像的判斷,且人可以通過各種感官判斷某種圖像,例如當在手背上寫字時,也可以通過感官判斷這個字體。圖像識別技術是人工智能領域中的重要技術,因此其識別原理與人眼識別的原理相似,都是以圖像的突出性特征為基礎進行的[ 2 ]。
圖像識別的重點是尋找圖像的特征,例如英文大寫字母中,A有個突出的尖角,O有個圈、而Y則基本可以視為線條和銳角鈍角所組成,對于特殊信息,也就是突出特征的捕捉和識別,才能通過圖像中的有效信息對這個圖像進行識別,并且判斷這個圖像的內容和性質,并且分析它所代表的含義。
為了模仿人眼識別圖像的原理,達到人眼識別的效果,科學家編制模擬人類圖像識別活動的計算機程序,從而獲取了眾多關于圖像識別的識別模型,當計算機捕捉到某個圖像時,若圖像特征與記憶中人腦的感官刺激相匹配,則認為這個圖像已經被識別。
2 基于人工智能的圖像識別過程
圖像識別技術是基于人工智能誕生的,因此,計算機對圖像識別的過程也與人腦識別圖像的過程基本類似,只不過是以技術和科技展現出來[ 3 ]。基于人工智能的圖像識別過程如下:
1)信息數據的獲取,信息數據的獲取是圖形識別的基礎,利用各類傳感器將聲音和光等特殊信號轉化為電信號,從而獲取所需的數據和信息,在圖像識別技術中,所需要獲取的信息是圖像的特征和特殊數據,這些信息和數據要求能夠區分圖形之間的特征,將其存儲于計算機的數據庫內,則可以用于之后步驟的展開。
2)信息數據預處理,此過程對圖像進行去噪、變換以及平滑等處理操作,將圖像的特征和重要信息突顯。
3)特征抽取與選擇,圖像識別技術中的核心內容就是對圖像進行特征的抽取與選擇,尤其是識別模式中,對于特征的要求更為嚴格,這決定著圖像最終能夠否被成功識別,也就是將不同圖形的特殊特征提取,選擇能夠區分圖形的特征,并且將所選擇的特征存儲,讓計算機記憶這種特征。
4)分類器設計與分類決策,此步驟是圖像識別的最后一步,分類器設計是指以有效的程序制定出一個識別規則,這種識別規則能夠按照某種規律對圖像進行識別,而不是盲目混亂的進行識別,借此識別規律能夠將相似的特征種類突顯,致使圖像識別過程的辨識率更高,之后通過對特殊特征的識別,完成圖像的評價和確認。
3 常見的圖像識別技術形式
3.1 模式識別
模式識別(PatternRecognition)是圖像識別技術中的一種有效模型,該模式從大量信息和數據出發進行圖像識別。該識別模型是圖像識別技術專家在多年經驗的積累基礎上和已有對圖像識別的認知基礎上,通過計算機進行計算,并且以數學原理進行推理,在圖像的形狀、模式、曲線、數字、字符格式等各個特征方面自動完成識別,并且在識別的過程中對這些特征進行評價[ 4 ]。
識別模式的進行分為兩個階段,即學習階段和實現階段,學習階段實質可以將其理解為一個存儲的過程,也就是對圖像的特殊信息、特征、樣本提前采集和存儲,通過計算機的存儲記憶能力將這些熟悉聚合信息按照一定的識別規律進行分類和識別,并且形成相應圖像的識別程序。
后一個階段則是實現階段,實現階段強調圖像必須與腦中的模板完全符合,如此才能完成識別程序,從現實角度來說,計算機的識別與人腦的識別還是有巨大的差異,但在計算機的識別過程中,能夠根據之前記憶階段的特征、數據以及信息,將最新捕捉的圖像信息進行匹配,若按照既定的規律能夠匹配完成,這說明這個圖像已經被識別。但這種識別是有限的,對于某一類特別相似的特征,可能會出現識別錯誤的現象。
3.2 神經網絡形式
神經網絡形式的圖像識別技術是當前應用較多且全面更新的一種技術,該技術基于傳統的圖像識別方式,與現代神經網絡算法完美融合,從而形成了這種全新的識別形式。因為圖像識別是人工智能領域的技術,因此,這里的神經網絡是指人工神經網絡,也就是說這種技術是模擬了人類及動物的神經網絡分布特征,相較于傳統的圖像識別技術,融入神經網絡算法的圖像識別程序更為復雜,成本更高,但發揮的效果也是顯而易見的。
被提取和捕捉的圖像特征能夠在神經網絡程序中加以映射,更為精確、全面的完成圖像識別,并且對其進行分類處理。在交通管理系統中,智能汽車監控拍攝識別,就是應用這一技術進行的,能夠在拍攝的瞬間迅速識別和分辨車牌信息,從而協助交通管理的進行。
3.3 非線性降維形式
非線性識別技術是一種高維形式的識別技術,該技術的優勢在于對于分辨率較低的圖形也可進行有效的識別,因為這種技術產生的數據具有多維性特征,且經過了非線性處理。這種技術在最初構想時就遇到了諸多的困難,非線性降維的圖像識別需要計算機在短時間內進行大量的計算。最初將降維劃分成非線性降維與線性降維兩類,諸但非線性降維更為簡單,其效果也較為突出。
例如人臉識別就可利用非線性降維實現,因為高維度空間內的人臉圖像分布不均,突出的特征信息也無法有效提取,而非線性降維方式則有效提升了人臉的辨識度。
4 結論
綜上所述,圖像識別技術是現今科技發展中的新興技術種類,已經被越來越多的人關注,并且廣泛應用于各個領域。在未來的發展中,圖像識別技術將被進一步普及,而隨著用戶的增加技術會進一步更新,以滿足人們生產生活的需求。圖像識別技術目前已經成為能夠服務社會、促進經濟發展、保障財產安全的重要技術,在未來會有更為廣闊的發展空間,被人們愈發深刻的認識與掌握。
參考文獻
[1]李萍,徐安林.基于BP神經網絡的智能制造系統圖像識別技術[J].現代電子技術,2016,39(18):107-109.
[2]蔣樹強,閔巍慶,王樹徽.面向智能交互的圖像識別技術綜述與展望[J].計算機研究與發展,2016,53(1):113-122.
[3]葛瑋,吳佳.關于計算機智能圖像識別的算法及技術分析[J].無線互聯科技,2014(10):82.
[4]陳波光,劉姝姝,蔡揚亞.計算機的智能化圖像識別技術的理論性突破[J].電子制作,2013(15):69.
[5]張家怡.圖像識別的技術現狀和發展趨勢[J].電腦知識與技術,2010,6(21):6045-6046.