商 睿
圖像識別技術是將所需物體進行有效信息采集,并依據所采集信息,在數據庫里進行關鍵信息檢索,從而將所需物體歸類到不同種類的圖像處理信息技術。其本質是將物體這一個體范圍投影到類別范圍。這種技術主要是對圖像所體現的信息進行識別。圖像識別技術的發展主要經歷了文本信息提取識別,分割圖像信息識別,三維物體信息識別3個階段。圖像識別系統主要由劃分圖像,提取圖像有效信息,檢索關鍵信息并以此分類將個體投影到類別這三大部分組成,是目前世界上較為先進的識別技術[1]。
圖像識別技術的原理是基于人們對事物的認知過程。當人們看到一個陌生的事物時,會在潛意識里在自己的大腦存儲庫里搜尋這種事物的關鍵詞。圖像識別技術亦是如此,它是先掃描面前的物體,通過圖像分割等步驟及方法,提取出有效信息并根據有效信息進行檢索得出物體種類后歸類。只不過圖像處理技術搜尋的關鍵是在于事物的特征是否明顯,若特征明顯,那么搜尋的效率就高,反之特征不明顯或者模糊不清,那么搜尋的效率就低。
圖像識別技術的發展主要經歷了文本信息提取識別,分割圖像信息識別,三維物體信息識別三個階段。文字識別興起于1950 年,主要是識別字母數字符號為基礎的印刷文明。隨著時代的發展,圖像識別技術開始識別手寫文字,且應用廣泛在許多專業設備中都有其身影。數字圖像識別技術于19世紀60 年代中期興起,其具體出現的時間有待考證。這種識別技術主要是對二維世界的信息提取與檢索分類,是在圖像識別技術發展中,應用較為廣泛的識別技術。在人類社會發展中起了非常重要的作用。這種技術除了感知與認識的作用外,還有著易于儲存運輸處理方便等巨大優勢,極大滿足了人們對于圖像信息提取處理的認識傳播的需求。以上兩種均是針對于二維世界,而近代興起的物體識別則是針對于三維世界,但物體識別也是在數字圖像識別的基礎上興起的,它通過對物體本身及環境的感知達到識別的目的。物體識別屬于高級計算機視覺領域,對我們生活產生著不可替代的意義。
圖像識別分兩大步,第一步是對圖像進行分割。對于圖像的分割,就目前來看有著3 種基本方法。第一種是依據圖像的閾值不同進行分割。這是較為常用的一種方法。這種方法本質上是基于不同目標的灰度值來選取信息,具有用時短效率高的巨大優勢。但是這種分割的局限性也很大,如不易區分閾值從而造成提取出大量無效或具有干擾性信息。第二種方法是依據區域不同來進行圖像分割。分割有兩種基本形式,一種是區域生長,一種是分裂合并。與其他方法不同的是,這種方法可以有效避免因無法區分閾值而提取出大量無效信息的問題,并且這種方法注意到了維護空間的連接性。因此,具有很強的魯棒性。第三種方法是通過檢測圖像像素的灰度值,并識別這些像素灰度值的差異,從而探測到圖像的邊緣地區來進行分割的方法。這種方法的科學技術含量較高,且需要按一定策略,將檢測所得邊緣點鏈接形成輪廓,構成所需圖像分割領域。第二步是進行圖像的匹配。在圖像匹配這一步中,現在最為常用的方法是細節匹配。這一步相較于上一步更為復雜,需要將一定信息數據帶入公式,再依據公式檢測出細節是否匹配[2]。
航空與衛星遙感技術是當今圖像識別技術應用較多的領域。其主要分為兩個方面,一是攝影,二是圖像識別,其中圖像識別又分為光學機器掃描(紅外探測系統)和多光譜遙感技術。紅外探測系統是依據地物發射的熱輻射溫度的差異,將紅外輻射能量以亮度表示的一種圖像化系統。多光譜遙感技術則是一種特殊的技術。在地物的輻射中,一般來說產生的是較寬的、連續的電磁波,在這樣的電磁波里難以直接獲取信息。而如果把這種電磁波分割成許多個比較瞎站的光譜段,就可以獲得一些有效信息。這種以攝影或掃描的方式,在同一時間獲得同一目標的、來自不同光短信息的技術就是多光譜遙感技術。這種技術在當下研究航空衛星圖像時是一種非常重要的內容,也是圖像識別技術的重大應用[2]。
人臉識別技術是圖像識別技術在生物信息提取識別方面的一種最為廣泛、最為主要的應用。人臉識別是近年來各領域研究的熱點問題。這是一種依據捕捉人眼鼻嘴的參數比例,在數據庫進行搜索識別技術[3]。但是這種技術也存在著一種缺陷,當外部環境或者人表情姿態發生變化是人臉識別的性能就會將下降,因此在人臉識別技術上,很多研究者對光照及姿態變化進行了專門的研究,找到了多種解決的方法,如針對于光照變化的構建圖像模型,針對于姿態變化的線形對象類思想,當然也有同時針對光照和姿態變化的三維建模思想,這些方法思想在近幾年均有了較大的進展[4],但在實際應用方面還存在著較大的挑戰。
在農業生產方面,圖像識別技術主要應用于識別不同的植物,如花伴侶App[5]?;ò閭HApp 是一種面向大眾新型知識服務App,它是基于中國植物圖像庫,將里面的植物按照所屬群科分類。人們只需要拍張照,就能知道這個植物是什么種類,是什么科的。方便了人們的生活,對于擴大人們對植物的認識有著非常重要的意義。
圖像識別技術在交通方面應用較為寬泛,如汽車標志定位技術,用于定位車標,在現實生活中具有重要意義。車標識別技術的原理并不復雜,利用攝像頭等攝影工具,把車標拍照后上傳到數據庫,再通過數據庫進行關鍵信息的檢索,即可得到我們所需要的信息。但是由于車標識別技術中的定位并不準確,因此帶來識別中車標大小尺寸的差異,所以如何減小這種差異也成為研究智能圖像識別技術的熱點。除此之外,圖像識別技術在維護交通安全方面有著重要的作用,交警可以將監控信息上傳,通過人臉識別,在信息庫中搜索相近的信息得出相似度最高的人員,從而協助交警抓住肇事逃逸人。因此圖像識別技術對交通安全的維護有著一定促進作用。
圖像識別技術在軍事上有著重要的應用,對軍事化的發展起到一定的促進作用。如在軍事演習中所使用的遙感技術,對地面物體的信息提取分析將所得主要信息呈現在所需人的屏幕上。除此之外,圖像識別技術還有利于軍事勘察,并且對于軍事勘察有著不可替代的作用。
機器視覺也可運用于對貨架中的商品進行識別。這一工作的原理是:先讓機器分析與識別大量的圖片,同時糾正機器判斷出錯的數據,同時使用神經網絡的算法反復學習。在這樣過程之后,計算機就獲得了具有簡單的識物功能。在此基礎上,繼續對機器進行訓練,使其可以認識貨架上商品的包裝,是瓶裝還是袋裝亦或其他類型,甚至是什么品牌、口味與規格。這樣的機器可以準確識別成千上萬種商品,大大提高無人超市的管理等工作的效率。
圖像識別技術在當今世界中起著不可替代的作用,它的應用范圍大到軍事航空,小到日常生活,在現實產生著重要意義,極大的方便了人們的生活,并且協助人們維護社會日常準則。但是圖像識別技術在當下并不完善,它還存在著許多未知領域和技術難題等待著我們的探索和完善,除此之外,圖像識別技術也并不是人們所想象中的那樣,它對人類同樣存在著一些威脅,只不過尚未表現出來。因此,針對圖像識別技術,我們在積極開發它的同時,也要注意合理運用。