張中良
摘 要:機(jī)器視覺的圖像目標(biāo)識(shí)別方法是目前國內(nèi)外相關(guān)領(lǐng)域?qū)W者的研究重點(diǎn)和研究熱點(diǎn)。首先就機(jī)器視覺的圖像目標(biāo)識(shí)別作了簡要介紹,然后針對圖像目標(biāo)識(shí)別的關(guān)鍵技術(shù),即圖像預(yù)處理、圖像分割和特征提取,總結(jié)、歸納了國內(nèi)外的研究現(xiàn)狀,指出各方面存在的問題,最后就機(jī)器視覺的圖像目標(biāo)識(shí)別技術(shù)的發(fā)展方向作了展望。
關(guān)鍵詞:機(jī)器視覺;圖像目標(biāo)識(shí)別;圖像預(yù)處理;圖像分割
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.15913/j.cnki.kjycx.2016.14.032
圖像目標(biāo)識(shí)別作為機(jī)器視覺中的一個(gè)重要研究領(lǐng)域,現(xiàn)已被廣泛應(yīng)用于農(nóng)業(yè)、工業(yè)、國防、醫(yī)療及日常生活等領(lǐng)域,比如農(nóng)作物藥物噴灑、工業(yè)自動(dòng)化、軍事偵查、醫(yī)療輔助及交通便利等。由于識(shí)別背景、環(huán)境及目標(biāo)的復(fù)雜性,機(jī)器視覺圖像目標(biāo)的高效、準(zhǔn)確識(shí)別具有一定的困難。因此,機(jī)器視覺如何高效、準(zhǔn)確地識(shí)別圖像目標(biāo),已成為近年來國內(nèi)外學(xué)者研究的重點(diǎn)。
機(jī)器視覺的圖像目標(biāo)識(shí)別主要利用模式識(shí)別和圖像處理,即從大量的圖片中學(xué)習(xí)后提取目標(biāo)圖像,并進(jìn)行目標(biāo)分類。與計(jì)算機(jī)視覺不同,機(jī)器視覺的圖像目標(biāo)識(shí)別更加注重實(shí)時(shí)性,所以其自動(dòng)獲取圖像與高效分析圖像的能力尤為重要。目前,國內(nèi)外學(xué)者對機(jī)器視覺的圖像目標(biāo)識(shí)別進(jìn)行了大量研究,但在識(shí)別精度、識(shí)別時(shí)間及抗干擾能力等方面仍然存在不足。本文就機(jī)器視覺的圖像目標(biāo)識(shí)別方法的關(guān)鍵問題進(jìn)行探討,并對其發(fā)展的方向進(jìn)行展望。
1 圖像預(yù)處理
圖像預(yù)處理是對機(jī)器視覺獲取的圖像目標(biāo)進(jìn)行灰度矯正、噪聲過濾等,使得圖像目標(biāo)中有用的信息更容易被提取。圖像預(yù)處理的流程如圖1所示。
圖像預(yù)處理需要對圖像進(jìn)行平移、旋轉(zhuǎn)和縮放等幾何規(guī)范,使得圖像識(shí)別能夠快速、準(zhǔn)確。同時(shí),圖像濾波的主要目的是在保持圖像特征的狀態(tài)下進(jìn)行噪聲消除,其可分為線性濾波和非線性濾波。與線性濾波相比,非線性濾波能夠在去噪的同時(shí)保護(hù)圖像細(xì)節(jié),是目前圖像濾波方法中研究的熱點(diǎn)。非線性濾波中具有代表性的是卡爾曼濾波和粒子濾波。卡爾曼濾波具有簡單性和魯棒性較好的優(yōu)點(diǎn),被廣泛應(yīng)用于機(jī)器視覺跟蹤。文獻(xiàn)[12]利用改進(jìn)的卡爾曼濾波提高了大氣數(shù)據(jù)同化;文獻(xiàn)[13]提出了無極卡爾曼濾波,使得圖像更加精確。對于粒子濾波算法,還存在退化現(xiàn)象、樣本匱乏及自適應(yīng)粒子數(shù)量選擇策略等問題,是目前國內(nèi)外學(xué)者的研究熱點(diǎn)。另外,圖像邊緣是圖像目標(biāo)的一個(gè)重要區(qū)域,圖像邊緣檢測技術(shù)對于圖像預(yù)處理十分重要。文獻(xiàn)[15]給出了多種邊緣檢測技術(shù)在實(shí)際應(yīng)用中選擇最優(yōu)檢測技術(shù)的方案,文獻(xiàn)[16]利用多尺度、多結(jié)構(gòu)的數(shù)學(xué)形態(tài)對圖像目標(biāo)進(jìn)行了邊緣提取,穩(wěn)定性更高。
從國內(nèi)外的研究現(xiàn)狀來看,圖像預(yù)處理對于機(jī)器視覺的圖像目標(biāo)識(shí)別具有重要作用,其幾何規(guī)范、圖像濾波和圖像邊緣檢測不斷有新的方法被提出,目的在于提高精度和效率。
2 圖像分割
圖像分割是實(shí)現(xiàn)機(jī)器視覺圖像自動(dòng)識(shí)別與分析的重要問題,其分割質(zhì)量對后續(xù)圖像的分析具有重要影響。快速、精確地將特征目標(biāo)從復(fù)雜的圖像中分割出來一直是國內(nèi)外學(xué)者的研究重點(diǎn)。圖像分割可采用3種途徑,即區(qū)域分割、邊界分割和邊界形成分割。圖像分割的方法有多種,其中,最常用的分割方法是閾值法,但這種方法適用范圍較小、分割精度較差;能量最小化方法在過去30年得到了巨大發(fā)展,但是其計(jì)算效率偏低;基于圖割的圖像分割方法能夠逼近最優(yōu)解,計(jì)算效率高,但存在不一定收斂的缺點(diǎn)。
近年來,隨著圖像分割要求的精度和效率越來越高,基于混合方法的圖像分割技術(shù)被提出,即集合多種方法進(jìn)行圖像分割,以獲得最優(yōu)的分割結(jié)果。這也成為機(jī)器視覺圖像分割未來的主要發(fā)展方向。
3 特征提取
作為機(jī)器視覺圖像目標(biāo)識(shí)別的一個(gè)中間節(jié)點(diǎn),特征提取對目標(biāo)識(shí)別的精度和速度具有重要影響。從復(fù)雜的圖像信息中提取有用的特征,對實(shí)現(xiàn)機(jī)器視覺的目標(biāo)識(shí)別起到?jīng)Q定性的作用。
根據(jù)不同分類方法,可將圖像特征分為多種類型,例如可根據(jù)區(qū)域大小分為全局特征和局部特征,根據(jù)統(tǒng)計(jì)特征分為矩特征、輪廓特征及紋理特征等。與全局特征相比,用局部特征在復(fù)雜的背景下對圖像目標(biāo)進(jìn)行描述非常高效,常用的檢測方法有稀疏選取、密集選取和其他方法選取。從現(xiàn)有的研究成果來看,這3類方法都有一定的不足——對圖像目標(biāo)背景依賴性大,因此,采用多種描述子進(jìn)行機(jī)器視覺的圖像目標(biāo)識(shí)別是一種發(fā)展趨勢。
對于圖像特征提取,不同的描述子不斷被提出,其中,GLOH(Gradient location orientation histograms)和SIFT(Scale invariant feature transform)描述子性能穩(wěn)定,應(yīng)用較為廣泛;SURF(Speeded-up robust features)描述子在圖像目標(biāo)特征明顯時(shí)能夠快速識(shí)別,應(yīng)用效果較好。除此之外,不變矩和導(dǎo)向?yàn)V波器在低維描述子中表現(xiàn)較好。
4 結(jié)論
通過對現(xiàn)有文獻(xiàn)中的研究成果進(jìn)行總結(jié)和分析可以發(fā)現(xiàn),機(jī)器視覺的圖像目標(biāo)識(shí)別是目前國內(nèi)外眾多學(xué)者的研究熱點(diǎn),其圖像預(yù)處理、圖像分割和特征提取技術(shù)各方面都得到了快速發(fā)展,高速、精確及立體化、智能化是未來機(jī)器視覺的圖像目標(biāo)識(shí)別技術(shù)發(fā)展的重要方向。
參考文獻(xiàn)
[1]Patil S B,Bodhe S K.Leaf disease severity measurement using image processing.International Journal of Engineering and Technology,2011,3(5):297-301.
[2]王靖,李少華,謝守勇.基于機(jī)器視覺的目標(biāo)識(shí)別方法研究[J].西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,40(6):130-133.
[3]陳景文.自動(dòng)識(shí)別技術(shù)及其在軍事領(lǐng)域中的應(yīng)用[J].現(xiàn)代電子技術(shù),2006,19(234):29-31.
[4]Bartel D P.MicroRNAs:target recognition and recognition and regulatory functions. Cell,2009,136(2):215-233.
[5]王耀南,李樹濤,毛建旭.計(jì)算機(jī)圖像處理與識(shí)別技術(shù)[M].北京:高等教育出版社,2001:23-24.
[6]吳紀(jì)超.機(jī)器視覺圖像中目標(biāo)提取識(shí)別算法研究[D].保定:河北農(nóng)業(yè)大學(xué),2010.
[7]張正炳,朱耀庭,朱光喜,等.實(shí)現(xiàn)圖像幾何變換的迭代函數(shù)系統(tǒng)參數(shù)修改法[J].數(shù)據(jù)采集與處理,1996,11(3):168-171.
[8]肖斌.基于不變矩的圖像幾何變換不變性識(shí)別研究[D].西安:陜西師范大學(xué),2007.
[9]Tang K J, Astola J, Neuvo Y.Nonlinear multivariate image filtering techniques.IEEE Transactions on Image Processing,1995,4(6):788-798.
[10]Basar T.A new approach to linear filtering and prediction problems.J.basic Eng. trans.asme,1960,82(1):35-45.
[11]Carpenter J,Clifford P,F(xiàn)earnhead P.Improved particle filter for non-linear problems.IEEE Proceedings F,1999,146(1):2-7.
[12]Houtekamer P L,Mitchell H L.A sequential ensemble kalman filters for atmospheric data assimilation.Monthly Weather Review,2001,129(1):123-137.
[13]Srkk S.Bayesian Filtering and Smoothing.Institute of Mathematical Statistics Textbooks,2013,40(4):S407.
[14]王法勝,魯明羽,趙清杰,等.粒子濾波算法[J].計(jì)算機(jī)學(xué)報(bào),2014,37(8):1679-1694.
[15]陳娟,陳乾輝,師路歡,等.圖像跟蹤中的邊緣檢測技術(shù)[J].中國光學(xué)與應(yīng)用光學(xué),2009,2(1):46-53.
[16]王芳,錢煒,李文超.基于數(shù)學(xué)形態(tài)學(xué)的圖像邊緣提取方法[J].機(jī)械工程與自動(dòng)化,2015(1):46-48.
[17]Pal N R,Pal S K.A review on image segmentation techniques.Pattern Recognition, 1993,26(9):1277-1294.
[18]Bhandarkar S M,Zhang H.A comparison of stochastic optimization techniques for image segmentation.International Journal of Intelligent Systems,2000,15(5):441-476.
[19]劉松濤,殷福亮.基于圖割的圖像分割方法及其新進(jìn)展[J].自動(dòng)化學(xué)報(bào),2012,38(6):911-922.
[20]Qiao S,Zhao C,Huang J,et al.Accelerated H-LBP-based edge extraction method for digital radiography.Nuclear Instruments and Methods in Physics Research Section A:Accelerators Spetrometers,Detectors and Associated Equipment,2015(770):52-56.
[21]曹健,陳紅倩,毛典輝,等.基于局部特征的圖像目標(biāo)識(shí)別問題綜述[J].中南大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,44(2):258-262.
[22]李文勇.基于機(jī)器視覺的果園性誘害蟲在線識(shí)別與計(jì)數(shù)方法研究[D].北京:中國農(nóng)業(yè)大學(xué),2015.
[23]Mikolajczyk K,Schmid C. A performance evaluation of local descriptors.IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(10):1615-1630.
[24]Lowe D.Distinctive image features from scale-invairant keypoints. International Joural of Computer Vision,2004,60(2):91-110.
[25]Redondo-Cabrera C,Lopez-Sastre R,Acevedo-Rodriguez J,et al.SURFing the point clouds:Selective 3D spatial pyramids for category-level object recognition.Proceeding of the IEEE Conference on the Computer Vision and Pattern Recognition. Providence,Rhode Island:IEEE,2012:3458-3465.
〔編輯:劉曉芳〕