【摘要】:數(shù)字圖像和視頻數(shù)據(jù)蘊(yùn)含了豐富的視覺資源,如何智能化地提取和分析其中的有用信息逐漸成為近年的研究熱點(diǎn)。計(jì)算機(jī)視覺技術(shù)在此學(xué)術(shù)背景下逐漸發(fā)展,并已經(jīng)廣泛應(yīng)用于生產(chǎn)制造、智能安檢、圖像檢索、醫(yī)療影像分析、人機(jī)交互等領(lǐng)域。與此同時(shí),計(jì)算機(jī)視覺技術(shù)仍然面臨諸如語義信息描述模糊、圖像特征檢測(cè)不穩(wěn)定且效率低下等諸多問題。
【關(guān)鍵詞】:計(jì)算機(jī)視覺;圖像特征;發(fā)展
1.計(jì)算機(jī)視覺技術(shù)核心問題
視覺問題復(fù)雜性的本質(zhì)在于相對(duì)聲音等物理信號(hào)的描述,視覺信號(hào)充滿了非常豐富的信息,描述起來也更加困難。比如,很多圖像中蘊(yùn)含了大量簡(jiǎn)單(如顏色、形狀、紋理、幾何特征等)及復(fù)雜(如場(chǎng)景、字符、物體分布、人物而部特征、人體姿勢(shì)等)信息并具有較大的動(dòng)態(tài)范圍和主觀性,如何攻克圖像信息提取過程中的各種難題一直是當(dāng)今計(jì)算機(jī)圖像學(xué)研究的熱點(diǎn)問題。而且,在科學(xué)家們還未完全破譯生物視覺系統(tǒng)的奧秘的前提下,大多數(shù)CV問題只能采用“逆向推導(dǎo)機(jī)制”—依據(jù)己知或假設(shè)的關(guān)聯(lián)將視覺系統(tǒng)的輸入(數(shù)字圖像)和輸出(語義描述)對(duì)應(yīng)起來,通過圖片猜測(cè)真實(shí)世界物體具有的形狀,照明度以及顏色分布。因此,基于概率論和數(shù)理統(tǒng)計(jì)的數(shù)學(xué)模型是最適合解決這類逆推問題的工具,這也是目前CV領(lǐng)域普遍采用各種統(tǒng)計(jì)模型和機(jī)器學(xué)習(xí)算法的本質(zhì)原因。由于各種學(xué)習(xí)機(jī)制和統(tǒng)計(jì)模型需要基于先驗(yàn)知識(shí)并建立在對(duì)待測(cè)圖像內(nèi)容的約束、簡(jiǎn)化及假設(shè)的基礎(chǔ)上,和生物視覺幾億年的發(fā)展進(jìn)化相比,其建立的數(shù)學(xué)模型也只能片而而且粗糙地描繪出視覺系統(tǒng)輸入與輸出之間的關(guān)系。因此,對(duì)某組特定圖像檢測(cè)時(shí)表現(xiàn)十分優(yōu)秀的系統(tǒng),往往對(duì)另一組語義相同的圖片素手無策;很多看似穩(wěn)定的機(jī)器學(xué)習(xí)機(jī)制,在增加樣本種類和數(shù)量后,檢測(cè)率反而會(huì)下降;很多設(shè)計(jì)復(fù)雜的檢測(cè)算法在實(shí)際應(yīng)用中的表現(xiàn)反而不如一些簡(jiǎn)單且基本的數(shù)學(xué)描述困。
2.計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域
計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域主要包括對(duì)照片、視頻資料如航空照片、衛(wèi)星照片、視頻片段等的解釋、精確制導(dǎo)、移動(dòng)機(jī)器人視覺導(dǎo)航、醫(yī)學(xué)輔助診斷、工業(yè)機(jī)器人的手眼系統(tǒng)、地圖繪制、物體三維形狀分析與識(shí)別及智能人機(jī)接口等。
早期進(jìn)行數(shù)字圖像處理的目的之一就是要通過采用數(shù)字技術(shù)提高照片的質(zhì)量,輔助進(jìn)行航空照片和衛(wèi)星照片的讀取判別與分類。由于需要判讀的照片數(shù)量很多,于是希望有自動(dòng)的視覺系統(tǒng)進(jìn)行判讀解釋,在這樣的背景下,產(chǎn)生了許多航空照片和衛(wèi)星照片判讀系統(tǒng)與方法。自動(dòng)判讀的進(jìn)一步應(yīng)用就是直接確定目標(biāo)的性質(zhì),進(jìn)行實(shí)時(shí)的自動(dòng)分類,并與制導(dǎo)系統(tǒng)相結(jié)合。目前常用的制導(dǎo)方式包括激光制導(dǎo)、電視制導(dǎo)和圖像制導(dǎo),在導(dǎo)彈系統(tǒng)中常常將慣性制導(dǎo)與圖像制導(dǎo)結(jié)合,利用圖像進(jìn)行精確的末制導(dǎo)。
3.計(jì)算機(jī)視覺技術(shù)在工業(yè)領(lǐng)域中的應(yīng)用
計(jì)算機(jī)視覺系統(tǒng)可用工業(yè)領(lǐng)域的很多方面,如零件檢驗(yàn)與尺寸測(cè)量、零件的缺陷檢查、機(jī)器人的引導(dǎo)和零件的識(shí)工業(yè)、木材工業(yè)、紡織工別等。應(yīng)用圖象處理及計(jì)算機(jī)視覺檢測(cè)技術(shù)最多的部門是電子工業(yè),零件裝配、其次是汽車業(yè)、食品加工工業(yè)、包裝工業(yè)及航空工業(yè)等等,已取得的應(yīng)用成果有產(chǎn)品形狀和表而缺陷檢查、產(chǎn)品非破壞性檢查、機(jī)器人、產(chǎn)品分類、其他應(yīng)用等。
考慮經(jīng)濟(jì)效益因素,一般將計(jì)算機(jī)視覺技術(shù)應(yīng)用飛以下場(chǎng)合在線處理零件;惡劣的制造環(huán)境,不適飛人進(jìn)行操作在運(yùn)送過程零件可能損壞有大量的小零件需要測(cè)量有合適的照明條件。其中,在需要重復(fù)檢測(cè)相同部件或產(chǎn)品的場(chǎng)合中,計(jì)算機(jī)視覺技術(shù)的應(yīng)用最為廣泛,采用的主要技術(shù)手段有計(jì)算機(jī)技術(shù)、傳感技術(shù)、圖象處理技術(shù)、模式識(shí)別等,目的在飛利用這些技術(shù)構(gòu)險(xiǎn)價(jià)比優(yōu)良的工業(yè)視覺檢測(cè)裝置。如果零件外形變化對(duì)加工不重要、或現(xiàn)場(chǎng)照明條件很差、或傳感器能夠提供所需的信息時(shí),就不需要使用計(jì)算機(jī)視覺系統(tǒng)。
工業(yè)視覺檢測(cè)過程包括二個(gè)步驟,首先是利用各種光源和傳感器進(jìn)行數(shù)據(jù)采集,實(shí)際應(yīng)用中,輸入的源圖象多數(shù)是256色的灰度圖象;其次是對(duì)源圖象進(jìn)行數(shù)據(jù)處理、分析及特征提取,為了得到準(zhǔn)確的檢測(cè)結(jié)果,通常先要對(duì)源圖象進(jìn)行預(yù)處理,大部分情況下,預(yù)處理基礎(chǔ)上還需應(yīng)用匹配技術(shù)進(jìn)行物體檢測(cè),即先建立模板,然后用已有的模板與被檢測(cè)物體相配,以便進(jìn)行分類;最后是輸出處理結(jié)果。檢測(cè)系統(tǒng)能否達(dá)到預(yù)期效果,關(guān)鍵在于第二階段—數(shù)據(jù)處理、分析及特征提取階段中計(jì)算機(jī)對(duì)圖象處理的準(zhǔn)確程度。
在圖象預(yù)處理方面,模板匹配前對(duì)圖象進(jìn)行預(yù)處理,目的在獲取源圖象的二位邊緣圖。圖象預(yù)處理階段需要完成邊緣檢測(cè)、二仇化等工作。目前,已有很多邊緣檢測(cè)方法,一階微分算子、二階微分算子、全局檢測(cè)方法等。
4.結(jié)語
在原有問題上采用新的描述方法、求解手段也是一個(gè)可能的突破點(diǎn)。在視覺領(lǐng)域中多數(shù)的問題不是問題本身正確與否,而是描述是否恰當(dāng)以及求解是否有效的問題,因而描述方式、求解手段的探索是十分重要的。總之,隨著對(duì)定量研究的重視,新的描述方式、求解手段的研究,以及感知手段的改進(jìn),計(jì)算機(jī)視覺的研究必將迎來一個(gè)更加繁榮的時(shí)代。
5.參考文獻(xiàn)
[1]韓瑞珍,何勇. 基于計(jì)算機(jī)視覺的大田害蟲遠(yuǎn)程自動(dòng)識(shí)別系統(tǒng)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2013,(03):156-162.
[2]關(guān)然,徐向民,羅雅愉,苗捷,裘索. 基于計(jì)算機(jī)視覺的手勢(shì)檢測(cè)識(shí)別技術(shù)[J]. 計(jì)算機(jī)應(yīng)用與軟件,2013,(01):155-159+164.
[3]許志杰,王晶,劉穎,范九倫. 計(jì)算機(jī)視覺核心技術(shù)現(xiàn)狀與展望[J]. 西安郵電學(xué)院學(xué)報(bào),2012,(06):1-8.
[4]江靜,張雪松. 基于計(jì)算機(jī)視覺的深度估計(jì)方法[J]. 光電技術(shù)應(yīng)用,2011,(01):51-55.
[5]潘磊慶,屠康,詹歌,劉明,鄒秀容. 基于計(jì)算機(jī)視覺和聲學(xué)響應(yīng)信息融合的雞蛋裂紋檢測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2010,(11):332-337.
[6]邱茂林,馬頌德,李毅. 計(jì)算機(jī)視覺中攝像機(jī)定標(biāo)綜述[J]. 自動(dòng)化學(xué)報(bào),2000,(01):47-59.