周明陽
機(jī)器視覺技術(shù)正在各領(lǐng)域扮演越來越重要的角色,我國新近問世的通用式三維即時視覺傳感技術(shù)填補(bǔ)了機(jī)器視覺領(lǐng)域的空白
視覺是人類觀察和認(rèn)知世界的重要手段。據(jù)統(tǒng)計(jì),人類從外部世界獲得的信息約有80%由視覺獲取。這既說明視覺信息量巨大,又體現(xiàn)出人類視覺功能的重要性。隨著信息技術(shù)的發(fā)展,為計(jì)算機(jī)、機(jī)器人或其他智能機(jī)器賦予人類視覺功能,成為科學(xué)家們的奮斗目標(biāo)
目前,機(jī)器視覺技術(shù)已經(jīng)實(shí)現(xiàn)了產(chǎn)品化、實(shí)用化,鏡頭、高速相機(jī)、光源、圖像軟件、圖像采集卡、視覺處理器等相關(guān)產(chǎn)品功能日益完善。機(jī)器視覺技術(shù)在信息化時代正扮演著越來越重要的角色。
什么是“機(jī)器視覺”
與計(jì)算機(jī)視覺相比,機(jī)器視覺偏重于計(jì)算機(jī)視覺技術(shù)工程化,能夠自動獲取和分析特定的圖像,對準(zhǔn)確度和處理速度要求都比較高。一般而言,計(jì)算機(jī)視覺多用來識別“人”,而機(jī)器視覺則多用來識別“物”
機(jī)器視覺是人工智能正在快速發(fā)展的一個分支,是研究用計(jì)算機(jī)來模擬生物視覺的科學(xué)技術(shù)。機(jī)器視覺系統(tǒng)的首要目標(biāo)是用圖像創(chuàng)建或恢復(fù)現(xiàn)實(shí)世界模型,然后認(rèn)識現(xiàn)實(shí)世界。其具體操作方法是通過機(jī)器視覺產(chǎn)品將被攝取目標(biāo)轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,再根據(jù)像素分布和亮度、顏色等信息將其轉(zhuǎn)變成數(shù)字化信號,圖像系統(tǒng)對這些信號進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而控制現(xiàn)場設(shè)備的動作。
說起視覺,人們并不陌生。近年來,作為重要的生物識別技術(shù)之一的人臉識別技術(shù)飛速進(jìn)步,“刷臉”可以實(shí)現(xiàn)考勤、支付、身份驗(yàn)證等操作,已經(jīng)成為安全系數(shù)較高的身份識別技術(shù)。不過,人臉識別技術(shù)屬于計(jì)算機(jī)視覺而非機(jī)器視覺,這兩種技術(shù)既有區(qū)別又有聯(lián)系。
張廣軍編著的《機(jī)器視覺》一書中這樣區(qū)分兩種技術(shù):計(jì)算機(jī)視覺是采用圖像處理、模式識別、人工智能技術(shù)相結(jié)合的手段,對目標(biāo)物體進(jìn)行識別,確定目標(biāo)物體的位置和姿態(tài);機(jī)器視覺則偏重于計(jì)算機(jī)視覺技術(shù)工程化,能夠自動獲取和分析特定的圖像,功能主要為物體定位、特征檢測、缺陷判斷、目標(biāo)識別、計(jì)數(shù)和運(yùn)動跟蹤等。
具體而言,計(jì)算機(jī)視覺應(yīng)用的場景相對復(fù)雜,要識別的物體類型也多,形狀不規(guī)則、規(guī)律性不強(qiáng),有時甚至很難用客觀量作為識別的依據(jù),比如識別年齡、性別,深度學(xué)習(xí)比較適合計(jì)算機(jī)視覺,對于光線、距離、角度等條件要求較低;而機(jī)器視覺場景相對簡單固定,在同一應(yīng)用中識別的類型少,規(guī)則且有規(guī)律,但對準(zhǔn)確度和處理速度要求都比較高,一般機(jī)器視覺的分辨率遠(yuǎn)高于計(jì)算機(jī)視覺,而且往往要求實(shí)時,處理速度非常關(guān)鍵。一般而言,計(jì)算機(jī)視覺多用來識別“人”,而機(jī)器視覺則多用來識別“物”。
機(jī)器視覺應(yīng)用廣泛
只要是需要對物體進(jìn)行識別、特征判斷和檢測,機(jī)器視覺就可以大展拳腳。如今,在農(nóng)業(yè)、工業(yè)、醫(yī)學(xué)等領(lǐng)域,機(jī)器視覺技術(shù)因其非接觸、速度快、精度高、現(xiàn)場抗干擾能力強(qiáng)等突出優(yōu)點(diǎn),得到了廣泛應(yīng)用
近幾十年來,視覺系統(tǒng)因其非接觸、速度快、精度高、現(xiàn)場抗干擾能力強(qiáng)等突出優(yōu)點(diǎn),使機(jī)器視覺技術(shù)在農(nóng)業(yè)、工業(yè)、醫(yī)學(xué)等領(lǐng)域得到了廣泛應(yīng)用。只要是需要對物體進(jìn)行識別、特征判斷和檢測,機(jī)器視覺就可以大展拳腳,將任務(wù)完成得又快又好。
比如在農(nóng)業(yè)生產(chǎn)中,有一部分工作是對農(nóng)作物或農(nóng)產(chǎn)品的外觀進(jìn)行判斷,如水果品質(zhì)檢測、果實(shí)成熟度判別、作物生長狀況以及雜草的識別等。這些過去主要依靠人的視覺進(jìn)行辨別和判斷的工作可以由機(jī)器視覺技術(shù)部分或全部替代,從而實(shí)現(xiàn)農(nóng)業(yè)自動化和智能化。例如,來自南京林業(yè)大學(xué)的黃秀玲團(tuán)隊(duì)就設(shè)計(jì)了一條可以對蘋果品質(zhì)進(jìn)行動態(tài)、實(shí)時檢測的智能化分級生產(chǎn)線。生產(chǎn)線上,均勻分布的3個攝像頭一次性采集蘋果表面信息,通過計(jì)算機(jī)智能控制系統(tǒng)對采集信息進(jìn)行綜合分析,從而對蘋果進(jìn)行分級。不過,也有專家表示,由于農(nóng)田環(huán)境的復(fù)雜多變性以及非結(jié)構(gòu)化特性,目前機(jī)器視覺在農(nóng)業(yè)生產(chǎn)中的應(yīng)用尚不成熟,仍需進(jìn)一步完善。
在工業(yè)環(huán)境中,機(jī)器視覺應(yīng)用日臻成熟,在提高工業(yè)生產(chǎn)靈活性和自動化程度方面發(fā)揮重大作用。此外,在危險工作環(huán)境或人工視覺難以滿足要求的場合,用機(jī)器視覺來替代人工視覺也提高了作業(yè)的安全性。在流水線上通過圖像識別技術(shù)檢查產(chǎn)品外觀缺損、標(biāo)簽印刷錯誤、電路板焊接質(zhì)量缺陷的圖像識別系統(tǒng)就是機(jī)器視覺系統(tǒng)應(yīng)用于工業(yè)領(lǐng)域的成功范例。印刷包裝、汽車工業(yè)、半導(dǎo)體材料、食品生產(chǎn)等,都是機(jī)器視覺在工業(yè)領(lǐng)域的應(yīng)用方向。
在勘探采集、有色冶煉等過程中,機(jī)器視覺技術(shù)也大有可為。選礦是礦產(chǎn)資源加工中的一個重要環(huán)節(jié),選礦水平高低直接影響礦物資源回收。近年來,基于機(jī)器視覺的礦物表面特征監(jiān)測技術(shù)已引起工業(yè)發(fā)達(dá)國家科研機(jī)構(gòu)的高度關(guān)注。資料顯示,歐盟聯(lián)合多家大學(xué)和企業(yè),于2000年啟動了“基于機(jī)器視覺的氣泡結(jié)構(gòu)和顏色表征”項(xiàng)目;南非、智利等國家也將機(jī)器視覺應(yīng)用到石墨、鉑金屬的浮選監(jiān)控中。在國內(nèi),對煤和鎳的浮選監(jiān)控研究也取得了重大進(jìn)展。
機(jī)器視覺技術(shù)還可以應(yīng)用于智能交通、安全防范、醫(yī)療設(shè)備等方面。在醫(yī)學(xué)領(lǐng)域,機(jī)器視覺可以輔助醫(yī)生進(jìn)行醫(yī)學(xué)影像的分析,比如X射線透視圖、核磁共振圖像、CT圖像等。在科學(xué)研究領(lǐng)域,可以利用機(jī)器視覺進(jìn)行材料分析、生物分析、化學(xué)分析和生命科學(xué)分析,如血液細(xì)胞自動分類計(jì)數(shù)、染色體分析、癌癥細(xì)胞識別等。
國產(chǎn)產(chǎn)品日益崛起
近年來,我國機(jī)器視覺領(lǐng)域快速發(fā)展,通過在某個細(xì)分市場推出定制化的系統(tǒng)產(chǎn)品,為細(xì)分領(lǐng)域客戶解決需求,成為我國機(jī)器視覺企業(yè)發(fā)展的重要方向。在硬件產(chǎn)品上,國內(nèi)企業(yè)也多有突破
一個典型的機(jī)器視覺系統(tǒng)包括光源、鏡頭、高速相機(jī)、圖像采集卡和視覺處理器5大部分。國外對機(jī)器視覺部件產(chǎn)品和軟件的研發(fā)已經(jīng)有數(shù)十年的歷史。瞄準(zhǔn)了機(jī)器視覺的廣泛應(yīng)用前景,許多國外廠商紛紛進(jìn)入這一領(lǐng)域,比如索尼、柯達(dá)等CCD圖像傳感器廠商,工業(yè)相機(jī)廠商如德國巴斯勒、AVT等,智能相機(jī)和視覺傳感器廠商如美國康耐視、日本松下等。
長期以來,機(jī)器視覺原配件和軟件算法被這些國外巨頭企業(yè)壟斷,我國主要依靠進(jìn)口國外整套系統(tǒng),價格昂貴。近年來,我國機(jī)器視覺領(lǐng)域迎來快速發(fā)展,發(fā)展最快的是系統(tǒng)集成與服務(wù),通過在某個細(xì)分市場推出定制化的系統(tǒng)產(chǎn)品,為細(xì)分領(lǐng)域客戶解決需求,成為我國機(jī)器視覺企業(yè)發(fā)展的重要方向。
在硬件產(chǎn)品上,國內(nèi)企業(yè)也多有突破。在不久前結(jié)束的第十二屆中國(深圳)機(jī)器視覺展覽會上,我國自主研發(fā)的相機(jī)、軟件包、鏡頭、光源等機(jī)器視覺的核心部件齊齊亮相,不少產(chǎn)品甚至吸引了外國廠商的目光,大恒、方誠等一批機(jī)器視覺領(lǐng)域方案供應(yīng)商的產(chǎn)品日臻成熟,產(chǎn)品體系日益完善,在某些方面可以與國外廠商媲美。
展覽會上,北京清影機(jī)器視覺技術(shù)有限公司研發(fā)的“通用式三維即時成像技術(shù)”在機(jī)器視覺領(lǐng)域?qū)崿F(xiàn)了重大突破,引發(fā)業(yè)界關(guān)注。通用式三維即時視覺傳感技術(shù)是在任意可見光條件下均可即時成像的光學(xué)檢測技術(shù),能夠快速生成相機(jī)視場范圍內(nèi)物體的邊緣特征點(diǎn)和三維數(shù)字線條圖像。這項(xiàng)技術(shù)采用專門研發(fā)的平行光軸四相機(jī)矩陣陣列布置的專用三維相機(jī)機(jī)組,4個相機(jī)排列在一個正方形盒子里,被稱為“多目慧眼”,精度和速度大大提高。
與機(jī)器視覺領(lǐng)域的其他技術(shù)相比,通用式三維即時成像技術(shù)最大的兩個特點(diǎn)是“通用式”和“即時”。北京清影機(jī)器視覺技術(shù)有限公司董事長周之琪介紹,整個測量和識別過程在普通可見光照條件下即可作業(yè),無需任何結(jié)構(gòu)光和輔助手段,也不需要提前對被視物體做任何事先標(biāo)定和專門處理;圖像匹配算法也具有通用性,與被視景物的類型無關(guān),數(shù)據(jù)的后期處理高度簡化,完全是“傻瓜式”操作;“即時”則體現(xiàn)在隨時隨地的三維測量結(jié)果輸出,秒級成像,速度非常快。
目前,該公司已經(jīng)搭建了整個技術(shù)框架體系,并成功開發(fā)出專用三維相機(jī)機(jī)組和對應(yīng)的全套通用算法,已獲得1項(xiàng)發(fā)明專利和5項(xiàng)實(shí)用新型專利的授權(quán)。該技術(shù)可廣泛應(yīng)用于軍事和工業(yè)領(lǐng)域,如對復(fù)雜戰(zhàn)場環(huán)境的快速偵測感知,應(yīng)用于生產(chǎn)線的工件外形尺寸與表面缺陷檢測,應(yīng)用在各種工業(yè)流水線上可為無人系統(tǒng)提供全方位的視覺能力支持;在民用領(lǐng)域也可應(yīng)用于無人汽車、AR、VR以及3D打印等,作為主要的前端視覺成像設(shè)備,提升系統(tǒng)的智能化和精確化程度。
經(jīng)過20年的發(fā)展,機(jī)器視覺已成為一門新興的綜合技術(shù),在社會諸多領(lǐng)域得到廣泛應(yīng)用。可以預(yù)見的是,隨著新技術(shù)、新理論在機(jī)器視覺系統(tǒng)中的應(yīng)用,機(jī)器視覺將在國民經(jīng)濟(jì)的各個領(lǐng)域發(fā)揮更大作用。