楊文橋,鄭力新
(1.華僑大學(xué)工學(xué)院,泉州362021;2.華僑大學(xué)工業(yè)智能化與系統(tǒng)福建省高校工程研究中心,泉州362021)
為了使機器人具有像人一樣對周圍環(huán)境感知與判斷的能力,以及計算機視覺技術(shù)方法與應(yīng)用的迅速發(fā)展,全球機器視覺市場正處于急速擴張階段。由于機器視覺具有高效率、高自動化、高可靠性等特點,其應(yīng)用范圍非常廣泛,涵蓋了軍事、農(nóng)業(yè)、制造業(yè)等各個行業(yè)。國內(nèi)機器視覺起步較晚,自動化程度和技術(shù)含量相對較低,市場也遠遠沒有飽和,再加之“中國制造2025”的提出,使得機器視覺將成為一片紅海。
據(jù)統(tǒng)計,人類獲取外部世界的信息80%來自于視覺,這體現(xiàn)視覺是人類觀察與認識世界的最重要方式[1]。同時也體現(xiàn)了視覺包含大量信息,人類對視覺信息的利用率之高的特點,而充分利用這些優(yōu)點,使得機器能夠像人一樣認識世界,成為人類的夢想。隨著計算機技術(shù)以及基于計算機技術(shù)相關(guān)產(chǎn)業(yè)地快速發(fā)展,以人視覺系統(tǒng)為基礎(chǔ)的仿生工程也逐步發(fā)展起來,在這一過程中形成了“計算機視覺”這一新興學(xué)科。計算機視覺研究的目標是通過一張或者多張圖像認知周圍的環(huán)境,使之不僅能夠完成人類視覺一樣的功能[2],還能夠完成人眼不能夠勝任的任務(wù)。
那什么是機器視覺?可以簡單的理解為機器和視覺組成的系統(tǒng)。在沒有“機器視覺”這個概念時,工廠里的設(shè)備,公路上行駛的車輛都可以稱為“機器”,一種沒有智慧的“機器”。但給“機器”加上視覺之后,就像人類一樣有了“眼睛”,再通過給予基本的邏輯判斷與處理能力,進而使之具有像人類一樣的智慧。
機器視覺偏向于計算機視覺技術(shù)的工程應(yīng)用,這不同于純粹的計算機視覺理論[3]。機器視覺建立在計算機對周圍環(huán)境感知的基礎(chǔ)之上,具有類似于大腦對圖像處理加工識別的功能,但又不限于此,其還具有對圖像處理后判斷以及執(zhí)行相關(guān)動作的功能。由此可以將機器視覺視為在對特定環(huán)境感知下,做出相應(yīng)的判斷和動作的系統(tǒng)。從圖1 可以看出機器視覺所處的應(yīng)用技術(shù)層面。
從學(xué)科屬性上看,機器視覺屬于綜合應(yīng)用型學(xué)科,涉及圖像處理技術(shù)、機械工程技術(shù)、控制技術(shù)、電光源照明技術(shù)、光學(xué)成像技術(shù)、傳感器技術(shù)、模擬與數(shù)字視頻技術(shù)、計算機軟硬件技術(shù)(圖像增強和分析算法、圖像卡、I/O 卡等)等技術(shù)[4]。涉及范圍之廣,學(xué)科之多,在一定程度上增加了入行的難度。

圖1
機器視覺系統(tǒng)的工作原理與人的運動方式比較相似:人通過眼睛觀察到目標,然后經(jīng)過大腦處理并做出相應(yīng)的判斷,最后由大腦發(fā)出指令使身體做出相應(yīng)的動作。在工業(yè)領(lǐng)域中,鏡頭、攝像機與圖像采集卡相當于眼睛,圖像處理系統(tǒng)則相當于大腦,控制機構(gòu)與執(zhí)行機構(gòu)相當于手腳等器官。具體的工作過程為圖像獲取、圖像傳輸、圖像處理,根據(jù)圖像處理結(jié)果選擇執(zhí)行決策、傳輸控制信息、執(zhí)行機構(gòu)執(zhí)行命令[5]。其基本流程如圖2 所示。

圖2 機器視覺工作流程
機器視覺系統(tǒng)通常以計算機為中心,主要有光源控制模塊、圖像捕捉模塊、圖像處理模塊、智能決策模塊以及執(zhí)行機構(gòu)。其基本組成如圖3 所示。

圖3 機器視覺系統(tǒng)
(1)被測對象到達一個固定的位置(通常是攝像機的視野中心),然后向圖像采集卡發(fā)出觸發(fā)脈沖。
(2)圖像采集卡接收到脈沖信號后,分別將觸發(fā)信號傳輸給相機和光照系統(tǒng)。
(3)光源系統(tǒng)響應(yīng)并打開曝光機構(gòu),再打開攝像機進行圖像抓取,燈光的曝光時間長于相機捕獲圖像的時間。
(4)圖像采集卡接收模擬信號并通過A/D 將其數(shù)字化,將轉(zhuǎn)化后的數(shù)據(jù)存儲于計算機的內(nèi)存中。
(5)計算機根據(jù)需求對圖像進行處理分析、識別,并返回判斷結(jié)果或者邏輯控制值。
(6)將邏輯控制值通過I/O 口傳輸給相應(yīng)的控制機構(gòu)(一般為PLC),而控制機構(gòu)通過現(xiàn)場總線接口控制執(zhí)行機構(gòu)(一般為電機),最終完成產(chǎn)線需求任務(wù)。
光源:是影響機器視覺系統(tǒng)輸入的重要因素,它直接影響輸入數(shù)據(jù)的質(zhì)量和應(yīng)用效果[6]。主要目的是使重要特征和非必要特征產(chǎn)生最大的對比度,即將目標的重要特征顯現(xiàn)出來,而同時將不需要的特征抑制掉,最終形成對處理過程最佳的圖像效果。這樣一方面減少了圖像算法的復(fù)雜度,另一方面保證捕獲圖像的穩(wěn)定性,提高了系統(tǒng)的精度。所以一般在選擇光源時,會考慮光源的對比度、亮度和顏色等基本要素。除此之外,還要根據(jù)工作環(huán)境的要求,例如視場及工作距離來選定用何種光源。
鏡頭:用于聚集光線使目標能夠在相機CCD 或者COMS 上呈現(xiàn)出清晰的圖像。作為成像器件,通常要與相機、光源配合使用,因此在選擇鏡頭時一般要考慮整個環(huán)境要求。鏡頭的選擇是建立在客戶的需求之上,一般會考慮視野大小、光學(xué)放大倍數(shù)、工作距離、景深要求以及與相機相配合的一些參數(shù),如芯片大小、相機接口方式(C 接口與CS 接口方式)等,所以選擇相機的鏡頭是一個非常考究的事情。
工業(yè)相機:屬于圖像采集單元,將光學(xué)圖像轉(zhuǎn)化為模擬/數(shù)字圖像,再將相應(yīng)的信號傳輸給圖像采集卡。與民用相機相比,具有輸出圖像質(zhì)量高、抗干擾能力強、可長時間工作等優(yōu)點,其核心部件是用以接收光線的CCD 或者CMOS 芯片。在選用相機的過程中,首先考慮的參數(shù)就是分辨率,這個參數(shù)的選取受檢測精度以及視野大小的限定,其次考慮的就是幀率了,該參數(shù)的選定與當前檢測速度有關(guān),相機的幀率一定要大于或者等于檢測速度,再之就是曝光方式的選擇。對于目前做目標檢測與識別來說,為了識別準確,防止拖影,要選擇全局曝光;對于通過抓取圖片識別的,可以選擇全局曝光與卷簾曝光方式。最后考慮其余的參數(shù)的,例如,用CCD 還是CMOS,用網(wǎng)口還USB,像素的深度又是多少,不過這些參數(shù)的選擇對于最終的實驗效果影響不是很大。
圖像采集卡:是連接工業(yè)相機(圖像采集)與電腦(圖像處理)兩大板塊的重要組件,用于將捕獲的信號存儲于計算機,相當于眼睛的視覺神經(jīng)。
圖像處理系統(tǒng):根據(jù)實際需求所設(shè)計的一套處理被測物體圖像的算法,并輸出相關(guān)的系統(tǒng)邏輯運動控制信號,屬于機器視覺的核心。在實際中根據(jù)不同的應(yīng)用場景,會開發(fā)出不同的圖像處理系統(tǒng)和算法,不過也有比較通用的軟件如德國的Halcon。
控制機構(gòu):接受來自計算機圖像處理后反饋的邏輯控制信息,用于控制執(zhí)行機構(gòu),主要使用PLC 或者工控機。
執(zhí)行機構(gòu):對最后的指令進行執(zhí)行,直接作用于被測物體,一般將機械臂或者電機作為執(zhí)行機構(gòu)。該部分一般與控制機構(gòu)構(gòu)成同一整體。
機器視覺作為機器人的眼睛,其伴隨著人工智能的快速發(fā)展,進入到了一個發(fā)展階段,主要體現(xiàn)在機器視覺系統(tǒng)在工業(yè)、農(nóng)業(yè)、醫(yī)療、交通等行業(yè)的廣泛應(yīng)用。由于機器視覺自身的優(yōu)點,使得在精度、速度和質(zhì)量等方面比工人更具有優(yōu)勢,在平均成本上也有所降低。下面具體闡述機器視覺在農(nóng)業(yè)智能化、制造業(yè)異常檢測、紡織業(yè)上的應(yīng)用。
(1)機器視覺的主要應(yīng)用之一:農(nóng)業(yè)智能化
機器視覺在農(nóng)業(yè)中的應(yīng)用主要體現(xiàn)在農(nóng)業(yè)機器人、農(nóng)作物病蟲害監(jiān)視和農(nóng)產(chǎn)品質(zhì)量檢測三個方面[7]。以農(nóng)產(chǎn)品為目標,經(jīng)過目標檢測、定位、識別后,自動化設(shè)備到達指定位置,最后通過柔性夾爪或者吸附設(shè)備來完成對農(nóng)產(chǎn)品的采摘。在檢測過程中不僅利用農(nóng)產(chǎn)品顏色、大小、形狀和氣味等特征,有時還會利用如密度、酸堿度、導(dǎo)電率等特性。其中Abundant Robotics(美國)公司最具有典型性,該公司通過真空來“抓取”如蘋果等易碎的水果。
農(nóng)作物病蟲害監(jiān)視是運用機器視覺技術(shù)實時分析農(nóng)作物葉、莖干、果實表面,并將分析結(jié)果反饋至技術(shù)員以供指導(dǎo)生產(chǎn)活動使用,一般情況下也可自主實施。其中比較典型的是大疆MG-1S 農(nóng)業(yè)植保機,其可以實現(xiàn)作業(yè)規(guī)劃、飛行實時管理等任務(wù)。
農(nóng)產(chǎn)品質(zhì)量檢測通常應(yīng)用于分級與分揀。例如根據(jù)水果的大小、顏色等將其分為一、二、三等,也可以將農(nóng)產(chǎn)品中不符合要求或者有損傷的篩選出來,完成這樣的任務(wù)通常是一個完備的機器視覺系統(tǒng)。
(2)機器視覺的主要應(yīng)用之二:尺寸與缺陷檢測
機器視覺常被應(yīng)用于工業(yè)中的異常檢測以及尺寸測量,而其中最主要的應(yīng)用領(lǐng)域則是像PCB 印制板檢查、車門縫隙檢測和電池虛焊、隱裂、斷柵檢測等。這方面的視覺檢測通常要求比較高,精度可以達到毫米級,所以對檢測的現(xiàn)場環(huán)境極高。機器視覺的應(yīng)用解決了人工視覺檢查產(chǎn)品質(zhì)量效率和生產(chǎn)率低的問題,同時也降低了疲勞所帶來的的誤判率。
(3)機器視覺的主要應(yīng)用之三:紡織業(yè)
目前在鞋革加工制造行業(yè)中,幾乎所有的涂膠工序都是由手工來完成的[8],而制鞋流程中不可避免的會使工作人員接觸到有毒有害的原材料,再加之現(xiàn)有生產(chǎn)環(huán)境惡劣、生產(chǎn)成本上升,使用何種新技術(shù)解決噴涂等問題成為了亟待解決的問題。現(xiàn)有的解決方案中有采用工業(yè)機械手和3D 視覺相結(jié)合的方式,該方案實現(xiàn)了高精度、高穩(wěn)定性的涂膠,這一方面做的比較好的是Pixoel 鞋底涂膠系統(tǒng)。
除以上應(yīng)用領(lǐng)域之外,機器視覺技術(shù)還可以應(yīng)用于智能交通、醫(yī)藥行業(yè)、安防等其他領(lǐng)域,具體情況如表1。

表1
如今,機器視覺仍然是個如火如荼的研究領(lǐng)域,雖然國內(nèi)主要集中在應(yīng)用、代理、二次開發(fā)的基礎(chǔ)上,但已經(jīng)超越了傳統(tǒng)的檢驗領(lǐng)域,向著更深層次、更為多元化的方向發(fā)展;并且越來越多的應(yīng)用機器視覺公司開始在提供解決方案的基礎(chǔ)之上成立自己視覺部門,逐漸向更深的領(lǐng)域鉆研。同時,也在結(jié)合多技術(shù),向著數(shù)字化、智能化發(fā)展。