文/李易健 張浩楠 黃金龍
“眼睛是心靈的窗口”根據(jù)可靠研究表明,人類對外界信息的獲取百分之七十都要靠視覺來完成,眼睛是人類感知類器官中最重要也是功能最完善的一個,人工智能領(lǐng)域上也是如此,通過對外界環(huán)境影像或圖像的獲取,處理,分離以及識別。人工智能可以獲取大量的信息和數(shù)據(jù),并針對這些數(shù)據(jù)信息采取相應(yīng)的處理。類似于這種以計算機為工具進行視覺感知和處理的相關(guān)研究領(lǐng)域劃分為一個獨立的部分,這個研究空間就是我們所了解的計算機視覺,也被稱為機器視覺。
近些年來,隨著半導(dǎo)體行業(yè)和處理器技術(shù)的進步,以及勞動力成本的上升和對產(chǎn)品質(zhì)量要求的提升,國外的計算機視覺技術(shù)伴隨著這些需求應(yīng)運而生并且蓬勃發(fā)展,隨著幾十年的開發(fā)和應(yīng)用,到目前為止,機器視覺已經(jīng)廣泛應(yīng)用于航空航天,智能家電,生物醫(yī)學(xué)工程,人臉識別等諸多領(lǐng)域,并且已具有較高水平,國內(nèi)的計算機視覺起步較晚,且市場遠遠沒有飽和,大部分都是做的國外廠商的代理,有著極大的人才需求。
圖像預(yù)處理就是通過圖像出路保留有用信息,篩掉無用信息的一個過程,通過圖像預(yù)處理可以加快處理速度同時增加識別正確率,從而使得特征提取、圖像識別分類更加可靠。由于剛開始采集的圖像都是彩色照片,而且極有可能存在角度偏差,位置偏差,以及噪聲影響所以在進行識別對比之前通常要對圖像進行預(yù)處理。因為缺陷檢測對顏色信息要求不高,而且彩色圖像計算繁瑣,我們可以現(xiàn)將圖像進行灰度化,然后對得到的灰度圖像二值化處理,通過適當(dāng)?shù)拈撝颠x取獲得的二值圖像仍具備所需的識別信息,且數(shù)據(jù)量大為減少使得計算便捷。其中LBP局部二值化模型應(yīng)用較廣,通過設(shè)定閾值來生成二值圖,原理如圖1所示。
由于拍照的圖像不一定是正角度的,我們需要對采集的圖像進行旋轉(zhuǎn),映射,平移,縮放等等的校正處理,圖像校正的基本思路是,根據(jù)圖像失真的原因建立相應(yīng)的數(shù)學(xué)模型,從非真的圖像信號中提取所需的信息,沿著圖像失真的逆過程復(fù)原圖像。圖像在傳輸和采集過程中,不可避免的會受到噪聲的影響,噪聲不僅會降低圖像的視覺質(zhì)量,還會影響圖像識別的精度,為了得到清晰易識別的圖像我們可以通過濾波處理進行去噪行濾波去噪,根據(jù)噪聲性質(zhì)的不同,消除噪聲的方法也不同,大致分為,均值濾波、中值濾波、傅里葉降噪、小波變換,對于高斯噪聲(即噪聲成正態(tài)分布)采用均值濾波更適合,然而對于椒鹽噪聲采用中值濾波效果更佳。

圖1

圖2:缺陷檢測效果圖
3.3.1 機器學(xué)習(xí)的概念
機器學(xué)習(xí)是基于數(shù)據(jù)構(gòu)建數(shù)學(xué)模型的過程,常用的數(shù)學(xué)模型有概率統(tǒng)計模型,機器學(xué)習(xí)從數(shù)據(jù)中來,到數(shù)據(jù)中去,利用數(shù)據(jù)訓(xùn)練模型,然后使用模型進行數(shù)據(jù)預(yù)測,從而完成一完整的學(xué)習(xí)的過程。機器學(xué)習(xí)算法主要分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)以及強化學(xué)習(xí)等,當(dāng)然還有半監(jiān)督學(xué)習(xí),其類型介于監(jiān)督和非監(jiān)督之間。監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)之間的最大區(qū)別就在于訓(xùn)練所用的數(shù)據(jù)是否提供輸出量。
3.3.2 支持向量機
英文名稱為Support Vector Machine,是一類按監(jiān)督學(xué)習(xí)方式對數(shù)據(jù)進行二元分類的廣義線性分類器,他的核心思路就是將非線性可分的空間特征通過一定的關(guān)系映射到線性可分的空間當(dāng)中來,具有非常強的使用意義,如果在n維空間中存在著兩種或多種不同類別的群體。我們總能找到這樣的一個n-1維的分界線將兩類群體進行分離。而且分離的可靠性最強。這個思想被擴展到很多深度學(xué)習(xí)分類器的領(lǐng)域中去,衍生了一系列的識別算法。在人臉識別、文本分類、等模式識別問題中有得到廣泛應(yīng)用。
3.3.3 Ababoost算法
Ababoost算法全稱為Adaptive Boosting,也被稱為自適應(yīng)增強算法。主要用于將預(yù)測精度低的弱分類器增強為預(yù)測精度高的強分類器,為直接構(gòu)造分類器提供了新的思路和方法。Adaboost算法是一種提升算法,這是一種十分常見且十分有效的統(tǒng)計學(xué)習(xí)算法。這類算法的特點就是:在分類問題中,他可以通過改變訓(xùn)練樣本所占據(jù)的權(quán)重,來訓(xùn)練出多個分類器,將這些分類器進行線性組合就可以得到一個滿足性能的強分類器。眾人拾柴火焰高,這樣往往能得到較好的分類效果。
3.3.4 HΟG特征
HΟG就是方向梯度直方圖,是在計算機視覺和圖像處理領(lǐng)域非常常見的一種特征提取算法,本特征提取通過統(tǒng)計圖像中各個小區(qū)域中的方向梯度直方圖,然后將其進行匯總得到。梯度主要存在于圖像的邊緣地帶。局部目標(biāo)能被梯度或邊緣的方向進行描述。與其他特征提取相比,HΟG具有對圖像的幾何變化,光學(xué)變化良好的魯棒性等優(yōu)點。
首先對拍攝的圖像進行預(yù)處理,預(yù)處理包括圖像的角度校正,平移,縮放等,同時由于拍攝的環(huán)境以及相機的拍攝質(zhì)量問題,照片會出現(xiàn)或多或少的噪聲干擾,這些噪聲會影響對缺陷的識別提取,所以也要對圖像提前進行噪聲濾波,如中值濾波和均值濾波。由于彩色圖片的儲存空間大,運算速度慢,邏輯復(fù)雜。對于零件的缺陷檢測來說顏色信息并無關(guān)鍵的作用,所以對拿到的圖像優(yōu)先進行灰度化和二值化處理得到二值圖。
零件表面的缺陷類型有多種,最常見的就是劃痕,斑點,金屬氧化物等。我們通過大量的樣本進行訓(xùn)練。提取LBP特征,LBP特征提取對光照有著很好的魯棒性,灰度不變性,且計算速度快,實現(xiàn)簡單,旋轉(zhuǎn)不變形等特點。LBP特征對于紋理特征有著很高的敏感性,能夠清晰的體現(xiàn)各區(qū)域的典型紋理,與此同時能夠淡化過度區(qū)域,所以目前應(yīng)用廣泛。本次采取了劃痕,斑點,金屬氧化物的樣本各五十張。樣本來自于零件廠的廢舊零件。經(jīng)過特征提取和訓(xùn)練分類器得到分類效率較高的系統(tǒng)。
對預(yù)處理后的圖像進行LBP特征提取,并通過與此前訓(xùn)練過的特征圖像進行比對,得到各種缺陷的相似程度,若相似程度均低于10%則判定無缺陷。若高于10%則取相似率最高的缺陷類型定義為本次識別零件的缺陷類型。同時確定零件在圓盤中所在位置,通過機械臂抓取將對應(yīng)缺陷的零件抓取到對應(yīng)缺陷的區(qū)域。之后進行下一個零件的缺陷檢測。如圖2所示。
通過圖2效果圖我們可以看出來,通過深度學(xué)習(xí)算法我們對相應(yīng)缺陷類型的零件已經(jīng)能夠進行一定正確率的識別。并且通過噪聲識別規(guī)避了一定的干擾,提升了識別的正確率。同時對缺陷類型進行分類,效果較好。
與此同時次識別過程存在一點的缺點,那就是目前只能對其表面的缺陷進行識別處理,對于零件內(nèi)部的缺陷不存在識別作用。同時表面識別只能進行上表面的識別。識別的維度較低。可以通過旋轉(zhuǎn)零件進行多個表面的缺陷識別從而增加識別維度,增加缺陷識別的實用性。
隨著計算機技術(shù)近些年來的飛速發(fā)展,以及計算機計算能力及容量的巨大提升,衍生除了一系列算法和技術(shù)相結(jié)合的人工智能領(lǐng)域,作為人工智能領(lǐng)域的一顆明珠,計算機視覺吸引著大量人才去開發(fā)挖掘,計算機視覺在工業(yè)領(lǐng)域的應(yīng)用意義也是十分重大的,通過強化學(xué)習(xí)以及圖像處理便可將計算機視覺應(yīng)用于工業(yè)生產(chǎn)中來實現(xiàn)生產(chǎn)零件的缺陷檢測和識別。