李佐廣
(中國人民大學,廣東 深圳518000)
尺寸測量和零件分揀是工業制造中出現較多的環節,傳統的人工方式的效率越來越不能滿足尺寸測量和零件分揀的要求,自動化、智能化技術的發展能更好滿足其需求。隨著機器視覺技術的發展和不斷成熟,人們用機器視覺技術來取代傳統的人工,如用機器視覺對工件的各種尺寸進行測量,進行工件和零件的區域測量、工件和零件的長度測量、工件和零件的圓半徑測量、工件和零件的弧線測量、工件和零件的角度測量等。將機器視覺和統計學結合用于分類及質量測量,使用統計方法分析測量的數據,對工業生產的質量進行合格性判斷。將統計學與圖像技術結合應用在工業制造中,能更有效提高工業生產制造效率,更有效地對產品質量進行管理。
在傳統的工業生產制造過程中,機器可進行生產加工,同一臺機器可能會生產出多個種類的零件,這些零件混合在一起,需對零件進行分類、打包。傳統的分揀工作主要依靠人工,人工對生產的零件進行分揀,分揀的速度慢,也容易產生疲勞,容易導致出錯,再加之人的工作時間受限制,分揀的速度跟不上。
隨著工業的發展,人員成本提高,對生產效率的要求越來越高,傳統的人工分揀越來越不滿足生產的要求。自動化的分揀需求越來越迫切,產生了工業視覺的分揀技術,用先進的機器視覺技術結合機械臂來實現自動化分揀、高效率分揀,從而更好滿足工業生產的多種類分揀需求。
基于視覺的分揀技術,主要通過視覺識別,并根據物體的顏色、形狀、尺寸、位置等特征進行分類識別。將位置、類別、大小等其他屬性發送給機械臂或傳送裝置,機械臂或傳送裝置來完成抓取、配準等作業?;谝曈X的自動化分揀系統與傳統的人工分揀相比,具有更多的優勢,如分揀的速度更快,分揀的準確度更高,可以24 h 不間斷工作,工作穩定,更加智能化、無人化、自動化。隨著工業4.0 的發展,分揀要求也將越來越高,將逐步實現無人化生產模式。
光源主要用來保障圖像的質量,加強圖像的特征,方便圖像處理,得到更穩定的結果。在工業應用中,光源起著非常重要的作用。沒有合適的光源,圖像的成像質量就不太高,如過暗、過曝、圖像亮度不均勻。通過合理的設計和安裝光源,還可以更明顯區分圖像的目標內容和背景內容,更容易地對目標和前景進行分割。工業機器視覺應用中,常用到以下幾種光源:點光源、線形光源、環形光源、背光源、條形光源、同軸光源。
圖像采集是圖像經過采樣、量化以后轉換為數字圖像并輸入、存儲到幀存儲器。圖像采集在數字圖像處理、圖像識別中有著廣泛的應用,如日常生活中手機拍照、可視電話,生物醫學領域、航空航天領域。圖像采集是非常關鍵的一個步驟,采集的速度、分辨率、質量等直接影響著產品的整體效果。
生產零件過程中,可以通過事先設定ROI 范圍,進行粗略的位置定位,零件大概率出現在這些ROI 區域里。比如一臺設備同時生產4個種類零件,所以采集1 張圖像,會在4個位置出現不同的零件,可以在圖像中設置4個ROI 區域。通過設置ROI,可以初步定位到物體出現的范圍,這樣可以排除其他區域的干擾。
在區域外的地方可以不進行圖像的特征處理,在區域內的地方進行圖像特征處理。設置ROI,也可以提升圖像處理速度、性能,可以減少很多圖像處理過程。一般在設置ROI時,會產生一個MASK 標記圖像,ROI 區域內標記為255,ROI 之外標記為0。在進行圖像特征提取過程中,對應MASK標記圖像的像素為0 的不進行處理,為255 的進行處理。
工業應用中,顏色特征是比較穩定的,可以在HSV 顏色空間進行顏色處理。處理彩色圖像時,需要選擇合適的顏色模型,HSV 模型常用于顏色處理。采集到的圖像通常是RGB、YUV 空間的圖像,需要將RGB 或YUV 轉換為HSVA顏色模型。HSV 模型主要由色調H、飽和度S、亮度V組成。H的取值范圍為0°~360°。S的取值范圍是0~1.0,顏色越飽和則值越大。V的取值范圍是0~255,越亮則值越大。
除了處理色彩圖像外,還要經常處理灰度級別的圖像,在灰度空間中對圖像進行特征提取,比如梯度處理的canny邊緣。sobel 處理,常用灰度圖像作為輸入。
邊緣提取是圖像特征提取的一種主要方法。對于形狀識別和幾何圖形的識別都非常有用。常用的邊緣提取方法有sobel、canny 方法。canny 邊緣檢測可以得到比較細的邊緣,用來做形狀識別、幾何圖形的識別,如提取直線邊緣,進行直線的擬合,得到直線,可以用于測量長度;也可以對邊緣像素進行統計分析,得到目標的邊緣坐標信息,得到目標的外接矩形,可以轉換為實際物理尺寸的大小。圖像邊緣檢測常用于對灰度圖像進行處理,處理后得到邊緣圖像。
圖像處理中,需要得到關注的目標,可以采用連通區域提取目標,連通區域主要是針對二值圖像,連通區域通常使用常4 連通處理和8 連通處理。4 連通如圖1 所示,p 是當前處理像素點,如果它的鄰居上、下、左、右4個x 鄰居像素中某個鄰居像素值和p 一樣,則認為該鄰居和p 是連通的,如果都不與p 值相同,則認為p 是孤立點,沒有像素和它連通。

圖1 p 的4 鄰域
8 連通如圖2 所示,如果它的鄰居左上、上、右上、右、右下、下、左下、左8個x 鄰居像素值中某鄰居像素值和p一樣,則認為該鄰居和p 是連通的,如果都不與p 值相同,則認為p 是孤立點,沒有像素和它連通。
連通區域標記算法,其基本思想是基于種子生長的方式,從一個種子生長點開始,將與該生長點性質相似的鄰域像素與生長點進行合并,并給該種子點位置標記,表示該種子點已經用過,新加入的點可以作為新的種子點生長,重復上面過程直到不能生長為止,這樣就得到了一個連通的目標像素組合。

圖2 p的8 鄰域
在工業自動化生產制造行業中,尺寸測量是一個比較常見的需求,可以采用機器視覺測量技術來代替人工進行測量,獲得工件的各種尺寸參數,例如用機器視覺來測量工件的長度、工件的角度、圓形工件的半徑長度等。
1.8.1 圓形零件半徑尺寸測量
由于圓形零件成像后,表現為橢圓的形式,對圖像進行canny 邊緣特征提取后,采用連通區域提取的方法,獲得橢圓的邊界像素,邊界像素是離散的像素點,記為(xi,yi),對橢圓邊界像素進行橢圓擬合,橢圓擬合采用最小二乘橢圓擬合方法,計算離散點到擬合橢圓的距離平方和,并使得該距離平方和為最小,可以獲得橢圓長軸、短軸、中心坐標及偏轉角度,從而得到圓形零件的尺寸。
設平面任意位置橢圓方程為:x2+Axy+By2+Cx+Dy+E=0,設Pi(xi,yi)(i=1,2,…,N)為橢圓邊界像素上的N(N≥100)個像素點,根據最小二乘原理,設定擬合的目標函數為:

為了使F為最小值,需要滿足:

由此可以得方程:

解方程可以得到A、B、C、D、E的值。
根據橢圓的幾何知識,可以計算出橢圓的五個參數,即位置參數(θ,x0,y0)以及形狀參數(a,b):

1.8.2 線段長度的測量
通過圖像邊緣像素的特征提取后,進行直線擬合,確認為直線,并得到直線的兩個端點像素坐標,進而由兩點的坐標可以得到對應線段的像素長度。
1.9.1 相機標定
像素長度與物理長度的比值人們習慣叫K值,單位是mm/pixel,用于做單位轉換;項目應用上常用標定的方式得到K值。用規則的標定板進行標定:如黑白棋盤格、圓形棋盤格,相機取像后求出棋盤格或圓形半徑的像素長度A,再用實際的棋盤格或圓形半徑長度B,計算可得出K=A/B。
1.9.2 像素長度轉換為物理長度
對于圓形器件,成像的圖像中可以作為橢圓處理,測量圓形器件的尺寸,需要將最小二乘法橢圓擬合的像素半徑a,b轉換成實際的物理尺寸。對于線段長度的測量,需要測量2點像素的長度,并轉換成實際的物理尺寸。
提取出圖像的顏色、大小、形狀特征后,組合成一組特征向量。采用統計學方法隨機森林對提取的特征向量進行分類。
對特征向量進行分類的隨機森林由決策樹構成,它的基本單元是決策樹,如圖3 所示。

圖3 決策樹
隨機森林是一種算法,該算法通過集成學習的思想將多棵決策樹集成到一起。每棵決策樹都是一個小的分類器,對于一個輸入樣本,每棵決策樹都會有一個分類結果,N棵樹構成N個分類結果,隨機森林集成了所有分類分類器投票的結果,將投票次數最多的類別作為最終的輸出。
隨機森林是一種簡單的Bagging 思想,最后分類取決于多棵樹(弱分類器)的投票表決,隨機森林模型如圖4 所示。

圖4 隨機森林模型
隨機森林樹學習算法:可以根據下面的算法來構造每棵樹。
隨機森林構建,要求數據的隨機性選取,以及待選特征的隨機性選取。訓練樣本的個數用N來表示,特征數目用M來表示。進行有放回地抽樣。輸入特征數目m,m應該遠小于M,這個是從M個特征中隨機選取的m個特征子集,用來構建一棵子樹,而選中的m個特征中相對是最優的。從N個訓練樣本中以有放回抽樣的方式抽取樣本,構成一個訓練集,然后用未抽取到的樣本來做預測,并評估它的誤差。重復上面的方式,可以構建多棵決策樹。
隨機森林的優點:①隨機森林實現起來相對比較簡單;②隨機森林相對來說在準確率方面比較高;③通過引入隨機性,這樣不容易過擬合;④通過引入隨機性,這樣具有比較好的抗噪聲能力;⑤隨機森林容易實現并行化,并且訓練速度快;⑥隨機森林能處理很高維度的數據,可以不用做特征選擇;⑦隨機森林可以判斷特征的重要程度。
隨機森林的缺點:①當隨機森林有很多決策樹時,需要較大的訓練空間和較長的時間;②隨機森林模型像是一個黑盒模型,還有許多難以解釋的地方;③隨機森林在某些噪聲較大的分類或回歸問題上會過擬合。
隨機森林在很多地方可以應用:對離散值進行分類,對連續值進行回歸,無監督學習進行聚類,異常點進行檢測。
基于視覺的分揀技術,主要通過視覺識別。根據物體的顏色、形狀、尺寸、位置等特征進行分類識別。將位置、類別、大小等其他屬性發送給機械臂或傳送裝置,機械臂或傳送裝置來完成抓取、配準等作業。
統計推斷的構成成分之一是假設檢驗,假設檢驗是利用樣本對總體進行某種推斷,在假設檢驗過程中,先對u的值提出一個假設,接下來利用樣本信息來檢驗這個假設是否成立。
原假設的表達式一般如下:H0=u0或H0∶u-u0=0
假設檢驗以H0表示原假設,也稱為零假設。假設檢測以H1表示備擇假設,u0則表示感興趣的數值,原假設和備擇假設是互斥的,如果肯定原假設,則表示放棄備擇假設。
假設檢驗有兩類錯誤,其中一種錯誤是α錯誤,也叫棄真錯誤,另一種錯誤是β錯誤,也叫取偽錯誤。α錯誤是原假設H0為真時卻將它拒絕了,犯這種類型的錯誤的概率用α表示,β錯誤是原假設為偽時卻沒將它拒絕,犯這種類型的錯誤的概率用β表示。
首先需要提出什么是原假設和以及什么是備擇假設,然后確定顯著性水平標準,確定檢驗方法,構造檢驗統計量,對檢驗統計量進行選擇,主要是可以對大樣本量時,以及符合正態分布時,當標準差σ已知,應當選用Z 統計量;小樣本量時,當標準差未知σ時,應選用T 統計量。以往的經量都近似服從正態分布,例如,機械零件的加工長度、厚度等都可以用正態分布來描述其變驗,大量隨機變化規律。
最后,作出檢驗決策,對比統計量的值與臨界值,假如該樣本統計量的取值超過了預設的臨界值,說明原假設落入到了拒絕域中,此時就可以拒絕原假設,否認則就可以接受原假設。
在抽樣研究中,研究設計、搜集數據和統計分析是一個整體。應用檢驗方法必需符合其適用條件。
作假設檢驗應注意樣本容量是否合理,樣本量的大小是選擇檢驗統計量的重要指標,在大樣本量下,一般使用z統計量。當n比較小的時候,t分布于z分布差異比較大,當樣本量n>30 時,t分布和z分布就非常接近了。正確選擇檢驗統計量,常用的統計量有z統計量、t統計量以及x2統計量。z統計量和t統計量主要用于比例和均值的檢驗,x2統計量主要用于方差的檢驗。正確理解假設檢驗的結論。
作假設檢驗時,可以對總體參數的區間估計進行結合。某機器生產的某一圓形零件,行業標準要求其半徑長度0.477 cm,從生產的零件中隨機抽30個,通過本文的圖像測量技術,測量其平均長度為0.475 cm,樣本標準差s為0.00842 cm,測量的長度服從正態分布,檢測生產的圓形零件半徑長度是否符合標準要求。
先提出原假設H0∶u=0.477;備擇假設H1∶u≠0.447。計算統計量-1.301。給出顯著性水平α=0.05,查表得到統計推斷所以接受原假設,長度符合標準要求。
假設檢驗還可以用于檢測其他測量屬性是否符合標準要求、檢測生產的工件顏色的一致性是否符合標準要求、生產的質量是否符合標準要求、分類的準確率是否符合標準要求。
隨著生產制造效率的需求不斷提高,以及對生產質量的需求不斷提高,假設檢驗理論在質量檢測管理中的應用越來越多,重要性不斷提高,用于質量檢驗與控制的各個方面。