張曉東,蘇瑞芳,董唯光
(1.寶雞職業(yè)技術(shù)學(xué)院 機(jī)電信息學(xué)院,寶雞721013;2.蘭州交通大學(xué) 自動化與電氣工程學(xué)院,蘭州730070)
隨著工業(yè)4.0 智能制造的發(fā)展, 工業(yè)機(jī)器人發(fā)展越來越迅速,機(jī)器人視覺系統(tǒng)是機(jī)器人的核心組成部分[1]。生產(chǎn)線上,人會因?yàn)槠v作出判斷失誤和測量錯誤,但是機(jī)器人卻能高效穩(wěn)定的生產(chǎn),工業(yè)機(jī)器人視覺系統(tǒng)利用機(jī)器代替人眼作出各種測量和判斷,但是隨著機(jī)器人的生產(chǎn)時間增加,需要大量的視覺圖像采集存儲空間,這就使得數(shù)據(jù)庫容量負(fù)擔(dān)大大增加。為此,需要壓縮采樣率低、重建恢復(fù)效果好、計算效率高的壓縮采樣算法。
迄今為止,已有部分學(xué)者對工業(yè)機(jī)器人視覺圖像壓縮問題進(jìn)行了研究。對于工業(yè)機(jī)器人而言,傳統(tǒng)的視覺圖像數(shù)據(jù)壓縮處理方法包括基于信號特征的特征值提取壓縮法、多尺度分析的小波壓縮法、傅里葉變換的插值壓縮法、數(shù)據(jù)壓縮稀化法等[2],這些方法雖然降低了存儲與傳輸負(fù)擔(dān),但是這些傳統(tǒng)的信號檢測與壓縮方法仍需具有很高的采樣頻率,存在著壓縮計算復(fù)雜、存儲空間浪費(fèi)和適用范圍低等問題。由Donoho 和Candes 等人提出的壓縮感知(compressed sensing,CS)理論[3-4],有效地解決了上述問題并指明了新的方向。CS 理論將壓縮與采樣同時進(jìn)行,在滿足一定條件下通過少量的信號測量值來重構(gòu)原始信號。該理論降低了模數(shù)轉(zhuǎn)換器帶寬的要求,取而代之的是信號的稀疏性。稀疏度與信號的重構(gòu)精度和計算復(fù)雜度息息相關(guān),是壓縮感知理論應(yīng)用的前提條件[5]。部分學(xué)者將CS 運(yùn)用在信號處理、諧波檢測、圖像重構(gòu)等方面[6-8]。
目前,工業(yè)機(jī)器人視覺圖像信號是一種非線性信號,該視覺圖像信號的稀疏性差,導(dǎo)致重構(gòu)效率低。因此,對于降低工業(yè)機(jī)器人視覺圖像的復(fù)雜度及提高重構(gòu)效率將成為CS 理論研究的關(guān)鍵。文獻(xiàn)[9-10]提出了一種自適應(yīng)視覺圖像分塊方法,該方法能夠自適應(yīng)地將一個視覺圖像分解為若干個小的塊分量。對于重構(gòu)精度和重構(gòu)速度,文獻(xiàn)[11]證明廣義匹配追蹤(gOMP)算法的重構(gòu)性能和運(yùn)行時間優(yōu)于一般的貪婪重構(gòu)算法。與gOMP 算法相比,本文研究了利用廣義Jaccard 系數(shù)的優(yōu)化gOMP 重構(gòu)算法具有更好的稀疏性與穩(wěn)健性。
結(jié)合以上2 種思想,本文提出了一種利用自適應(yīng)分塊預(yù)處理技術(shù)與優(yōu)化的壓縮感知重構(gòu)算法相結(jié)合的工業(yè)機(jī)器人視覺圖像處理方法。利用自適應(yīng)分塊技術(shù)把工業(yè)機(jī)器人視覺圖像信號分解為若干個視覺圖像塊分量,然后對每個塊分量圖像利用優(yōu)化的CS 重構(gòu)算法進(jìn)行處理, 重構(gòu)得到工業(yè)機(jī)器人原始視覺圖像信號。與直接采用CS 壓縮重構(gòu)工業(yè)機(jī)器人視覺圖像方法相比,該方法充分利用自適應(yīng)分塊預(yù)處理與優(yōu)化的壓縮感知重構(gòu)算法的優(yōu)點(diǎn),不但計算復(fù)雜度降低,而且重構(gòu)精度得到提高。
對于大小IM*In個像素的機(jī)器人視覺圖像X,為體現(xiàn)不同圖像內(nèi)容的紋理結(jié)構(gòu)、邊緣特征,并控制分塊過程的復(fù)雜度,在對工業(yè)機(jī)器人視覺圖像進(jìn)行稀疏變換之前,以機(jī)器人視覺系統(tǒng)圖像內(nèi)相鄰像素間的灰度差值表征內(nèi)容間的相關(guān)度,以此作為機(jī)器人視覺圖像塊大小的分割依據(jù),即:

機(jī)器人視覺圖像自適應(yīng)分塊算法的具體流程如圖1所示。利用四叉樹算法,即根據(jù)機(jī)器人視覺圖像的紋理變化情況,在需要對視覺圖像進(jìn)一步分割時,將對應(yīng)視覺圖像分成4 個等份的塊,從而有效分離平坦區(qū)域和細(xì)節(jié)復(fù)雜區(qū)域。首先,將圖像分成均勻大小的B×B 塊,設(shè)定分塊閾值T,當(dāng)區(qū)域塊相鄰像素灰度平均差值小于T 時,說明此塊機(jī)器人視覺圖像內(nèi)容比較平坦,停止分塊。為防止相鄰機(jī)器人視覺圖像塊邊緣出現(xiàn)塊效應(yīng), 且減小計算量,當(dāng)塊大小分割至4×4 時即停止繼續(xù)分塊。

圖1 機(jī)器人視覺圖像自適應(yīng)分塊算法流程Fig.1 Algorithm flow chart of robot vision based on adaptive blocking
機(jī)器人視覺圖像自適應(yīng)分塊閾值T 由整幀視覺圖像相鄰像素灰度的行差、列差的平均值決定,即:

壓縮感知理論主要包括信號的稀疏表示,信號的非線性測量表示, 以及信號的重構(gòu)算法設(shè)計,其成立條件是信號是可壓縮的或稀疏的[13-14]。
將原始有限長一維離散時間實(shí)信號X∈RN,可以把信號X= [X(1),X(2),…,X(N)]T在某正交基向量下進(jìn)行展開,把向量作為列向量轉(zhuǎn)換成字典矩陣ψ=[ψ1,ψ2,…,ψN],信號X∈RN表示為

假設(shè)稀疏系數(shù)向量θ 是K-稀疏的,即向量θ 中非零系數(shù)個數(shù)K?N, 取另一個與正交基不相關(guān)的測量矩陣Φ∈RM×N(M?N)對原始信號X 進(jìn)行壓縮測量,得到:

由于方程(7)屬于高度欠定方程,存在無數(shù)多組解,但向量θ 是K-稀疏的,從M 個測量向量中可重建θ,即:

求解該問題典型的重構(gòu)算法有:正交匹配追蹤算法(orthogonal matching pursuit,OMP)、正則化正交匹配追蹤算法、分段正交匹配追蹤算法、廣義正交匹配追蹤算法[11]等。
2.2.1 廣義正交匹配追蹤重建算法
在2012年,韓國高麗大學(xué)Wang Jian 等人提出gOMP 算法是OMP 算法的一個改進(jìn),該算法每次選擇的原子個數(shù)大于1(而OMP 算法每次只選擇1 個最佳原子)。
算法1gOMP 重構(gòu)算法
輸入:稀疏度K,感知矩陣A=Φψ,投影向量y,S 為≥1 的正整數(shù)。
輸出:重構(gòu)信號。
初始化:r0=y,索引集J0≠?,A0=?,迭代次數(shù)t=1。
步驟:
(2)求y=Atθt的最小平方解:
(3)更新殘差rt=y-At
(4)如果‖rt-r‖≤ε,進(jìn)入步驟(5)中運(yùn)行;否則,令r=rt,t=t+1,跳回步驟(1)中運(yùn)行;
2.2.2 優(yōu)化內(nèi)積的gOMP 重建算法
原始gOMP 算法中,信號代理為

對任意兩個向量x,y, 它們的相似度可以用Jaccard 系數(shù)來表示[12]:

式中:x=(x1,x2,…,xn),y=(y1,y2,…,yn)。
改進(jìn)的gOMP 使用Jaccard 相似系數(shù)作為計算“代理”向量的標(biāo)準(zhǔn),也就是將式(7)改為式(9):

式中:Φi表示Φ的第i 列。
在式(11)中,利用廣義Jaccard 相似系數(shù)可以充分反映出兩個任意向量x,y 之間的相似程度。在計算相似性時,Jaccard 系數(shù)把任意兩個向量中的各個元素的作用效果放大,主要原因是式(11)分母中減去兩個向量中相同的部分, 放大了向量的差異,增大了向量的相似程度, 從而使得原子不容易混淆,具體表現(xiàn)在各個元素對原子的選取,以此優(yōu)化了支撐集,從而使得重構(gòu)更加精準(zhǔn),如圖2所示。

圖2 廣義Jaccard 系數(shù)匹配與內(nèi)積度量匹配對殘差的影響Fig.2 Effect on residuals of generalized Jaccard coefficient matching and inner product matching
本設(shè)備由工業(yè)機(jī)器人、AGV 機(jī)器人、托盤流水線、裝配流水線、視覺系統(tǒng)和碼垛機(jī)立體倉庫等六大系統(tǒng)組成[13],如圖3所示。

圖3 實(shí)驗(yàn)室設(shè)備組成圖Fig.3 Composition diagram of laboratory equipment
通過視覺系統(tǒng)對工件進(jìn)行識別,然后由工業(yè)機(jī)器人進(jìn)行裝配,裝配完成后,再入庫[14]。因此,機(jī)器人圖像識別與壓縮存儲是關(guān)鍵,圖4為所需要識別抓取和裝配的工件。

圖4 抓取和裝配的工件Fig.4 Workpiece of grab and assemble
采用本文所研究的基于自適應(yīng)分塊預(yù)處理的工業(yè)機(jī)器人壓縮感知視覺圖像處理示意圖如圖5所示。

圖5 基于自適應(yīng)分塊預(yù)處理的工業(yè)機(jī)器人壓縮感知視覺圖像處理Fig.5 Industrial robot visual image processing based on adaptive block and compressed sensing
本實(shí)驗(yàn)在學(xué)院工業(yè)機(jī)器人實(shí)驗(yàn)室進(jìn)行,其中機(jī)器人為匯博機(jī)器人、電腦參數(shù)Windows10 版本,i5CPU 2.7 GHz,4 GB 內(nèi)存,Matlab2010 上進(jìn)行。選取一張256×256 的工件圖像作為仿真原圖像。本文中機(jī)器人視覺圖像重構(gòu)質(zhì)量評價指標(biāo)為峰值信噪比(peak signal to noise ratio,PSNR)。

仿真時,首次塊大小B 取32,為驗(yàn)證基于工業(yè)機(jī)器人視覺圖像的自適應(yīng)分塊優(yōu)勢,將與均勻分塊的效果進(jìn)行比較。仿真時,均勻塊大小分別取8×8,16×16,32×32,基于相鄰像素自適應(yīng)分塊的采樣率均設(shè)置為40%,得到表1、表2的實(shí)驗(yàn)結(jié)果,圖6為自適應(yīng)分塊處理的機(jī)器人壓縮感知視覺重構(gòu)圖像。

圖6 自適應(yīng)分塊預(yù)處理的機(jī)器人壓縮感知視覺重構(gòu)圖像Fig.6 Industrial robot visual reconstruction image based on adaptive block and compressed sensing
對比表1、表2的實(shí)驗(yàn)結(jié)果可知,采樣率相同情況下,相比于均勻分塊,基于相鄰像素的自適應(yīng)分塊的機(jī)器人壓縮感知視覺重構(gòu)方法的重構(gòu)質(zhì)量提高2 dB~3 dB,且重構(gòu)時間縮短40 ms~50 ms。

表1 分塊的機(jī)器人視覺圖像重構(gòu)時間的對比Tab.1 Robot visual image reconstruction time comparison in blocking

表2 分塊的機(jī)器人視覺圖像重構(gòu)質(zhì)量PSNR 的對比Tab.2 Robot visual reconstruction image quality PSNR comparison in blocking
本文研究了基于自適應(yīng)分塊處理的工業(yè)機(jī)器人壓縮感知視覺圖像處理,利用相鄰像素均值為分塊依據(jù),本文自適應(yīng)分塊處理的機(jī)器人壓縮感知視覺重構(gòu)方法的重構(gòu)圖像質(zhì)量提高了2 dB~3 dB,且重構(gòu)時間縮短了40 ms~50 ms,這為工業(yè)機(jī)器人視覺圖像數(shù)據(jù)存儲和圖像重構(gòu)提供新的方法。