李繪英
(九江職業(yè)大學 智能制造學院,江西 九江 332000)
智能垃圾分類機器人承擔垃圾搬運、拾撿、打包環(huán)節(jié)等工作,其中,拾撿作業(yè)就是按照抓取要求揀選混放的多種垃圾,嚴格來說,機器人必須具有決策任務、移動抓取、物品交互等行為能力。目前,分類型機器人的設計主要借助綜合感知、決策執(zhí)行等多項技術(shù)手段,實現(xiàn)垃圾清理、巡邏、環(huán)境監(jiān)測等功能。這就意味著為使機器人在分揀垃圾的過程中擁有自主判斷及運動規(guī)劃的能力,就必須聯(lián)合網(wǎng)絡主機對機械部件的行為能力進行全方位的控制[1]。為更好適應各行各業(yè)對分類機器人的需求量不斷增大的發(fā)展情況,需要將先進的人工智能技術(shù)與智能化機械設計思想結(jié)合起來,一方面對抓取行為過程中的目標對象進行精準識別,另一方面靈巧抓取行為路徑內(nèi)的拾撿物體。
機器人行為過程中的抓取誤差主要表現(xiàn)在橫向坐標軸、縱向坐標軸、空間向坐標軸三個方向上。在消除坐標誤差方面,王煜升等人在期望位置模型的支持下,通過針對性估計的方式,識別抓取目標所處位置,并根據(jù)目標節(jié)點的輪廓還原結(jié)果,建立位置模型庫,再將待檢測目標分別與模型庫內(nèi)的節(jié)點參量進行匹配,以確定當前行為模式下,機器人是否能夠準確抓取到預設拾撿目標[2]。張震等人建立了一種新的特征描述子定義條件,規(guī)定所提取到的目標對象就是機器人抓取行為的中心節(jié)點,利用二維Gauss函數(shù),求解機器人抓取行為的偏導執(zhí)行結(jié)果,再在局部二值模式下,定義目標拾撿對象所處的具體位置[3]。
深度學習是在學習過程中獲得大量的數(shù)據(jù)樣本,以便于主機元件可對整個學習流程進行規(guī)劃與完善。相較于其他類型的學習算法,深度學習模型的最終目標就是使機器能夠具有與人類似的分析與學習能力,并以此為基礎獲得更加真實的數(shù)據(jù)分析結(jié)果[4]。在計算機網(wǎng)絡環(huán)境中,深度學習算法的應用有助于獲得更加真實的數(shù)據(jù)樣本提取與識別結(jié)果。隨著機器人行為模式的不斷復雜化,雙目視覺傳感器、Shi-Tomasi和改進LBP的定位方法并不能保證抓取目標節(jié)點與定位節(jié)點的高度重合關(guān)系,故而也就不能將兩類節(jié)點之間的坐標誤差控制在較低的數(shù)值范圍之內(nèi)。為解決上述問題,以深度學習模型為基礎,設計一種新型的智能垃圾分類拾撿機器人抓取目標定位方法,并通過對比實驗的方式,突出該算法的實際應用價值。
深度學習模型是依照神經(jīng)網(wǎng)絡規(guī)則制定的卷積運算類模型結(jié)構(gòu),由多個神經(jīng)元節(jié)點共同組成,在輸入數(shù)據(jù)置信等級完全相同的情況下,深度學習模型可以同時訓練大量的信息參量,且只要輸入數(shù)據(jù)的編碼形式相同,那么與之相關(guān)的輸出數(shù)據(jù)編碼形式也就完全相同。定位智能垃圾分類拾撿機器人抓取目標時,深度學習模型結(jié)構(gòu)中主要包含輸入層、學習層、輸出層三類節(jié)點對象[5]。其中,輸入層節(jié)點負責錄入機器人抓取目標位置信息,在數(shù)據(jù)樣本學習的過程中,該類型節(jié)點不具備改變信息參量編碼形式的能力。學習層節(jié)點負責對已錄入的機器人抓取目標位置信息進行決策與加工處理,并可以按照深度學習條件,將這些數(shù)據(jù)信息參量整合成多個輸出單元。輸出層節(jié)點負責向外反饋完成處理的機器人抓取目標位置信息,為保證機器人抓取目標定位結(jié)果的準確性,主機元件要求同一類信息參量在完成學習處理時與反饋輸出后的編碼形式應保持一致[6]。完整的深度學習模型結(jié)構(gòu)如圖1所示。

圖1 深度學習模型結(jié)構(gòu)
目標函數(shù)是基于深度學習模型所定義的特殊線性計算函數(shù)。依照該函數(shù)表達式,主機元件對智能垃圾分類拾撿機器人抓取目標位置信息的處理具有明顯的規(guī)律性特征,即在抓取目標位置信息取值趨近于負無窮時,深度學習目標函數(shù)的求解結(jié)果也趨近于負無窮;在抓取目標位置信息取值趨近于正無窮時,深度學習目標函數(shù)的求解結(jié)果也趨近于正無窮;在抓取目標位置信息取值為零時,深度學習目標函數(shù)的求解結(jié)果也等于零[7]。深度學習模型對于拾撿機器人抓取目標位置信息的決策曲線如圖2所示。

圖2 深度學習模型對于數(shù)據(jù)信息參量的決策曲線

(1)
對于智能垃圾分類拾撿機器人抓取目標的檢測由數(shù)據(jù)集合定義、抓取目標檢測值求解兩部分組成。數(shù)據(jù)集合就是包含所有智能垃圾分類拾撿機器人抓取目標位置信息的數(shù)據(jù)樣本空間,對于主機元件而言,其在定位機器人抓取目標時,取樣的每一個數(shù)據(jù)信息參量都必須屬于依照深度學習模型所定義的數(shù)據(jù)集合[8-9]。抓取目標檢測值求解就是在數(shù)據(jù)集合中選擇多個目標信息對象,再聯(lián)合目標函數(shù)表達式,計算檢測值指標的實際數(shù)值范圍。
(1)數(shù)據(jù)集合如式(2)所示。
(2)

(2)抓取目標檢測值求解如式(3)所示。
(3)
式(3)中,a1、a2、…、an表示數(shù)據(jù)集合中n個不相等的數(shù)據(jù)參量,表示目標信息檢測系數(shù)。
(3)抓取目標檢測表達式如式(4)所示。

(4)
尺度空間可以用來描述智能垃圾分類拾撿機器人抓取行為平面的排列關(guān)系。按照深度學習算法定位機器人抓取目標時,不可能只選擇一個行為平面作為目標數(shù)據(jù)定義區(qū)域,且多個行為平面同時存在的情況下,目標數(shù)據(jù)的排列形式也很難保持完全一致的狀態(tài)。但若按照深度學習算法定義統(tǒng)一的尺度空間模型,則可以為關(guān)聯(lián)行為平面提供唯一的定義架構(gòu),從而在保障行為平面完整性的同時,使目標數(shù)據(jù)在同一平面內(nèi)保持統(tǒng)一的排列形式[10-11]。在尺度空間模型中,上級行為平面可向下級行為平面提供映射投影,且在投影區(qū)域內(nèi),上、下及平面內(nèi)的目標數(shù)據(jù)統(tǒng)一性分布關(guān)系能夠得到較好保障。基于深度學習的機器人抓取目標尺度空間模型結(jié)構(gòu)如圖3所示。

圖3 基于深度學習的機器人抓取目標尺度空間模型

(5)
主機元件對機器人抓取對象的標定從橫軸、縱軸、空間軸三個方向同時進行。橫軸方向上的抓取對象標定決定了智能垃圾分類拾撿機器人在水平方向上的行為能力,在機器人行為幅度保持不變的情況下,橫軸方向上標定值指標的取值越大,就表示待抓取目標在水平方向上的定位距離越遠[12]。縱軸方向上的抓取對象標定決定了智能垃圾分類拾撿機器人在豎直方向上的行為能力,縱軸方向上標定值指標的取值越大,就表示待抓取目標在豎直方向上的定位距離越遠。空間軸方向上的抓取對象標定決定了智能垃圾分類拾撿機器人在三維尺度空間內(nèi)的行為能力,空間軸方向上標定值指標的取值越大,就表示待抓取目標在三維尺度空間內(nèi)的定位距離越遠[13]。
在式(5)的基礎上,可將橫軸、縱軸、空間軸三個方向上的標定向量分別如式(6)所示。
(6)
式(6)中,KX表示水平方向上的機器人抓取行為幅值,ΔLX表示水平方向上的機器人抓取目標定義距離,KY表示豎直方向上的機器人抓取行為幅值,ΔLY表示豎直方向上的機器人抓取目標定義距離,KZ表示三維尺度空間內(nèi)的機器人抓取行為幅值,ΔLZ表示三維尺度空間內(nèi)的機器人抓取目標定義距離。
利用式(6),推導機器人抓取對象標定表達式如式(7)所示。
(7)
式(7)中,μ表示基于深度學習的機器人抓取對象辨別參數(shù),m表示非零條件下的目標點計數(shù)值,bm表示基于參數(shù)m的目標節(jié)點閾值向量,b0表示零值條件下目標節(jié)點閾值向量的初始取值。
對于智能垃圾分類拾撿機器人抓取目標物體而言,僅僅掌握目標對象標定表達式還不夠,還要對定位條件進行估計,才能確保定位結(jié)果的準確性。結(jié)合目標定位過程的特點,主機元件依照深度學習算法選擇目標節(jié)點時,只有保證尺度空間模型的完整性,才能獲得較為理想的定位結(jié)果[14-15]。
對于抓取目標定位條件的估算參考如下表達如式(8)所示。

(8)
利用式(8),推導智能垃圾分類拾撿機器人抓取目標定位表達式如式(9)所示。
(9)
式(9)中,t表示基于深度學習的抓取目標定位參數(shù),e1、e2、…、en表示不同的抓取目標節(jié)點定義向量。為避免錯誤抓取拾撿目標情況的出現(xiàn),主機元件在定位智能垃圾分類拾撿機器人抓取目標時,應排除同一行為軌跡內(nèi)完全重合的目標節(jié)點。
為突出說明基于深度學習的智能垃圾分類拾撿機器人抓取目標定位方法、雙目視覺方法、文獻[3]Shi-Tomasi和改進LBP算法的實用差異性,設計如下對比實驗。
本次實驗選擇T7S Plus型智能垃圾分類拾撿機器人作為實驗對象,在其行為半徑內(nèi)放置一條輸送帶,并在輸送帶上放置不同類型的垃圾,作為機器人抓取目標,詳情如圖4所示。

圖4 智能垃圾分類拾撿機器人抓取目標
機器人每拾撿一個目標垃圾,并將其投放至正確的分類箱之中為一個抓取行為周期,本次實驗共設置6個抓取行為周期。測試用的輸送帶垃圾來源于某家庭生活垃圾。該家庭中放置了不同類型的可回收物、有害垃圾、濕垃圾和干垃圾等垃圾桶,其中包含塑料瓶、紙張、金屬罐、電池、食物殘渣等不同類型垃圾的物品。
不能準確定位抓取目標所處位置,是導致智能垃圾分類機器人錯誤抓取拾撿目標的主要原因。本次實驗首先記錄定位節(jié)點坐標的具體數(shù)值,所得結(jié)果記錄為標準值;然后分別從橫軸、縱軸兩個方向上定義抓取目標節(jié)點的實際坐標(本次實驗過程中,智能垃圾分類機器人對于拾撿目標的抓取行為只存在于平面范圍內(nèi),所以只需參考橫軸、縱軸兩個方向上的實驗結(jié)果);最后根據(jù)標準值與實驗值之間的坐標差,總結(jié)實驗規(guī)律。
圖5反映了定位節(jié)點坐標標準值在橫軸、縱軸兩個方向上的數(shù)值變化情況。

分別應用基于深度學習的智能垃圾分類拾撿機器人抓取目標定位方法(實驗組)、雙目視覺方法(對照A組)、Shi-Tomasi和改進LBP算法(對照B組)進行實驗,并記錄不同方法作用下,抓取目標節(jié)點實際坐標在橫軸、縱軸方向上的數(shù)值變化情況。抓取目標節(jié)點實際坐標的橫軸坐標數(shù)值如圖6所示。

(實驗組)
分析圖6可知,實驗組抓取目標節(jié)點橫軸坐標的數(shù)值變化情況與標準值相同,且二者最大值的差值水平僅為0.01m。對照A組、對照B組抓取目標節(jié)點橫軸坐標的數(shù)值變化情況與標準值具有較大差異性,其最大差值分別為0.25m、0.55m,遠大于實驗組差值水平。
抓取目標節(jié)點實際坐標的縱坐標數(shù)值如圖7所示。

(實驗組)
分析圖7可知,實驗組抓取目標節(jié)點縱軸坐標的數(shù)值變化情況與標準值相同,且二者最大值的差值水平僅為0.02m。對照A組、對照B組抓取目標節(jié)點縱軸坐標的數(shù)值變化情況與標準值也具有較大差異性,其最大差值分別為0.23m、0.11m,也遠大于實驗組差值水平。綜合上述實驗結(jié)果可知,應用基于深度學習的智能垃圾分類拾撿機器人抓取目標定位方法,可以有效解決抓取目標節(jié)點與定位節(jié)點間坐標差較大的問題,不會因為無法準確定位抓取目標所處位置,而造成智能垃圾分類機器人錯誤抓取拾撿目標的情況,與實際應用需求相符合。
所提方法在深度學習模型的基礎上,對抓取目標進行檢測后,在目標尺度空間內(nèi),標定機器人抓取對象所處位置,從而根據(jù)目標定位估算條件,實現(xiàn)對機器人抓取目標的準確定位。對比實驗結(jié)果表明,深度學習定位方法的應用可以有效控制抓取目標節(jié)點與定位節(jié)點之間的坐標差水平,在準確定位抓取目標所處位置方面,具有較強的實用可行性。