黃崇富 常 宇 劉力超
(1. 重慶工程職業技術學院,重慶 402260;2. 中煤科工集團重慶研究院有限公司,重慶 400037;3. 四川大學錦城學院,四川 成都 611731)
在中國制造2025和工業4.0的推動下,機器人技術發展迅速[1]。在食品行業,產品往往具有數量多、批量大的特點,因此需要在食品的包裝、分揀和裝箱等方面投入大量的工作[2]。Delta機器人具有位置控制精度高、末端慣性小、速度快等優點,被廣泛應用于食品行業[3]。
目前,中國許多學者都在開展Delta機器人抓取控制策略的研究,并取得了一些突出的成果。賈超廣等[4]提出了一種基于機器視覺的并聯機器人高速自動分揀方法,該系統能夠快速完成包裝食品的分揀,分揀速度可達120袋/min,極大地提高了生產效率,降低了工人的勞動強度。嚴培培[5]提出了一種基于并聯機器人和視覺技術的分揀系統,通過可靠性測試,該系統能夠準確分揀,滿足非典型食品分揀的設計要求。柳振宇等[6]提出了一種新的并聯機器人分揀控制方法,結合閉環控制和力矩前饋控制,該方法比傳統方法的跟蹤誤差下降了70%左右,最大軌跡誤差下降了50%左右。吳旭清等[7]提出了一種基于并聯機器人和視覺技術的分揀系統,并對影響分揀成功率的因素進行分析,找出了影響最大的因素為機器人加速度、機器人速度和傳送帶速度。倪鶴鵬等[9]提出了一種基于機器視覺的Delta機器人分揀方法,該方法的最快分選速度為110次/min,誤抓率小于2‰,漏抓率為0。雖然上述方法能夠滿足Delta機器人在食品生產中的一般要求,但并聯機器人在實際應用中存在抓取成功率低、運行不穩定、效率低等問題,其適應性有待進一步提高。
研究擬將改進BP神經網絡和PID控制相結合用于Delta機器人運動目標抓取。采用改進的粒子群優化算法(Improved Particle Swarm Optimization,IPSO)對BP神經網絡(Back Propagation Neural Network,BPNN)初始權值進行優化,并利用優化的BPNN對PID控制參數實時調整,以期為Delta機器人分揀技術的發展提供參考。
食品分揀系統主要由三部分組成:上位機、視覺系統和動作執行器,其系統結構如圖1所示[8]。視覺系統中相機安裝在傳送帶上方,選擇位置反饋視覺解決方案。散亂放置的目標物體通過傳送帶運行至相機下方進行圖像采集,由圖像采集卡對圖像進行相關分析和處理,然后將相關信息發送到上位機[9]。上位機根據圖像信息計算抓取位置。動作執行器為Delta機器人本體,在食品分揀系統實際應用中,傳送帶上的目標食品是隨機分布的,因此需制定相應抓取策略以保證生產效率[10]。

圖1 系統結構Figure 1 System structure
在不漏抓和不錯抓的前提下,盡可能提高抓取的效率。抓取時帶速要與機器人配合,以便機器人能夠抓取傳送帶上的所有目標,同時,最大化機器人的抓取效率[11]。
根據傳送帶上的目標密度調整帶速,采用無級調速策略。假設當前帶速為Vt,最大帶速為Vmax,目標物體的當前位置Xt,抓取目標的上、下限位為Xmax和Xmin,速度如式(1)所示[12]。
(1)
如果對帶速進行調整,應規劃加速度,以減少速度變化對整個系統的影響,起始和結束速度已知。假設起始帶速為v0,結束帶速為v1。加速度采用正弦運動規律,如式(2)所示[13]。
(2)
式中:
a——t時刻傳送帶的加速度,mm/s2;
amax——傳送帶的最大加速度,m/s2;
T——一次抓放操作的運行時間,s。
速度V的計算可以通過對式(2)兩側同時積分,如式(3)所示。
(3)
對式(3)積分可得位移變化量ΔL,如式(4)所示。
(4)
綜上,機器人坐標系中目標位置x如式(5)所示[14]。
x=ΔL+x0,
(5)
式中:
x0——跟蹤開始時目標位置。
粒子群優化算法是一種全局優化算法,優勢為粒子的適應度。速度和位置更新如式(6)和式(7)所示[15]。
(6)
(7)
式中:
c1、c2——學習因子;


pbest——個體最優解;
gbest——全局最優解;
ω——權值因子。
考慮到算法早期容易收斂、后期搜索精度低、迭代效率低等問題,從兩個方面對算法進行優化[16]。
(1) 優化慣性權值:慣性權值越大,全局搜索就越容易。慣性權值越小,局部搜索越容易。隨著迭代次數的增加,問題的細節也會增加,而固定值在解決方案解析中存在許多缺陷。因此,引入可變慣性權值,如式(8)所示。
(8)
式中:
λ——加權系數,多次試驗后取值0.01;
N——粒子數;
t——當前迭代次數;
pbesti(t)、gbest——當前的個體和全局最優值。
(2) 優化學習因子:通過改進線性增減策略,可以在初始搜索階段增強全局搜索功能,不易陷入局部最優。在后期,可以加強局部搜索,提高全局最優解的精度。如式(9)和式(10)所示。
(9)
(10)
式中:
tm——最大迭代次數;
c1max、c2max——最大學習因子;
c1min、c2min——最小學習因子;
t——粒子的當前迭代次數。
通過IPSO算法優化BP神經網絡,解決網絡收斂慢和易局部極值的缺點,將權值定義為粒子群位置向量,通過IPSO尋優,適應度函數如式(11)所示[17]。
(11)
式中:

N——訓練樣本數。
優化流程如圖2所示。

圖2 IPSO-BP神經網絡流程Figure 2 IPSO-BP neural network process
將BP神經網絡的權值作為粒子位置向量各元素的值,即粒子維度是從輸入層到隱藏層的連接權值數和隱藏層到輸出層的連接權值數之和。網絡結構為4-5-3,粒子長度35,隨機生成20組數據,IPSO算法找到最優初始
權值[18]。步驟如下:
(1) 采用ISPO算法離線訓練初始權值。
步驟1:隨機初始化種群。每個粒子在種群中的位置表示網絡的初始權重。
步驟2:計算適應度值J,越小性能越好。
步驟3:不斷更新找到最優初始權值。
(2) 通過優化BP神經網絡實時調整PID控制器。
步驟1:確定網絡結構,初始化學習率和慣性因子,并將IPSO算法優化權值作為網絡初值。
步驟2:計算目標值與當前實際輸出之間的偏差。
步驟3:輸出PID可調參數kp、ki、kd[19]。
步驟4:計算控制器輸出,即控制率u(k)。
步驟5:更新權值實現PID參數自適應調整,并返回步驟2。
圖3為Delta機器人抓取控制策略結構。

圖3 Delta機器人抓取控制策略結構Figure 3 Delta robot grasping control strategy structure
視覺系統獲得拍照時目標在機器人坐標系中的位置RP(x1,y1,z1)。機器人末端在任意時刻的位置為Pr0(xr0,yr0,zr0)。目標在任意時間的位置為RP(x1,y1,z1)+vc(t)-vc(0)。目標位置和機器人末端之間的位置差ε(t)如式(10)所示[20]。
ε(t)=RP+vc(t)-vc(0)-Pr0,
(12)
式中:
vc(t)、vc(0)——t時刻和拍攝時的編碼器讀數。
因目標不涉及姿態的變化,可以將式(12)進一步分解,如式(13)所示。
(13)
式中:
εx(t)、εy(t)、εz(t)——ε在3個坐標軸的分量;
θ——傳送帶與X軸夾角,rad;
γ——傳送帶和基坐標系平面夾角,rad。
而傳送帶的行進方向與機器人的X軸幾乎一致,因此可忽略θ和γ的影響。
在下一次采樣時,機器人末端的目標位置Prn如式(14)所示。
Prn=Pr0+m(t),
(14)
式中:
m(t)——末端在t時刻的調整量。
采用PID控制策略對機器人進行跟蹤抓取。
在上述策略中,如目標的分布密度達到一定值時,單個機器人抓取率會降低,嚴重影響生產效率。同時,如果傳送帶上物體的類型和形狀不同,機器人必須具有分揀和篩選的能力。在這種情況下,單個機器人很難滿足生產需求,需要多機協同完成工作,多機協作抓取流程如圖4 所示。

圖4 多機協同分揀流程Figure 4 Multi machine collaborative sorting process
為了驗證所提出控制方法的有效性,對不同的軌跡抓取效果和不同分選控制策略進行了對比試驗。測試設備為華為PC,操作系統為windows 10 64位旗艦,Intel i5 2450m CPU,2.5 GHz主頻,8 GB內存。Delta機器人是深圳華盛科技有限公司生產的wsc-300d型并聯機器人,相機采用德國生產開發的英美鏡 USB3.1型工業相機,并配有索尼感光組件。伺服電機采用松下MHMD型伺服電機。編碼器為歐姆龍E2B2-C型編碼器。試驗參數和算法參數見表1和表2。

表1 試驗參數Table 1 Test parameters

表2 算法參數Table 2 Algorithm parameters
3.2.1 不同優化軌跡抓取 選取某食品廠生產的餅干進行分揀試驗,比較了不同的優化軌跡(正弦優化和拋物線優化)的分揀效果。試驗過程中,在傳輸線上隨機放置2 000塊餅干。Delta機器人在視覺系統的引導下完成分揀工作。表3為不同優化軌跡的分揀結果。
從表3可以看出,當傳送帶速度為200,300 mm/s時,正弦優化軌跡的分揀成功率最高。將傳送帶速度從200 mm/s增加到300 mm/s時,會在一定程度上降低不同優化軌跡的分揀成功率。拋物線優化軌跡的抓取成功率從96.50%下降到94.80%,正弦優化軌跡的成功率從99.70%下降到98.60%。對不同優化軌跡的對比分析表明,在機器人末端軌跡優化中,正弦優化軌跡優于拋物線優化軌跡。

表3 不同優化軌跡分揀試驗結果Table 3 Sorting test results of different optimized tracks
3.2.2 不同分揀控制策略對比 選擇某食品廠生產的餅干進行分揀試驗,并將研究提出的控制方法與BP神經網絡優化的PID控制方法(BPNN-PID)[21]和IPSO優化的BP神經網絡方法(IPSO-BPNN)[22]進行比較。在傳輸線上隨機放置2 000塊餅干。Delta機器人在視覺系統的引導下,將進入目標分揀區域的餅干按照要求分揀到相應的位置,完成分揀操作。優化軌跡統一為正弦優化軌。表4為不同分揀控制策略的分揀試驗結果。
從表4可以看出,在不同的傳送帶速度下,研究提出的控制方法的分揀成功率最高。隨著傳送帶速度從200 mm/s 增加到300 mm/s,3種分揀控制策略的分揀成功率都有一定程度的下降。BPNN-PID控制方式從91.00%降至89.00%,IPSO-BPNN控制方法從95.80%降至94.00%,研究提出的控制方法從99.70%降至98.60%。這是因為在PID控制策略中引入IPSO-BP神經網絡來實時調整PID控制參數,具有較強的抗干擾能力和適應性,提高了Delta機器人分揀成功率。

表4 不同分揀控制策略的分揀試驗結果Table 4 Sorting test results of different sorting control strategies
研究提出了一種基于IPSO-BP神經網絡和PID控制的Delta機器人運動目標抓取策略。結合帶速控制和目標位置預測,利用IPSO對BP神經網絡的初始權值進行優化,優化后BP神經網絡對PID控制參數進行實時調整。與傳統方法相比,研究提出的控制方法的分揀成功率最高,傳送帶速度為200 mm/s時最優值達到99.70%,具有較強的抗干擾能力和適應性,滿足食品分揀的需要,但試驗進行研究和分揀的對象僅為餅干,后續應進一步增加食品的種類不斷完善整個系統。