(北京物資學(xué)院 北京 101149)
物聯(lián)網(wǎng)等技術(shù)的發(fā)展使人們的生活水平不斷提高,電子商務(wù)也在重塑著人們的購物方式,由此引起以物流為主導(dǎo)的各行各業(yè)不斷發(fā)展。在物流的智能倉儲環(huán)節(jié),多機器人系統(tǒng)扮演著很重要的角色。與單個機器人相比,多機器人系統(tǒng)擁有效率高、速度快、魯棒性好以及傳遞信息準確等優(yōu)點。
著名多機器人系統(tǒng)研究專家Lynne E。Parker從七個方面總結(jié)了多機器人系統(tǒng)領(lǐng)域的主要研究內(nèi)容及亟待解決的問題[1]。其中最為嚴峻的且對企業(yè)發(fā)展影響較大的一個問題就是多機器人的任務(wù)分配問題,在多機器人進行協(xié)作探索時,特別是在未知環(huán)境下,任務(wù)分配問題是多機器人系統(tǒng)能效優(yōu)化的一個極其重要的環(huán)節(jié),該怎樣提高任務(wù)分配的效率是多機器人系統(tǒng)研究的關(guān)鍵問題[2]。
多機器人系統(tǒng)中的機器人調(diào)度過程如下[3]:當(dāng)有一批訂單到來時,一般選擇已經(jīng)存在的任務(wù)分配算法,對這一批訂單進行分配,各個機器人會被分配到一個或多個訂單任務(wù),機器人根據(jù)被分到任務(wù)的具體信息,通過路徑規(guī)劃算法從當(dāng)前位置移動到貨架位置;然后將貨架運輸?shù)街付ǖ墓ぷ髋_進行相應(yīng)處理,再從當(dāng)前位置移動到下一個任務(wù)訂單所指向的貨架,依次循環(huán)直至完成所有被分到的任務(wù)。
其中多機器人任務(wù)分配的定義[4]為:已知存在一個多機器人系統(tǒng),一個任務(wù)集合以及系統(tǒng)性能的評價指標(biāo),為每個子任務(wù)尋找一臺合適的機器人負責(zé)執(zhí)行該子任務(wù),且使得機器人系統(tǒng)執(zhí)行完任務(wù)集合中的全部任務(wù)時所獲得的收益達到最大。即將任務(wù)按照一定的分配規(guī)則,分配給機器人去執(zhí)行,目標(biāo)是在保證所有任務(wù)完成的情況下,使總成本最小。
對于多機器人任務(wù)分配問題,國內(nèi)外學(xué)者已經(jīng)做了許多研究,下面對于任務(wù)分配現(xiàn)存研究方法做出闡述,分別敘述各個方法的優(yōu)缺點。
深度強化學(xué)習(xí)[5-6](DRL,Deep Reinforcement Learning)是將深度學(xué)習(xí)方法與強化學(xué)習(xí)方法相結(jié)合,它集成了深度學(xué)習(xí)方法在感知問題上強大的特征提取能力,以及強化學(xué)習(xí)算法的行動決策能力,這些特點使其得以運用于現(xiàn)實場景中的大規(guī)模復(fù)雜問題。在使用深度強化學(xué)習(xí)方法解決任務(wù)分配問題時,機器人是具有自主決策能力的智能體(Agent),當(dāng)一批訂單來臨時,由任務(wù)臺通過深度強化學(xué)習(xí)算法進行任務(wù)分配,將任務(wù)分配給空閑機器人,以實現(xiàn)整體效益最大化。
優(yōu)點:在多機器人系統(tǒng)中該方法效率較高,精確度高,機器人學(xué)習(xí)時間較短。
缺點:對機器人性能要求較高,算法較為復(fù)雜。
群體智能方法[7]是指利用群體中各個體之間的相互協(xié)作和信息分享求解和優(yōu)化問題。群體智能方法可以在沒有集中控制且缺少全局信息的情況下解決分布式問題,能夠適用于分布式動態(tài)任務(wù)分配問題。常見的群智能體智能算法有:蟻群算法、粒子群、魚群算法等。
優(yōu)點:穩(wěn)定性與可擴展性好,很好地動態(tài)適應(yīng)性。
缺點:機器人之間的協(xié)調(diào)能力差,效率低,不適合復(fù)雜情況。
基于市場機制的任務(wù)分配方法[8]是在多機器人系統(tǒng)中,利用分布式的組織方式使得機器人之間保持共享信息,機器人通過投標(biāo)來獲取執(zhí)行任務(wù)的一種分配方法。這是一種具有良好魯棒性、靈活性的任務(wù)分配方法,適合動態(tài)不確定環(huán)境下求解任務(wù)分配問題。
優(yōu)點:魯棒性與靈活性較好。
缺點:機器人需要彼此合作,資源耗費大,不能保證通訊中斷時的分配效果。
綜上,我們可以知道在現(xiàn)在智能倉儲系統(tǒng)發(fā)展迅速的情況下,在機器人越來越智能的情況下,深度強化學(xué)習(xí)方法是進行多機器人任務(wù)分配的首要選擇。
本文介紹了多機器人任務(wù)分配的基本概念與現(xiàn)存的幾種任務(wù)分配方法,包括深度強化學(xué)習(xí)方法、群智能方法、基于市場機制的方法,分別介紹了他們的概念以及優(yōu)缺點,得到的結(jié)論是,在科技發(fā)展迅速的今天,使用深度強化學(xué)習(xí)方法來進行多機器人任務(wù)分配是一個較為合適的方法。