張虹
摘 要:火災是發生最頻繁且極具破壞性的災害之一,滅火機器人的廣泛應用對其路徑規劃能力提出了更高的要求。本文提出一種利用多智能體系統建立一種有機有效的協作模型,使功能相對獨立的智能體能夠互相協作完成復雜的滅火任務的方法,以提高撲滅惡性火災的能力。
關鍵詞:多智能體;協作;滅火機器人
近年來,火災是發生最頻繁且極具破壞性的災害之一,給國家財產和人員造成了難以計數的損失。滅火機器人屬于特種移動機器人范疇,它作為特種消防設備可以替代消防隊員接近火災現場實施有效的滅火救援作業,開展各項火場偵察任務,尤其是在危險性大或消防隊員不易接近的場合,滅火機器人的應用將大大提高消防部門撲滅惡性火災的能力,對減少國家財產損失和滅火救援人員的傷亡具有重要的作用。滅火機器人集人工智能、信息處理、圖像處理、無線通訊等專業技術為一體,跨計算機、自動控制、機械、電子等多學科,成為當前移動機器人研究的重點之一。目前,越來越多的滅火機器人己應用到各種危險場合,滅火機器人的廣泛應用對其路徑規劃能力提出了更高的要求。傳統的移動機器人基本上都采用專用處理器和專用操作系統,這已不能滿足現代滅火機器人的發展要求,隨著嵌入式系統的發展,滅火機器人正向經濟化、小型化、智能化和通用型方向發展。
一、互聯網+大數據時代人工智能的發展
智能包含感知能力、記憶與思維能力、學習和自適應能力、決策與行為能力。人工智能是計算機科學的一個分支,分為弱人工智能、強人工智能和超人工智能。從目前人工智能的應用場景來看,當前人工智能仍是以特定應用領域為主的弱人工智能,如圖像識別、語音識別等生物識別分析,如智能搜索、智能推薦、智能排序等智能算法等。而未來隨著運算能力、數據量的大幅增長以及算法的提升,機器智能將在大數據中從感知、記憶和存儲向認知、自主學習、決策與執行進階。在工程實踐中,經常使用仿生的一些算法或理論,比如粒子群算法,遺傳算法,禁忌搜索,神經網絡等。這些算法或理論都有一些共同的特征(比如仿生),通稱為“智能算法”。它們在解決一些復雜的工程問題時大有用武之地。但隨著互聯網+大數據時代的強勢來臨,迫切地需要開發新人工智能算法。
二、基于多智能體的滅火機器人系統
智能體系統(multi-gent system,MAS)一直是人工智能研究的熱點領域。但是多智能體在弱通信環境中無法做出有效決策以及在巨大災難環境中多智能體遇到的“維數災難”這兩個問題,從而無法提高智能體學習和決策能力。而發生火災的場所就是一個通信環境差的災難環境。多智能體系統的協作是人工智能研究的熱點。多智能體系統通過建立一種有效的智能協作模型,使功能獨立的智能體能夠互相協作完成復雜的滅火任務。目前,多智能體協作技術已經廣泛應用于智能機器人、軌道交通、智能制造、網絡自動化與智能化、商業管理等領域。
在多智能體領域中,基于行為的方法是一個受到廣泛認可的智能體協同控制算法?;谛袨榈姆椒ú恍枰鶕煌沫h境去建立不同的數學模型,也可稱之為免模型算法,具有不錯的魯棒性。但是智能體的行為選擇策略往往是預先人工設定好的,面對復雜多變的環境,缺乏自適應能力。因此,只依靠基于行為的方法,無法解決復雜智能博弈對抗問題。在21世紀初期,越來越多的研究者開始將機器學習的方法與基于行為的算法相結合,提出新的智能體控制技術,使得智能體逐漸開始擁有自主學習的能力。但是單一的智能體學習方法,往往不能滿足多智能體系統的需要。受到生物學和社會學的啟發,基于多智能體的特點,研究者們逐漸開始將不同類型的機器學習方法與傳統基于行為的方法相融合,試圖尋找更好的合作方式。而這種跨學科將多方法融合的思路,對于提高智能體的學習效率,擴大多智能體的應用范圍及提高多智能體的協同能力具有重要的實踐意義。
總體來看,在智能體的發展研究過程中,多智能體面對復雜多變的環境時應該具有協調性、自適應性和自組織性。因此,多智能體中的每個獨立的智能體首先必須具有獨立的自主決策能力與面對動態變化的自適應能力。另外在多智能體系統中,不能忽視智能體之間的合作和競爭,必須要考慮到整體的利益,即協同能力。本文在對多智能體系統分析的基礎上,針對目前協作模型存在的問題,提出一種通用的滅火多智能體協作模型,三個關鍵模塊是:滅火任務處理模塊,滅火協商模塊,滅火協調規劃模塊。滅火任務處理模塊對復雜任務的三個處理步驟為:滅火任務分解、滅火任務組織關系、滅火任務重要屬性處理。確定了滅火協商模塊中的協商模型及相應的滅火協商協議和滅火協商流程。按照提出的滅火多智能體協作模型構建了滅火執行智能體和滅火管理智能體結構。并對滅火任務處理模塊提出一種可自學習尋徑避障軌跡的智能群算法應對復雜環境下(大數據)的滅火。通過對可能的軌跡進行編碼、適應度評價、群聚、強局部搜索能力的混沌模式、自學習等一系列操作步驟,經過一定代數的迭代獲得最優的行進策略和軌跡方案。多個智能體多方協作,共同完成滅火任務。
三、總結
多智能體深度強化學習在單智能體強化學習基礎上增加了智能體數量并通過在算法中加入博弈對抗和通信協調機制使多個智能體具有群體性、分布性和自主性等特點,具備學習推理和自組織協調能力?,F有的多智能體多用于解決維度較低、智能體個數較少的問題,隨著深度學習技術的突破以及與仿生算法結合的成功,使得多智能體深度強化學習方法在應對面對外界復雜多變的環境中取得一定進展。多智能體系統中每個智能體之間可通過通信和協作機制達成(默契),在學習過程中不僅考慮自身利益,更重要的是考慮如何最大化整體利益。每個智能體在與環境的不斷交互中學習并提升協同能力和決策能力。將其應用在滅火中,是一個有益的嘗試和探索。但是仍然存在一些難題需要以后繼續研究。
參考文獻
[1]基于Q學習的RoboCup多智能體決策優化.周戎.南京郵電大學.2018-11-14碩士
[2]國內多智能體系統應用研究歸納——共詞分析視角[J].邢曉昭,望俊成.數字圖書館論壇2013-04-25期刊
[3]基于差分進化算法多智能體任務分配熊遠武[J].趙嶺忠,翟仲毅.計算機工程與設計2019-10-14
[4]RoboCup救援仿真平臺中多智能體滅火策略.楊祥.南京郵電大學.2015-03-01
[5]RoboCup機器人救援仿真中多智能體協作模型的研究與建立.錢程.東南大學.2018-06-30
[6]基于深度強化學習的智能博弈對抗關鍵技術[J].曹雷.指揮信息系統與技術.2019-11-11