蘇景佑 易嗣力 彭康杰 孫詩越 曾梓安
摘要:本文從熱點問題多人追捕問題的角度出發(fā)主要闡述了精典博弈論和量子博弈輪將會在多人追捕問題中的時機作用與效果,雖然并未深入探究其領(lǐng)域發(fā)展現(xiàn)狀,但是較為側(cè)面的剖析了目前所面臨的困難及問題。
[關(guān)鍵詞]量子博弈多機器人系統(tǒng)
隨著人類生產(chǎn)和生活逐漸向智能化、自動化、無人化發(fā)展,無數(shù)的智能型機器人涌入人們?nèi)粘5纳a(chǎn)生活之中,然而如何降低人類勞動強度,增加勞動速度,維護勞動質(zhì)量,卻依舊可以保證日常生產(chǎn)效益的發(fā)展,成為了目前研究的主要方向。正是因為這一問題,多機器人聯(lián)合工作技術(shù)應用應運而生,并且自誕生開始就以極高的速度發(fā)展,恒快成為了目前世界上最尖端的科學技術(shù)研究方向之一。由于機器人可以很大程度上代替人工勞動并且產(chǎn)生更大的效益,所以在現(xiàn)代科技社會幾乎隨處可見機器人的生硬。工廠里汽車生產(chǎn)自動化流水線,在醫(yī)院納米機器人、微型機器人的高尖端應用,生活上家務機器人,兒童機器人,導購機器人等等已經(jīng)成為現(xiàn)代科學家研究功課的重點,這些機器人使人類生活變得更加快速和便捷。
1多機器人系統(tǒng)概述
然而隨著人類的進一步深入對機器人的要求日漸提高,出現(xiàn)了許多顯示類問題,例如機器人在需要合作任務操作時單靠一個機器人很難對指令的執(zhí)行成功,因此需要將一群相對來說獨立的個體機器人系統(tǒng)有機結(jié)合起來這就是多機器人追捕問題的基本雛形,而多機器人系統(tǒng)的研究也已經(jīng)成為人工智能領(lǐng)域的重要研究分支,多機器人聯(lián)合工作系統(tǒng)絕非單純的系統(tǒng)聯(lián)合對其起來,這樣將會出現(xiàn)邏輯混亂缺乏調(diào)度等情況,進而無法突出多機器人協(xié)同工作的優(yōu)勢從而退化為但機器人祖業(yè)形式,因此是多機器人協(xié)調(diào)調(diào)度相互配合成為多機器人領(lǐng)域的急需解決的重要問題。
1.1系統(tǒng)結(jié)構(gòu)
目前主要的機器人系統(tǒng)結(jié)構(gòu)共分三種集中式、分散式和混合式,三種結(jié)構(gòu)。集中式系統(tǒng)結(jié)構(gòu)存在一臺中控機器人也被稱為中控機器人,由它來分配其他機器人的任務和指令;分散式系統(tǒng)中,所有機器人完全平等,每個機器人自主性共同完成同一個任務;而混合式系統(tǒng)兼并了上述兩種系統(tǒng)的優(yōu)點,分為兩種形式:若干集中式系統(tǒng)組成的多機器人系統(tǒng)以及若干集中式系統(tǒng)與分散式系統(tǒng)混合的垛機器人系統(tǒng)。
1.2淺談多機器人追捕類問題研究
多機器人追捕問題研究的難度主要體現(xiàn)在兩個方面:
(1)無法預測逃亡者的移動策略。
(2)如何使系統(tǒng)調(diào)配追捕機器人都能有效的參與到追捕過程中又不出現(xiàn)資源浪費或資源沖突的情況,在滿足這一條件的同時又能找到最有效率的最優(yōu)策略。
因此截止到目前對于過機器人系統(tǒng)的研究大多都是將機器人視作理性機器人。其特點是其自身所做所有決策都是基于全局最優(yōu)化考慮,沒有假如任何個體因素,盡可能配合整體來執(zhí)行任務。然而隨著對人工智能研究的不斷深入,如何使機器人更貼近人類,使無數(shù)國內(nèi)外學者投入極高的研究熱情。現(xiàn)有機器人區(qū)別于人類的最主要不同點便是在于思維方式。現(xiàn)有機器人無法做出獨立思考,僅僅依賴固定程式進行決策的輸出,并且作為智能從某種意義上來說自立性是其外在表現(xiàn)的主要特征之一。
2博弈論與量子博弈
2.1博弈論概述
博弈論作為現(xiàn)代數(shù)學的重要分支,它把對抗環(huán)境下可能存在的最優(yōu)策略以數(shù)學模型的方式體現(xiàn)出來,博弈論的重點在于它量化了處于博弈雙方的因所采取的策略學所獲取的利益和損失并根據(jù)既定發(fā)生了的實際情況調(diào)整自身策略,使其朝最優(yōu)方向改進。在博弈論中有四個必備要素,局中人、策略、支付和均衡點并且局中人必須大于二,有兩個局中人的被稱為雙人博弈,有多個局中人的被稱為多人博弈。
2.2兩字博弈概述
量子博弈以量子信息理論為基礎(chǔ),與上述經(jīng)典博弈論有著截然不同的特點。首先其初始情況可以疊加。博弈時的信息傳輸可以看做為一"個物理過程。在經(jīng)典博弈時兩個局中人各有兩個不同的策略,而量子博弈中每個人所有的是由兩個或以上的幾臺疊加而成,在撒謊方博弈時兩字以一個疊加狀態(tài)電子的自旋轉(zhuǎn)來表示,每一種旋轉(zhuǎn)姿態(tài)作為局中人的選擇,當局中人做出選擇后,由仲裁對兩個電子進行測量,由此傳達兩局中人所選擇策略。
3量子博弈與多機器人追捕合作
多機器人追捕問題作為多種類型機器人協(xié)作的典型問題,其研究方向主要是依據(jù)動態(tài)視覺信息處理、無線信號通訊、多種機器人分布與控制等知識領(lǐng)域為基礎(chǔ),構(gòu)建機器人群體控制性網(wǎng)絡,對多個機器人進行控制使其完成追捕一個或者多個逃亡者的任務。而博弈論則是解決多方競爭類問題的一種強大武器。我們在這里首先進行模式固定規(guī)定多機器人追捕的系統(tǒng)性受益規(guī)則,并加入博弈論方法,使原本處于盲目性競爭的機器人開始對自身的運作進行有意識的策略調(diào)整,進而使個人利益更加融匯到團體利益之中,最終使其追捕結(jié)果得到一定的改善,然而在一些特定情況下博弈論依舊無法改善其追捕效益,這時可以將追捕系統(tǒng)量子化,將其每個個體的策略擴展到相應的量子空間之中,從而使每個追捕機器人在追求自己本身既定目標的利益最大化的同事,也無意識兼顧整個團隊的整體利益,最終解決在精典博弈論下,每個個體所承受的困境。
4結(jié)論
本文從熱點問題多人追捕問題的角度出發(fā)主要闡述了精典博弈論和量子博弈輪將會在多人追捕問題中的時機作用與效果,雖然并未深入探究其領(lǐng)域發(fā)展現(xiàn)狀,但是較為側(cè)面的剖析了目前所面臨的困難及問題。在研究多機器人協(xié)作追捕問題的兩字我一~輪延伸時,本人發(fā)現(xiàn)大部分目前研究的多人機器人追捕系統(tǒng)的理性對其策略角度造成了極大影響。后受到量子博弈理論原理的啟發(fā),并經(jīng)過模型試驗、研究從量子博弈的角度來解決在線基礎(chǔ)模型下理性機器人系統(tǒng)合作策略性問題。得出量子糾纏時博弈轉(zhuǎn)型的關(guān)鍵因素,只有在量子糾纏度足夠大時,量子博弈才得以超越經(jīng)典博弈。
參考文獻
[1]王月海。基于對策論的機器人部隊追捕問題研究[D].哈爾濱工業(yè)大學工學博士學位論文,2004:19-40.
[2]蘇治寶,陸際聯(lián),童亮。一種多移動機器人協(xié)作圍捕策略[J].北京理工大學學報,2004,24(05):403-406.