999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

RobuCup 2D結合神經網絡算法的跑位與決策研究

2020-04-16 12:44:48耿志文
科學大眾 2020年2期
關鍵詞:機器學習計算機人工智能

耿志文

摘? ?要:國際信息科技領域新興一項前沿機器人學習方面大型學術活動—機器人足球世界杯。機器人足球世界杯涉及領域廣泛,研究方法多樣,集合了多領域合作,涉及計算機、通信、自動化、機電一體、機器學習等多項前沿技術的開拓和綜合集成;對其的研究已經成為各個領域的重點。在教育方面,機器人足球已經成為21世紀計算機科技與信息科技頂尖人才的重要方向。甚至在歐美很多國家已將其設定為核心課程。概括來說,機器人足球世界杯是以仿真體育賽事為載體的前沿科技競爭和高科技對抗賽事,機器人賽事的蓬勃發展極大地促進了計算機科學等學科前沿技術的發展,在某種程度來說,機器人賽事的發展也是自動化、機器人、計算機等科技的重要窗口。

關鍵詞:機器學習;計算機; RobuCup;人工智能

1? ? RobuCup簡介

RoboCup聯盟是一個國際性研究和教育組織,提供一個標準問題來應對機器人運動方面的研究。這個領域可以檢驗許多提出的設想性方案的實際呈現,也可以檢驗許多新技術在應用方面存在的問題,同時也可以用作教育領域,促進許多學科基礎教育的進步與前沿科技發展。

足球比賽被RoboCup選作一個基本領域,組織了世界上級別最高、規模最大、影響最廣泛的機器人足球賽事和學術會議—機器人足球世界杯及其學術會議。機器人球隊的正常運作,涉及多方面的技術,而文章所研究的RobuCup 2D則是為軟件及策略方面研究,以用于實際操作。

2? ? RobuCup研究重點

RobuCup 2D挑戰為智能主體提供了一系列挑戰,同時還提供了一個動態、實時多主體的平臺對戰展現效果,通過足球場上仿真設定各種影響因素來模擬真實賽場環境,例如通過“噪音”干擾智能主體之間的通信,提高其信息傳遞的失敗率;通過“視野”限制降低智能主體對場上信息的獲取;通過場上球員的相互阻礙來提高策略的重要性。因此,為了在重重限制下贏得比賽,如何讓智能主體有目的地學習進攻策略就變得極其重要,因此在研究這個方面課題的時候要學會對智能主體的訓練。

如上所述,學習成為智能主體非常重要的一個環節,所以在RobuCup學習挑戰中,為一組智能主體創建有效的學習方法成為主要挑戰,這個挑戰分為以下幾個部分:

(1)單個智能主體的離線學習技術(對球的攔截與踢球)。

(2)智能主體之間配合的離線學習(傳接球)。

(3)在線技術和合作學習(如適應性跑位)。

(4)在線對抗學習(如預測對手行為并采取有效策略)。

足球這種復雜、動態的多主體分布式人工智能的訓練需要各種考慮多種因素,需要靈活的協調和通信來克服場上的不確定性,所以必須建立一個讓智能主體之間聯系更加緊密的神經網絡來加強團隊之間的聯系和實現更加完善的攻防策略,要建立一個完整的體系結構來讓分布的智能主體即使在視野、信息受限的情況下也能將戰術與隊形調整到最佳狀態。

3? ? 多智能體的學習

在分布式多主體的人工智能中,一個多智能主體的系統在結構上和系統功能上都比較復雜,智能體之間信息傳遞的不穩定性以及場上干擾都會給整個系統的功能發揮帶來干擾,而無法實現給定所有可能發生的情況,因此需要讓多智能主體擁有一定的學習能力和自適應性,讓多智能主體的系統可以通過學習和分析來更好的實現功能。而采用神經網絡來加強團隊之間的學習和配合是文章的重點。

4? ? 反應式Agent結構

反應式Agent指簡單地對外部刺激產生響應,沒有里面的任何狀態,每個Agent可以是用戶也可以是服務端。

5? ? Monitor

Monitor是可視化工具,提供平臺讓人們觀看比賽時候的場景,利用可視化平臺讓人們更直觀地看見智能主體的表現和團隊策略的實施,可以直接看見智能主體和球在場上的運動坐標,RobuCup 2D為二維球場,需要考慮的球員因素例如人形關節、轉頭等比較少,但對于團隊策略更為注重。

6? ? 球場上的動態規劃

球場上的每個周期都需要準確的判斷,由于踢球力量到加速度轉換率(Kick Power Rate,KPR)提高到0.027以后,把球高速踢出比以前容易多了,在4個周期內都可以把球加速到2.5左右。

使用搜索和強化算法來設計踢球模塊,讓智能主體擁有快速踢球的能力是非常重要的一個環節,但是智能主體對場上的時機判斷并不準確,球的運動會干擾所有智能主體的判斷,當運動狀態改變時,智能主體的決策也會相應改變,所以要離散化球隊球員的位置空間,用來表示過度踢球的中間狀態。所以這里使用動態規劃來準確的確定球隊球員之間策略的決定。以10×10離散球員魏忠賢,邊長2x kickable area的正方形。首先需要得出兩個點的球運動狀態,如果確定了第二個點,那智能主體就可以擁有對第二個點球的實際控制能力。

智能主體給球的加速度和智能主體的力量之比為kick rate,其只與KPR、球到智能主體的距離以及球和智能主體的角度有關。

7? ? 動作訓練

在對智能主體策略的規劃中,還需要考慮到對智能主體離線和在線的訓練,將Q學習和UCT結合,保證探索和盡量保證選取最優動作獲得一個比較科學的估值機制。

8? ? 結語

設計了一個簡單的場上教練實現改變球員的類型,詳細的球員類型應用非常復雜,本設計演示了如何使用場上教練來改變球員類型,這些改變不是策略的一部分,球員類型的改變目前還影響不到策略實施的效果。

猜你喜歡
機器學習計算機人工智能
計算機操作系統
基于計算機自然語言處理的機器翻譯技術應用與簡介
科技傳播(2019年22期)2020-01-14 03:06:34
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
信息系統審計中計算機審計的應用
消費導刊(2017年20期)2018-01-03 06:26:40
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
基于支持向量機的金融數據分析研究
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
主站蜘蛛池模板: 免费又爽又刺激高潮网址| 真人免费一级毛片一区二区| 午夜福利在线观看成人| 午夜影院a级片| 国产日韩精品一区在线不卡 | 高清无码一本到东京热| 久久亚洲天堂| 成人久久精品一区二区三区| 国产成人精品日本亚洲77美色| AV不卡在线永久免费观看| 国产真实乱子伦视频播放| 欧美三级自拍| 就去吻亚洲精品国产欧美| 91精品国产一区自在线拍| 亚洲精品久综合蜜| 欧美精品亚洲二区| 久久香蕉国产线看观看精品蕉| 在线播放国产一区| 国产一级特黄aa级特黄裸毛片| 国产午夜一级毛片| h网址在线观看| 久草青青在线视频| 在线综合亚洲欧美网站| 亚洲开心婷婷中文字幕| 日韩精品亚洲精品第一页| 亚洲αv毛片| 午夜欧美理论2019理论| 免费观看国产小粉嫩喷水| 久久精品无码一区二区日韩免费| 亚洲最新地址| 无码久看视频| 日韩小视频在线观看| 91免费国产在线观看尤物| 国产综合网站| 国产精品福利在线观看无码卡| 狠狠躁天天躁夜夜躁婷婷| 国产精品自在拍首页视频8| 亚洲欧美在线综合一区二区三区| 亚洲福利一区二区三区| 无码'专区第一页| 日韩高清无码免费| 国产三区二区| 一本大道无码日韩精品影视| 狠狠色香婷婷久久亚洲精品| 欧美19综合中文字幕| 欧美在线视频不卡| 国产精品短篇二区| 一本久道久久综合多人 | 成人免费黄色小视频| 丁香婷婷综合激情| 欧美人人干| 国产天天射| 欧美午夜在线观看| 伊人久久久久久久久久| www.av男人.com| 毛片视频网址| 九九这里只有精品视频| 日韩中文精品亚洲第三区| 亚洲国产成人久久精品软件 | 免费人成在线观看成人片| 2021国产在线视频| 热热久久狠狠偷偷色男同| 午夜啪啪福利| 成人午夜天| 极品私人尤物在线精品首页| 九九热在线视频| 在线看国产精品| 国产成人艳妇AA视频在线| 免费高清自慰一区二区三区| 国产精品3p视频| 国产在线精品99一区不卡| 波多野结衣在线se| 国产在线精品人成导航| 国产福利在线免费| 色偷偷一区| 婷婷99视频精品全部在线观看| 亚洲国产理论片在线播放| 热99精品视频| 美女一级毛片无遮挡内谢| 国产主播在线一区| 亚洲天堂高清| 成人在线第一页|