999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

RobuCup 2D結合神經網絡算法的跑位與決策研究

2020-04-16 12:44:48耿志文
科學大眾 2020年2期
關鍵詞:機器學習計算機人工智能

耿志文

摘? ?要:國際信息科技領域新興一項前沿機器人學習方面大型學術活動—機器人足球世界杯。機器人足球世界杯涉及領域廣泛,研究方法多樣,集合了多領域合作,涉及計算機、通信、自動化、機電一體、機器學習等多項前沿技術的開拓和綜合集成;對其的研究已經成為各個領域的重點。在教育方面,機器人足球已經成為21世紀計算機科技與信息科技頂尖人才的重要方向。甚至在歐美很多國家已將其設定為核心課程。概括來說,機器人足球世界杯是以仿真體育賽事為載體的前沿科技競爭和高科技對抗賽事,機器人賽事的蓬勃發展極大地促進了計算機科學等學科前沿技術的發展,在某種程度來說,機器人賽事的發展也是自動化、機器人、計算機等科技的重要窗口。

關鍵詞:機器學習;計算機; RobuCup;人工智能

1? ? RobuCup簡介

RoboCup聯盟是一個國際性研究和教育組織,提供一個標準問題來應對機器人運動方面的研究。這個領域可以檢驗許多提出的設想性方案的實際呈現,也可以檢驗許多新技術在應用方面存在的問題,同時也可以用作教育領域,促進許多學科基礎教育的進步與前沿科技發展。

足球比賽被RoboCup選作一個基本領域,組織了世界上級別最高、規模最大、影響最廣泛的機器人足球賽事和學術會議—機器人足球世界杯及其學術會議。機器人球隊的正常運作,涉及多方面的技術,而文章所研究的RobuCup 2D則是為軟件及策略方面研究,以用于實際操作。

2? ? RobuCup研究重點

RobuCup 2D挑戰為智能主體提供了一系列挑戰,同時還提供了一個動態、實時多主體的平臺對戰展現效果,通過足球場上仿真設定各種影響因素來模擬真實賽場環境,例如通過“噪音”干擾智能主體之間的通信,提高其信息傳遞的失敗率;通過“視野”限制降低智能主體對場上信息的獲取;通過場上球員的相互阻礙來提高策略的重要性。因此,為了在重重限制下贏得比賽,如何讓智能主體有目的地學習進攻策略就變得極其重要,因此在研究這個方面課題的時候要學會對智能主體的訓練。

如上所述,學習成為智能主體非常重要的一個環節,所以在RobuCup學習挑戰中,為一組智能主體創建有效的學習方法成為主要挑戰,這個挑戰分為以下幾個部分:

(1)單個智能主體的離線學習技術(對球的攔截與踢球)。

(2)智能主體之間配合的離線學習(傳接球)。

(3)在線技術和合作學習(如適應性跑位)。

(4)在線對抗學習(如預測對手行為并采取有效策略)。

足球這種復雜、動態的多主體分布式人工智能的訓練需要各種考慮多種因素,需要靈活的協調和通信來克服場上的不確定性,所以必須建立一個讓智能主體之間聯系更加緊密的神經網絡來加強團隊之間的聯系和實現更加完善的攻防策略,要建立一個完整的體系結構來讓分布的智能主體即使在視野、信息受限的情況下也能將戰術與隊形調整到最佳狀態。

3? ? 多智能體的學習

在分布式多主體的人工智能中,一個多智能主體的系統在結構上和系統功能上都比較復雜,智能體之間信息傳遞的不穩定性以及場上干擾都會給整個系統的功能發揮帶來干擾,而無法實現給定所有可能發生的情況,因此需要讓多智能主體擁有一定的學習能力和自適應性,讓多智能主體的系統可以通過學習和分析來更好的實現功能。而采用神經網絡來加強團隊之間的學習和配合是文章的重點。

4? ? 反應式Agent結構

反應式Agent指簡單地對外部刺激產生響應,沒有里面的任何狀態,每個Agent可以是用戶也可以是服務端。

5? ? Monitor

Monitor是可視化工具,提供平臺讓人們觀看比賽時候的場景,利用可視化平臺讓人們更直觀地看見智能主體的表現和團隊策略的實施,可以直接看見智能主體和球在場上的運動坐標,RobuCup 2D為二維球場,需要考慮的球員因素例如人形關節、轉頭等比較少,但對于團隊策略更為注重。

6? ? 球場上的動態規劃

球場上的每個周期都需要準確的判斷,由于踢球力量到加速度轉換率(Kick Power Rate,KPR)提高到0.027以后,把球高速踢出比以前容易多了,在4個周期內都可以把球加速到2.5左右。

使用搜索和強化算法來設計踢球模塊,讓智能主體擁有快速踢球的能力是非常重要的一個環節,但是智能主體對場上的時機判斷并不準確,球的運動會干擾所有智能主體的判斷,當運動狀態改變時,智能主體的決策也會相應改變,所以要離散化球隊球員的位置空間,用來表示過度踢球的中間狀態。所以這里使用動態規劃來準確的確定球隊球員之間策略的決定。以10×10離散球員魏忠賢,邊長2x kickable area的正方形。首先需要得出兩個點的球運動狀態,如果確定了第二個點,那智能主體就可以擁有對第二個點球的實際控制能力。

智能主體給球的加速度和智能主體的力量之比為kick rate,其只與KPR、球到智能主體的距離以及球和智能主體的角度有關。

7? ? 動作訓練

在對智能主體策略的規劃中,還需要考慮到對智能主體離線和在線的訓練,將Q學習和UCT結合,保證探索和盡量保證選取最優動作獲得一個比較科學的估值機制。

8? ? 結語

設計了一個簡單的場上教練實現改變球員的類型,詳細的球員類型應用非常復雜,本設計演示了如何使用場上教練來改變球員類型,這些改變不是策略的一部分,球員類型的改變目前還影響不到策略實施的效果。

猜你喜歡
機器學習計算機人工智能
計算機操作系統
基于計算機自然語言處理的機器翻譯技術應用與簡介
科技傳播(2019年22期)2020-01-14 03:06:34
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
信息系統審計中計算機審計的應用
消費導刊(2017年20期)2018-01-03 06:26:40
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
基于支持向量機的金融數據分析研究
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
主站蜘蛛池模板: 国产精品手机视频| 白浆免费视频国产精品视频| 久久综合色播五月男人的天堂| 国产精品手机在线播放| 国产超碰一区二区三区| 国产免费一级精品视频| 欧美成在线视频| 有专无码视频| 久久黄色毛片| 国产精品分类视频分类一区| 国产区在线看| 欧日韩在线不卡视频| 亚洲视频在线网| 成人一级免费视频| 91麻豆精品国产高清在线| 国产精品女人呻吟在线观看| 丁香六月综合网| 国产精品性| 精品丝袜美腿国产一区| 国禁国产you女视频网站| 午夜日b视频| 一级毛片免费观看久| 毛片大全免费观看| 国产美女人喷水在线观看| 亚洲资源在线视频| 国产一级裸网站| 在线观看91香蕉国产免费| a毛片在线免费观看| 国产丝袜啪啪| 制服丝袜无码每日更新| 88av在线| 99re热精品视频国产免费| 亚洲国产成人在线| 宅男噜噜噜66国产在线观看| a级毛片毛片免费观看久潮| 久久青草热| 国产精品lululu在线观看| 97色婷婷成人综合在线观看| 超碰免费91| 九九热在线视频| 国产日韩丝袜一二三区| 亚洲人成网站观看在线观看| 午夜a视频| 亚洲三级片在线看| 婷婷综合在线观看丁香| 97在线公开视频| 中文字幕在线看| av色爱 天堂网| 国模极品一区二区三区| 国产网站黄| 在线五月婷婷| 亚洲精品欧美日本中文字幕| 亚洲综合色婷婷| 毛片三级在线观看| 美女毛片在线| 欧美高清日韩| 亚洲精品天堂自在久久77| 精品91视频| 国内嫩模私拍精品视频| 欧美在线精品一区二区三区| 伊人久综合| 动漫精品啪啪一区二区三区| 亚洲中文字幕在线一区播放| 国产自在自线午夜精品视频| 久久久国产精品免费视频| 免费毛片a| 免费一看一级毛片| 亚洲天堂.com| 国产在线观看人成激情视频| 一区二区午夜| 国产在线91在线电影| 欧洲成人免费视频| 日韩无码视频网站| 丰满少妇αⅴ无码区| 一个色综合久久| 国产一级无码不卡视频| 一本大道无码高清| 成人国产精品网站在线看| 国产区精品高清在线观看| 成人在线视频一区| 97精品国产高清久久久久蜜芽 | 久久精品欧美一区二区|