999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度強化學習在地形自適應運動技能上的應用

2017-07-10 03:40:59劉仕超
科技風 2017年7期
關鍵詞:深度動作技能

劉仕超

摘 要:強化學習為開發模擬特性技能提供了一種很有效的方法,但強化學習通常需要稀疏手動的來獲取特征。依賴于深度強化學習,我們引進了動作-評價和專家學習混合的學習方法(MACE)來學習動態地形自適應技能,把高緯度狀態和地形描述作為該方法的輸入,參數化的跳躍或行走作為輸出動作。MACE方法比單一的動作-評價方法的學習效率更快,從而使動作-評價和專家學習變得更具獨特性。

關鍵詞:深度強化學習;地形自適應;卷積神經網絡

人和動物在環境中優雅敏捷的運動,在動畫片中,動物的動作通常是在熟練的動畫片制造者和捕獲到的動作數據的幫助下創造出來的。從基本原理出發,應用強化學習和基于物理特性的仿真,呈現出了研發不同種類運動技能的美好前景。這需要通過一個連續的決策問題,涉及狀態,動作,獎勵和控制決策的鏡頭看問題。給定當前狀態的特性,作為捕獲的狀態,控制策略決定采取最佳動作,從而導致隨后的狀態,以及獎勵發生改變??刂茮Q策的目的是最大限度地提高預期的未來回報,即,任何直接的獎勵以及所有預期的回報。

本文應用深度神經網絡與強化學習相結合的方式來解決上述問題。在運動技能領域,我們應用控制結構建立設計動作參數的預期工作。強化學習過程中,值函數或者動作-值函數已經作為導向函數應用于動作的合成上,基于深度神經網絡的控制策略已經能夠借助可微神經網絡來控制動作。

1 原理

系統原理圖如圖1所示,它有三個嵌套循環,每個嵌套對應于不同的時間尺度。最內層循環模型是底層控制和基于物理特性的仿真過程;中間循環是在運動周期的時間尺度上運行;最外層循環是以動作-評估參數來進行決策更新。決策由動作評價對來決定,這些動作評價對的輸出就是深度神經網絡的輸出。每個動作,都有其獨自的決策模型,動作選擇,根據基于軟最大化的模型,以一定的概率進行選擇,這個選擇是把動作賦予具有較高評價函數值Q的。在做出動作選擇時,可能會摻雜高斯噪聲,使得噪聲以一定的概率參與到輸出。

3 結論

本文應用深度強化,和基于物理特性的動作-評價專家學習模型,以及Boltzmann探索,使得學習性能更佳。這也避免了需要設計緊湊的手工制作的特征,并且允許針對可能不容易開發緊湊特征描述的地形進行學習策略的開發。

參考文獻:

[1] COROS, S., BEAUDOIN, P., YIN, K.K., AND VAN DE PANNE,M.2008.Synthesis of constrained walking skills.ACM Trans. Graph.27,5,Article 113.

[2] COROS, S., BEAUDOIN,P.,AND VAN DE PANNE,M.2010. Generalized biped walking control. ACM Transctions on Graphics 29,4,Article 130.

[3] HAUSKNECHT,M.,AND STONE,P.2015.Deep reinforcement learning in parameterized action space. arXiv preprint arXiv:1511.04143.

[4] HESTER, T., AND STONE, P.2013.Texplore: real-time sampleefficient reinforcement learning for robots. Machine Learning 90,3,385-429.

[5] LEE, Y., KIM, S., AND LEE, J. 2010.Data-driven biped control.ACM Transctions on Graphics 29,4,Article 129.

猜你喜歡
深度動作技能
高級技能
深度理解一元一次方程
深度觀察
深度觀察
深度觀察
動作描寫要具體
秣馬厲兵強技能
中國公路(2017年19期)2018-01-23 03:06:33
拼技能,享豐收
畫動作
動作描寫不可少
主站蜘蛛池模板: 色哟哟精品无码网站在线播放视频| 四虎在线高清无码| 精品小视频在线观看| 在线色国产| 2020久久国产综合精品swag| 亚洲欧美一区二区三区蜜芽| 无码日韩人妻精品久久蜜桃| 国产成人a在线观看视频| 美女啪啪无遮挡| 第一页亚洲| 欧美日韩资源| 国产亚洲男人的天堂在线观看| 久久精品中文字幕免费| 免费在线a视频| 亚洲国产成人在线| 一区二区在线视频免费观看| 国产精品主播| 波多野吉衣一区二区三区av| 国产凹凸视频在线观看| 欧美日韩精品一区二区在线线| 国产成人精品日本亚洲| 亚洲无码在线午夜电影| 国产1区2区在线观看| 国产亚洲精品精品精品| 日韩精品成人在线| 亚洲精品自拍区在线观看| 91青青草视频在线观看的| 国产成人精品男人的天堂| 亚洲精品午夜无码电影网| 91偷拍一区| 久一在线视频| 国产精品视频导航| 亚洲热线99精品视频| 国产国模一区二区三区四区| 国产精品女人呻吟在线观看| 99在线视频网站| 久久精品国产免费观看频道| 亚洲欧美日韩中文字幕在线| 国产精品美女免费视频大全| 亚洲精选无码久久久| 亚洲无码熟妇人妻AV在线| 99热线精品大全在线观看| 亚洲国产高清精品线久久| 欧美亚洲日韩不卡在线在线观看| 中文字幕 欧美日韩| 国产香蕉国产精品偷在线观看 | 日本一区二区不卡视频| 99精品免费在线| 亚洲成AV人手机在线观看网站| 国产剧情一区二区| 亚洲激情99| 亚洲欧美自拍中文| 国产高清不卡视频| 99免费在线观看视频| 国产成a人片在线播放| 最新加勒比隔壁人妻| 91www在线观看| 日韩乱码免费一区二区三区| 嫩草影院在线观看精品视频| 欧美一区精品| 日韩二区三区无| 亚洲视频二| 99国产精品免费观看视频| 欧美日韩精品一区二区在线线 | 日本在线免费网站| 亚洲无码高清视频在线观看 | 一级毛片不卡片免费观看| 91麻豆久久久| 免费一级毛片在线观看| 国产一级毛片yw| 青草视频免费在线观看| 狠狠做深爱婷婷综合一区| 狠狠色丁婷婷综合久久| 99久久国产综合精品2020| 欧美综合区自拍亚洲综合绿色| 丰满少妇αⅴ无码区| 色综合婷婷| 波多野结衣AV无码久久一区| 蜜桃臀无码内射一区二区三区 | 91在线高清视频| 久久久久久久久久国产精品| 再看日本中文字幕在线观看|