999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于強化學習的值迭代算法

2014-12-05 03:05:50崔軍曉等
電腦知識與技術 2014年31期

崔軍曉等

摘要:強化學習(Reinforcement Learning)是學習環境狀態到動作的一種映射,并且能夠獲得最大的獎賞信號。強化學習中有三種方法可以實現回報的最大化:值迭代、策略迭代、策略搜索。該文介紹了強化學習的原理、算法,并對有環境模型和無環境模型的離散空間值迭代算法進行研究,并且把該算法用于固定起點和隨機起點的格子世界問題。實驗結果表明,相比策略迭代算法,該算法收斂速度快,實驗精度好。

關鍵詞:強化學習;值迭代;格子世界

中圖分類號:TP181 文獻標識碼:A 文章編號:1009-3044(2014)31-7348-03

Abstract: Reinforcement learning is learning how to map situations to actions and get the maximize reward signal. In reinforcement learning, there are three methods that can maximize the cumulative reward. They are value iteration, policy iteration and policy search. In this paper, we survey the foundation and algorithms of reinforcement learning , research about model-based value iteration and model-free value iteration and use this algorithms to solve the fixed starting point and random fixed starting point Gridworld problem. Experimental result on Gridworld show that the algorithm has faster convergence rate and better convergence performance than policy iteration.

Key words: reinforcement learning; value Iteration;Gridworld

強化學習可以解決自動控制,人工智能,運籌學等領域方面的各種問題。其中自動控制和人工智能是強化學習的重要發源地。在自動控制領域中,強化學習用于自適應的最優控制問題。在人工智能領域中,強化學習用于協助構建人工agent,可以在未被構建的未知環境中找到最優化的行為。

我們在這里對強化學習的值迭代算法進行研究,并以格子世界為例將該算法進行實際運用,以此表現出該算法的優勢。

如圖 1所示,agent做出了一個動作,環境對agent做出的動作產生回應,從而改變了agent的狀態并且對agent給出一定的獎賞。在每個時間步中,agent都要實現從狀態到每一個可能選到的動作的映射。這個映射就是agent的策略。

3 離散空間實驗結果分析

現在來用基于模型的值迭代算法解決格子世界問題。將算法1直接運用在格子世界問題上。設定初始狀態的狀態值函數全部為0,折扣因子[γ]為0.5。對應的值迭代結果如圖3所示,策略如圖4所示。……

登錄APP查看全文

主站蜘蛛池模板: 国产剧情一区二区| 在线观看亚洲天堂| 在线免费观看AV| 国产午夜精品鲁丝片| 国产男人的天堂| 国产精品永久免费嫩草研究院| 九色国产在线| 国产成人精品午夜视频'| 99视频精品在线观看| 亚洲热线99精品视频| julia中文字幕久久亚洲| 国内精品久久人妻无码大片高| 国产精品999在线| 亚洲国产欧洲精品路线久久| 亚洲视屏在线观看| 国产v精品成人免费视频71pao| 真实国产乱子伦视频| 欧洲高清无码在线| 亚洲色精品国产一区二区三区| 亚洲精品国产综合99| 欧美日韩中文国产| 波多野结衣一区二区三区四区| 欧美人与动牲交a欧美精品| 欧美色视频网站| 国产福利一区二区在线观看| 高潮爽到爆的喷水女主播视频| 欧美成人二区| 在线无码av一区二区三区| 国产av无码日韩av无码网站 | 久久久久久久久亚洲精品| 伊人久久综在合线亚洲2019| 亚洲VA中文字幕| 国产一国产一有一级毛片视频| 黄色网站在线观看无码| 免费视频在线2021入口| 99视频只有精品| 99热这里只有精品在线观看| 欧美a√在线| 92精品国产自产在线观看| 无码内射在线| 久久亚洲日本不卡一区二区| 一级毛片免费不卡在线视频| 国产自在自线午夜精品视频| 中文无码伦av中文字幕| 真实国产乱子伦视频| 久久香蕉欧美精品| 欧美日韩精品一区二区在线线| 免费观看亚洲人成网站| 毛片免费观看视频| 欧美区国产区| 国产欧美精品一区二区| 天天综合网在线| 亚洲另类色| 国产XXXX做受性欧美88| 亚洲无码精品在线播放| 日韩资源站| 免费一级成人毛片| 中文字幕色站| 亚洲天堂免费观看| 欧美日本激情| 亚洲二区视频| 成人国产精品网站在线看| 免费不卡在线观看av| 久久精品这里只有精99品| 久久99精品国产麻豆宅宅| 欧美在线中文字幕| 日韩无码真实干出血视频| 日本www在线视频| 2021亚洲精品不卡a| 毛片免费在线视频| 无码一区二区波多野结衣播放搜索| 麻豆国产在线不卡一区二区| 国产95在线 | 全午夜免费一级毛片| 欧美精品aⅴ在线视频| 亚洲欧美不卡视频| 成人福利在线观看| 亚洲国产精品久久久久秋霞影院| www.亚洲天堂| 久久免费视频播放| a级毛片免费看| 久久香蕉国产线看观看亚洲片|