999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于貪心算法的動態(tài)規(guī)劃策略

2021-09-26 16:14:45曾妮,陳俊豪,傅清爽
電腦知識與技術(shù) 2021年20期

曾妮,陳俊豪,傅清爽

摘要:為解決單目標玩家在僅知道當(dāng)天的天氣狀況下如何規(guī)劃最佳行動策略的問題,提出一種基于貪心算法的動態(tài)規(guī)劃策略。通過分析單目標玩家的狀態(tài)轉(zhuǎn)移過程,提出基于Floyd算法得出最短路徑以及貪心算法的最優(yōu)后續(xù)決策期望方法,分析最終收益的期望值,從而選擇一種最佳行動策略,并通過蒙特卡洛模擬對天氣進行隨機模擬,將出現(xiàn)概率最大的視為最佳路線進行對比檢驗。分析結(jié)果表明:該策略能夠使玩家在一般情況的未知天氣組合下選擇出最佳行動路線,使得最終資金收益值達到最大。

關(guān)鍵詞:動態(tài)規(guī)劃模型;蒙特卡洛模擬;貪心算法;Floyd算法;決策模型

中圖分類號:TP391.9? ? ?文獻標識碼:A

文章編號:1009-3044(2021)20-0141-03

Dynamic Programming Strategy Based on Greedy Algorithm

ZENG Ni1, CHEN Jun-hao2, FU Qing-shuang3

(1.School of Science, Jiangxi University of Science and Technology, Ganzhou 341000,China;2.School of Civil and Surveying Engineering, Jiangxi University of Science and Technology, Ganzhou 341000, China; 3.School of Information Engineering, Jiangxi University of Science and Technology, Ganzhou 341000, China)

Abstract: To solve the problem of single target player under just know the day's weather conditions due to the problem of how to plan the best strategies in this paper, a dynamic planning strategy based on greedy algorithm, through the analysis of the status of the single target player transfer process resource state function model is established and the optimal decision model of funds, it is concluded that the shortest path based on Floyd algorithm, and the optimal expected follow-up decision-making method based on greedy algorithm, the analysis of the subsequent decisions ultimately earnings expectations, to choose a best course of action strategy, and through monte carlo simulation to stochastic simulation of the weather, will be regarded as the best route with the highest probability compared test The analysis results show that this strategy enables the player to choose the best course of action under the general circumstance of unknown weather combination, which makes the final capital gain reach the maximum.

Key words: dynamic programming model; monte carlo simulation; greedy algorithm; floyd algorithm;decision-making mode

1 引言

近年來,越來越多的探險家為了領(lǐng)略沙漠壯觀的景色以及對自己毅力的考驗進而選擇徒步穿越沙漠,為了更方便地對探險家行走方式進行研究,將此過程模擬成一款穿越沙漠的小游戲,從沙漠的起點出發(fā)前往所規(guī)劃的終點過程,會受到多種因素的限制,而探險家穿越沙漠希望能夠在預(yù)計時間內(nèi)到達終點且此過程花費的成本最少,因此途中如何進行決策將面臨挑戰(zhàn)。

程凱等[1]通過將地圖數(shù)字化后,通過歷遍前往礦山以及村莊的所有路徑,從中得到在天氣已知的情況下第一關(guān)和第二關(guān)的最優(yōu)解,其次,在天氣未知的情況下,通過最大似然估計得到未來天氣的分布函數(shù)來預(yù)測未來天氣,但具體最佳行動策略仍未得出確切解。臧洋等[2]根據(jù)Bellman-Ford算法和最短路的思想,通過確定目標函數(shù)和約束條件,搭建線性規(guī)劃模型,得到在天氣已知的情況下每種情況的最優(yōu)策略,但對于單個玩家在天氣未知的情況下沒有給出具體的分析。

筆者基于貪心算法在單目標玩家僅知當(dāng)天天氣狀況下,對比得出最優(yōu)后續(xù)決策期望的選擇策略,并通過蒙特卡洛模擬對天氣進行隨機模擬,將出現(xiàn)概率最大的視為最佳路線進行對比檢驗,驗證了該種選擇策略方法的可行度。

2 模型建立

2.1 問題提出

主站蜘蛛池模板: 六月婷婷精品视频在线观看| 成年网址网站在线观看| 国产亚洲视频中文字幕视频| 国产精品毛片一区| 成人精品在线观看| 91无码人妻精品一区二区蜜桃| 天天干天天色综合网| 日韩a在线观看免费观看| 欧美国产成人在线| 国产自在自线午夜精品视频| 国模私拍一区二区| 亚洲一道AV无码午夜福利| 丝袜美女被出水视频一区| 国产成人无码久久久久毛片| 99一级毛片| 最近最新中文字幕在线第一页| 国产91成人| 国产在线一区视频| а∨天堂一区中文字幕| 中文精品久久久久国产网址 | AV片亚洲国产男人的天堂| 国产精品久久自在自线观看| 麻豆精品在线视频| 久无码久无码av无码| 91精品视频在线播放| 日韩精品久久久久久久电影蜜臀| 区国产精品搜索视频| 国产手机在线观看| 国产亚洲欧美在线视频| 97国产精品视频人人做人人爱| 日韩黄色在线| 日本少妇又色又爽又高潮| 人妻精品全国免费视频| 国产国产人免费视频成18| 韩国福利一区| 狼友视频一区二区三区| 国产精品久久久久久久久kt| 欧美亚洲国产一区| 狠狠亚洲婷婷综合色香| 99精品伊人久久久大香线蕉| 58av国产精品| 国产精品三级专区| 色欲色欲久久综合网| 情侣午夜国产在线一区无码| 素人激情视频福利| 青草午夜精品视频在线观看| 国产欧美中文字幕| 欧美色综合网站| 在线观看欧美国产| 青青草国产免费国产| 亚洲视频免费播放| 亚洲中文制服丝袜欧美精品| 欧美色99| 亚洲AV无码一区二区三区牲色| 国产清纯在线一区二区WWW| 中文字幕久久波多野结衣| 亚洲男人的天堂在线| 亚洲人精品亚洲人成在线| 98超碰在线观看| 国产99视频精品免费观看9e| 黄色三级网站免费| 综合色在线| 美女无遮挡免费视频网站| 东京热一区二区三区无码视频| 成年人免费国产视频| 日韩少妇激情一区二区| 亚洲国产精品美女| 无码高潮喷水专区久久| 国产精品香蕉| 欧美日韩国产系列在线观看| 欧美一级在线| 国内自拍久第一页| 色婷婷狠狠干| 第一页亚洲| 色综合成人| 欧美一区二区三区不卡免费| 91视频首页| 99re热精品视频国产免费| 日韩精品中文字幕一区三区| 亚洲欧美日韩中文字幕一区二区三区| 国产尤物视频在线| 久久99国产视频|