999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度強化學(xué)習(xí)的自動駕駛技術(shù)研究

2021-11-24 17:29:51劉澄
商品與質(zhì)量 2021年23期
關(guān)鍵詞:深度汽車理論

劉澄

哈曼(中國)投資有限公司 上海 200235

自動駕駛車輛是一個集環(huán)境感知、決策規(guī)劃和智能控制等功能于一體的綜合系統(tǒng),是智能交通系統(tǒng)的重要組成部分,也是智能車輛領(lǐng)域研究的熱點和汽車工業(yè)增長的新動力。自動駕駛汽車的控制技術(shù)是整個自動駕駛系統(tǒng)中的關(guān)鍵環(huán)節(jié),也是國內(nèi)外廣大學(xué)者重點研究的領(lǐng)域。自動駕駛系統(tǒng)一般采用分層結(jié)構(gòu),其中控制層的功能是將來自決策和規(guī)劃層的指令轉(zhuǎn)化為各執(zhí)行機構(gòu)的動作,并控制各執(zhí)行機構(gòu)完成相應(yīng)的動作,以此準(zhǔn)確地跟蹤路徑并合理地控制速度。

1 行為決策

自動駕駛汽車(Autonomous Car)是指一類能夠自我感知環(huán)境、規(guī)劃路徑并對實時路況進行合理決策的智能汽車。行為決策模塊是自動駕駛汽車的“大腦”,受到傳統(tǒng)車企乃至相關(guān)高校的高度關(guān)注。強化學(xué)習(xí)在20世紀(jì)80年代已經(jīng)興起,但隨著問題的復(fù)雜度逐漸增大,傳統(tǒng)的表格式強化學(xué)習(xí)已經(jīng)難以解決龐大的狀態(tài)空間和搜索空間,因此,利用深度神經(jīng)網(wǎng)絡(luò)擬合Q值或輸出行為策略的深度強化學(xué)習(xí)被提出,并在策略游戲、直升機特技表演、火電廠控制等領(lǐng)域取得了極大的成功。自動駕駛車輛的控制可分為橫向控制和縱向控制,傳統(tǒng)的橫/縱向控制的方法大多需要精確的數(shù)學(xué)解析模型,并對受控系統(tǒng)進行精確的數(shù)值求解。然而精度較高的模型一般也比較復(fù)雜,參數(shù)較多。復(fù)雜的模型也造成了較高的計算代價,使得求解困難,往往難以保證實時性。隨著互聯(lián)網(wǎng)+、大數(shù)據(jù)和人工智能的迅速發(fā)展,研究人員開始基于機器學(xué)習(xí)方法開發(fā)智能汽車決策和控制算法,開辟了一條不同于汽車工程專家的研究思路。根據(jù)現(xiàn)代決策理論的發(fā)展,可以將行為決策理論分為理性決策理論和行為決策理論,理性決策理論在20世紀(jì)80年代之前一直處于主導(dǎo)地位,之后隨著行為科學(xué)研究的興起,行為決策理論逐步發(fā)展壯大。行為決策理論是一個多學(xué)科交叉的研究領(lǐng)域,旨在探討“人們實際是怎樣決策的”以及“這樣決策的根據(jù)是什么”,目前,關(guān)于機器人的行為決策理論較為成熟,從機器人學(xué)科的角度來看,無人駕駛汽車可以看作是一種移動輪式機器人,因此移動機器人的行為決策方法也可以應(yīng)用在無人駕駛汽車中。無人駕駛行為決策的目標(biāo)是對可能出現(xiàn)的駕駛的道路環(huán)境都給出一個合理的、實時的行為策略,核心任務(wù)是消化上層規(guī)劃模塊的輸出軌跡點,通過一系列結(jié)合自身屬性和外界物理因素的動力學(xué)計算,轉(zhuǎn)換成對汽車控制的油門、剎車、方向盤信號。

2 深度強化學(xué)習(xí)

隨機性策略梯度算法被廣泛應(yīng)用于解決大型空間或者連續(xù)動作空間的強化學(xué)習(xí)問題中,直到2014年,效力于谷歌公司旗下Deepmind實驗室的DavidSilver提出確定性策略梯度理論,不僅從數(shù)學(xué)上證明了確定性策略梯度的存在,同時提出確定性策略梯度算法(DeterministicPolicyGradient,DPG)。DDPG便是深度神經(jīng)網(wǎng)絡(luò)與DPG算法結(jié)合的產(chǎn)物,實現(xiàn)端到端的學(xué)習(xí)。

(2)DPG算法。DPG算法包括在線策略確定性AC、離線策略確定性AC兩種,確定性策略在進行強化學(xué)習(xí)時,智能體對于給定狀態(tài)s和策略參數(shù)時,動作是固定的。也就是說,智能體的初始狀態(tài)確定后,通過確定性策略產(chǎn)生的軌跡會永遠(yuǎn)是固定的,這樣就會導(dǎo)致智能體無法探索到其他的狀態(tài),從而無法學(xué)習(xí)到相對完整的“經(jīng)驗知識”,離線策略的引入可以有效解決上述問題,即:行動策略是隨機策略,評估策略是確定性策略。

(3)DDPG算法。DQN是強化學(xué)習(xí)中第一個將深度學(xué)習(xí)與強化學(xué)習(xí)結(jié)合的產(chǎn)物,通過神經(jīng)網(wǎng)絡(luò)的引入,使智能體可以從高維視頻像素中直接學(xué)習(xí)控制策略的方法,但是,DQN對于連續(xù)動作問題便顯得無能為力,而DPG算法可以有效解決動作空間連續(xù)問題,DDPG結(jié)合DQN與DPG,實現(xiàn)了從原始數(shù)據(jù)中進行端到端學(xué)習(xí)。

3 訓(xùn)練細(xì)節(jié)

(1)行為決策。根據(jù)接口定義,通過調(diào)整油門(throttle)、方向盤(steer)、剎車(brake)信號實現(xiàn)自動駕駛車輛的控制。

(2)深度卷積網(wǎng)絡(luò)。預(yù)處理,原始輸入圖像為RGB圖像,這樣不僅浪費算力,還導(dǎo)致深度卷積網(wǎng)絡(luò)的計算時間較長,因此,將RGB圖像編碼成單通道的灰度圖像。

(3)獎勵函數(shù)。經(jīng)過對比訓(xùn)練,設(shè)計復(fù)合獎勵函數(shù)如下:

r=rc+ra+rv式中,rc是碰撞的懲罰項,發(fā)生碰撞:rc=-100,否則rc=0.1;ra是駛出道路的懲罰項,駛出道路:ra=-10,否則ra=0.5;rv是速度的懲罰項,速度大于80或者小于10:rv=-5,否則rv=0.5.

(4)探索策略。本文通過給確定性策略添加噪聲N來構(gòu)建行為策略,保證智能體可以高效的探索:式中,N選擇隨機噪聲。

4 實驗

(1)仿真環(huán)境。Carla作為一款專業(yè)的自動駕駛模擬環(huán)境,提供多元化的Python接口實現(xiàn)地圖切換、傳感器信號切換、汽車控制等。

(2)實驗環(huán)境。實驗環(huán)境為ubuntu18.04操作系統(tǒng)、256G內(nèi)存、TeslaV100顯卡*(4)Carla0.9.2、python3.7。訓(xùn)練7000個回合,每個回合500步。

(3)實驗結(jié)果。①獎勵。可以看出,DDPG算法引導(dǎo)的自動駕駛車輛經(jīng)過大約3000個回合后,獎勵逐漸趨于穩(wěn)定。②指定路線成功率。測試選擇20條不同的路線,每條路線測試5次,成功率達(dá)到95%。

5 結(jié)語

本文采用深度強化學(xué)習(xí)的方法,通過設(shè)計合理的獎勵函數(shù)、深度卷積網(wǎng)絡(luò)、探索策略,實現(xiàn)車輛指定路線的自動駕駛。同時,通過測試回放發(fā)現(xiàn),車輛在包含環(huán)島路況的路線時效果欠佳,未來的工作,將針對此進行算法優(yōu)化和改進。

猜你喜歡
深度汽車理論
堅持理論創(chuàng)新
神秘的混沌理論
理論創(chuàng)新 引領(lǐng)百年
相關(guān)于撓理論的Baer模
深度理解一元一次方程
深度觀察
深度觀察
深度觀察
汽車的“出賣”
汽車們的喜怒哀樂
主站蜘蛛池模板: 自拍欧美亚洲| 亚洲首页在线观看| 91人妻在线视频| 成人精品午夜福利在线播放| 国产97色在线| 欧美性猛交一区二区三区| 欧美人在线一区二区三区| 亚洲AV无码一区二区三区牲色| 18禁高潮出水呻吟娇喘蜜芽| 在线观看亚洲成人| 国产精品免费露脸视频| 国产va免费精品| 九九九精品成人免费视频7| 青草视频在线观看国产| a级毛片在线免费观看| 日本一区高清| 国产精品太粉嫩高中在线观看| 日韩国产综合精选| 亚洲第一黄色网址| 国产精品 欧美激情 在线播放| 亚洲第一成年网| 就去色综合| 日本www色视频| 波多野结衣在线一区二区| 久久99精品久久久久纯品| 日本久久免费| 午夜免费小视频| 国产网友愉拍精品视频| 午夜少妇精品视频小电影| 婷五月综合| 在线视频亚洲欧美| 久久男人视频| 国产区在线看| 久久国产精品影院| 亚洲综合精品香蕉久久网| 99激情网| 啪啪啪亚洲无码| 免费欧美一级| 国产在线观看99| 欧美亚洲综合免费精品高清在线观看| 在线a视频免费观看| 亚洲V日韩V无码一区二区| 国产精品香蕉| 国产免费久久精品99re丫丫一| 日韩精品视频久久| 美女一级毛片无遮挡内谢| 精品久久777| 久久免费观看视频| 71pao成人国产永久免费视频| 国产精品页| 日韩无码视频专区| 97青青青国产在线播放| 免费a在线观看播放| 欧美成人影院亚洲综合图| 丝袜美女被出水视频一区| 色老二精品视频在线观看| 日韩精品成人在线| 亚洲精品成人片在线观看| 精品国产中文一级毛片在线看| 亚洲国产系列| 亚洲无码高清视频在线观看| 亚洲一区二区三区麻豆| 国产精品视频导航| 成人午夜亚洲影视在线观看| 国产精品福利导航| 中文字幕免费播放| 亚洲欧美另类日本| 婷婷六月综合网| 在线网站18禁| 拍国产真实乱人偷精品| 在线人成精品免费视频| 国产精品永久不卡免费视频| 伊人久久精品亚洲午夜| 国产成人精品综合| 毛片网站免费在线观看| 久久国产精品77777| 亚洲综合色吧| 午夜激情福利视频| 亚洲国产高清精品线久久| 国产成人禁片在线观看| 777午夜精品电影免费看| 亚洲国产成人精品青青草原|