999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于強化學習的液壓舵機殼體流道路徑規劃

2025-08-05 00:00:00樊堯黃斌達曹群
機電信息 2025年14期
關鍵詞:流道殼體規劃

0 引言

航空液壓操縱系統是保障飛機飛行的基礎功能系統,也是飛機綜合作戰效能的重要保障和核心載體[。液壓舵機殼體是飛行器液壓作動系統的關鍵零部件,在有限空間內遍布數十條滿足復雜液壓介質傳輸需求的液壓流道[2。流道路徑規劃指的是在液壓舵機殼體設計空間內,尋找兩個接口間的油路路徑,該路徑需要滿足與其他流道間的最小間距、工藝性約束、功能性約束等一系列約束,本質上是一個多目標優化問題。傳統的人工設計方式完全依賴設計人員經驗,設計效率低下,且無法有效復用歷史設計經驗;遺傳算法等雖然也可以解決此類問題,但設計空間大,需要長時間迭代,不利于對設計輸入的快速響應。而強化學習通過神經網絡學習規則和人工經驗,對設計輸入實現瞬間響應,更適合舵機殼體此類結構復雜且需要頻繁調整輸入的設計任務。因此,本文運用強化學習算法訓練路徑規劃神經網絡,實現流道路徑的快速尋優,解決舵機殼體流道快速最優設計的難題。

1液壓舵機殼體流道路徑規劃流程

舵機殼體的流道主要由油路接口和油路兩部分組成,如圖1所示。油路接口是舵機殼體與其他功能組件進行溝通的接口,有殼體表面接口和環槽接口、油路溝通接口三種。流道接口的參數包括接口的安裝坐標、安裝方向、長度、直徑。油路是兩個流道接口之間的溝通通道,其參數包括油路的起點接口坐標、終點接口坐標、油路的拐點坐標及油路直徑。流道的路徑規劃本質上就是在已知接口參數及油路起點、終點和直徑(下稱“流道設計任務”的基礎上,尋找油路拐點的過程。

圖1航空舵機殼體模型

流道路徑可簡化為流道起點、流道終點及一系列拐點構成的點集。利用強化學習算法進行流道路徑規劃的流程如圖2所示,根據設計任務確定流道的起點和終點,隨后路徑規劃智能體對自身狀態進行感知,得到當前的狀態信息。將狀態信息輸入強化學習網絡,在路徑規劃智能體動作空間中選擇智能體的下一步動作,得到流道的拐點坐標。若拐點坐標與終點不重合,則智能體繼續感知環境,生成新的拐點,直到拐點與終點重合,輸出流道路徑點集。

2 路徑規劃智能體的狀態空間構建

狀態空間指的是智能體在與環境交互過程中可以獲取的信息集合,是智能體獲取信息、學習和做出決策的基礎。狀態空間包含沿每個組合方向 (θ,?) 的障礙物距離及終點位置。智能體對環境的觀測信息矩陣 Obs 表示為:

Obs={Rxunit,Ryunit,Rzmit,Rbarier,Rgoal}

式中: Rxunit 表示各掃描方向在 x 方向上的單位分量構成的矩陣; Ryunit 表示各掃描方向在 y 方向上的單位分量構成的矩陣; Rzunit 表示各掃描方向在 z 方向上的單位分量構成的矩陣; Rbarier 表示各掃描方向上到障礙物的距離構成的矩陣; Rgoal 表示各掃描方向上到終點區域的距離構成的矩陣。

則智能體的狀態空間state可表示為:

state={Obs,Nmax,Nnow,Rmin}

式中: Nmax 表示當前任務的智能體最大行動次數,該值與接口的位置有關; Nnow 表示智能體當前的行動次

數; Rmin 表示當前行動的最小前進步長。

3路徑規劃智能體的動作空間構建

智能體的動作空間指的是智能體可以采取的所有動作的集合。智能體在三維空間內以第一人稱基于球坐標進行運動。運動模型基于球坐標系 C3(θ,? ,R) ,殼體空間基于全局直角坐標系 C1(x,y,z) ,為了將 C3 中的運動轉換為 C1 中的路徑點及路徑向量,引入了與 C3 相對應局部直角坐標系 C2(x,y,z) 及 C2?C1 的坐標轉換矩陣 T 。可以得到三組坐標系的定義:

1)全局坐標系 C1(x,y,z) ,位于坐標原點。

2)局部坐標系 C2(x,y,z) ,位于智能體當前位置, y 軸為智能體的當前前進方向, x 軸平行于XOY平面。

3)球坐標系 C3(θ,?,R) ,位于智能體當前位置。其中0為 xy 軸的夾角, ? 為 yz 軸的夾角。

基于上述坐標系,對智能體的三個運動維度 (θ ?,R) 的取值進行如下定義: θ 和 ? 為 0°~180° 之間、公差為 5° 的離散角度; R 為大于0小于1的連續實數。由于智能體的動作最終表現為拐角和前進步長,為了便于計算,將智能體的動作空間簡化為拐角β和步長 R ,其中β為0維度和 ? 維度組合后的方向與前一段油路的夾角。

4流道路徑規劃的獎勵函數設計

獎勵函數在強化學習過程中主要用于評價當前動作并指導網絡更新。由于本研究中智能體存在多個動作,評分應當充分反映各子動作獨立的評價及其綜合評價,以指導各網絡充分學習經驗。流道評分Rew 的計算方法如下:

圖2流道路徑規劃流程

式中: i(i=1,…,n) 表示當前輪次的第i次行動; Rewi 為智能體單步獎勵; Rewstep 為步長獎勵; Rewangle 為角度獎勵; Rewstate 為狀態獎勵; αa,b 均為系數。

Rewstep 用來評價動作 R ,計算方式為:

Rewangle 用來評價組合動作 (θ,?) ,計算方式如下:

Rewangle=|cosβ-0.5|

式中: β 為有效 (θ,?) 組合后的角度。 β 越接近 90° 或0° ,評分越高。

Rewstate 對智能體是否完成任務進行獎勵,計算方式為:

5 路徑規劃網絡的構建及訓練

路徑規劃網絡是路徑規劃智能體的大腦,用來分析狀態信息,選擇合適的動作。路徑規劃網絡由FeatureExtractor、DiscreteActor網絡、ContinuesActor網絡及Critic網絡構成,如圖3所示。其中FeatureExtractor用來對狀態信息進行降維處理,提取關鍵特征;DiscreteActor網絡用來生成離散動作 β ; ContinuesActor網絡用來生成連續動作 R ;Critic網絡分析動作的評價結果,指導網絡更新[3]。

在完成網絡構建后,對路徑規劃網絡進行訓練。通過在立方體表面隨機尋找兩個接口的位置,在立方體內部隨機生成障礙物路徑來為智能體的訓練環境產生隨機性,以保證智能體在各種復雜情況下學會最優策略。在訓練20000輪后,智能體的平均每輪獎勵收斂于10左右(圖4);在容量為1000的驗證集上,預測準確率穩定在 90% 左右(圖5)。

6 測試及結果分析

樣例的設計空間為一個立方體空間,長 300mm 寬 150mm ,高 150mm ,環境中包含2個主閥孔(MH)和4個接口,如圖6所示,流道定義信息如表1所示,算法輸出的流道路徑如表2所示。結合特征建模工具,本算法可以將單條流道的設計建模時間壓縮到 10s 以內,與人工設計建模相比,時間縮短了 70% 。

系統輸出的流道骨架如圖7所示,建模后得到的流道模型如圖8所示。以流道1201為例,若沿常規的直線路徑,則會與1301發生干涉(圖9),本文算法輸出了非對心的流道路徑,滿足了流道1201與1301之間的最小流道間距約束。

圖3動作生成網絡結構
圖4平均每步獎勵曲線
圖6設計空間及接口分布
圖5預測準確率
圖7流道骨架

7 結論

本文通過分析液壓舵機殼體流道設計原理及流道建模特征,提出了一套適合強化學習的流道設計模型。通過分析流道及其接口特征,分析了流道路徑規劃的輸入和輸出,構建了流道路徑規劃算法的基本流程?;诂F有設計經驗及約束,形成了智能體的動作空間、狀態空間及評價獎勵函數,搭建了路徑規劃網絡,實現了舵機殼體流道路徑的快速生成。最終通過實例驗證,設計結果滿足設計要求與設計約束,取得了較好的設計結果。本研究在保證設計質量的前提下,極大地減少了液壓流道路徑的設計工作量,將設計建模時間縮短了 70% 。

表1流道設計任務
表2流道信息
圖8流道模型

[參考文獻]

圖9流道避讓

[1]郭生榮.航空機電系統綜合技術發展分析[J].航空科學技術,2013(5):5-10.

[2]郭生榮.航空機電系統綜合技術發展[J].航空精密制造技術,2016,52(1):1-6.

[3]FAN Z,SU R,ZHANG W N,et al.Hybrid Actor-CriticReinforcement Learning in Parameterized ActionSpace[C]//IJCAI'19:Proceedingsofthe 28th Interna-tional Joint Conferenceon Artificial Intelligence,2019:2279-2285.

收稿日期:2025-04-14作者簡介:樊堯(1998一),男,山西大同人,碩士研究生,研究方向:人機與環境工程。

猜你喜歡
流道殼體規劃
MJP750噴泵艉軸密封漏水應急處置及改進
航海(2025年4期)2025-08-26 00:00:00
高壓齒輪泵結合面密封性優化研究
河南科技(2025年14期)2025-08-24 00:00:00
質子交換膜燃料電池新型冷卻流道設計及性能研究
聚能射流作用于帶殼B炸藥非爆轟解體的研究
爆破器材(2025年4期)2025-08-03 00:00:00
電機噪聲支撐結構優化設計研究
能源新觀察(2025年6期)2025-07-29 00:00:00
規劃引領把握未來
快遞業十三五規劃發布
商周刊(2017年5期)2017-08-22 03:35:26
多管齊下落實規劃
中國衛生(2016年2期)2016-11-12 13:22:16
迎接“十三五”規劃
主站蜘蛛池模板: 婷婷色狠狠干| 亚洲人成网站观看在线观看| 日韩高清无码免费| 国产精品欧美激情| 日本国产在线| 高清无码一本到东京热| 亚洲人成网站观看在线观看| 亚洲一区二区三区在线视频| 最新日韩AV网址在线观看| 亚洲精品在线影院| 国产精品欧美激情| 国产综合色在线视频播放线视| 久久精品91麻豆| 青青草欧美| 福利在线不卡一区| 久久中文字幕av不卡一区二区| 综合色区亚洲熟妇在线| 91国语视频| 亚洲国产精品成人久久综合影院| 国产中文在线亚洲精品官网| 九九热精品视频在线| 国产一级毛片在线| 伊人久久福利中文字幕| 99re在线免费视频| 青青热久麻豆精品视频在线观看| 国产全黄a一级毛片| 日韩欧美91| 国产乱子伦视频在线播放| 97青草最新免费精品视频| 婷婷久久综合九色综合88| 色天堂无毒不卡| 国产成人h在线观看网站站| 色综合激情网| 全午夜免费一级毛片| 性视频久久| 欧美日韩福利| 全裸无码专区| 无码一区中文字幕| 伊人久久婷婷| 免费xxxxx在线观看网站| 韩日无码在线不卡| 国产主播在线观看| 亚洲乱强伦| 国产福利一区二区在线观看| 天天综合网在线| 亚洲一区二区在线无码| 久久一级电影| 久久a毛片| 欧美日韩一区二区三区四区在线观看| 欧美精品啪啪一区二区三区| 国产微拍一区| 波多野结衣中文字幕一区二区| 91在线免费公开视频| 美女无遮挡拍拍拍免费视频| 免费人成网站在线观看欧美| 黄色污网站在线观看| 国模沟沟一区二区三区| 黄色在线网| 欧美精品v欧洲精品| 5555国产在线观看| 国产精彩视频在线观看| 亚洲成人手机在线| 制服丝袜在线视频香蕉| 日本伊人色综合网| 久久久91人妻无码精品蜜桃HD| 国产欧美自拍视频| 日韩精品专区免费无码aⅴ| 国模粉嫩小泬视频在线观看| 久久九九热视频| 国产丝袜精品| 久久久久国产精品嫩草影院| 天天综合天天综合| 高清久久精品亚洲日韩Av| 亚洲香蕉伊综合在人在线| 91精品专区| 亚洲国产清纯| 久久婷婷六月| 久久不卡国产精品无码| 刘亦菲一区二区在线观看| 久久久久久尹人网香蕉| 中国成人在线视频| www.91在线播放|