張智超,高太元,張磊,拓雙芬
北京機電工程總體設計部,北京 100039
高超聲速飛行器氣動熱環境的準確預測對于飛行器熱防護系統的設計至關重要。一方面,若飛行器表面的熱流預測偏低,會嚴重危及飛行器的安全,甚至會導致飛行器的燒毀;另一方面,表面熱流預測偏高,會造成熱防護系統存在較大的冗余度,降低飛行器的有效載荷。然而,高超聲速飛行器氣動熱環境的準確預測仍面臨諸多難題[1]。在飛行器的氣動熱設計過程中,工程估算方法雖然速度快、效率高,但其針對非軸對稱復雜外形的飛行器適應性較差、精度不足。風洞試驗方法雖然能夠較準確地預測飛行器模型在地面風洞的熱環境,但目前風洞試驗數據的天地一致性問題尚未完全解決[2],并且受制于經費、試驗周期等因素的限制,無法針對飛行走廊內全部狀態開展大規模氣動熱環境的試驗研究。目前,隨著計算流體力學(Computational Fluid Dynamic,CFD)方法的迅猛發展,已經可以實現對高超聲速復雜外形飛行器全尺寸流場的數值模擬,但沿全飛行走廊開展大規模數值計算的代價仍相當昂貴,也無法滿足工程設計階段對氣動熱環境快速分析的需求。因此,發展一種可達到與CFD方法相當精度的高超聲速飛行器氣動熱環境快速預測方法,有效縮短飛行器氣動熱設計的周期,是目前高超聲速飛行器氣動熱設計需要亟待解決的問題之一。
針對上述問題傳統的解決方法是以試驗或數值模擬數據為基礎,通過擬合或回歸預測方法以一定的精度逼近真實模型,得到飛行器氣動參數的解析表達式[3]。然而,飛行器在不同狀態下表面不同位置的氣動參數難以用統一的數學關系式來描述,并且不同狀態下對應的氣動參數存在較強的非線性關系,采用傳統的線性插值、回歸方法難以保證精度。為此,Dowell[4]和Silva[5]提出了基于CFD數值模擬構造飛行器流場降階代理模型(Reduced-Order Model,ROM)的思想。ROM是一類低階的、具有一定計算精度并節約時間的數學模型[6-7],該方法最初用于建立氣動彈性問題中非定常流場的氣動力辨識模型,此后在優化設計、實時仿真等領域也得到了重要的發展。傳統的ROM代理模型常用方法有響應面、Kriging[8]、本征正交分解(Proper Orthogonal Decomposition,POD)[9]等,但這些方法大多要求訓練樣本數據庫對輸入的自變量盡可能采取正交設計方法,這導致獲取訓練樣本所需計算量與自變量維度成幾何量級式增長。
近些年,隨著人工智能技術的快速發展,機器學習在算法、理論和實際應用方面都取得了巨大的成功,尤其是人工神經網絡方法在氣動建模與先進飛行器設計中也蘊含著巨大的應用價值[10-11]。相比于傳統回歸預測方法,神經網絡方法無需事先確定輸入和輸出之間映射關系的數學方程,僅通過自身的訓練,學習某種規則,在給定輸入值時得到最接近期望輸出的結構。利用多層神經網絡方法進行回歸預測,對樣本點正交性要求降低,并且能夠通過設計不同的神經網絡結構和選用不同的激活函數來模擬逼近多種非線性關系,進而建立適用于飛行器氣動參數辨識的代理模型。在國內,多位學者利用神經網絡方法開展了氣動力辨識代理模型的研究[12-17]。王孝學[12]利用自動增加隱藏節點的徑向基神經網絡對再入飛行器的氣動力進行了辨識。張鋒濤等[13]利用人工神經網絡響應面方法,開展了乘波體飛行器優化設計研究??芗覒c和張偉偉[14]開展了基函數寬度對遞歸徑向基(Radial Basis Function,RBF)神經網絡氣動力模型精度的影響研究。白俊強等[15]采用改進的RBF神經網絡對翼梢小翼進行了優化設計。尹明朗等[16]發展了一種高泛化能力的神經網絡氣動力ROM模型。張棟[17]利用誤差逆傳播(error Back Propagation,BP)神經網絡方法為故障飛行器建模獲取了大量故障氣動力系數的數據。需要注意的是,現有研究所建立的大多是氣動積分力的代理模型,而飛行器表面的分布熱流、壓強等物理量由于數據量大且內部存在相關性,目前的建模研究尚較缺乏。
不同于傳統氣動積分力的預測,表面熱流為分布量,每個飛行狀態對應飛行器表面不同位置的熱流不同。若采用單一神經網絡,其輸入變量給定為相應的飛行參數,輸出變量給定為熱流,則神經網絡輸出的熱流也應隨位置的不同而不同。因此,采用單一神經網絡進行飛行器表面熱流預測存在較大的困難。
本文將基于徑向基神經網絡發展一種適用于高超聲速飛行器表面熱流分布預測的代理模型方法,以實現對飛行器氣動熱環境的快速預測。第1節介紹了所采用的神經網絡及在此基礎上發展的氣動熱代理模型方法。第2節使用所建立的代理模型方法針對美國火星實驗室的橢圓鈍化外形飛行器開展訓練建模,分析了基函數寬度對代理模型預測精度的影響以及代理模型泛化能力。最后,第3節給出了結論。
為了建立氣動熱快速預測的代理模型,本文提出了一種采用多個離散位置的神經網絡協同預測飛行器表面熱流的方法:① 以數值模擬中飛行器表面網格節點為基礎,在每個網格節點上均單獨構造一個神經網絡;② 每個神經網絡的輸入為飛行狀態參數,輸出為該飛行狀態下當前網格節點的表面熱流;③ 通過訓練集對所有神經網絡同時進行訓練,獲得各自網絡的連接權值;④ 所有網格節點的神經網絡協同預測飛行器表面的熱流,獲得氣動熱預測代理模型。
對于每個節點神經網絡的設計,選擇同一種網格結構形式以保持預測精度的一致性。在常用的前饋神經網絡中,BP神經網絡易限于局部極小值,學習過程收斂速度慢,并且隱藏層數量及各層神經元數難以確定。相比之下,RBF神經網絡可以根據具體問題確定相應的網絡拓撲結構,具有自學習、自組織、自適應能力,它對非線性連續函數具有一致逼近性,學習速度快。因此,本文對于每個節點的神經網絡均采用了RBF神經網絡方法進行設計。
人工神經網絡方法從信息處理角度對人腦神經元網絡進行抽象,按不同的連接方式組成不同的網絡。神經網絡由大量的神經元之間相互連接構成,每個神經元代表一種特定的輸出函數,每2個神經元間的連接都代表一個通過該連接信號的加權值。網絡的輸出根據網絡的連接方式、連接權值和激活函數的不同而不同。
RBF神經網絡是由Broomhead和Lowe[18]首先提出的一種采用徑向基函數作為激活函數的前饋神經網絡,通過適當的訓練,可以實現數據分類和函數逼近。典型RBF神經網絡的基本結構如圖1所示,其中d為輸入矢量維數,q為隱藏層神經元數,l為輸出矢量維數。RBF神經網絡是一種單隱藏層的前饋神經網絡,它使用徑向基函數作為隱藏層神經元激活函數,而輸出層則是對隱藏層神經元輸出的線性組合。RBF神經網絡共3層,分別為輸入層、隱藏層和輸出層。RBF神經網絡不僅收斂速度高于傳統的BP神經網絡[19],而且只要給定其隱藏層足夠數量的神經元,則可實現以任意精度逼近某個函數[14]。
圖1 典型RBF神經網絡結構Fig.1 Structure of typical RBF neural network
輸入變量首先通過RBF神經網絡的輸入層進入網絡,經過隱藏層的激活函數完成非線性映射。隨后,隱藏層的輸出以不同線性加權的方式由輸出層的各神經元實現線性映射。其中,隱藏層的激活函數一般采用高斯函數[14]。設輸入矢量為x=[x1,x2,…,xd],進入隱藏層后,在高斯函數的作用下發生如下變換:
(1)
輸入變量經過由輸入層至隱藏層的非線性變換后,得到隱藏層的輸出向量B=[b1,b2,…,bq]T。然后,通過不同線性加權的方式由隱藏層,得到RBF神經網絡輸出層神經元的輸出:
(2)
式中:yj為輸出層第j個神經元的輸出,輸出層所有神經元的輸出構成輸出向量y=[y1,y2,…,yl]T;ωjh為隱藏層第h個神經元和輸出層第j個神經元的連接權值,RBF神經網絡訓練的關鍵問題之一就是如何獲取連接權的權值ωjh。若當前RBF神經網絡隱藏層的輸出為矩陣B,隱藏層至輸出層的連接權值矩陣為ω,則對所有訓練集樣本,網絡的輸出為
(3)
則神經網絡的實際輸出與訓練集的誤差為
(4)
通過最小二乘法使ε最小化,可求出隱藏層至輸出層的連接權值矩陣:
ω=B+y
(5)
式中:B+為B的偽逆,表達式為
B+=(BTB)-1BT
(6)
在RBF神經網絡中,輸入通過隱藏層被映射到一個新的向量空間,輸出層在新的向量空間中重新進行線性組合并進行輸出。當隱藏層神經元的個數及高斯基函數中心和寬度等參數確定后,對連接權值的訓練就可以采用線性優化方法,因而RBF神經網絡可實現快速訓練學習。構造和訓練一個RBF神經網絡就是要確定每個高斯基函數的中心ch和寬度σh,并通過適當的訓練獲得連接權值ωjh,實現輸入到輸出的映射。
一般地,RBF神經網絡隱藏層節點的中心向量取自輸入向量,通過逐個增加隱藏層節點,使均方偏差滿足要求后完成網絡設計,這種方法訓練而成的神經網絡被稱為廣義RBF神經網絡。然而,現有研究[14]表明,正則化RBF神經網絡在氣動分析領域具有較高的優勢,因此本文選擇正則化RBF神經網絡進行氣動熱預測代理模型訓練。正則化RBF神經網絡是創建一個精確的徑向基網絡,其隱藏層節點數目與輸入樣本相同,各個隱藏層中心即為各樣本向量。正則化RBF神經網絡隱藏層中心向量可直接確定為輸入各樣本向量,各隱藏層基函數采用均勻寬度,作為模型的超參數通過交叉試驗法給出。在隱藏層基函數的中心和寬度確定后,隱藏層神經元的輸出也隨之確定。因此,隱藏層和輸出層之間的權值ωjh可以通過有監督的學習規則計算確定,如線性最小二乘法或偽逆法。
至此,正則化RBF神經網絡隱藏層神經元數量、隱藏層基函數中心和寬度、隱藏層至輸出層權值均可以確定,進而可以建立氣動熱預測代理模型,模型建立過程如圖2所示。
圖2 氣動熱預測代理模型建立過程Fig.2 Establishment process of ROM model for aerodynamic heat prediction
為了檢驗氣動熱快速預測代理模型的實際應用效果,本節選取了美國NASA火星實驗室所設計的橢圓鈍化高超聲速飛行器[20]開展應用驗證研究。
NASA火星實驗室所設計的橢圓鈍化高超聲速飛行器[20]幾何尺寸如圖3所示,其中L=0.304 8 m,anose=0.101 6 m,r=blower=0.050 8 m,alower= 0.025 4 m。
圖3 飛行器幾何外形示意圖[20]Fig.3 Schematic diagram of geometric shape of hypersonic vehicle[20]
本研究利用自有的ACANS有限差分數值模擬平臺開展氣動熱數值計算,收集用于神經網絡訓練的氣動熱數據,該程序氣動熱計算結果的可靠性已得到相關研究的驗證[21-22]。通過數值模擬獲得了飛行器在50個飛行狀態下的表面熱流分布數據作為建立氣動熱快速預測代理模型的樣本數據庫。其中,單個飛行狀態數值模擬耗時約107 min。飛行狀態由飛行高度H、馬赫數Ma、攻角α和側滑角β確定,具體參數見附錄A中的表A1。根據交叉驗證方法,取其中的前3/4(序號1~38)作為訓練集用于神經網絡的訓練,剩余的1/4(序號39~50)作為測試集用于神經網絡的精度評估及超參數調整。
為了建立氣動熱快速預測代理模型,以數值模擬中表面網格數量為基礎,在每個網格節點均建立如圖1所示的RBF神經網絡。對于圖3所示的飛行器數值模擬表面網格節點數量為20 559,則建立相同數量的RBF神經網絡,每一個神經網絡的輸入變量為飛行高度、馬赫數、攻角、側滑角,輸出變量為熱流、壓強。根據1.1和1.2節正則化RBF神經網絡的構建方法,網絡共分為3層:輸入層神經元數d=4,輸出層神經元數l=2,隱藏層神經元數量與訓練樣本數量相同,即q=38。
由于采用了正則化的RBF神經網絡,隱藏層神經元基函數的中心向量ch與訓練樣本的輸入向量相同。對于該神經網絡唯一的超參數為隱藏層基函數寬度σh,通常采用均勻寬度,一般固定為
(7)
式中:dm為隱藏層所有神經元所選基函數中心之間的最大距離。在以附錄A表A1中前38個狀態作為模型訓練集的條件下,采用式(7)計算所得隱藏層基函數寬度σh為3.2。
輸入層至隱藏層非線性變換中所采用的基函數為高斯函數,其一般形式為
(8)
對高斯基函數而言,寬度的大小決定了每個基函數對輸入的影響范圍,寬度越小,表明輸入信號的影響范圍越小,得到的輸出結果越不光滑。另外,當(x-μ)→∞時,有g(x) →0。
圖4給出了μ=0、x∈[-400,400]時,高斯基函數隨寬度σ的變化情況。從圖中可以看出,隨著基函數寬度的增加,高斯基函數的作用范圍不斷變大。對于寬度大的情況,可以通過較少數目的神經元完成所有輸出樣本空間的映射,因此所需神經元較少;而隨著寬度的減小,每一個神經元的作用范圍在逐漸變小,因此需要更多的神經元來描述樣本空間中的任意輸入。因此,寬度選擇對預測結果有很大影響。隱藏層徑向基函數的寬度由人為給定,現有研究[14]表明基函數寬度將對代理模型精度產生影響。為了分析超參數基函數寬度對代理模型預測結果的影響并確定合適的基函數寬度選取范圍,本文除采用式(7)的方法外,還在給定基函數寬度為2、10、20、50、70條件下分別開展模型訓練并對基函數寬度對代理模型預測結果的影響開展分析。
圖4 不同寬度σ的高斯函數形狀Fig.4 Shapes of Gauss function with different σ
從附錄A的表A1中選取前38個作為訓練集,給定不同的基函數寬度進行模型訓練,獲得對應的氣動熱快速預測代理模型。由于采用了正則化徑向基神經網絡結構,訓練耗費時間最多的為通過最小二乘或偽逆法求解隱藏層和輸出層之間的權值矩陣,因此訓練時間與權值矩陣維度密切相關。本次訓練權值矩陣為38×38,訓練耗時約41 s。將附錄A中表A1的最后12個狀態作為測試集(表1),采用不同基函數寬度的氣動熱快速預測代理模型對測試集狀態進行飛行器表面熱流預測,單機串行每個狀態耗時約1 s。相比之下,同等網格數量下采用數值模擬方法并且采用并行計算仍需要約107 min,可見所提出的代理模型方法在計算效率上具有巨大的優勢,可以快速給出整個飛行走廊內飛行器氣動熱數據,有效縮短飛行器氣動熱設計的周期。
表A1 訓練集狀態參數Table A1 State parmeters of train set
續表
表1 測試集狀態參數Table 1 State parmeters of test set
為了分析不同代理模型計算結果的精度,采用飛行器頭部駐點熱流的整體均方根誤差RMSE對代理氣動熱預測結果進行評估,RMSE計算公式為
(9)
式中:N為測試集檢驗點個數;yi為數值模擬彈頭熱流預測結果;y′i為本文所建立的代理模型所預測飛行器表面熱流結果。
圖5給出了飛行器頭部駐點熱流的整體均方根誤差RMSE隨所采用基函數寬度σ的變化曲線。從圖中可知,頭部熱流最大值的整體均方根誤差隨著基函數寬度σ的增大而減小,并在基函數寬度大于20后呈收斂趨勢。一方面,整體均方根RMSE的減小代表著代理模型泛化能力的增強;另一方面,隨著基函數寬度的增加,隱藏層至輸出層的權值矩陣中非零元素逐漸減少,即實際產生響應的神經元數目變少,這將使得隱藏層至輸出層連接權的權值矩陣最大值與最小值之間差異變小,數據之間的相似度不斷提高,甚至產生較多的冗余數據,造成矩陣的秩不斷減小,產生秩虧的現象,不利于權值矩陣的求解。因此,經綜合評估確定適用于高超聲速飛行器表面氣動熱預測代理模型的基函數寬度范圍為20~50。
圖5 頭部駐點熱流的RMSE隨基函數寬度變化曲線Fig.5 RMSE of stagnation point heat flux on vehicle head with different σ of Gauss function
通過2.2的分析,本節選擇基函數寬度為50的代理模型預測結果開展進一步的模型精度分析。圖6和圖7分別給出了表1中序號40和50狀態下由代理模型和數值模擬所預測的表面熱流(qw)分布云圖。從圖中可以看出,代理模型所預測熱流準確辨識了飛行器頭部的高熱流區,并且熱流分布與數值模擬結果基本一致。
圖6 序號40狀態代理模型和數值模擬 表面熱流云圖對比Fig.6 Comparison of surface heat flux contours between ROM and CFD (No.40)
圖7 序號50狀態代理模型和數值模擬 表面熱流云圖對比Fig.7 Comparison of surface heat flux contours between ROM and CFD (No.50)
表2給出了代理模型所預測的飛行器頭部駐點熱流值與數值模擬結果對比。可以看到代理模型在測試集內對于頭部駐點熱流的預測結果與數值模擬偏差均在10%以內,表明本文所建立的代理模型對頭部駐點熱流預測具有較高的精度。
對于迎風大面積區域,圖8給出了序號40和50狀態下迎風面中心線代理模型所預測熱流分布與數值模擬結果的對比。從圖中可知在迎風大面積區域整體偏差均在10%以內,代理模型也獲得了較高精度的預測結果,表明本文所建立的代理模型具有良好的泛化能力。
圖8 代理模型和數值模擬迎風中心線 熱流對比Fig.8 Comparison of heat flux along center line on windward wall between ROM and CFD
表2 代理模型和數值模擬計算的駐點熱流對比
Table 2 Comparison of stagnation point heat
flux between ROM and CFD
序號代理模型/(kW·m-2)數值模擬/(kW·m-2)相對偏差/%391465.931491.661.76402422.922334.573.65412411.932370.71.71421335.641453.848.85431934.671932.610.11441896.231929.331.75452085.572151.773.17461828.901910.814.48471666.711675.900.55481857.621812.822.4149465.18507.629.12501235.731303.535.49
本文基于徑向基神經網絡發展了一種適用于高超聲速飛行器氣動熱快速預測的代理模型方法,通過美國火星實驗室所設計的橢圓鈍化高超聲速飛行器對該方法進行驗證,得到結論如下:
1) 本文所提出的代理模型方法在模型訓練完成后能夠快速進行飛行器表面熱流預測,測試算例中在不考慮建立訓練集和神經網絡訓練時間的前提下,單個飛行狀態下使用代理模型計算時間降低至約1 s,而相同條件下利用ACANS程序數值模擬則需要約107 min。代理模型方法在計算效率上具有巨大的優勢,可以快速給出整個飛行走廊內飛行器氣動熱數據,能夠有效縮短飛行器氣動熱設計的周期。
2) 代理模型中基函數寬度將影響飛行器表面熱流預測結果的精度。測試集飛行器頭部駐點熱流整體均方根誤差隨基函數寬度變化曲線表明,整體均方根誤差隨著基函數寬度的增大而減小,并在基函數寬度大于20后呈收斂趨勢。經綜合評估,確定適用于高超聲速飛行器表面氣動熱快速預測代理模型的基函數寬度范圍為20~50。
3) 頭部駐點熱流和迎風中心線上熱流分布曲線的代理模型和數值模擬結果對比表明,代理模型在測試集內對于頭部駐點和迎風大面積區域熱流的預測結果與數值模擬偏差在10%以內,表明本文所建立的代理模型能夠獲得較高精度的氣動熱預測結果,并具有良好的泛化能力。