戰慶亮,白春錦,張寧,葛耀君
1. 大連海事大學 交通運輸工程學院,大連 116026
2. 同濟大學 土木工程防災國家重點實驗室,上海 200092
流體流經機翼表面時,繞流流場的特征會影響機翼表面壓力分布,從而決定其受力特征。受風攻角、雷諾數和湍流度等因素[1]影響,機翼邊界層和分離剪切層的狀態復雜多變[2]。如在低雷諾數下機翼前端的分離泡可導致其升力特性與高雷諾數情況下的形態截然不同[3-5],這種分離現象是影響機翼空氣動力特性的主要原因,對其大小與區域的識別具有重要研究意義。
流場的特征識別是一類復雜的數學物理問題,是流體力學中亟待解決的重要問題[6]。在流體力學的特征識別研究中,基于樣本構建非定常流場的降階模型(Reduced-Order Model,ROM)是一種重要的研究手段。目前典型的非定常流場降階模型[7]有基于系統辨識方法的降階模型和基于特征提取的降階模型,能在一定程度上實現流場的重構和流場的非定常演化分析。
傳統的流場降階模型以基于試驗或計算的整場瞬時流場快照(Snapshot)為分析數據,通過一個或一組不同時刻的樣本集進行流場特征的分離和提取。然而由于機翼周圍的流動特征較復雜,實驗中的流場快照數據在采集、特征提取和分析等方面存在諸多難題。如在風洞、水洞實驗中一般可通過顯示技術進行流場顯示,卻難以定量測得流場的速度分布。激光多普勒測速儀(Laser Doppler Anemometer,LDA)[8]、粒子圖像測速法[9]是流場測速的高精度方法,然而受方法原理限制,目前使用粒子類方法對容積內進行全場三維同步測量仍難以實現,因而仍難以得到大范圍流場的瞬態流動快照數據。
隨計算機和大數據領域的發展,近年來深度學習在工程中的應用有了飛速發展和質的突破,流體力學的研究也逐步開始與深度學習方法相結合[10-11],如基于神經網絡模型的雷諾應力模型[12-13]、尾流狀態的流動控制[14]、高精度流場預測方法[15]等。同時,深度學習方法提供了新的流場特征識別手段。除上述傳統特征識別方法外,近年來流場特征識別研究也開始出現部分基于深度學習的方法。Murata等[16]用深度學習方法對瞬態流場進行模態分解,得到了比傳統模態分解精度更高的結果。Omata和Shirayama[17]提出了基于自編碼模型的瞬態流固耦合分析方法,同樣采用數據驅動方案得到了流場的低維表示。Fukami等[18]提出了一種定制的基于卷積神經網絡的自動編碼器,實現了流場提取的非線性自動編碼模式,同時能保持潛在向量的貢獻順序。
相比于流場快照,一點位置處流場時程的獲取更為方便且可靠,比如一點的速度時程、壓力時程等。然而一點處的流場時程包含的信息量有限,采用傳統方法難以僅通過一點處的時程信號進行整個流場的流動特征推測。針對這個問題,文獻[19]提出了基于時程數據深度學習的方法對流場特征進行識別,得到了適用于流場特征表征的流場參數,并對歸一化時程數據進行流場特征提取研究[20],初步證明了卷積深度學習方法可提取流場不同位置處的時程特征,為本文的研究提供了依據。
針對上述流動特征識別研究中的難點與問題,本文提出了流場特征識別的新方法:以一點處流場的時程為特征提取對象,采用基于卷積自編碼方法的深度學習模型進行時程數據的抽象特征提取,并獲得降維后原始時程的表征編碼,進而對編碼進行聚類分析從而得到具有不同特征的流場區域劃分結果,建立流場特征提取新方法。利用本方法進行機翼繞流流場特征的自動分類及基于一點信息的流動分離狀態識別。
基于卷積神經網絡的流場時程數據特征提取方法構建了不需帶有標簽訓練樣本的流場時程數據自動編碼特征分類模型(Time-History Auto Encoder Feature Classification,TAEC),通過卷積運算提取流場時程的特征,并將高維時序映射到低維特征空間內,實現復雜時程信號的特征降維,進而實現特征分類,模型的技術結構如圖1所示。
模型由輸入層、卷積編碼器、特征編碼層、卷積解碼器、輸出層、編碼分類器共6部分組成。其中輸入層的輸入數據為流場中不同位置處的時程x,通過編碼器進行特征提取與壓縮,得低維空間中的特征編碼λ;特征編碼通過卷積解碼器進行還原,使輸出x′與輸入的時程信號盡可能相同;編碼分類器對低維空間中的特征編碼進行聚類(K-Means)運算,得到低維空間中樣本的分類標簽,完成輸入流場時程的特征分類。
為保證時程特征分類的準確性,TAEC模型設計中要滿足以下條件:① 根據流場及其樣本特征選擇合適的卷積編碼器結構;② 為保證特征代碼λ能準確表征輸入x的特征,編碼器與解碼器需滿足變換:

(1)
式中:Fe為編碼部分;Fd為解碼部分。由式(1)可知TAEC模型的輸入數據類型和輸出數據類型的數據類型是相同,即一維時程的長度與采樣間隔是相同的,TAEC模型的無監督學習目標是使輸入時程與輸出時程相同。卷積層中對輸入數據的計算過程為
(2)


圖2 時程卷積的計算過程
隨著無人飛行器、風力發電機等應用領域的興起,低雷諾數機翼的氣動力也顯得尤為重要[21]。選取NACA0012機翼開展研究,雷諾數Rec=5 000,幾何形狀如圖3所示。

圖3 NACA0012翼型
采用不可壓縮流體計算程序[22]進行流場模擬及數據的提取。流場計算區域流向長度Lx=46c,橫向長度Ly=48c,展向長度Lz=0.4c,如圖4 所示。機翼上游來流區域流向長度24c,下游區域流向長度為23c。在遠離機翼的區域采用較稀疏的網格,而機翼周圍的流場網格進行了加密。為保證計算的準確性,靠近機翼表面的第1層網格厚度保證底層網格y+≈1。流場左側邊界條件為入口邊界條件,右側邊界條件為出口,平面內網格數約為18 500。

圖4 流場網格劃分
不同攻角下模擬所得升力系數與實驗結果的比較如圖5所示。當攻角為0°~12°時升力系數與攻角呈線性關系;12°~15°時升力系數變化較小,與文獻[23]的實驗值吻合度較高。

圖5 升力系數隨攻角變化曲線
圖6所示為12°來流攻角下機翼周圍的瞬態流場計算結果。由速度場和流線圖可發現此時流動發生了明顯分離,與文獻[24](Rec=8 200)得到的流動顯示結果一致。由于流動分離會造成機翼氣動力系數的改變,不是一般性,因此針對12°來流攻角下機翼周圍的流場進行研究。

圖6 流場計算結果
根據TAEC模型方法,結合研究對象對數據的提取、模型參數設置和模型訓練過程進行介紹。
在CFD數值模擬機翼繞流流場的同時,通過在機翼周邊布置采樣點獲取采樣位置處的流場時程。數據集中測點的位置和數量是影響數據集質量的關鍵因素,若測點數量遠大于網格密度則會導致不同測點模擬出相同的數據;若測點數量小于網格密度則會導致訓練集的數據不足以反映流場的全部信息,從而影響模型的訓練精度。在流場中共選取7 418個測點,如圖7所示,可比較完整地反映機翼周圍的流場。

圖7 測點布置
在流場計算過程中,所選的時間計算步長Δt=0.01 s,每隔6個流體計算點選1個數據作為訓練樣本數據的輸入值,因此輸入樣本的采樣時間步長為0.06 s,輸入樣本長度L=2 000。
由于所選測點的監測范圍較大,樣本的時程特征各不相同。隨機選取機翼附近流場中6個測點,將測點的速度時程曲線繪于圖8,可見各測點的時程曲線差異較大,其中包含了不同測點位置處的流場特征。

圖8 機翼附近的流場速度時程
為有效提取流場中不同位置的時序特征,設計的TAEC模型結構見圖1,其中所有卷積均采用尺寸為13的大卷積核,步長均為1,經數值試驗發現大卷積核可在一定程度上獲得較大范圍的時程特征信息,相同網絡層數的情況下有利于模型迭代收斂。
三層卷積層的核數為128、64與16,經系列卷積變換的輸出尺寸為2 000×16,為保留卷積權重與時程序列之間的對應關系,使用全局平均的方法壓縮數據長度,進而附加2層全連接層進行降維,最終將單個時程樣本壓縮為10維空間中的一點,對其進行聚類分組。TAEC的解碼部分各模型參數與編碼部分對應,具體參數如表1所示。

表1 模型參數
模型訓練的網絡優化器為Adam,可通過自適應調整學習率加速模型收斂,使用其默認參數并選擇損失函數為MSE(Mean Squared Error)。對網絡的訓練過程中損失函數隨迭代次數的曲線如圖9所示,可看出經10次迭代后模型趨于收斂,此時優化器Adam及時調整了學習率使網絡的殘差繼續降低;經40次迭代后優化器Adam再次對學習率進行調整,使殘差值進一步降低;最終損失曲線在經200次訓練后達到了穩定值0.000 04。

圖9 TAEC模型訓練損失曲線
TAEC模型為無監督的深度學習模型,因此在模型參數的訓練過程中不需帶有標簽的數據,大幅擴展了模型的適用范圍。為驗證模型特征提取及降維編碼的準確性,進行模型對輸入數據還原效果比較。在整個流場的訓練集內隨機選取6個流場時程樣本,先采用TAEC模型得到降維后的特征編碼,再通過解碼器還原6個時程樣本,所得結果如圖10所示。可見解碼后時程曲線與原樣本高度重合,表明該模型可準確提取不同時程曲線中包含的流場特征,得到的降階編碼能表征機翼表面附近的流動狀態,可驗證使用降維模型的準確性。

圖10 TAEC模型對時程曲線的還原
對最優模型得到的降階編碼進行K-Means聚類,獲得降維后不同測點處流場的時程特征進行特征區分。降階編碼維度為10維,遠遠少于原始輸入的輸入數據,且包含流場的關鍵特征。將降階編碼進行聚類劃分,按類別結果及測點所處流場位置進行可視化,如圖11所示。
當分為3類時,TAEC模型準確識別了流場的分離區;改變聚類數目為7,可將分離區內流場按流動特性進行進一步細分。對比圖7(a)和圖7(b) 可看出隨聚類類別增加,在橙色區域中重新劃分出了藍色區域,該區域位于分離泡的邊界,其內的流體分布比較復雜。將分離區的識別結果與文獻[23]中流動顯示結果進行比較,如圖11(c) 所示,可驗證本文模型識別結果的正確性。
通過4.2節中聚類結果將機翼周圍的流體大致分為3個區域:圖11中橙色區域、藍色區域、黃綠色及其他顏色的區域。綜合流線圖(如圖6(c) 所示)、聚類結果可判斷橙色區域的流體流動比較平緩,流動方向單一,具有較快的流向速度,同時測點速度時程曲線波形振幅較小,如圖12(a) 所示。黃綠色區域為分離泡的內部區域,由于產生分離泡時流體會有回流等復雜現象,因此區域中測點的時程曲線大多為負值,振幅略大于其他類別的時程曲線,部分測點的時程曲線如圖12(b)所示。藍色區域位于分離泡的邊界,其內部的流體分布比較復雜,既包含與橙色區域內特征相似的流體,又包含與黃綠色區域內特征相似的流體。因此該區域內的流體無統一的流動方向且流動速度也有很大差異,部分測點的時程曲線如圖12(c) 所示。

圖11 TAEC模型對流場分離區的識別
提出了無需樣本標簽的流場特征無監督識別方法,基于時程數據實現了復雜流場特征的低維表征,同時對表征編碼進行了類別分析,實現了不同流動區域的自動識別,得到結論如下:
1) 提出了基于流場時程數據進行流場特征識別的TAEC模型,實現了流場時程的特征提取及其降階表征。
2) 應用提出的方法對機翼周圍流場進行了無監督訓練,得到了機翼繞流流場降階表征模型,驗證了模型對多點復雜流場的還原精度。
3) 利用TAEC模型自動識別了流動分離區,選擇不同區域流場時程進行比較,對模型的識別結果進行直觀解釋。
4) 由于流場具有復雜的空間與時間特性,對其時程數據的無監督深度學習難度較大。進行了流場特征識別的探索,驗證了方法的可行性,可為相關深入研究提供借鑒。