王怡星,韓仁坤,劉子揚,張揚, ,陳剛, ,*
1. 西安交通大學 機械結構強度與振動國家重點實驗室,西安 710049 2.西安交通大學 航天航空學院 先進飛行器服役環境與控制陜西省重點實驗室,西安 710049 3.中國空氣動力研究與發展中心 計算空氣動力研究所,綿陽 621000
流場預測與載荷建模是飛行器設計領域至關重要的環節。計算流體力學(CFD)通過對流場基本物理方程的高精度數值求解,在眾多應用中發揮著越來越重要的作用[1-4]。然而,CFD對網格質量要求高、數值求解過程復雜、動網格處理難度大導致計算耗費大,限制了CFD方法在諸如高精度氣動優化設計、氣動伺服彈性、閉環流動控制等多學科耦合建模與優化等問題中應用[5-6]。當網格數量巨大、幾何外形復雜時,CFD方法所需要的前后處理、計算時間以及海量數據后處理往往是多學科優化問題迭代過程中難以承受的。本征正交分解(Proper Othogonal Decomposition, POD)[7]、動模態分解(Dynamic Mode Decomposition, DMD)[8]等模型降階方法極大地減少了復雜系統的求解復雜度,提升了建模與求解效率。但傳統模型降階方法也存在一些顯著的不足:不適合或難以應用于多尺度、瞬態過程、間斷過程,并且在發生移動、縮放及旋轉變換時無法保證不變性[9]。
事實上,自然界具有高超飛行能力的生物無一不是通過經驗學習來掌握流體運動規律并提升飛行效率的。因此,采用基于經驗的學習方法解決復雜流動預測、建模與閉環控制是可行且具有重要價值的。新一代人工智能技術的核心算法——深度學習和強化學習技術能夠從大數據中自動尋找隱藏特征信息,并且可以直接處理原始形態數據獲得經驗或知識,從而可以預測復雜非線性系統的未來行為[10]。深度學習技術提出后短短幾年內就在圖像處理、視頻和語音識別、語言翻譯、疾病診斷等領域創造了顛覆性的變化[10-11],揭開了數據驅動研究新范式的大幕,并迅速推動了眾多學科研究范式的變革。
與POD和DMD等方法相比,深度神經網絡(Deep Neural Network, DNN)則有望解決傳統降階方法所固有的缺點[9]。因此,在流體力學建模及預測方面,深度學習技術具有重大應用前景。“萬能近似性質”[12-13]指出:一個滿足一定條件的前饋神經網絡,只要給定足夠數量的隱藏單元,它可以以任意精度來近似Borel可測函數。由于實際應用中大多數函數均滿足該定理所述條件,因此流場深度學習的可行性從理論上也得到了堅實保證。然而,由于不存在通用的訓練算法[14],目標神經網絡是不容易得到的。如果對于可能的分布做出預假設,就可以設計出對于這些分布表現很好的學習算法[14]。因此,深度學習的重點在于針對特定問題尋找所適宜的神經網絡結構和形式設計,以及相對應的良好算法。
在深度學習大熱之前,基于傳統淺層神經網絡的機器學習技術已被證明在流體力學問題中是有效的[15-16]。但傳統神經網絡存在如下兩大問題:① 采用全連接方式的神經元消耗了大量的計算資源,并且無法提取結構化的時空信息;② 傳統訓練算法對于深層網絡的訓練誤差無法有效地傳遞,造成深層網絡的潛力無法發揮。這對于具有復雜流動特征的流體系統來說極大地阻礙了神經網絡的應用。近些年來,由于可提取結構化信息的卷積神經網絡(Convolutional Neural Networks, CNN)[17]、深度學習算法和GPU(Graphic Processing Unit)加速技術的突破性進展[18]為上述兩大問題提供了解決方案,深度學習技術在眾多科學與工程領域均獲得極大成功[11, 17, 19]。
文獻[20]通過理論推導,對流場基本控制方程進行變換,得到了與深度卷積神經網絡以及訓練算法相類似的表達,這從理論上說明了目前的深度學習算法是非常適合于對流體系統進行學習的。近年來,深度學習在流體力學中的應用潛力也逐漸被挖掘出來[5, 6, 9, 21-34]。深度神經網絡一旦訓練成功,在應用時僅需要很少的計算時間和計算資源[20, 28, 32-33, 35-36],使得流體力學深度學習技術具有重要學術和工程應用價值。
當前學術界關于流體力學與深度學習技術的交叉研究主要集中在以下3個方面:
1) 對于流體力學控制方程的學習。該研究從偏微分方程的數學求解出發,探索應用神經網絡輔助求解的方法。采用該方法對流體力學方程進行建模有如下兩個思路:應用深度神經網絡以偏微分方程整體為目標進行學習,以及只對諸如雷諾平均Navier-Stokes(RANS)方程中雷諾應力等部分項進行的學習。
2) 流場重構。這種方法將幾何外形特征表達等已知信息輸入網絡,并期望直接獲得與CFD相同的流場解。它類似于圖像生成,只不過生成的對象是流場各基本變量。該方法使用深度學習的強大表征能力,直接從流場數據中挖掘規律。由于網絡可以輸出流場各物理量,因此應用時方便簡單。但這種方法對網絡規模要求較高,需要精心設計網絡結構,訓練時還需要反復調整各種超參數,以便獲得精度高、泛化性強的神經網絡;另外,特征提取方法也是值得研究的重要內容:文獻[14]指出,對于可能分布的預假設直接關系到深度學習的最終效果,因此如何表示物理量并與神經網絡相結合具有重要研究價值。
3) 力系數等特征量的映射與應用。該研究通過神經網絡直接映射至諸如力系數等各種流場特征量。與流場重構方法不同的是,該方法忽略了流場細節,只關心力系數等最終結果,屬于黑箱方法。但這種方法可以直接獲得工程應用中所需結果,因此對于氣動優化、氣動彈性控制等領域具有較大應用價值。
應用深度學習技術解決流體力學問題通常遵循如下步驟:首先,制定特征提取方式,確定神經網絡輸入及目標輸出的表示形式;其次,確定網絡結構,依據不同任務中數據的分布形式,設計并確定相應的網絡結構和激活函數等神經網絡要素以使數據獲得最佳表達;然后,確定訓練算法,設計相應的損失函數及訓練流程,并根據驗證結果調整網絡結構及參數設置,以獲得最佳網絡;最后,設計神經網絡應用接口,方便實際使用。深度學習采用的基本流程如圖1所示。

圖1 流體力學深度學習建模的基本流程Fig.1 Basic process of modeling of deep learning for fluid mechanics
本文從流體力學與深度學習技術的交叉融合角度出發,較為系統地介紹了復雜流動深度學習建模技術及其最新進展。第1節介紹了深度學習中常被用到的基本理論和相關技術;第2節針對流體力學控制方程的深度學習建模,介紹了直接對流體力學偏微分方程的學習,以及對RANS方程中雷諾應力項的學習;第3節以流場重構技術為核心,并以作者課題組最新研究進展為重點,首先介紹深度學習技術中主要采取的幾種特征提取方式及各自的優缺點,然后從固定邊界定常流場、固定邊界非定常流場、動邊界非定常流場、相關改進及其他應用等幾方面介紹深度學習在流場重構方面的應用及最新進展;第4節介紹對于力系數等特征量的深度學習建模方法以及相關應用;第5節探討流場深度學習技術目前面臨的挑戰,并對未來研究方向給出相關建議。
依據“萬能近似性質”[12-13],神經網路具有對絕大多數實際映射關系的建模能力。因此,深度神經網絡是深度學習技術的核心組成部分。神經網絡主要由神經元和激活函數組成,其實現的映射可以表示為對于神經元中權重的一系列線性張量變換,以及激活函數所引入的非線性變換。損失函數衡量了網絡輸出和目標值之間的差距。因此DNN的訓練實際是一個優化過程:對于給定的輸入和輸出,尋找可以使損失函數最小化的一組神經元權重值。DNN訓練過程主要分為以下幾步:
1) 前饋。神經網絡根據目前神經元權重,對輸入進行變換得到輸出。
2) 誤差計算。根據指定的損失函數形式,計算當前網絡輸出值與目標值之間的差距,得到標量型的誤差值。
3) 后向傳播。通過鏈式法則,從輸出位置開始依次向后計算損失函數值對于各神經元權重的偏導數。
4) 根據第3)步計算的偏導數,更新神經元權重值。
5) 重復第1)~4)步,直至損失函數計算的誤差值滿足要求。
傳統神經網絡使用如圖2所示的全連接層。定義W為神經元權重矩陣,b為偏置向量,輸入和輸出分別為X和Y,則單層網絡實現的計算過程可以表示為

圖2 神經網絡示意圖Fig.2 Schematic diagram of neural network
Y=WX+B
(1)
由于第2層及之后的每一個神經元均與前一層的所有神經元相連接,因此當輸入輸出量維度較高時,會導致數以千計甚至上萬的神經元連接,這將極大地降低計算效率;并且為數過多的連接很容易產生過擬合現象[32],使得網絡泛化性大大降低。因此全連接網絡一般僅在分類器等應用中的最后幾層使用。卷積神經網絡(CNN)不僅極大地降低了神經元的個數,并且可以提取結構化的空間信息,因此被廣泛應用于圖像識別等人工智能應用場景中。CNN由卷積核構成,卷積核依次對輸入矩陣進行掃描并與對應位置數值相乘得到輸出,其過程如圖3所示。

圖3 卷積操作過程Fig.3 Process of convolution operation
與全連接網絡不同的是,權重矩陣中非卷積核覆蓋的位置均為0。由于卷積核掃描至邊界位置時,只能覆蓋部分輸入量,因此存在所謂的補丁(Padding)操作,也就是認為沒有被卷積核覆蓋的位置值為0。如果沒有Padding,通過卷積核提取到的特征矩陣將會變小,從而損失一部分信息,并限制了網絡的深度。而另一方面,Padding又會引入不必要的信息,影響權重的正確更新。因此是否使用Padding是在實際應用中需要權衡的問題。在進行全連接或卷積這樣的線性操作后,非線性激活函數對每一層的輸出進行非線性變換。雙曲正切函數(f(x)=tanh(x))、sigmoid函數(f(x)=1/(1+exp(-x))),以及整流線性單元(ReLU,f(x)=max(0,x))[17]等是常用的激活函數。另外,池化層有時連接在卷積層之后,通過依次對所提取的特征矩陣中不相鄰的子區域取最大值來進一步提取重要信息。
對具有時間結構信息的數據進行建模時,長短期記憶(Long Short-Term Memory, LSTM)網絡[37]具有良好的性能。LSTM網絡基本結構如圖4所示,其主要由3個門來控制細胞狀態:忘記門、輸入門和輸出門。LSTM的第1步即忘記門決定需要丟棄哪些信息,該部分操作由sigmoid處理;第2步是決定添加哪些新信息,這一步主要利用tanh層;更新完細胞狀態后需要判斷輸出哪些狀態特征,這里需要將輸入經過一個稱為輸出門的sigmoid層得到判斷條件,然后將細胞狀態經過tanh層得到向量,該向量與輸出門得到的判斷條件相乘就得到了最終單元的輸出。

圖4 長短期記憶(LSTM)網絡基本結構Fig.4 Basic structure of Long and Short-Term Memory (LSTM) network
在網絡訓練過程中,如果直接使用后向傳播,當網絡層數較深時,將出現誤差無法有效傳遞,從而導致神經元參數不能更新的情況。因此神經網絡的應用曾一度局限在簡單函數擬合等場景中。2006年,Hinton等提出采用無監督預訓練對權值進行初始化,并使用有監督訓練微調的方法解決深層網絡訓練中梯度消失的問題[38]。目前,諸如Tensorflow、Pytorch等機器學習庫常用的人工智能框架均已在底層實現了相應的訓練算法,使用者無需關注內部實現過程,通過調用相關函數即可方便地實現深度學習訓練過程。
如果僅使用誤差值或其各種范數作為損失函數,將可能導致網絡泛化性降低。這是因為模型的學習能力沒有被恰當地限制,從而使得模型僅對訓練集具有較小的誤差,但增加了方差。另外,在一些具有物理背景的應用中,對于某些物理特性的要求與保證甚至要高于精度等數學特性[39-40],因此僅使用誤差來訓練網絡顯然是不合適的。對于神經網絡的訓練,實際上是一個優化過程:
minL2(W;X,Y)
s.t.Lphysics=0
(2)
式中:L2為誤差函數;Lphysics為需要考慮的物理特征。為了求解這一約束優化問題,構造拉格朗日函數:
J(W,α;X,Y)=L2+αLphysics
(3)
式中:α為KKT乘子。優化問題(2)的解在J(W,α;X,Y)取最小值時得到。也就是說,解約束優化問題(2)的過程其實就是最小化方程(3)的過程。因此,實際所采用的損失函數應當具有式(3)的形式。參數α會影響約束區域的大小,這需要根據具體問題進行相應地調整。改造損失函數實際上是一種正則化方法[14]。除此之外,常用的正則化方法還有Dropout[14]等技術。

(4)
式中:Pdata和PG(x)分別表示生成數據與目標的分布;KL是交叉熵,用于衡量兩個分布之間的相似性。因此,對抗訓練實際上是一種最大似然估計方法,它可以自動地尋找到目標數據的分布特性。而這一點恰恰是希望在流體力學相關問題建模中達到的目的。
本節以流體力學控制方程本身為核心,主要對目前發展的偏微分方程深度學習技術進行介紹。關于僅從數據層面進行深度學習而不涉及其數學控制方程的方法在第3節和第4節中介紹。另外,一些方法雖然考慮了控制方程[32, 43],但主要是以損失函數的形式引入網絡訓練過程中,其核心目的還是在于數據層面的擬合,而不是求解數學方程本身,因此也不屬于本節討論范圍,相關介紹參見3.5節。對流動控制方程進行深度學習的方法主要可以分為兩類:直接對方程學習;以及首先對方程中某些項進行學習,然后嵌入到方程求解過程。
實際物理背景下的函數基本都符合泰勒級數展開條件,并收斂于原函數。因此直接對數學控制方程進行學習在數學上是可行、有保證的。Rudy等[44]使用稀疏回歸技術學習泰勒級數展開中的各項系數及各階導數形式。該方法實現了可解釋性的機器學習技術,但是需要構建函數庫來確保所涉及到的函數形式被包括在其中。這種方法的主要缺點是:使用的差分求解在很多情況下是病態或不穩定的,并且構建的函數庫有可能由于不全面而導致學習失敗。Raissi[45]通過構造兩個不同深度神經網絡分別對泰勒級數中的系數和函數項進行學習,解決了上述兩個問題。由于函數項是由神經網絡表示的,因此只能學習到原函數的抽象表達,但這并不影響其在實際問題中的應用。該方法在對于Burgers方程[46]、納維-斯托克斯(N-S)方程等微分方程的求解上展示出了很好的效果,相關數據和代碼已開源(具體網址為https:∥github.com/maziarraissi/DeepHPMs)。
湍流研究方面,湍流大數據與人工智能相結合是湍流研究的一個新領域。時空尺度在湍流中的極端分離使得求解全尺度流動結構在湍流中是不現實的。常見的解決方法是對小尺度進行截斷并進行建模,例如RANS和大渦模擬(LES)。在航空航天中應用廣泛的RANS模型基于渦黏假設,主要適用于附著流動,在分離流中預測能力受限,而雷諾應力模型的預測性能也并未得到本質提升,計算效率與穩定性有待提高。同時,模型參數設置需要有很豐富的經驗。近年來,利用機器學習來發展湍流封閉模型是當前研究的一個活躍領域[47]。目前主要應用方法可以分為3類:① 湍流模式方程源項的學習;② 湍流模型系數的學習;③ 對特征量的直接學習。
已有研究表明,通過直接構建流場信息與湍流模型方程源項的映射關系,可以提升湍流模型的預測性能[48-49]。Parish等[15]提出了基于流場反演和機器學習的湍流模型研究框架,該方法利用高可信度的數值模擬和實驗數據,采用反演模型推斷方法建立當地平均流物理量和模型源項的映射關系,然后再采用機器學習方法對k-ε湍流模型源項進行修正。該方法在槽道湍流中得到了與直接數值模擬(DNS)符合很好的結果(如圖5所示)。Singh等[16]使用相同的結構對S-A模型實現了增強與修正。對翼型繞流湍流分離問題,顯著提升了模型的預測能力。

圖5 Reτ=2 000槽道湍流模型性能對比[15]Fig.5 Comparison of channel turbulence (Reτ=2 000)[15]
2.2.1 對相關系數的建模
在對于RANS方程的求解中,雷諾應力張量的求解最為復雜。采用低個數的方程模型會導致對于流動的細節模擬不充分,高個數的方程模型又會大大增加求解難度。因此有學者提出使用深度學習技術對RANS方程中的雷諾應力相關量進行建模。這樣,不僅解決了直接求解雷諾應力時的麻煩,而且由于最終的流場求解方法是根據流體力學基本方程所構造的,因此求解可靠性也得到了極大的保證。Maulik等[50]使用深度學習技術對大渦模擬中用到的亞格子尺度模型實現了智能分類,并嵌入在LES中,從而解決了LES應用必須事先人為確定有關先驗信息的缺點。張偉偉等構造了徑向基函數神經網絡,并對渦黏性系數進行建模,然后引入CFD計算中,從而提高了計算效率[51]。Luo等[48]對神經網絡、支持向量機等多種機器學習模型進行了對比分析。Yang和Xiao[49]基于流場反演和機器學習對四方程k-ω-γ-Ar轉捩模式中的不確定度以及誤差進行了量化和改善,對第一模態時間尺度實現了系數修正,在二維翼型算例中表現了良好的性能。相關方法還可見文獻[52-54]。
2.2.2 對特征量的直接預測
機器學習在湍流建模研究中應用最廣泛的領域是對相關特征量的建模與預測,該方法并非直接獲得升力、阻力等最終統計量,而是為進一步湍流模擬提供基礎。該領域的研究通常采用DNS/LES/RANS數據進行訓練,直接獲取流場平均量到關注量之間的映射。主要可以分為:① 對渦黏性預測[55-56];② 對雷諾應力差量的預測[53,57-63];③ 對雷諾應力真值的預測[50,64-68]。相關代表性工作如下:
1) 對渦黏性的預測
張偉偉等[51]采用神經網絡算法,以高雷諾數翼型繞流的S-A湍流模型計算結果為訓練數據,重構出渦黏系數與平均流動變量之間的映射關系,針對近壁區、尾跡區和遠場區分別進行數據驅動建模,構建了相應的湍流模型,流程圖如圖6所示。模型對于亞聲速翼型附著流動,實現了與原始SA模型相當的性能,如圖7所示。Kou和Zhang[55]開展了非線性非定常氣動降階模型的多核神經網絡研究,提出了多核神經網絡并將其應用于非定常氣動力建模預測,構建了可以應用于變工況條件條件下的氣動載荷預測模型。

圖6 機器學習建模流程[51]Fig.6 Process of machine learning modeling[51]

圖7 翼型繞流渦黏系數云圖[51]Fig.7 Contour of eddy viscosity coefficient of flow around airfoil[51]
2) 對雷諾應力差值的預測
機器學習直接預測中應用最為廣泛的是對雷諾應力差值的預測,該方法用于對RANS模型與高保真模擬之間雷諾應力張量的差異進行建模,最終應用在計算中對RANS模型進行修正。Xiao等[58]開發了一種嵌入先驗知識的貝葉斯框架,用于量化RANS模擬中模型形式的不確定度,并引入了雷諾應力。該框架中利用卡爾曼方法吸收先驗知識和觀測數據,并將其應用到后驗分布中。文獻[63]使用有物理背景指導下的機器學習方法,其研究以RANS和DNS模擬的雷諾應力差異作為響應,獲得差異函數并將其嵌入RANS求解器中。這一改進的湍流模型對于方管流動、周期繞流和高馬赫數平板邊界層流動,與常規RANS模型相比,對于平均速度和雷諾應力與實驗結果符合更好,且在回流區內更具優勢。然而該模型泛化能力目前還較為有限。
Wang等[57]將RANS求解與DNS求解的雷諾應力差異以隨機森林算法學習獲得雷諾應力差異關于平均流動的函數。Wu等[53]針對湍流模型研究提出了較為完整的機器學習框架,并進行了系列測試。Wang等[60]在高超聲速平板邊界層湍流中獲得了較好的預測結果。Wu等[61]解決了由于機器學習方法加入所導致的數值求解不穩定問題。Wu等[62]對其團隊所發展的數據驅動湍流模型進行了定量評估。Ti等[59]采用k-ε湍流模型計算結果作為訓練數據,構建湍動能差值、尾跡特征度量與當地流場信息以及入流條件之間的映射關系,建立了基于人工智能的風力發電尾跡模型。
3) 對雷諾應力真值的預測
機器學習對雷諾應力真值預測的思路與差值預測基本類似。Ling和Templeton[69]使用支持向量機方法、Adaboost決策樹和隨機森林預測雷諾應力張量中高不確定度的區域。Ling等[64]首先采用具有深度網絡來建模各向異性雷諾應力張量。他們通過引入伽利略不變量來保證所獲得的的雷諾應力張量具有旋轉不變性,以k-ε模型計算的雷諾應力作為輸入,采用DNS和精細求解的LES結果作為真值標簽進行訓練,在非相似流場中得到了較好的結果,展現出一定的泛化能力。Zhang等[68]將其應用于槽道流動。
Weatheritt等[67]采用符號回歸和基因表達式編程自適應演化算法進行監督學習,采用RANS/LES混合方法計算結果作為訓練數據,獲得雷諾應力代數模型,并提出了數據驅動湍流模型的先驗訓練與后驗預測的研究思路框架。Cruz等[65]以DNS數據訓練流場,學習得到雷諾應力矢量并對k-ε湍流模型進行修正。Maulik等[70]采用深度神經網絡訓練并預測定常狀態下的湍流渦黏系數,實現后臺階流動模擬的精度和速度的提升。
對基本控制方程進行深度學習建模雖然有較強的物理可解釋性,但其中涉及到復雜的偏微分方程求解以及數值計算方法等技術,建模時需要提取額外特征量進行單獨建模,之后又要與偏微分方程的數值求解進行融合。在應用中,不可避免地要耗費較大計算資源,操作復雜,不一定適合于對計算效率有較高要求的工程應用場景。實際上,依據“萬能近似性質”[12-13],能夠直接對流體力學方程解進行映射建模的深度網絡是存在的。因此,深度學習流場重構技術近些年來逐漸發展起來,并展示出精確、便捷、高效的特點,為氣動外形智能優化設計、流固耦合建模與控制、閉環流動控制等應用提供了新的機遇。
雖然在神經元個數足夠多時,數學分析表明滿足要求的深度神經網絡是存在的。但現實世界中的計算資源、計算時間都是有限的,不可能永無止盡地嘗試下去。機器學習的重點并不是尋找一個絕對意義上好的學習算法,而是尋找一個適合于深度學習技術、符合真實世界的分布,并且針對這種分布設計性能相對較好的學習算法。因此,尋找針對特定問題的特征提取方式、合適的網絡結構和訓練方法就是擺在流場重構技術面前的主要研究內容。本節首先介紹了目前利用深度學習進行流場重構中常用到的幾何外形特征提取技術,然后以具體問題為導向,分別介紹了固定邊界條件下定常與非定常流場、動邊界非定常流場深度學習,以及相關改進措施。
目前深度學習建模技術雖然已經在流體力學領域進行了諸多探索[64,71-74],但主要集中于可用性和有效性研究。大多數早期研究僅采用諸如飛行攻角、馬赫數等狀態參數作為輸入,缺乏對于幾何外形表達方式的詳細研究。另外,飛行器外形設計中,要求可以在氣動外形變化時給出流動和氣動力的快速預測,實現幾何外形作為輸入的氣動建模能力。因此幾何外形特征提取方式是流動人工智能建模中需要重點研究的關鍵問題。
Zhang等[71]曾對二維翼型兩種不同表達所產生的輸入數據導致的預測結果進行了對比分析,并發現相較于簡單地采用幾何坐標作為輸入,利用像素密度作為輸入顯著地提高了預測效果。對于圓這類簡單的二維幾何外形,Miyanawala和Jaiman[72]使用矩形網格內每一網格點到邊界的最近距離作為輸入來預測阻力系數,并得到了很好的效果。以上研究表明:幾何外形特征提取方法對于深度學習建模效果具有決定性的影響。然而,現有研究基本上局限于圓這類簡單、特殊的幾何外形,缺乏廣泛通用性。并且通過這些方式表示的幾何信息具有很大的冗余性。筆者團隊等[75]提出一種流場特征提取方法,主要采用Laplace形式的偏微分方程生成流場網格,并將各網格點曲率值作為深度學習網絡輸入數據,通過這種方法在一定程度上表達了邊界對周圍流場造成的影響。對于長短徑比為3的半橢圓得到的網格曲率云圖如圖8所示。為了引入攻角、來流速度等工況參數,構造了串行復合深度神經網絡結構并取得了較好的結果。另外,還有使用深度學習技術提取的特征表達作為輸入的有關研究[76-77]。這些研究將自編碼器對幾何外形的壓縮表達作為幾何特征并輸入神經網絡。

圖8 長短徑比為3的半橢圓所產生的 網格線曲率云圖[75]Fig.8 Contour of curvature of grid lines caused by ellipses with different long-short axis ratios[75]
利用深度學習技術進行流場重構的探索目前任然處于起步階段,對神經網絡建模精度和泛化能力影響至關重要的幾何特征提取方式還缺乏充分系統的研究。如何構造適合于深度學習的幾何外形表達方式,并具有較強的實用性是未來研究有待探索的方向。
定常流場重構類似于圖像生成技術。由于流場離散表達具有空間結構,因此卷積神經網絡是這類研究中主要采用的網絡形式。CNN是從計算機視覺領域發展起來的,擅長處理圖像數據。一般將流場重構對應于計算機視覺中圖像到圖像的回歸任務,流場信息值類似于圖像中的像素點。神經網絡結構與自編碼器原理相似:如圖9所示,首先為編碼過程,通過CNN卷積核逐步提取不同范圍內的流場特征;在得到一定維度的抽象特征后,通過解碼器逐漸豐富流場細節,最后輸出所需要的定常流場。自編碼器具有良好的特性:如果解碼器是線性的,并且訓練時采用均方根誤差做為損失函數,則可以得到與POD方法相同的低維子空間[14]。

圖9 自編碼器Fig.9 Autoencoder
Ribeiro等[77]利用自編碼器實現了對圓等幾何外形的繞流流場重構,結果表明深度神經網絡具備學習NS方程的能力,并且計算效率與CFD方法相比得到了極大地提升。由于定常流場研究中樣本構造成本較高,每一個樣本均需要對不同的幾何外形重新計算流場信息。定常流場的深度學習實際上對神經網絡泛化能力具有極大挑戰性。相對于非定常周期流場的深度學習預測與建模而言,關聯幾何外形變化的定常流動灰箱建模相關研究實際上更為少見。當前更多的研究是從氣動力系數直接出發進行黑箱建模,沒有有效利用深度學習特性。
非定常流動中每一個時間步的計算僅需要在前一時間步的基礎上做時間推進即可,樣本構造相對較為簡便。同時實際非定常流動應用場景對神經網絡的泛化能力要求并沒有像關聯幾何外形變化問題的要求那樣高,因此當前深度學習在非定常流動建模技術中得到了更多的探索。非定常流動具有時空特性同時變化的特點,必須考慮時間效應,因此長短期記憶網絡被廣泛采用。
韓仁坤等[33]構建了能夠從高維非定常流場數據中直接捕捉非定常流動時空特征的混合深度神經網絡結構,實現了利用前k個時間步流場數據預測下一時刻流場數據的目的。訓練后的混合深度神經網絡可以實現一定范圍內不同雷諾數的非定常流場預測。該方法混合了常用的神經網絡形式,具有較典型的特征。下邊詳細闡述該方法的實施流程:
1) 數據集構造。利用高精度數值模擬方法計算非定常流場動態過程,并記錄各時刻的流場信息。選擇能夠包含流場特征主要變化范圍的矩形區域作為采樣區域,并在區域內均勻放置個數為Nx×Ny的采樣點,如圖10[33]所示。然后,將無量綱化的流場變量投影到該采樣區域上,并將物體內部數據點的對應值設為0。每個采樣時間步將三維流場變量(p*、u*和v*)均做相同處理,因此每個瞬時流場可以表示為Nx×Ny×3的三維數據。將所獲得的數據按時間順序排列,按照一定比例分成訓練和測試集。

圖10 翼型繞流的結構化網格(黑色)與均勻分布的笛卡爾網格(紅色)[33]Fig.10 Structured grid (black) and uniformly distributed Cartesian grid (red)[33]
2) 網絡結構確定。網絡由六層卷積神經網絡(CNN)層、1層卷積長短期記憶神經網絡(ConvLSTM)層和6層反卷積神經網絡(DeCNN)層組成,如圖11[33]所示。其中,卷積層的作用是捕捉各個時間步流場數據的空間結構特征并降低流場數據維度;卷積長短時記憶層的作用是在保留流場空間結構特征的同時學習各時間步之間流場時間演化特征;反卷積層的作用是將預測的下一時間步流場特征擴展成高維流場數據。在卷積層與卷積長短時記憶層之間需要進行數據變換,將各個時間步流場卷積得到的相同類型流場特征組合,使用前k個時間步的相同類型特征預測下一時間步該類型特征的狀態。

圖11 混合深度神經網絡結構[33]Fig.11 Architecture of hybrid deep neural network[33]
3) 神經網絡訓練。采用均方根誤差(RMSE)來評價模型的性能:
(5)

采用Adam算法作為優化算法對神經網絡進行訓練。在該算法中,使用指數移動平均來更新梯度向量和平方梯度。
4) 翼型繞流預測。利用訓練后的神經網絡對雷諾數為8 000、來流攻角為20°的情況進行預測。預測中使用前16個時間步的流場數據預測第17個時間步的流場數據,并將預測數據作為輸入數據,持續迭代預測下一時間步的流場。這樣,前16個時間步之后的流場數據均來自神經網絡預測輸出。結果顯示,測試階段兩個周期內流場的預測值和準確結果之間的均方根誤差小于1%。圖12[33]展示了第64個時間步的混合深度神經網絡預測結果與CFD計算結果的瞬時流場比較。所有預測結果與CFD結果吻合較好,混合深度神經網絡能夠準確地預測出流場結構。在圖13[33]所示翼型周圍選取兩個特征位置A和B用于顯示時間序列預測精度,流向速度的預測結果和CFD計算結果的時間歷程對比展示在圖14[33]中。可以看出,隨著時間推進,神經網絡預測流場和CFD計算流場的誤差積累不明顯。這是因為卷積神經網絡能夠忽略某些位置較小的誤差,而捕捉流場的主要時空結構特征。因此所構造的神經網絡完成了預定目標,實現了對非定常流場時空特征的學習。



圖12 第64個時間步的流向速度神經網絡預測結果與CFD計算結果比較[33]Fig.12 Comparison of prediction results of flow direction velocity by neural network with those calculated by CFD at the 64th time step[33]

圖13 翼型周圍選取兩個特征位置顯示時間序列預測精度[33]Fig.13 Selection of two feature positions around airfoil to show prediction accuracy of time series[33]

圖14 流向速度在兩個選定位置的神經網絡預測結果和CFD計算結果的時間歷程對比[33]Fig.14 Comparison of time history between neural network prediction results and CFD calculation results of flow velocity at two selected positions[33]
在跨聲速狀態下,由于激波與邊界層的相互干擾作用會引起流動分離,進而產生激波振蕩現象。這種自維持激波運動現象被稱為跨聲速抖振。跨聲速抖振問題具有復雜的非定常和非線性效應。對于該問題的研究手段主要有試驗與數值計算,且對試驗環境與計算資源的要求很高。隨著深度學習的發展,其強大的特征提取與非線性表達能力為跨聲速抖振問題的研究帶來新的手段。本文作者等從流場特征學習的角度入手,基于卷積神經網絡與長短時記憶網絡構造深度神經網絡,利用高精度數值計算得到的流場時空序列數據對網絡進行訓練,直接從原始高維流場數據中捕捉跨聲速強非線性流場時空特征,對其中復雜非定常非線性變化規律進行學習,較好地實現了流場預測。
研究采用OAT15A超臨界翼型作為對象。由于激波振蕩現象發生在翼型上表面區域,采樣時選擇該區域作為流場特征區域,如圖15所示。計算工況為Ma=0.73,3.5°迎角,雷諾數為3×106。該數據樣本集由西北工業大學航空學院王剛教授提供。

圖15 數據采樣區Fig.15 Data sampling area
通過對圖11所示的混合神經網絡進行改進,實現了非定常強間斷非線性流場重構。圖16展示了預測20時間步后的對比情況。在流場翼型上表面距翼型前緣位置x/c=0.43處設置考察點,流場變量的預測情況見圖17。通過比較瞬時流場云圖,神經網絡預測結果與數值計算結果吻合良好,流場分布一致;流場中預測誤差偏大的區域主要集中在激波位置處,這是由于激波位置處存在較大的數據梯度,但不影響神經網絡對于流場整體的預測,且瞬時流場內激波位置預測基本與計算結果吻合。通過比較考察點處的流場變量變化情況,預測結果在多個周期內基本符合數值計算得到的變化規律,在時間維度上變化同步。這表明深度神經網絡學習到了跨聲速抖振的流場時空變化特征,能夠初步實現對激波運動的重構與預測。在強非線性流體問題方面,深度神經網絡也展現出了強大的學習能力。

圖16 流向速度預測結果和數值計算結果 對比(20時間步)Fig.16 Comparisons of instantaneous flow fields between prediction results and numerical calculation results(after 20 time-steps)

圖17 流場變量在考察點A處速度預測情況Fig.17 Prediction of flow field variables at survey point A
固定邊界下非定常流場深度學習預測與重構技術是當前研究熱點之一。Wang[22]和Omata[23]等也利用卷積自編碼器實現了非定常流場的降階。Mohan[24]、Pawar[25]以及Deng[26]等在POD方法得到的降階子空間上,采用LSTM網絡實現了流場的時間演進。Huang等[6]使用CNN與LSTM結合的方式實現了對三維火焰演化預測。湍流研究方面,CNN與LSTM混合網絡則展現出對時空特征的良好建模能力[31]。另外,對抗訓練方式的引入進一步提升了深度網絡預測效果[32, 34]。



動邊界非定常流動現象在飛行游走生物、柔性仿生飛行器以及柔性旗幟等可變形柔性結構流固耦合動力學系統中普遍存在。隨著人類對昆蟲和鳥類飛行機理認識的逐步深入,以及智能材料結構技術、信息技術和制造技術的飛速發展,對于流固耦合效應的研究與開發具有重要意義。實驗研究和數值模擬均表明,柔性撲翼在非定常流場中的周期性運動比剛性撲翼能夠產生更大的推力,其非定常空氣動力與漩渦在流場中的產生、融合、機翼形狀改變及結構柔性密切相關[78]。然而,包括POD、DMD在內的傳統降階模型雖然能以較少自由度描述原系統的主要動力學特性,但是這類降階模型受限于所依賴的數學算法基礎,都難以直接構造出包含分離和漩渦等強非線性多尺度流動現象的流固耦合系統高質量降階模型,并且在整個系統參數空間內缺乏魯棒性。而作為顛覆性大數據處理技術和人工智能技術代表的深度學習技術無疑為解決這一問題提供了強大武器。
盡管深度學習在流體力學和結構力學中的嘗試從2016年就已經開始,但從現有公開文獻來看,固定邊界非定常流動重構仍然是當前研究熱點,而含運動邊界的非定常流動應用報道非常少見,對流固耦合動力學系統建模也未見公開報道。韓仁坤等基于對固定邊界非定常流動建模提出的混合神經網絡基本結構[33],進一步改進發展了適用于動邊界非定常流場深度學習建模方法,對于周期性振動的圓形動邊界非定常流場,獲得了較好的預測效果[79](如圖18所示),并在不同振動幅度、不同雷諾數下具有不錯的泛化性能。

圖18 流向速度在選定位置的神經網絡預測結果和CFD計算結果時間歷程對比[79]Fig.18 Comparison of time history between neural network prediction results and CFD calculation results of flow velocity at the selected position[79]
作者所在課題組近期應用卷積自編碼器,并且通過損失函數引入對于動邊界的考慮,實現了翼型俯仰沉浮氣動彈性運動狀態下的非定常流場預測。從圖19可以看到,深度神經網絡對非定常流場做出了較為準確的預測。但由于動邊界效應,靠近邊界處始終是誤差最大位置處。另外,在對動邊界非定常流場的預測中,神經網絡傾向于抹平流場中的變化(如圖20所示)。研究中還發現,在經過足夠長的時間步后,神經網絡的預測會逐漸縮小幾何邊界的范圍,直至消失。造成這一現象的原因可能與動邊界的處理有關,是未來研究需要進一步探討的方向。

圖19 深度神經網絡在10個時間步后對 流向速度的預測結果Fig.19 Prediction results of flow velocity by deep neural network after 10 time steps

圖20 3個位置處動邊界非定常流場流向速度預測值與CFD計算值比較Fig.20 Comparison of predicted flow velocity and CFD calculation results of unsteady flow field with moving boundary at three locations
當采用深度學習技術對流體力學相關特性進行學習時,神經網絡的形式主要由卷積神經網絡,與長短時記憶網絡組成。卷積網絡提取空間特征,長短時記憶網絡提取時間特征。目前尚未見有新的基本網絡形式被采用。網絡結構方面的改進主要集中在各種網絡與訓練方法的搭配上。除此之外,如第1節所述,改造損失函數對結果會產生較大影響。因此,流體力學深度學習效果的改進主要圍繞網絡結構設計、訓練算法,以及損失函數3方面進行。
Raissi等[43]將流體力學基本方程——N-S方程引入損失函數,實現對圓柱尾流流場以及顱內動脈瘤影響的生物流場重構,這一成果發表在國際頂級學術期刊Science上。其具體做法是通過自動微分技術對網絡輸出變量求導,并代入N-S方程計算殘差,損失函數定義為傳統二范數誤差與這一殘差的和。預測結果表明訓練過程所用到的損失函數確實提升了神經網絡的學習效果。相關方法被同一作者應用于渦致振動的研究中,同樣顯示出了良好效果[5]。與Raissi直接求解流體控制方程的殘差不同,Lee和You[32]采用有限體積法的思想計算網格點處的物理守恒量,將預測結果與目標值之間物理守恒量的差值作為損失函數。其文中詳細研究了將物理守恒律引入損失函數以及是否采用對抗訓練方式對網絡學習能力造成的影響。研究表明考慮損失函數對于非對抗性的訓練具有改進作用,但采用對抗方式時不對損失函數引入額外物理守恒項的結果更好。這恰恰驗證了第1節中關于對抗訓練優點的相關論述。由于對抗訓練過程中會自發地尋找到內在規律,因此引入額外的約束反而是給出了錯誤的引導。但對抗訓練收斂難度大,極易發散,這是在實際應用中必須注意的問題。綜合考慮,采用考慮物理守恒性質的損失函數進行非對抗訓練是實際應用深度學習技術解決流體力學問題的推薦方法。損失函數除引入物理特征量之外,Mathieu等[80]指出通過修正預測量的梯度誤差,可以更精準地預測細節。
另外,作者課題組在相關研究中引入自編碼器實現流場降階,并對比研究了是否采用對抗方式,以及是否采取降階網絡對深度神經網絡建模能力的影響。圖21示出了不同網絡對非定常流場的預測結果。研究表明降階網絡與對抗訓練都有利于建模能力的提升。在采用降階網絡后,雖然在訓練過程中需要對降階網絡進行額外訓練,但訓練結束后,可方便高效地應用。因此在實際使用中推薦采用自編碼器實現的降階網絡,并進行對抗式訓練。

圖21 深度神經網絡非定常流場預測二范數誤差累積與預測時間步的關系Fig.21 Accumulation of the second norm errors of predictions based on deep neural networks with time steps of unsteady flow field
對諸如升力系數等流體力學特征量的直接映射屬于黑箱方法,它不關心流場細節,僅尋求從幾何外形和工況等條件直接獲得所需變量的方法。該應用場景是數據科學技術所要解決的傳統問題。深度學習由于其強大的非線性表征能力,為該問題的解決提供了堅實的基礎。與第3節所不同的是,網絡中引入全連接層將具有空間結構化的信息展成一維向量后輸出,從而實現回歸。多篇文獻均已成功利用深度學習技術構建力預測神經網絡[20, 35-36, 81]。Salehipour等[82]利用卷積神經網絡對相關物理背景下的湍流混合效率進行建模,顯示出深度學習技術相較于一些傳統方法具有更可靠、更精確的預測能力。本文作者在3.4節所述網絡的基礎上,引入力系數預測網絡,并與結構動力學求解器耦合,實現了深度神經網絡松耦合氣動彈性模擬。對于NACA0012翼型,在翼型進入穩定振蕩過程后,深度神經網絡對升力系數作出的預測如圖22所示。張偉偉團隊利用LSTM實現了非定常氣動力建模。在其研究中,以NACA64A010翼型兩自由度跨聲速狀態為測試算例,驗證了深度神經網絡能夠準確把握不同流動和結構參數下,諸如極限環等氣動力與氣動彈性響應動態特征[83]。由于該類方法直接預測最終氣動力等統計量,屬于純黑箱方法,這里主要是說明深度學習的擬合能力,不做過多介紹。

圖22 深度神經網絡松耦合氣動彈性模擬 系統對升力系數的預測Fig.22 Prediction of lift coefficient made by deep neural network aeroelastic simulation system
除上述黑箱方法外,張偉偉教授研究團隊引入高斯與小波基函數,構建了復合神經網絡,并使用POD等方法為網絡提供先驗信息。該網絡對非線性非定常問題成功實現了降階目的[55]。上述研究結果表明工程問題中直接利用深度學習方式快速獲得流體力學特征量是可行的,并且有巨大應用前景。
流體力學與人工智能技術的交叉具有較大發展前景,從目前其在流體力學應用中獲得的廣泛關注和初步應用來看,以深度學習和強化學習為代表的人工智能技術推動數據驅動的流體力學研究新范式的建立只是時間問題[9]。深度神經網絡的建立離不開特定問題特定數據集,因此流體力學深度學習預測與建模技術應當以具體問題為導向,即針對特定問題分別尋找相適宜的建模方法。根據作者近期相關研究經驗和初步認識,認為深度學習技術在流體力學中應用面臨的挑戰和需要盡快突破的科學問題如下:
1) 數據構造與學習方式。深度學習依賴大數據,只有足夠大量的數據才能實現深度網絡的充分學習。而流體力學高精度計算需要耗費巨大計算資源;且在某些情況下獲取數據成本高昂甚至無法獲得數據,比如飛行試驗數據。因此如何構造數據,并在小樣本集上對網絡進行訓練是深度學習應用中亟待解決的問題。另外,如3.1節所述,數據提取及表達方式直接關系到深度學習建模效果,因此探索合理高效的特征提取方式也是重要研究方向。
2) 神經網絡超參數和激活函數選取。雖然提取時、空特征的最佳網絡形式分別為LSTM和CNN,然而對于一定量的樣本規模來說,設置幾層網絡、每層網絡設置多少個神經元可以達到最好的學習效果是沒有通用解決方法的。實際使用中需要耗費大量資源反復嘗試,這無疑為深度學習應用帶來了障礙。激活函數方面,已有研究表明不同激活函數對建模能力是有較大影響的[84-86]。是否有較通用的網絡結構設計模式,針對特定問題,哪種激活函數可以達到最佳的建模效果,這些都是對于實際應用具有重要價值的研究方向。
3) 訓練方法。3.5節中的相關研究表明,對抗訓練可以提升深度網絡學習能力。然而對抗訓練難以收斂,且并非所有問題都適合采取對抗訓練的方式。另外,訓練中所用到的損失函數構造可以明顯改善深度學習效果。因此如何在對抗帶來的好處與訓練難度之間平衡,如何針對特定問題、特定網絡結構和訓練方式構造相適宜的損失函數,將會對深度學習效果產生重要影響。
4) 可靠性問題。深度學習被應用的大部分場景均是在數據層面進行數據特性挖掘,由于沒有可靠的數學物理方程作為保證,神經網絡的可靠性與穩定性很大程度限制了深度學習在對安全性有較高要求的領域中應用。因此對深度學習可靠性進行分析也是擺在研究者面前的一大難題。
5) 深度學習與流體力學的深度融合。在第2節介紹了從流體力學控制方程出發的深度學習技術,然而這些方法目前只能應用于一些特殊條件下,且沒有與具體問題特性結合起來。深度學習與各學科的融合不僅會為實際問題帶來新的解決手段,對各學科的發展也具有重要意義。
6) 流體力學標準數據集的構造。為了更方便地進行深度學習研究與檢驗,在圖像處理領域有著名的ImageNet數據集。目前對于流體力學的深度學習研究每次均需要耗費大量資源構造數據集;且由于數據來源不同,方法的檢驗與改進面臨很大障礙。因此流體力學相關標準數據集的提出對深度學習的發展將具有重要意義。
7) 空氣動力數字孿生(Aerodynamic Digital Twin)技術。數字孿生應用場景為流體力學人工智能建模技術提出了全新的機遇和挑戰。空氣動力學作為飛行器、船舶和汽車等先進運載和能源動力裝備發展的先行官和關鍵基礎支撐,毋庸置疑是構建面向全壽命周期的高端裝備數字孿生中不可或缺的一環。通過與人工智能建模技術相結合,有可能發展出準實時、交互式、動態進化、高保真、數據驅動的具備大數據處理能力和進化能力的空氣動力數字孿生系統。
8) 數據驅動的流體力學研究新范式構建。以深度學習技術為代表的人工智能技術本身仍處于發展階段,過去幾年其在各行各業取得了令人矚目的成就,顯示出深度學習技術的強大潛力。流體力學深度學習技術方興未艾呈現百花齊放的良好局面,但仍然處于起步和探索階段,與工業界對流體力學人工智能技術的能力期望仍具有較大差距。與新一代可解釋人工智能技術相結合的數據驅動流體力學研究新范式的建立,則更需要學術界和工業界的科研工作者的共同努力。