韋 昌 樊昱晨 周永清 劉 欣, 張超群 王赫陽,1)
* (天津大學機械工程學院,天津 300072)
? (煙臺龍源電力技術股份有限公司,山東煙臺 264006)
近年來,隨著計算資源和可用數據的暴發式增長,機器學習技術不僅在計算機視覺[1]、自然語言處理[2]和智能推薦系統[3]等方面取得了革命性成果,在智能計算領域也展現出了巨大潛力[4].目前,機器學習技術已被廣泛應用于各種常見的科學問題[5]和工程問題[6].例如,基于高斯過程[7]求解線性和非線性偏微分方程(partial differential equations,PDE),采用稀疏回歸算法[8]從觀測數據中反演物理系統的狀態和屬性,以及基于深度學習方法對流場進行超分辨重構[9]等.但是,上述機器學習技術屬于基于數據驅動的方法,強大的代理模型需要建立在大量的訓練數據之上.而在現實應用場景中,數據的獲取通常伴隨著昂貴的代價和成本,這導致人們往往要在信息不完備的情況下對復雜系統做出預測和決策.另外,絕大多數先進的機器學習技術都是建立在概率統計上的一種黑箱模型[10],缺乏對物理系統內部機理的合理解釋.在這種背景下,物理信息神經網絡[11](physics-informed neural networks,PINN)因其訓練數據少和內嵌了物理先驗知識而受到學術界的廣泛關注.
PINN 的基本原理是神經網絡的函數通用近似定理[12],核心思想是將PDE 的殘差形式嵌入到神經網絡的損失函數中,約束訓練參數的求解空間.該思想最早出現于1994 年,Dissanayake 等[13]基于神經網絡強大的非線性近似能力,將求解PDE 的數值問題轉化為無約束優化問題,通過最小化損失函數實現了神經網絡輸出對PDE 解的近似.但是,由于當時反向傳播算法的落后以及計算資源的限制,使用神經網絡求解PDE 的方法并未引起太多的關注.近年來,隨著機器學習技術的崛起和自動微分技術[14]的出現,該方法才再次走進科研人員的視野.在2019 年,Raissi 等[11]采用自動微分技術代替了原始的手動求導方法,極大地提升了神經網絡的計算效率,并正式將嵌入物理知識的神經網絡命名為PINN.并且,為了應對不同的使用場景,Raissi 進一步設計了連續時間模型和離散時間模型兩種不同的神經網絡模型.
PINN 的概念自從被提出后,迅速成為數據科學工程和人工智能領域的研究熱點[15].為了提高PINN求解PDE 問題的精度、加快收斂速度以及增強泛化性能,研究人員從神經網絡結構、損失函數類型和激活函數形式等方面展開了深入研究,并提出了各種PINN 的變體.Yu 等[16]利用PDE 的梯度信息,將額外的梯度項嵌入到損失函數中,提出了梯度增強型物理信息神經網絡(gPINN)框架,提高了神經網絡的穩定性和泛化性.針對PINN 訓練過程中存在梯度反向傳播不平衡的問題,Wang 等[17]提出了一種自適應學習率退火算法,可以在PINN 訓練期間動態調節各個損失項的量級,提高模型求解精度.Jagtap 等[18]通過在激活函數中加入可縮放因子,提出了一種自適應激活函數,加快了PINN 求解非線性PDE 的收斂速度.
根據損失函數不同的構造方式,PINN 可以分為連續時間模型和離散時間模型,離散時間模型也被稱為基于龍格庫塔法的物理信息神經網絡(physicsinformed neural networks based on the Runge-Kutta method,PINN-RK).為方便起見,文中后續內容中的PINN 將特指物理信息神經網絡連續時間模型.雖然PINN 具有出色的高效性和靈活性,但是仍存在兩個局限性[19-23].在正問題中,隨著PDE 維度的升高,其施加物理約束所需的采樣點數量呈指數級增長,增加了計算負擔.在逆問題中,其前提假設是采樣數據在整個時空域內是連續可用的,采樣點能夠取到求解域內的任意時空坐標點.但是,在實際的應用場景中,該假設往往難以得到滿足.數據采集過程中,傳感器通常在固定位置上以固定時間間隔對系統進行采樣.并且,對于采樣空間較大的應用,采樣數據在時空域內往往呈現出稀疏離散的特點.與PINN 相比,PINN-RK 的使用并不存在該假設限制,更加符合實際應用場景,約束點數量也不會隨PDE維度的升高而呈現指數級增長.但是,迄今為止,針對PINN-RK 的研究少之又少,且主要集中在一維非穩態問題上.另外,由于神經網絡結構的限制,PINNRK 的輸出僅能表征一種物理量,無法同時反映多個物理量的狀態,導致現有的PINN-RK 模型僅適用于求解單個PDE,而無法求解相互耦合的PDE 系統.
因此,為了擴展PINN-RK 的應用范圍和實現對PDE 系統的求解,本文提出了一種基于龍格庫塔法的多輸出物理信息神經網絡(multi-output physicsinformed neural networks based on the Runge-Kutta method,MO-PINN-RK).MO-PINN-RK 在PINNRK 的基礎上采用了并行輸出的神經網絡結構,通過將神經網絡劃分為多個子網絡,建立了多個神經網絡輸出層,利用不同輸出層近似不同的物理量,并通過輸出層共享的隱藏層捕捉不同物理量之間的耦合關系,使MO-PINN-RK 不僅可以同時預測多個物理量,還可實現耦合PDE 系統的求解.為驗證MOPINN-RK 的有效性,本文將二維不可壓縮流體的圓柱繞流問題作為測試案例.基于觀測數據,使用MOPINN-RK 對流場預測和參數辨識兩種問題展開研究,并將模型預測解與基準解進行對比.本工作采用并行的多輸出神經網絡結構,構建了新型的PDE 求解器,以期為工程和科學領域的問題求解提供準確高效的解決方案.
一般情況下,線性和非線性PDE 的通用形式為
其中,u(t,x)表示PDE 的解,下標t表示函數u(t,x)對時間的偏導數,N [·] 表示線性或非線性微分算子,?為 RD的子集.從神經網絡的通用近似定理可知,一個包含足夠多神經元的單層神經網絡模型可以以任意精度近似一個非線性函數.基于該定理,在大量訓練數據的基礎上,可以通過神經網絡的輸出近似PDE 的解.然而,很多科學問題和工程系統的數據采集較為困難,基于大量數據的機器學習技術并不適用于這些小數據系統.人們對于科學問題和工程應用卻有著大量的先驗知識,這些先驗知識的存在恰好可以彌補數據上的不足.一般而言,先驗知識以PDE 守恒方程的形式出現,如式(1)所示.與傳統的神經網絡不同,PINN 是一種將物理先驗知識嵌入到損失函數中的神經網絡模型,如圖1 所示.
PINN 通過最小化損失函數的方式,使用梯度下降算法不斷更新神經網絡的權重和偏差,以實現近似PDE 解的目的[24].將PDE 的殘差形式以懲罰項的方式加入到神經網絡損失函數中,可以為神經網絡的優化學習指明方向,減少可行解的參數空間,降低訓練代價.當神經網絡的權重參數不滿足約束條件時,懲罰項會導致損失函數的增加.因此,在神經網絡優化過程中,懲罰項會影響權重的調整,以達到在約束條件下降低總損失值的目標.先驗知識的嵌入相當于人為地從數據中提取了物理規律,代替機器學習模型進行了部分特征提取工作,節省了優化算法自身進行數據挖掘的時間.另外,相比于優化算法主動學習隱藏在數據中的物理規律,顯式地將先驗知識嵌入到神經網絡中的做法可以進一步放大增強數據中的信息量[25],更有益于模型朝著最優解的方向前進.
龍格庫塔法是一種高階精度的數值方法,常被用于科學計算和工程應用中.該方法通過在每個時間步中計算多個中間節點加權和的方式逼近數值解,可以有效地抑制數值發散等問題,提高了數值求解過程的穩定性,因此更適用于處理長時間跨度問題.PINN-RK 是神經網絡與龍格庫塔法結合的產物.將q階龍格庫塔公式[26]應用到式(1),可以得到
其中,q為龍格庫塔階數,?t表示時間間隔,aij為龍格庫塔公式中的系數,龍格庫塔公式的顯式格式和隱式格式由這些系數所決定.由于隱式格式具有非常出色的穩定性,本文后續計算均采用隱式龍格庫塔公式.ci和cj為龍格庫塔節點,un+ci和un+cj為龍格庫塔采樣值
為了便于書寫表達,式(2)可以被轉化為如下形式
在PINN-RK 中,輸出層神經元數量等于龍格庫塔階數q+1,具體形式如下所示
其中,un(x)表示PDE 當前時刻的解,un+1(x)表示PDE下一時刻的解.
通過整合PINN 框架、龍格庫塔公式(5)和相應的PDE,即可得到PINN-RK 模型.相比于PINN,PINN-RK 的輸入量僅為空間坐標x,不含任何時間變量t.時間變量通過龍格庫塔公式被隱式地嵌入到了損失函數中,能夠顯著提升求解過程中的穩定性.PINN-RK 的輸出為q階龍格庫塔采樣值與下一時刻PDE 的解
從式(7)中可以看到,由于龍格庫塔公式的嵌入和神經網絡結構的限制,PINN-RK 的輸出層只能表示單個物理量的龍格庫塔采樣值,無法同時描述多個物理量.這導致PINN-RK 僅適用于求解單個PDE 的問題,無法處理相互耦合的PDE 系統.究其原因,主要是因為PINN-RK 中神經網絡結構過于簡單,輸出層個數僅為1,使得神經網絡表達能力較差,難以準確近似多個物理量.為此,本文通過對PINNRK 結構的改進,提出了MO-PINN-RK.
為了闡明MO-PINN-RK 的構建方法,本文將以N-S 方程為例描述多輸出神經網絡的構建過程,并詳細介紹如何將物理先驗知識嵌入到損失函數中.通常情況下,全連接神經網絡包含一個輸入層、多個隱藏層和一個輸出層,而在MO-PINN-RK 中則采用了多個輸出層的結構設計,以實現同時求解耦合PDE 的目的.另外,該模型還采用了并行的隱藏層結構,能夠捕獲不同物理量之間的差異,增強了神經網絡模型的表達能力.MO-PINN-RK 的輸出層數量取決于PDE 問題中的未知數個數.對于二維流動問題N-S 方程,未知的物理量為u,v和p,因此輸出層個數為3.其次,根據龍格庫塔階數確定輸出層神經元個數,每個輸出層的神經元個數等于龍格庫塔階數q+1.最后,以采樣點的二維空間坐標 (x,y)作為神經網絡的輸入,選擇合適的隱藏層層數和神經元個數,建立MO-PINN-RK 模型,如圖2 所示.
MO-PINN-RK 模型隱藏層可以分為兩個部分.一部分為共享隱藏層,另一部分為并行隱藏層.共享隱藏層與神經網絡常規的隱藏層相同,均為全連接結構.共享隱藏層可以學習到多個子任務之間的特征表示,提取不同物理量之間的共同特征.并行隱藏層則分為3 個并行子網絡,不同子網絡近似不同的物理量,每個子網絡中的隱藏層均為全連接結構,不同子網絡的隱藏層互不干擾.并行隱藏層允許每個子網絡根據其所要解決的任務特點,自由設計隱藏層結構和參數.這樣的靈活性使得每個子網絡可以更好地適應不同任務的復雜性和數據特點,從而提高整體模型的性能.
采用多輸出的神經網絡結構,可以利用不同的輸出層表示不同的物理量,提高了模型的準確性和泛化能力.由于每個輸出層專注于自己的任務,神經網絡可以學習每個物理量的特征,并通過共享的隱藏層捕捉不同物理量之間的耦合關系,使得MOPINN-RK 可以有效地求解耦合PDE 系統,更好地描述復雜的物理過程.
下列式子為本文所采用的N-S 方程表達式
其中,u和v分別表示流向速度分量和橫向速度分量,p表示壓力.下標t,x和y分別表示函數對時間和空間的一階偏導數,下標xx和yy分別表示對空間的二階偏導數.為了將N-S 方程嵌入MO-PINN-RK 的損失函數中,使用q階隱式龍格庫塔公式對其進行離散化,可得
其中,下標i表示不同的空間采樣點,取值范圍由采樣點數量決定,上標j表示龍格庫塔階數,j=1,2,···,q,q+1.式(14)和式(15)分別為式(12)和式(13)的一部分,表示不同采樣點下不同龍格庫塔節點處N-S方程的殘差形式.兩式的作用是為神經網絡的損失函數引入物理約束,指導神經網絡的訓練朝著滿足N-S 方程的方向進行.
根據式(11)~式(13)構建用于MO-PINN-RK的損失函數.不同的損失函數形式會對訓練結果產生不同的影響,文中采用了平方誤差和(sum of squared errors,SSE)形式.總損失函數由3 部分組成
其中,SSEm為連續性方程損失函數,SSEu為x方向動量方程損失函數,SSEv為y方向動量方程損失函數,N為訓練集中采樣點個數,和表示神經網絡輸出,和表示已知的觀測數據.MO-PINN-RK將以最小化損失函數SSE 為目標,通過優化器不斷更新神經網絡中權重,直至損失函數低于設定的閾值.
為了更加深入地理解MO-PINN-RK 的訓練原理,可以將其與自編碼器中的編碼神經網絡和解碼神經網絡[27]進行類比.在MO-PINN-RK 中,觀測數據可視為編碼神經網絡中的輸入特征向量,前向傳播過程則類似于對觀測數據進行編碼操作,而輸出層神經元所代表的變量則可視為編碼神經網絡所輸出的潛在變量,即解碼神經網絡的輸入特征.MOPINN-RK 輸出層應用龍格庫塔公式的過程類似于解碼網絡中的解碼操作.為了最小化編碼神經網絡輸入特性向量和解碼神經網絡輸出特征之間的差異,自編碼器模型以最小化重構誤差為目標進行訓練.在MO-PINN-RK 中,最小化損失函數的作用與最小化重構誤差相同,均用于指導神經網絡的優化訓練過程.但是,與之相比,MO-PINN-RK 還嵌入了物理先驗知識,提高了模型的泛化性能.此外,MOPINN-RK 中的解碼過程由龍格庫塔公式和描述物理守恒定律的PDE 充當,使得解碼方式由隱式形式轉化為了顯式形式,顯著地增強了模型的可解釋性,提高了模型的魯棒性.同時,這種轉變也使MOPINN-RK 可以更加準確地求解復雜的PDE 系統.
圓柱繞流因幾何形狀簡單而流動形態豐富、機理復雜,一直作為流體力學中的經典問題被廣泛研究[28].當流體流經圓柱體時會出現剪切流動,產生邊界層分離和渦的非對稱脫落現象.這種繞流現象廣泛地存在于各種工程應用中,例如跨海大橋的穩定性設計、熱電廠輸運管道的優化以及水利機械的制造等.了解圓柱體周圍的流動模式對這些結構的優化設計和性能提高具有至關重要的作用.為此,人們從理論、實驗和數值模擬進行了各種研究.
為了驗證MO-PINN-RK 的有效性,本文使用該模型對二維不可壓縮流體的圓柱繞流問題進行流場推斷預測和參數辨識研究.在圓柱繞流中,圓柱尾跡的流動狀態不僅展現出了豐富的流動現象,如圖3(a)和圖3(b)所示,而且還蘊含著深刻的物理規律,因此本文只對圓柱下游特定的小矩形區域進行研究,如圖3(c)所示.

圖3 圓柱繞流示意圖Fig.3 Schematic diagram of flow around a cylinder
圓柱繞流現象背后的物理規律由N-S 方程所控制.為此,根據前一節中闡述的方法,建立如圖2 所示的MO-PINN-RK 架構.考慮到目前已有大量文獻對圓柱繞流問題進行了數值模擬研究,本文將直接使用文獻[11]中提供的流場數據作為MO-PINNRK 的訓練數據和測試數據,以確保結果的可靠性.對于流場分布預測問題,MO-PINN-RK 以一個時間切片的速度觀測值作為輸入來預測另一個時間切片的速度分布.從數值模擬數據的時空分布中隨機選擇某一時間點作為數據采集時刻t,并將該時刻下的流向速度分布u(x,y)和橫向速度分布v(x,y)作為模型的數據集,如圖3(a)和圖3(b)所示.在圓柱下游特定矩形區域內進行數據集的隨機采樣操作,總計采樣5000 個觀測點,采樣區域如圖3(c)所示.設置損失函數中龍格庫塔公式的時間步長為 ?t.通過迭代訓練和優化過程,MO-PINN-RK 能夠根據觀測數據推斷損失函數中N-S 方程的解,學習流體的時空動態行為,并準確地提供未來t+?t時刻的速度分布.
對于參數辨識問題,MO-PINN-RK 以時間間隔為 ?t的N個速度觀測值作為輸入,用于推測PDE 中的未知參數.在參數辨識中,MO-PINN-RK 中的NS 方程并非完全已知,而是存在部分未知參數 λ1和λ2,如下式所示.參數 λ1和 λ2的真實值由文獻[11]確定
基于部分觀測數據和不完備的物理知識,MOPINN-RK 通過最小化損失函數并采用梯度下降方法來進行優化訓練,以獲取最優的參數估計.經過充分訓練后,MO-PINN-RK 能夠從觀測數據中學習和理解系統的物理規律,并準確地推斷出未知參數的值.這使得MO-PINN-RK 成為了一種強大的工具,可在缺乏部分信息的情況下,通過結合物理先驗知識和觀測數據,推斷出系統的隱藏特性和未知參數,并生成準確的預測結果.
神經元中的非線性激活函數是神經網絡能夠具備強大表達能力和擬合性能的關鍵因素.神經網絡中常見的激活函數有ReLU,Tanh 和Sigmoid 等[29].在智能科學計算中,由于損失函數中嵌入了物理約束PDE,通常需要獲得神經網絡輸出關于輸入的導數信息.由于Tanh 激活函數具有無限可導的特點,文中所有的隱藏層均采用Tanh 激活函數.但是,Tanh 函數的輸出范圍僅為[-1,1]區間,為了不限制神經網絡的輸出,輸出層不設置激活函數.設定神經網絡共享隱藏層數量為10,并行隱藏層數量為2,每個隱藏層包含20 個神經元.神經網絡結構選擇全連接神經網絡,權重初始化方式采用Glorot 正態分布初始化.
MO-PINN-RK 的訓練過程是對PDE 不斷尋優求解的過程,訓練算法的好壞對神經網絡的性能起到了決定性的作用.本文將神經網絡訓練過程分為兩個階段,前期使用隨機梯度下降算法的變體Adam 算法,訓練10 000 代,后期則使用L-BFGSB 算法訓練,直至算法迭代收斂.Adam 等[30]結合AdaGrad 算法和RMSProp 算法的優點,并引入了動量的概念,不僅能夠自適應地調整學習率,而且還能借助動量加速收斂,逃離局部極小值.但是,Adam 算法對學習率的選擇非常敏感,過高的學習率會導致優化過程的不穩定.L-BFGS-B 算法[31]是一種基于擬牛頓方法的優化算法,通常比梯度下降等一階優化算法更高效,收斂速度更快,且不需要手動調整學習率.然而,L-BFGS-B 算法在非凸優化問題中容易陷入局部極小值.因此,本文訓練過程采用Adam 和L-BFGS-B 結合的方式,先利用Adam 盡可能地逼近全局最優點,再使用L-BFGS-B 加快神經網絡的收斂.文中的所有計算代碼均基于TensorFlow2.9 版本的Python 庫完成,并在GeForce RTX3090 顯卡上進行運算.
本小節將應用MO-PINN-RK 和PINN 兩種模型對二維不可壓縮流體的圓柱繞流問題進行流場預測研究,并對模型預測結果展開深入討論.當預測時間間隔 ?t為0.1 時,由MO-PINN-RK 和PINN 模型所獲得的速度云圖如圖4 所示.圖中,第1 列對應著基準解,第2 列上下圖分別為MO-PINN-RK 和PINN 模型的預測解,第3 列則展示了不同模型與基準解之間的絕對誤差.絕對誤差公式為
綜合來看,兩種模型的預測解與基準解之間具有很好的一致性,都能夠成功地捕獲到圓柱繞流中渦街脫落的形態和位置.根據圖4 中的絕對誤差分布圖可以觀察到,PINN 的預測誤差主要集中在圓柱下游的尾跡區域.造成該現象的原因是尾跡區域的流動特性比較復雜,常常涉及邊界層分離和旋渦的相互作用.這些因素增大了神經網絡的訓練難度,導致預測結果與基準解間的誤差增大.然而,相比于PINN,MO-PINN-RK 在整個求解域內都表現出更低的絕對誤差,包括尾跡區域.究其原因,這主要是由于MO-PINN-RK 中不僅嵌入了龍格庫塔方法,而且還使用了多輸出的神經網絡結構,可以同時捕獲系統的不同屬性,因此能夠更好地學習尾跡區域的流動特性,產生更精確的預測結果.
在較短的時間跨度內,流動的演變幅度較小,使得模型能夠獲得較好的預測精度.但是,隨著時間的推移,流動過程中的非線性特性會加劇系統的演變,給模型的預測任務帶來挑戰.為了對MO-PINN-RK的性能進行深入驗證,進一步推進模型預測的時間間隔.圖5 展示了當預測時間間隔 ?t為0.4 時,由MO-PINN-RK 和PINN 所獲得的速度云圖.從圖5(a)可以觀察到,PINN 的預測解已經出現了偏離基準解的趨勢,產生了較大的預測誤差.然而,MO-PINNRK 仍能具備精確捕捉圓柱尾跡流動特性的能力,展現出了出色的預測精度.在面對長時間跨度的流體動態預測任務時,由于龍格庫塔法的融入,MO-PINNRK 不僅可以實現對流體動態過程的精確模擬,而且還能根據初始觀測數據優化模型的預測能力.這種結合了數值方法和物理約束的深度學習框架使得MO-PINN-RK 在預測流體行為和捕捉流場特性方面表現出了更高的準確性.
為了從定量的角度比較MO-PINN-RK 和PINN 的預測準確性,本文采用模型預測解與基準解之間的L2相對誤差作為衡量標準,其計算公式如下所示

表1 MO-PINN-RK 和PINN-RK 流場預測值與基準值之間的L2 相對誤差Table 1 The L2 relative errors between the flow field predictions of MO-PINN-RK and PINN-RK and the benchmark solutions
根據表1 提供的數據可以得出,在各個預測時間間隔下,MO-PINN-RK 的預測誤差均比PINN 低.這一結果進一步驗證了MO-PINN-RK 在流場預測方面的優越性.在預測流向速度分布時,MO-PINNRK 最大L2相對誤差僅為0.026 2.相比之下,PINN的預測誤差約為MO-PINN-RK 的2 倍.在對橫向速度預測時,MO-PINN-RK 的L2相對誤差雖然略有升高,但仍將最大誤差控制在0.038 9.而PINN 的相對誤差則為0.128 7,約為MO-PINN-RK 模型的3 倍.這表明經過足夠的迭代次數,MO-PINN-RK 能夠逐漸學習真實系統的物理規律,更加有效地捕捉流體流動的時間演化和動態行為,具有較高的預測精度.
本小節將應用MO-PINN-RK 和PINN 兩種模型對圓柱繞流問題進行參數辨識研究,并對模型辨識結果展開深入討論,以評估不同模型的可行性和有效性.在參數辨識問題中,未知參數 λ1和 λ2是需要從給定的數據中推斷或估計的參數.未知參數 λ1和λ2并非以顯式的形式存在于神經網絡的輸出中,而是借助TensorFlow 庫的功能,以可訓練參數的形式嵌入到神經網絡中.
在模型的訓練初期,隨機假設未知參數的初始值.為了說明MO-PINN-RK 的性能,選擇不同的采樣時間間隔 ?t=0.1,0.2,0.3,0.4.圖6 為MO-PINNRK 與PINN 在不同采樣時間間隔下對N-S 方程中未知參數 λ1和 λ2的辨識結果.圖中,藍色虛線和紅色虛線分別表示 λ1和 λ2的真實值,藍色實線和紅色實線分別表示MO-PINN-RK 對 λ1和 λ2的辨識結果,藍色點線和紅色點線分別表示PINN 對 λ1和 λ2的辨識結果,綠色實點表示Adam 算法的結束位置和LBFGS 算法的起始位置.

圖6 MO-PINN-RK 和PINN 參數辨識結果與真實值對比Fig.6 Comparison between the parameter identification results of the MO-PINN-RK and PINN with the true values
整體上看,在較短時間間隔內,隨著迭代次數的不斷增加,不同模型的辨識結果逐漸趨向于真實值.但是,隨著采樣時間間隔的增加,PINN 的辨識結果開始逐漸偏離真實值,產生了較大的預測誤差.與之相比,MO-PINN-RK 的辨識結果一直具有較高的精度,不隨采樣時間間隔的增大而偏離真實值.這主要是因為MO-PINN-RK 具有多個神經網絡輸出層,可同時捕捉相互耦合的多變量信息,具有更強的描述復雜流動形態的能力.并且,龍格庫塔方法的嵌入使得該模型能夠更好地處理長時間跨度問題.相較于PINN,MO-PINN-RK 可以高效地從稀疏離散的觀測數據中學習潛在的物理規律,具有更好的適應性.
為了從定量的角度比較MO-PINN-RK 和PINN的辨識準確性,本文采用模型辨識值與真實值之間的相對誤差進行衡量,其計算公式如下
不同采樣時間間隔下,由不同模型獲得的辨識值與真實值的之間相對誤差如表2 所示.從表中可以看到,PINN 模型的相對誤差隨著采樣時間的增加而增大,且最大誤差達到了19.38%,大幅偏離了真實值.與之相比,MO-PINN-RK 能夠準確地辨識出未知參數 λ1和 λ2,且最大相對誤差保持在低于1.11%的水平.另外,可以觀察到,無論是對參數 λ1還是λ2的辨識,MO-PINN-RK 的相對誤差始終比PINN 的相對誤差低一個數量級.這一結果表明,MO-PINNRK 在參數辨識方面具有更好的性能,能夠從流體復雜的動態演化過程中推測出數學模型中的未知參數,對于推斷流體系統的未知屬性具有非常重要的意義.

表2 MO-PINN-RK 和PINN-RK 辨識參數和真實參數的相對誤差Table 2 The relative errors between the identified parameters by MO-PINN-RK,PINN-RK and the true values
針對PINN-RK 無法求解耦合PDE 系統的問題,本文提出了一種MO-PINN-RK.MO-PINN-RK 在原始PINN-RK 架構的基礎上設計了并行的神經網絡輸出層,通過采用不同輸出層近似不同物理量、共享隱藏層捕捉不同物理量之間耦合關系的方式,成功實現了在損失函數中嵌入多個PDE 并同時求解的目的.與PINN 相比,MO-PINN-RK 中嵌入了龍格庫塔法的數值求解方法,提高了神經網絡的求解精度和泛化性能.與PINN-RK 相比,MO-PINN-RK 增強了神經網絡的表達能力,實現了對耦合PDE系統的求解,將PINN-RK 的應用范圍從一維空間擴展到了多維空間域.
為驗證MO-PINN-RK 的有效性,本文選擇二維不可壓縮流體的圓柱繞流問題作為測試案例,分別進行了流場預測和參數辨識研究.測試結果表明,在流場預測問題中,定性上,MO-PINN-RK 的預測解與基準解完全吻合.定量上,MO-PINN-RK 的L2相對誤差保持在低于0.038 9 的水平,具有較高的準確性.在參數辨識問題中,定性上,MO-PINN-RK 的辨識值會隨著迭代次數的增加收斂于真實值,且收斂行為不受采樣時間間隔增大的影響.定量上,MO-PINNRK 辨識值與真實值之間的最大相對誤差僅為1.11%,擁有極高的辨識性能.因此,本文所提出的MOPINN-RK 作為一種新型的物理信息神經網絡架構,無論是在流場預測還是參數辨識方面都具有非常大的潛力.