999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數值模擬的工程設計中參數不確定性表征方法研究綜述

2024-01-20 08:25:20熊芬芬李澤賢劉宇夏侯唐凡
航空學報 2023年22期
關鍵詞:理論方法模型

熊芬芬,李澤賢,劉宇,夏侯唐凡

1.北京理工大學 宇航學院,北京 100081

2.電子科技大學 機械與電氣工程學院,成都 611731

為了縮短設計周期、降低開發成本、滿足產品不斷提升的性能需求和更新換代頻次,計算流體力學(Computational Fluid Dynamics,CFD)、結構有限元分析(Finite Element Analysis,FEA)等數值模擬技術正在成為科學研究和工程設計等許多領域內解決問題的主流方法[1]。在航空航天領域,CFD 和FEA 已分別成為氣動和結構分析設計中不可或缺的研究手段?!吨袊圃?025》指出,仿真技術對于發展和提高中國制造能力具有重要支撐作用,特別是2015 年12 月31 號國家出臺了智能制造標準體系建設指南,其中明確了要在制造生產過程中應用仿真技術[2]。

飛行器等復雜裝備的整個壽命周期都充滿了源于仿真建模和模擬、生產制造(如幾何尺寸)、工作環境(如載荷環境)、儀器監測(如測量誤差和信息處理)等的大量不確定性[3]。一般而言,根據不確定性屬性的不同,可以將不確定性分為隨機不確定性(Aleatory Uncertainty)、認知不確定性(Epistemic Uncertainty)或者是兩者兼而有之的混合不確定性[4]。其中,隨機不確定性源于物理現象中存在的固有隨機性,無法通過收集更多信息進行控制或減?。徽J知不確定性源于知識的缺乏、數據的不足,可通過知識增加、建模方法改進、數據搜集等達到減小甚至消除的目的。不確定性按照來源又可分為參數不確定性、模型不確定性和數據不確定性[5]。對于數值模擬,以廣泛用于飛行器空氣動力計算的CFD 仿真為例,不確定性一般可歸為模型形式不確定性、模型參數不確定性和模型數值離散不確定性[6]。模型形式不確定性屬于認知不確定性,一方面源于求解湍流流場時湍流模型的選擇,采用不同的假設構造的湍流模型會對數值模擬結果有較大影響[7];另一方面源于數值模擬建模所作的各種假設和簡化,使得仿真結果與試驗數據存在偏差。模型參數不確定性既包含攻角、雷諾數、壓力、流量等來流和邊界條件和制造誤差、工藝波動等影響幾何尺寸的隨機不確定性,也包含湍流模型封閉系數以及卡門數、壁面普朗特數等認知不確定性[8]。對這些不確定性進行表征時,由于數據匱乏會導致數據不確定性,這屬于認知不確定性。模型數值離散不確定性也屬于認知不確定性,其源于對控制方程及邊界條件離散化造成的截斷誤差和迭代誤差[9]。

一方面,這些不確定性必然會導致數值仿真的輸出響應也存在不可忽視的不確定性,且輸出極有可能對某些不確定性非常敏感,例如激波在翼型上表面的位置和激波后壓力對湍流模型封閉系數的變化非常敏感[10],嚴重影響CFD 結果的可信度,這對于具有高可靠性要求的航空航天裝備而言,極有可能引入潛在風險,因此開展優化設計前必須對數值模擬進行模型確認(Model Validation)。另一方面,這些不確定性必然會導致飛行器系統性能的波動,甚至導致設計失效,帶來災難性后果。例如NASA 的高超聲速飛行器X43-A 試驗失敗,究其原因是對氣動設計不確定性因素模擬不足[11]。因此,需要在飛行器等復雜裝備設計中開展不確定性下的優化設計(Design Optimization under Uncertainty),如穩健優化設計[12-13]和基于可靠性的優化設計[14-15],提升系統性能的同時確保系統的穩健和可靠。對數值模擬模型確認和不確定性下的優化設計,其關鍵皆為不確定性量化(Uncertainty Quantification,UQ),主要包括不確定性表征(Uncertainty Characterization)和不確定性傳播(Uncertainty Propagation,UP)2 個關鍵部分。圖1 對基于概率理論的UQ 進行了示意。

圖1 基于概率理論的不確定性量化示意Fig.1 Schematic of uncertainty quantification based on probability theory

如圖1 所示,不確定性表征是根據不確定性變量的數據(源于測量、理論或專家等)建立數學模型的過程,具體指:①指定不確定性的數學結構;②確定結構所需元素的數值。比如,隨機變量可建模為概率分布模型(見圖中隨機變量x1、x2、x3的實線概率密度曲線)。不確定性傳播包含正向和反向不確定性傳播,正向UP 研究在輸入不確定性的影響下,系統輸出(通常也稱為感興趣的量Quantity of Interest,QoI)的不確定性(圖1 中實線表示從輸入x=[x1,x2,x3]到輸出y的不確定性傳播過程);反向UP 研究根據y的觀測數據反向推理計算輸入不確定性(圖1 中虛線從輸出y反推輸入x的不確定性傳播過程),最終得到圖中隨機變量x1、x2、x3的虛線概率密度曲線,需在正向UP 的基礎上進行[16]。當然,不確定性表征不僅可以用于輸入不確定性變量,還可直接應用于系統的QoI。例如,對于CFD 數值模擬可以基于湍流模型系數、來流等不確定性表征的結果,進行正向UP 得到流場壓力場的不確定性,也可根據壓力場的測量數據,直接對其進行不確定性表征建模。此外,根據流場壓力場的測量數據,可利用反向UP 對湍流模型系數的不確定性表征模型進行修正。本文后續提及UP,若不作特殊說明皆指正向UP?;赒oI 不確定性量化的結果,可進行設計和決策,比如確定是否接受或有多大信心接受當前的數值仿真模型或設計方案。顯然,對不確定性進行合理的表征建模至關重要[17-18],它是實施UQ 的前提。

在對數值模擬模型形式不確定性的研究中,當考慮單個數值模擬模型時,基于該模型進行不確定性傳播。比如,CFD 中考慮湍流模型系數或雷諾應力的不確定性,比較UQ 結果與試驗數據來估計模型形式不確定度,形成了模型評價的假設檢驗統計量、貝葉斯因子、頻率指標、面積度量等諸多模型確認度量指標[19];當考慮多個數值模擬模型時,通過模型選擇或數據融合的方式對模型預測中的模型選擇不確定性進行量化,其中貝葉斯模型平均(Bayesian Model Averaging,BMA)是目前較為常用的方法。Chen 等[20]針對機械系統的疲勞裂紋問題,基于BMA 方法量化了模擬性能退化的維納過程模型、伽馬過程模型和逆高斯過程模型所引入的模型形式不確定性。Tang 等[21]基于證據理論對ZAERO 和NASTRAN 軟件所模擬的導彈舵面顫振仿真結果進行了融合,從數據融合的角度進行了模型形式(不同仿真平臺)的不確定性量化。由此可見,模型形式不確定性量化最終都歸結到單個模型的參數不確定性表征及傳播。

數值模擬中數值離散的不確定性主要指離散誤差的估計,Richardson 外推是較為常用的估計方法,它將數值離散不確定性表征為一個認知不確定性區間。Schaefer 等[5]基于Richardson 外推對NASA 提出的通用運輸機研究模型(CRM)的網格收斂誤差進行了估計,得到了其升阻力系數的認知不確定性區間。陳江濤等[22]同時考慮了數值離散不確定性和模型形式不確定性,提出了一種考慮數值離散誤差的湍流模型選擇不確定度量化方法,基于Richardson 外推計算了SA湍流模型和湍流k-ω模型真解的95%置信區間,然后將其作為認知不確定性通過二階概率框架給出了NACA0012 低速繞流和CHN-T1 跨聲速繞流中升阻力系數的概率分布上下限。對于基于數值模擬的工程設計,狹義上講,不確定性表征都可以歸為對參數的不確定性表征。因此本文主要綜述各種參數不確定性表征方法,以下提及的不確定性表征皆指參數不確定性表征。

目前關于不確定性傳播,國內外學者從不同角度開展了大量研究以及綜述性工作。在隨機不確定性傳播方面,產生了蒙特卡洛模擬[23]、混沌多項式[24]、隨機配點[25]、高斯數值積分[26]、多可信度不確定性傳播[27]等諸多方法,并應用在飛行器氣動系數[28]、火箭氣動載荷[29]、結構形變[30]、電阻抗成像[31]、CFD 數值模擬[32]等大量不確定度量化問題中。在認知不確定性傳播方面,產生了基于區間、概率盒(Probability-Box,p-box)、D-S(Dempster-Shafer)證據、模糊、可能性、粗糙集等理論的方法[33],分別應用于飛機結構[34]、翼型氣動特性[35]、屋頂結構形變特性[36]等諸多不確定度量化問題。關于混合不確定性傳播,大多將概率理論與區間分析、概率盒、模糊集、證據理論等其中一種認知不確定性量化方法相結合,形成外層處理認知不確定性、內層處理隨機不確定性的雙層嵌套抽樣混合不確定性傳播框架[37]。這些研究在進行不確定性傳播時,均假設不確定輸入數學模型已知,如正態、均勻分布或區間模型,例如氣動力系數不確定性量化中將馬赫數、迎角、箭體幾何外形等直接假設建模為正態分布[28]、將湍流模型封閉系數建模為均勻分布[38];氣動彈性不確定性量化中將高超聲速舵面熱不確定性建模為正態分布[29];結構不確定性量化中將楊氏模量、橫截面積、外部載荷不確定性建模為對數正態分布和極值分布[30]。如此假設未必合理,由此得到的不確定度量化結果對工程問題的參考價值有限,需要根據具體場景下不確定性變量信息對其建立合理的數學表征模型。Ferson 等[39]對美國Sandia 實驗室發起的認知不確定性研討會進行總結,指出不確定性表征是值得進一步研究的關鍵。相比不確定性傳播,不確定性表征方面的研究明顯要少,鮮有綜述性的研究工作報道。

本文面向基于數值模擬的工程設計,主要回顧國內外已經開展的不確定性表征工作,總結不確定性表征的基本內容和方法,并對表征后的不確定性傳播的基本思路進行簡要介紹,最后給出進一步開展不確定性表征研究的思考與建議。

1 不確定性表征概述

表征不確定性的信息來源主要包括:①真實或相似條件下的試驗測量數據;②理論模型生成的數據;③專家意見。在這些信息來源下,可將表征不確定性的信息源分為3 類[4]:①強統計信息,具有大量試驗或高可信理論數據,可足夠確信地構建不確定性變量的概率統計模型;②稀疏統計信息,很多情況下僅具有不確定性變量的少量試驗或高可信理論數據,無法構建確定的統計模型,否則構建的統計模型存在大量認知不確定性;③不精確信息,如專家判斷存在一個或多個具有上下界的區間,這多個區間可能來自不同專家或團隊。實際中,不確定變量的信息源往往是上述信息源的混合,比如某儀器的稀疏測量數據可能以區間形式存在,正態分布的均值可能位于某個區間。

不確定性表征需解決3 個關鍵問題,一是要從本質和來源上摸清不確定性的類型,包括隨機不確定性、認知不確定性以及兩者兼而有之的混合不確定性,這需要結合具體物理對象確定;二是要建立不確定性的數學模型,包括但不限于概率框架下的概率密度函數以及非概率框架下的廣義區間表達等,通常這需要根據不確定性的信息源決定采取何種建模方法;三是要獲取數學模型中的全部參數,如正態分布模型的均值、方差,或區間模型的上下界以及可信度等。

圖2 總結了目前主流的不確定性表征方法,其中隨機不確定性的概率表征方法發展相對較為成熟,但由于經典的概率建模和參數估計方法僅能處理不確定性源的信息形式為點數據且數據足夠多的情況,具有一定局限性。針對隨機不確定性以稀疏點數據和/或區間數據、區間數據形式存在的情況,也可認為由于數據不足而導致的認知不確定性,目前產生了處理稀疏點和/或區間數據的基于似然理論的表征方法[40]、概率分布混合加權的表征方法[41]、專門處理區間數據的概率表征方法[42]。對于認知不確定性表征,目前方法較多且研究較為獨立,其共同之處是無法直接根據不確定性源的信息形式進行建模,通常需要專家信息,比如證據理論需要給定不確定性變量的證據結構,模糊理論需要給定隸屬度函數。

圖2 不確定性表征方法Fig.2 Uncertainty characterization methods

表1 對不確定性表征方法的特點進行了分類整理,不失一般性,按照概率和非概率方法兩大類展開。概率表征方法均以經典概率統計為理論基礎,將不確定性變量建模為概率分布,其最大優勢是可便捷地應用于各類基于概率的不確定性傳播和優化設計理論和方法。非概率表征方法由于涉及新的理論體系,對于后續的不確定性傳播和設計,可能需要花費更多的精力進行人員培訓[43]。一些學者認為純概率方法可完全考慮各種形式的不確定性,但更多學者認為非概率表征方法在認知不確定性處理上更加合理[39]。根據表征不確定性的信息源所屬類別,可對不確定性進行分類,在此基礎上再進行表征,為此第3 節介紹了一種考慮隨機、稀疏和區間變量的不確定性分類準則及相應的不確定性建模方法。

表1 各種不確定性表征方法的特點Table 1 Characteristics of various uncertainty characterization methods

根據概率表征和非概率表征框架,第2 節介紹了經典的概率表征方法,第3、4、5 節則按照表征不確定性的不同信息源形式,分別介紹了處理點數據、稀疏點數據和/或區間數據、區間數據的不確定性表征方法。第6 節針對場變量介紹了常用的隨機場表征方法。第7 節介紹了處理認知不確定性的非概率表征方法。

2 基于經典概率統計的表征方法

概率統計法具有成熟的理論基礎,保證了它在處理隨機不確定性時的有效性。如果信息足夠估計變量的概率分布,則可通過經典概率統計法將隨機不確定性建模為隨機變量。這種隨機不確定性的概率分布表征方法目前已經在結構優化[44]、氣動分析[45-46]、電工電子[47]、核工業技術[48]、水利水電[49-50]、航空航天[51-52]等諸多領域得到廣泛應用。

2.1 參數估計

首先,根據經驗、先驗知識或專家意見,以及變量的不確定性特征及其所涉及的物理背景,確定隨機變量服從的分布(如均勻、高斯、泊松、對數正態等)。然后,基于試驗觀測數據或其他可用信息,采用矩估計(Moment Estimation)[53]、極大似然估計(Maximum Likelihood Estimation,MLE)[54]、貝葉斯估計(Bayesian Estimation)和最大后驗(Maximum A Posteriori,MAP)估計[55]等參數估計方法求得分布的參數(如正態分布的均值和標準差)?;诮浀涓怕式y計的不確定性表征方法最終都能根據點數據得到不確定性變量的概率分布。

張文生等[56]針對土質邊坡可靠度分析,將巖土參數中黏聚力和內摩擦角隨機變量表征為正態分布,利用矩估計方法估計了分布的均值和方差。Kim 等[57]針對懸臂梁撓度測量誤差的不確定性,采用極大似然估計方法估計假設的均勻分布和正態分布的分布參數,為考慮測量誤差時的觀測數據的不確定性表征提供了指導。張諾亞[58]基于貝葉斯估計獲得了煤礦地下電性分布模型,并開展了模型參數的不確性分析和可靠度評估。Edeling 等[59]在二維分離流和三維可壓縮流等高雷諾數流動問題計算中,采用最大后驗估計對CFD 仿真中使用的k-ε、k-ω、SA 湍流模型封閉系數進行了估計,以量化湍流模型的不確定性。

本節主要介紹最為常用的極大似然估計和貝葉斯估計。

2.1.1 極大似然估計

極大似然估計是一種利用已知的樣本信息反推最具有可能(最大概率)導致這些樣本結果出現的概率模型分布參數的估計方法,即“分布已定,參數未知”。對于連續型概率分布f(x;θ),其中x為隨機變量,θ為未知參數。從總體X中取出樣本容量為n的簡單樣本和其樣本觀測值分別為(X1,X2,…,Xn)和(x1,x2,…,xn),則樣本的似然函數(即聯合概率密度)為

極大似然估計就是給定樣本觀測值(x1,x2,…,xn)下,選取未知參數θ的估計值使得似然函數最大的過程。在樣本數量較大的情況下,概率連乘會導致數據下溢,產生較大數值計算誤差,由于似然函數及其對數函數在同一點處達到最大,通常對似然函數取對數進行求解。

極大似然估計基于經典概率統計理論,為獲得準確的參數估計結果,文獻[60]建議樣本數據量大于30。實際中待估計參數維數不同,對數據量的要求也會有所不同[61],但并未給出確切的參數維數和數據量間的定量關系。

2.1.2 貝葉斯估計

在數據量較少或比較稀疏的情況下,直接利用MLE 存在一定誤差,此時可利用貝葉斯估計方法,認為待估計參數也服從某種概率分布,已有數據只是在這種參數的分布下所產生的。該方法也被認為是一種可處理數據不足而導致的認知不確定性的有效方法。

在樣本觀測值x=(x1,x2,…,xn)下,待估計參數θ的條件概率密度為

式中:π(θ)為參數θ的先驗分布;f(x|θ)為總體X的條件分布;π(θ|x)為參數θ的后驗分布;分子項f(x|θ)π(θ)為參數和樣本的聯合分布,分母項∫θ f(x|θ)π(θ)dθ為樣本觀測值x的邊緣概率密度。

在貝葉斯估計中,若采用極大似然估計的思想,考慮后驗分布極大化而求解θ,則變成了最大后驗估計:

2.1.3 分布類型的選擇

上述參數估計方法的應用前提是概率分布類型已指定,并未給出如何判定選擇最為合適的分布類型的方法,實際中極有可能缺乏指定分布類型所需要的信息。此時,可基于不確定性變量的給定數據(觀測或理論)應用擬合優度檢驗(Goodness of Fit,GOF)或模型選擇方法來確定分布,給出接受或拒絕一個候選分布適合表示給定數據假設的結論。

最具代表性的擬合優度檢驗有Kolmogorov-Smirnov(K-S)、Anderson-Darling(A-D)和卡方(χ2)檢驗[62-64]。K-S 檢驗和A-D 檢驗均通過比較經驗數據分布與候選分布的累積分布函數(Cumulative Distribution Function,CDF)間的距離,來度量2 個分布間的差異程度,但A-D 檢驗將權重應用于尾端概率分布,這對那些要求尾端概率分布較為精確的情況比較有用。χ2檢驗則是直接比較數據頻率和候選分布的概率密度函數(Probability Density Function,PDF)之間的吻合程度。擬合優度檢驗為候選分布是否可表征給定數據提供了有效驗證手段,但是識別出的正確分布模型通常有多個,無法對各個模型的優劣排序,尤其當樣本數量較少時該問題廣泛存在。

模型選擇方法可有效解決上述問題,主要包括極大似然估計(MLE)、赤池信息準則(Akaike Information Criterion,AIC)、赤池信息修正準則(AICc)和貝葉斯信息準則(Bayesian Information Criterion,BIC))等[65-67]。其基本原理為:參考分布越接近不確定性變量的給定數據,對應的似然函數值越高,AIC 值、AICc 值和BIC 值的計算公式依次分別為

式中:Lmax為候選分布的似然函數最大值;k為候選分布的模型參數個數;n為樣本量。

MLE 方法僅計算候選分布似然函數最大值的負對數-ln(Lmax),通常認為三參數分布比一或二參數分布更適合,因此有時會錯誤地將三參數分布識別為正確分布。如式(4)所示,相比MLE,AIC 額外考慮了參數的數量,權衡估計模型復雜度和擬合數據優良性。

作為AIC 的修正版本,AICc 在信息損失計算中額外考慮了樣本量n,適用于小樣本下的模型選擇。BIC 又進一步考慮了參數個數的影響,相較于AIC 和AICc,BIC 所引入的與模型參數個數相關的懲罰項kln(n)所占比重更大,當樣本量較多時,可有效防止追求模型高精度所導致的模型復雜度過高。文獻[65-67]對3 種準則及其懲罰項和修正項的引入給出了詳細的理論推導。

Lim 等[68]采用AIC 準則建立了不確定變量的表征模型,對白車身及發動機車架進行了結構有限元仿真,開展了性能可靠度分析及基于可靠性的優化設計。Kang 等[69]比較了AIC、AICc 和BIC 3 種方法對多種概率分布類型識別的準確率,得出BIC 準則識別準確率最高。陳健等[70]在比較MLE、AIC 和BIC 時也得出了類似結論。此外,Kang 等還對K-S、A-D 和χ2檢驗在不確定性表征中的效果進行了比較,得出K-S 檢驗和A-D檢驗精度相當,但A-D 檢驗對于極值分布的識別正確率較低,而χ2檢驗在不確定性的樣本數據量較小時檢驗結果并不準確,因此K-S 檢驗被認為是相對較好的擬合優度檢驗方法。

Kang 等[69,71]提出了一種結合擬合優度檢驗和模型選擇的序列統計建模方法,首先通過擬合優度檢驗篩選掉不符合給定樣本數據的候選分布,然后應用模型選擇方法對接受的候選分布進行優劣排序。當擬合優度檢驗拒絕了全部可能的候選模型分布時,則利用核密度估計(Kernel Density Estimation,KDE)方法[72]獲得不確定性變量的概率密度分布。圖3[69]為Kang 等提出的序列統計建模方法的實施流程,圖中N和Ntot分別表示候選模型數量以及全部可能的模型數量。

圖3 序列統計建模方法[69]Fig.3 Sequential statistical modeling method[69]

Kang 等的研究表明,對于不同的分布類型和樣本數目,K-S 檢驗和BIC 方法的組合可獲得最高的估計精度。但是,由于擬合優度檢驗和模型選擇方法都需在給定數據較充足的情況下才可精確識別分布類型,所以Kang 等提出的方法適用條件為n>30。

2.2 非參數估計

參數估計需基于工程經驗或專家意見等信息對概率分布進行假設,非參數法無需提前假設參數的概率分布,可直接根據數據特征進行分布擬合,避免對概率分布模型的假定不當導致重大錯誤。本節將介紹常用的基于最大熵原理以及基于核密度的非參數估計方法。

2.2.1 最大熵原理

基于最大熵原理的方法通過求解以下優化問題得到連續型隨機變量x∈D的概率分布函數f(x):

式中:Mi為第i階統計矩。式中目標函數表示最大化信息熵[73],概率分布越準確則信息熵越大。對上式構造聯合約束條件的拉格朗日函數,通過求解拉格朗日乘子,最終可得f(x),完成不確定性表征。

黃乾坤等[74]圍繞基于Shannon 熵的最大熵原理,討論了不同約束條件下最大熵優化問題的一般形式,并對經典最大熵的不足給出了改進方法。陳雷等[75]針對航空發動機模擬轉子葉片,通過最大熵方法擬合了不同葉端定時傳感器布局下的測點振幅的概率密度函數,而后通過ANSYS 有限元分析開展了轉子葉片動應變重構不確定性量化。Chen 等[76]對模型自身不確定性、模型參數估計的不確定性以及整個模型的不確定性進行了分析,證實了最大熵分布在海洋波高極值計算中的優越性。在數據樣本量很小的情況下,樣本統計矩所能提供的信息不夠豐富和全面,基于最大熵原理的方法所得概率密度分布可能與實際存在較大偏差,為此呂文[77]提出了一種小樣本下采用秩來構造約束條件的改進最大熵方法。此外,最大熵方法涉及大量積分計算,積分區間會引入截斷誤差,且當統計矩最高階數較大時,會面臨求解困難、概率密度積分不為1 等問題,為此李昊燃[78]和劉鈺等[79]分別提出了基于轉換函數和密度核估計的改進最大熵方法。

2.2.2 核密度估計

假設有n個樣本點數據xi(1 ≤i≤n),傳統的核密度估計(KDE)方法求解概率密度函數公式為[72]

式中:K為核函數,常用于KDE 算法中的核函數有高斯核函數、三角核函數、Epanechnikov 核函數等[80];h為帶寬(或窗寬),其通過影響核函數中自變量的取值來控制每個樣本的相對權重,影響概率密度的光滑程度和估計精度,可根據最小化AMISE 準則和Silverman 經驗法則計算[81]。

單德山等[82]采用核密度估計分析了橋梁構件地震易損性,基于有限元仿真模型構建了橋梁結構構件地震易損性的核密度估計算法。Kang等[83]提出了一種有界數據的核密度估計算法,并對懸臂梁楊氏模量、水平和垂直方向載荷的區間數據進行了核密度估計,發現相較于原始KDE 方法的估計結果更為準確,尤其是樣本數據較少時。理論上,只要提供足夠多的樣本數據,KDE可收斂到任意形狀的概率密度函數,即使是在小樣本下也可得到概率密度函數的光滑連續估計[84]。但KDE 易出現邊界偏差,無法在邊界點附近給出良好的估計結果,且擬合的概率密度函數在高密度樣本區間過于平滑,缺乏局部適應性。針對該問題,繆鵬彬[85]提出了采用邊界核的自適應非參數核密度估計算法。趙鐵軍[86]對傳統KDE 方法進行了改進,將自適應核密度估計與基于偽數據的核密度估計相結合,將偽數據添加到邊界附近以修正偏差。

3 面向點數據的不確定性分類表征方法

針對隨機不確定性往往依賴測量樣本數據獲取統計規律的特點,開展面向點數據的不確定性表征建模,Kang 等[69]、Peng 等[41]以及魏驍[87]等學者在這方面作了探索性研究。上述已提到Kang等[69]的研究為如何從隨機不確定性多種可能的概率分布中確定最佳分布模型,提供了一條解決思路。但是,當不確定性參數的信息源較少時,單一的概率分布未必能合理表征不確定性。Peng等[41]在各種單一概率分布的基礎上引入多種概率分布的混合加權分布作為候選分布模型之一,建立了一種基于擬合優度檢驗的不確定性變量類型確定方法,對候選模型的擬合優良性給出了定量評價。但該方法采用的AD 檢驗并不適用于均勻分布,且給出的檢驗統計量和臨界值的計算公式僅適用于正態分布,無法應用于其他概率分布的檢驗。為此,我們對Peng 等[41]提出的不確定性分類方法進行了改進[88],采用K-S 檢驗來滿足檢驗均勻分布的需求,同時定義p值[89]作為擬合優良性的評價指標,使得檢驗適用于多種分布。

改進的不確定性分類方法將不確定性表征為以下3 種類型的變量,如圖4 所示。

圖4 隨機變量、稀疏變量、區間變量的表征示意Fig.4 Characterization of random variable,sparse variable and interval variable

1)隨機變量:數學模型為常見的單一概率分布。

2)稀疏變量:數學模型為多種分布組成的混合加權概率分布。

3)區間變量:數學模型為上下界表達的區間形式。

以下為面向點數據的不確定性表征方法的具體實施步驟。

步驟1判斷不確定性變量觀測樣本個數n,若n<ncv(臨界樣本數),則認為不宜擬合概率分布,直接將變量表征為區間變量;否則執行步驟2。

步驟2假設該不確定性變量為隨機變量,令變量依次滿足m種常見的概率分布,其概率密度函數分別為fi(x)(i=1,2,…,m)。對于不同的研究對象,可根據具體的物理背景選擇候選概率分布模型。

步驟3假設該不確定性變量為稀疏變量,令其概率分布為上述除均勻分布外其余m-1 種分布的加權和,其概率密度函數見式(9),根據赤池信息準則[90]為各個概率分布分配權重wi。為了降低模型復雜度,忽略權重小于0.1 的候選概率模型。

步驟 4確定上述分布的fi(x)(i=1,2,…,m)、fmix(x)以及概率分布函數F(x)?;贙-S 檢驗計算檢驗統計量Kn,并求解在顯著性水平α下的擬合優度(p值),關于p值的計算如下。

1)根據不確定性變量的觀測數據,得到其經驗概率分布函數Fn(x)。

2)計算KS 距離dKS,在經驗概率分布和假設概率分布2 條曲線相交和不相交2 種情況下,KS距離計算的如圖5 所示。

圖5 KS 距離Fig.5 KS distance

式中:當i=n時,有Fn(xn+1)=Fn(∞)=1;sup表示上確界。

3)由Kn的準確概率分布P(Kn≤dKS)求解p值,p值越大說明擬合程度越優。

式中:tkk的計算詳見文獻[91]。

步驟5比較擬合優度最大值pmax和顯著性水平α的大小,確定不確定性參數的最佳表征形式。若pmax≥α,pmax對應的分布類型為單一概率分布,不確定性變量被表征為隨機變量,pmax對應的分布類型為混合加權分布,則被表征為稀疏變量;若pmax<α,將該不確定性變量表征為區間變量。

不確定性分類表征能夠科學合理地表征不確定性變量的類型,并對分布與樣本數據之間的擬合優良性進行定量評價,混合加權分布的構建進一步豐富了候選模型庫,為隨機不確定性從多種可能的一般概率分布中確定最佳的分布模型給出了較為通用的解決方案。該表征方法適用于不確定性信息中僅包含點數據的情況,當點數據和區間數據同時存在時,方法應用受限;同時在候選模型擬合優度均較差的情況下,方法直接將不確定性表征為粗糙的區間變量,如何根據可用的樣本數據對區間模型進一步細化和優化也是后續研究需要解決的問題。

4 處理稀疏點和/或區間數據的似然表征方法

上述不確定性表征方法都僅能處理點數據,實際中受時間和經濟成本的限制,除了稀疏點數據,可用信息還可能以區間的形式存在。例如與儀器校準相關的不確定性或誤差以及試驗觀測數據的不確定性等,常用區間來描述。圖6 為某隨機變量X的不確定性信息為稀疏點數據和區間數據,存在3 個點數據{4.1,5.6,3.8}和3 個區間數據[3.5,4]、[3.9,4.1]和[5,6]。對此,產生了基于似然理論和基于加權分布的概率表征方法。

圖6 點數據和區間數據同時存在Fig.6 Point data and interval data exist at the same time

通??捎酶怕世碚撎幚睃c數據,而處理區間數據則常用區間理論,難以同時用這2 種理論來描述以區間和稀疏點數據存在的隨機變量。Sankararaman 和Mahadevan 針對以點數據和/或區間數據存在的隨機變量,提出了一種基于似然理論(Likelihood-Based)的方法[40](以下簡稱LBM),將信息不充足情況下的隨機變量統一用概率模型表征。在該方法的基礎上,他們進一步分別利用貝葉斯模型平均和貝葉斯假設檢驗對分布類型選擇導致的不確定性進行量化,進而可在后續的不確定性傳播中同時考慮輸入參數的隨機性、分布參數的不確定性、分布類型的不確定性[92]。張鵬等[93]將這種包含離散數據與區間的變量稱為稀疏混合不確定性變量,針對多種候選單一概率分布,分別利用Sankararaman 和Mahadevan[40]提出的LBM 獲取不確定性變量的概率密度函數,進一步根據貝葉斯信息準則確定最合適的概率分布類型。

基于LBM 的不確定性表征可分為參數法和非參數法,如圖7 所示。參數法需要提前指定不確定性變量的分布類型。然而,在很多情況下有效選擇分布類型可能非常困難,而且不同的分布類型假設將導致不同的不確定性表征結果。非參數法避免了對分布類型的假設,且由于不必對分布類型抽樣,可顯著降低不確定性表征的計算量。接下來將分別對LBM 的2 種實現方法進行介紹。

圖7 分布族(有參)和單個分布(無參)Fig.7 Family of distributions(parametric method)and individual distributions(nonparametric method)

4.1 LBM 的參數法

設隨機變量X存在m個稀疏點數據xi(i=1,2,…,m) 和n個區間數據[ai,bi] (i=1,2,…,n),且這些數據來源相互獨立。fX(x|P)表示X關于P的概率密度函數,P為所需要估計的參數。參數P的似然函數可表示為

不同于直接采用極大似然估計的方法,Sankararaman 和Mahadevan[40]通過全似然估計,利用貝葉斯定理得到分布參數P的概率密度函數。假設fP(P)表示參數P的聯合概率密度函數,選擇均勻先驗概率密度,則分布參數P的后驗分布為

根據fP(P)對P抽樣可得隨機變量X的一族PDF 曲線,導致后續不確定性傳播為雙層循環,計算量較大。為此,可進一步對分布參數P的不確定性積分從而得到隨機變量X的平均PDF。

Sankararaman 和Mahadevan[40]詳細給出了求解上式積分的方法。需要注意的是參數法需要提前假設隨機變量X的分布類型,但經過積分后所得隨機變量X的分布將發生改變,不再與假設相同。

4.2 LBM 的非參數法

非參數法直接基于已有的稀疏數據和/或區間數據,確定隨機變量X的最大、最小值邊界。然后在最大、最小值形成的區間中將X離散為有限個點qi(i=1,2,…,Q)。pi表示這些離散點上X的PDF 值,即fX(x=qi)=pi。根據這些離散點上的值,利用插值技術可得到其他點上對應的X的PDF 值。令p=(p1,p2,…,pQ),同理可將似然函數表示為

通過優化如下問題得到p:

Sankararaman 和Mahadevan[40]對PDF 插值的3 種方法——線性插值、樣條插值、高斯過程插值進行了詳細介紹和探討,認為高斯過程插值是最為通用的方法。

Peng 等[41]針對基于CFD 數值模擬的曲柄滑塊機構和熱交換器可靠度評估問題,采用LBM的參數法,完成了混合加權分布的不確定性表征[94-95]。魏驍[87]針對基于CFD 數值模擬的KCS船型優化設計,根據船舶測量設備記錄的吃水數據,同樣采用參數似然估計對吃水變量的不確定性進行了表征。Peng 等[96]又采用非參數法構建了源于稀疏采樣點和區間數據的高斯過程插值模型,提出了稀疏采樣點和區間數據多源數據融合方法。

4.3 基于最壞情況最大似然的方法

Zaman 等[97]指出,Sankararaman 和Mahadevan 提出的基于似然理論的不確定性表征方法[40]需要利用貝葉斯更新和積分來獲取隨機變量的分布,過程較為繁瑣,且所得隨機變量的分布類型不再與假設分布相同。而且,當所有區間數據均有共同重疊部分時,該方法給出的方差(二階統計矩)的最大似然估計為零,不再適用,Zaman等[42]認為此時Sankararaman 和Mahadevan[40]提出的方法低估了不確定性。為此,Zaman 等[97]基于似然理論,提出了一種基于最壞情況最大似然估計(Worst-Case Maximum Likelihood Estimation,WMLE)的方法,基于此建立了穩健優化模型,并將其應用于兩級入軌飛行器穩健優化問題,對其中的分離飛行軌跡角和長細比進行了不確定性表征[97]。該方法同樣可以處理隨機變量以稀疏點和/或區間存在的混合數據,也適用于任何類型的多區間數據,即非重疊、重疊以及非重疊和重疊組合的混合區間。

如式(17)和式(18)所示,對于m個稀疏點數據和n個區間數據,基于最壞情況最大似然的方法以外層和內層的2 層嵌套優化來估計分布參數,內層在固定稀疏點數據取值的情況下,對區間數據所有可能取值進行組合計算似然函數值,找到使似然函數最小的區間變量所取的數據值,也就是所謂最壞情況,即區間數據的不確定性所導致的似然下限;外層再通過最大化似然函數,估計分布參數,找到不確定性變量最優的分布參數p。

式中:p為分布參數;x為點數據和區間數據;xlow、xup分別為區間數據的下限和上限。

似然函數值代表概率分布支持現有樣本數據的好壞程度,而對于區間數據,觀測樣本不再是固定的一組值,而是各個區間上所有可能取值的一系列組合。Zaman 等[42]通過搜尋使似然函數最小的這些區間上形成的某組取值,得到概率分布擬合的最壞情況,在該最壞情況下再通過最大化似然函數值來估計參數p的值,這就是基于最壞情況的最大似然的內涵。

上述已經提及,LBM 不適用于所有區間數據均有共同重疊部分的特殊情況,而且無法在僅有一個區間數據的情況下進行不確定性表征,因為此時無論什么形式的概率分布,在該區間上的似然函數值都為1。對此,Zaman 等提出了一種專門應對區間數據的概率表征方法[42]。

當不確定性變量以區間和稀疏點數據混合的形式存在時,除了上述多種基于似然理論的表征方法以外,也有研究直接認定該變量為第3 節不確定性分類中所提到的稀疏變量[41,96],將其建模為多種單一概率分布混合加權和的形式,見式(9)。

5 處理區間數據的概率表征方法

實際上,不確定性變量的不確定信息源可能為單個或多個區間,多個區間為互不重疊或有重疊的區間。針對單個區間的情況,過去較為常用的做法是直接將區間數據形式的不確定性變量表征為該區間上的均勻分布,相當于認為變量在區間上任意位置出現的可能性是相等的,事實上變量會在區間上的哪個位置出現并不知道,很多研究也指出該處理方式并非合理[98-99]。此外,對于僅存在一個區間信息的不確定性表征問題,上一節中介紹的基于似然理論的方法無法適用。為此,Zaman 等提出了一種專門應對區間數據的概率表征方法[42],該方法針對單個區間數據、多個互不重疊或有重疊的區間數據的情況,分別給出了統計矩邊界計算以及分布擬合的解決辦法。

首先建立單個區間的前四階統計矩的計算方法,在區間上下界的約束范圍內進行抽樣,并對每個樣本點分配概率質量函數(PMF)值,計算各階中心距E(xk)。前四階統計矩為

不同的概率質量分配方式對應著前四階統計矩的無數種可能組合,通過優化即可估計單個區間數據的前四階統計矩的上下界,找到使單個區間數據的矩最小或最大的區間端點的PMF 值:

Zaman 等[42]研究發現,對于單個區間數據的各階統計矩的最小值和最大值,PMF 只集中在區間的2 個端點。單個區間數據的統計矩邊界隨區間下端點處PMF 變化的估計結果曲線,如圖8 所示[42]。從圖8 中可以看出,當2 個端點的PMF 均為0.5 時,二階統計矩達到最大值;對于三階統計矩,估計結果曲線呈對稱;對于四階統計矩,曲線呈雙峰形狀。

圖8 單個區間數據的統計矩邊界估計[42]Fig.8 Boundary estimation of statistical moments for single interval data[42]

Zaman 等[42]將單個區間的前四階統計矩的計算方法擴展到適用于多個重疊或非重疊區間數據的二階、三階和四階統計邊界的優化,建立了適用于單個、多個區間數據的統計矩邊界計算方法,如式(21)~式(23)所示:

式中:n為區間個數;ai、bi分別表示多個區間數據的下上界端點;xi為在區間中抽取的樣本點,即ai≤xi≤bi且i=1,2,…,n。

得到統計矩上下邊界后,作者認為每個邊界內的各階統計矩均服從均勻分布,進行抽樣,每一組前四階統計矩的組合都能擬合出有界約翰遜分布,通過大量抽樣或基于優化的方式得到所有可能的有界約翰遜分布的分布包絡,形成Jonson 概率盒,完成對區間數據的概率表征。圖9[42]針對式(24)(多個非重疊區間)和式(25)(多個重疊區間)給出的2 組區間數據,分別展示了所得的Jonson 概率盒,圖中粗實線為Jonson 概率盒,階梯狀細實線為數據的經驗概率盒,細點線族為前4 階統計矩的每一組可能組合對應的有界約翰遜分布曲線族。

圖9 Jonson 概率盒[42]Fig.9 Jonson p-box[42]

6 隨機場表征方法

上述介紹的都是關于單個不確定性參數的表征方法。由于不確定性參數的分散性,不確定性可能隨空間的變化而波動,比如隨機有限元中的力學空間可變材料特性為輸入隨機場[100]以及CFD 中雷諾應力的輸入隨機場[16],此時單個不確定性參數已無法完整描述整個結構性能的分布。如何準確地描述不確定性參數隨空間位置變化的特性,是建立不確定性模型重要的考量。隨機場是處理具有空間變異性的不確定性參數的一種表征模型,是解決參數空間分散問題的重要手段。

隨機場在其場域內的每個位置均為隨機變量,即包含無限個空間相關的隨機變量。處理隨機場問題要通過點離散、平均離散或級數展開法等離散方法[101]將連續隨機場離散為若干個相互獨立的隨機變量。級數展開法中的Karhunen-Loève(K-L)展開是處理隨機場實現維度縮減較為有效的方法[102]。以下對較為常用的K-L 方法進行簡要介紹。

設H(x,ω)表示一個隨機場,其中x是有界域D ?Rd(d∈{1,2,3})中的空間變量,代表一維/二維/三維空間位置坐標;ω為概率空間中的隨機事件。假設隨機場H(x,ω)平方可積,具有均值μ、標準差σ和協方差矩陣CH(x,x′),x和x′為場內兩點的空間位置坐標??墒褂肒-L 展開將H(x,ω)進行如下離散:

式中:μ和分別為隨機場的確定性部分和隨機部分;n為K-L 截斷階數(級數展開項數);λi和φi(x)為隨機場協方差矩陣CH(x,x′)的特征值和相應的特征函數,滿足

隨機場表征的核心是如何進行隨機場離散,即確定均值μ、標準差σ、協方差矩陣CH(x,x′)的特征值和特征函數,本質上仍然是參數的不確定性表征。不確定性參數μ和σ可基于工程經驗給出,也可通過試驗測量數據的參數估計得出,CH(x,x′)定義在規則幾何空間域上,與場內兩點的相關距離有關,而這種相關距離由相關函數體現,常用的相關函數有高斯型、指數型、三角型、指數余弦型、二階自回歸型等[103]。蔣水華對這幾種相關函數下的隨機場進行了研究,發現高斯型生成隨機場連續性較好、效率較高[104],采用高斯型相關函數計算協方差矩陣的公式為

式中:1 ≤i,j≤n;δk為有界空間域D 的相關距離。

通過上述步驟,將輸入隨機場離散為了一系列有限個不相關、零均值、單位方差的隨機變量ξi(ω),如果隨機場H(x,ω)是高斯隨機場,則ξi(ω)形成一組獨立的標準高斯隨機變量,實現對隨機場的不確定性表征,在此基礎上就可以進行不確定性傳播。

賈超等[105]在地下水力學滲流耦合過程的數值模擬中,考慮到滲透系數作為隨機變量的空間變異性,將其不確定性表征為隨機場,并根據庫區鉆孔水位觀測資料及庫區外圍水文地質調查資料確定了隨機場模型參數,對地下洞室涌水量進行了預測。Gravanis 等[106]建立了表征巖石邊坡穩定問題中巖石材料屬性的二維隨機場模型,探討了巖石材料屬性的空間變異性對巖石邊坡失效概率的影響。牛燚煒等[107]在此基礎上提出了三維隨機場的建立方法,并把底面摩擦系數和粘聚力視為高斯隨機變量,分析了巖石邊坡的三維穩定性問題。Feng 等[108]采用均勻隨機場表征了各有限元單元彈性模量的不確定性,研究了簡支梁和層流板的動力學特性。

7 非概率表征方法

上述不確定性表征方法在建模中主要按照不確定性變量存在的數據形式及數量進行不確定性分類和建模。若將不確定性分為隨機和認知兩大類,非概率表征方法則為認知不確定性的表征提供了有效建模手段。非概率表征方法往往需要基于專家信息去建立不確定性表征的數學模型,基于不同的數學理論基礎形成了如證據理論、區間理論、模糊理論以及凸模型等眾多非概率表征方法,呈現出“百花齊放”的局面。

7.1 區間理論

對于許多實際問題,獲得不確定參數可能的取值范圍要比獲取精確概率分布容易得多。當認知水平有限,只清楚參數位于哪個區間,但是不清楚在區間內哪個部分或位置取值的可信度更高時(參數的真值可能取區間中的任意一個值,沒有證據或信息表明區間內的任一值比其他值更有可能),可采用區間模型對該參數進行不確定性建模。區間(Interval)模型一般定義為[109]

在區間數學方法中,不確定參數被認為是“未知但有界”,每個不確定性參數都有上限和下限,由一個區間描述,而不具有概率形式。區間AI包含了不確定性參數所有可能的結果,可以包含參數的所有不確定性信息,其中區間中點Ac=(AL+AU)/2 是區間表達的確定性部分,區間半徑Ar=(AU-AL)/2 和[-Ar,Ar]構成了區間表達的不確定性部分。區間的不確定性水平γ由區間半徑與區間中點比值確定,即γ=Ar/Ac。當不確定性輸入包含多個參數時,每個參數對應一個區間數AI,各個區間數組合形成區間向量,對應了不確定性問題的區間模型。

將認知不確定性表征為區間的方式在工程機械、金融經濟、環境科學等領域都得到了諸多應用[110-112]。Wong 等[113]采用一階泰勒展開對損傷結構前后的剛度參數不確定性進行了區間表征,開展了不確定性下的結構損傷判定。劉剛等[114]采用區間數對風力發電系統出力的不確定性進行描述與分析,建立了風電注入功率不確定性的配電網三相區間潮流模擬模型。

基于區間理論的非概率表征方法只需給出確定的上下邊界,很大程度降低了對原始數據的要求[115]。區間表征包含了不確定性所有可能出現的情況,經過區間分析后得到的輸出響應的區間可能要遠大于實際區間,存在“區間擴張”現象[116],失去工程參考價值。

7.2 概率盒理論

20 世紀90 年代,Williamson 和Downs 在累積分布函數的基礎上引入了區間型邊界[117],稱之為概率盒(p-box),也稱p盒。概率盒定義為一組包含不確定性變量所有可能的累積分布函數曲線的上下邊界或概率包絡,可以表示為

如圖10 所示[118],概率盒同時適用于隨機、認知以及混合不確定性的表征。對于隨機不確定性以及單一區間認知不確定性的表征很容易理解,當不確定性變量以多個區間數據存在時,文獻[119]提出了“經驗概率盒”的概念,定義為給定區間數據集的所有可能的經驗分布的集合。由于缺乏對區間數據可信度的分配,經驗概率盒認為每個區間數據都是等可能的,因此如果有N個區間數據的話,經驗概率盒是2 條具有1/N的恒定垂直步長的遞增函數形式的階梯曲線所構成的不確定區域。圖11 和圖12 分別展示了文獻[119]針對6 個非重疊區間和9 個重疊區間2 種情況下的區間數據集以及相應的經驗概率盒,可見每個數據點處的階梯高度相等,反映了每個區間均被同等加權的假設。

圖10 各種形式下的概率盒[118]Fig.10 p-box in various forms[118]

圖11 非重疊(左)/重疊(右)區間數據集Fig.11 Non-overlapping(left)/overlapping(right)interval datasets

圖12 非重疊(左)/重疊(右)區間數據集的經驗概率盒Fig.12 Empirical p-box for non-overlapping(left)/overlapping(right)interval datasets

在某些參數的概率分布類型已知,但其分布參數卻在一定范圍波動的情況下,隨機不確定性和認知不確定性耦合在同一個變量中,變量表現出混合不確定性,其數學模型為一族概率分布所形成的概率包絡,即給定區間集上所有可能的概率分布的集合,為典型的概率盒。式(31)和式(32)分別以正態分布和均勻分布為例,給出了2 個混合不確定性變量x1和x2的數學模型。如圖13所示,隨機生成μ以及a和b的80 組值,繪制了變量x1和x2的CDF 函數曲線族。

圖13 混合不確定性的概率盒表征Fig.13 Characterization p-box-based of mixed uncertainty

概率盒還分為參數化概率盒和非參數化概率盒。參數化概率盒由一族同類型的累積分布函數組成,例如上述所舉的混合不確定性表征實例就是典型的參數化概率盒;而非參數化概率盒由邊界分布包絡的不同類型CDF 曲線組成,其包絡的分布函數的形式任意,并不局限于經典的分布函數類型[120]。Zhu 等[121]將汽車客艙復合材料的楊氏模量和密度表征為參數化概率盒,對聲壓振幅響應進行了不確定性量化。吳沐宸等[120]針對NACA0012 翼型繞流CFD 模擬的不確定性量化問題,根據來流和湍流模型系數的邊界分布及其取值范圍指定了非參數概率盒變量。

概率盒理論作為一種區間和概率的混合模型,兼顧了區間和概率的特性,現有的區間、概率分布和證據結構都可以轉化為概率盒形式,同時適用于隨機、認知以及混合不確定性的表征,是一種相對較為通用的不確定性表征方法。但概率盒表征無法直接對來自多個渠道或專家的信息進行融合,證據理論則提供了解決方案。

7.3 證據理論

證據理論起源于1967 Dempster 提出的上下概率理論,他的學生Shafer 對其進行了發展和完善[122]。證據理論通過辨識框架(Frame of Discernment,FD)、基本可信度分配(Basic Probability Assignment,BPA)、信任函數(Belief Function,Bel)和似然函數(Plausibility Function,Pl)的基本概念構成了一個不確定性建模架構。

證據理論下證據變量是表征認知不確定性的最基本變量,證據變量需給定變量的區間描述(通常稱為焦元)和相應的BPA(或概率權值),BPA 往往根據工程經驗或專家預測確定。以Ai和m(Ai)(i=1,2,…,n)分別表示同一個識別框架上的n個焦元及其BPA。例如證據變量x可以取區間[0,3]上的任意值,但取值落在不同區間[0,1]、[1,2]和[2,3]上的概率不同,分別是0.1、0.6 和0.3,一共有3 個焦元,其對應的BPA 分別為m(x(1))=0.1,m(x(2))=0.6,m(x(3))=0.3。

基于專家意見、仿真數據、測量結果等手段給出的證據是一個非常寬泛的概念,并且各條證據之間相互獨立,因此證據理論的基本可信度分配相較于概率滿足更弱的公理。根據證據的數學表現形式,基本可信度分配主要有3 種類型:貝葉斯結構(概率結構)、一致性結構(嵌套結構)和一般性結構,如圖14 所示[123]。在貝葉斯結構中,辨識框架的每個焦元都會被賦予BPA;在一致性結構中,賦予BPA 的焦元之間有著相互包含的關系;一般性結構是證據最常見的一種形式,顧名思義,BPA 的分配具有一般性和任意性,焦元之間可能存在獨立、相交、嵌套等多種關系。形成哪種BPA 結構取決于可用的證據信息。

圖14 3 種常見的BPA 結構[123]Fig.14 Three common BPA structures[123]

同一個變量的認知不確定性信息可能來自于不同的專家,而不同專家給出的變量區間描述和相應的概率取值往往不同,在證據理論下認為其為多源信息變量,可以按照Dempster 證據合成法則進行多源信息融合,轉化為以區間和概率權值描述的證據變量[124],從而實現多源信息的證據表征。

式中:Bi和Cj分別是來自2 條信息源的證據命題;Ak為合成后的命題;K為沖突系數,表示不同專家給出的證據間的沖突程度,K越大則沖突程度越大。

當存在多個信息源的證據時,需要證據兩兩之間依次融合,對N條證據重復進行N-1 次操作即可得到最終的融合結果。Dempster 證據合成法則是最經典的證據合成規則,但其不適用于高沖突的證據,因此眾多學者又提出了一些改進的證據合成規則,最具代表性的是Yager[125]和Inagakill[126]提出的證據合成公式,它將證據中的沖突部分和未知部分都重新進行了分配,引入比例系數來決定分配的權重。

證據理論使用信任函數Bel 和似然函數Pl 作為不確定性度量的下界和上界。Bel 定義為完全支持命題A成立的所有子集ξ的BPA 加和,Pl 則定義為完全以及部分支持命題A成立的所有子集ξ的BPA 加和。圖15 表示信任函數、似然函數、不確定性三者之間的關系,Bel(A)和Pl(A)2 個測度之間的間隔度量了不確定性。

圖15 證據理論下的不確定性區間Fig.15 Uncertainty interval based on evidence theory

類似概率理論中的累積概率分布函數(CDF),在證據理論中定義累積信任函數(Cumulative Belief Function,CBF)和累積似然函數(Cumulative Plausibility Function,CPF)分別為Bel 和Pl 構成的概率邊界的點集,設不確定性變量x的取值空間為D,有

式中:Θ為不確定性變量x的辨識框架;D為取值空間。

姜潮等[127]在研究汽車側面碰撞的結構可靠性分析問題時,考慮了某型轎車門梁和B 柱加強板的厚度和材料屈服極限的認知不確定性,通過證據理論進行表征。類似地,范松等[128]在汽車正面碰撞的輕量化設計中,給出了保險杠厚度以及外板厚度等幾何認知不確定性的貝葉斯BPA 結構,進行了證據理論下基于有限元仿真的可靠性優化。除了可以直接表征認知不確定性,證據理論也能實現對隨機不確定性的表征,胡盛勇等[129]和Shah 等[35]分別將隨機不確定變量的概率分布進行離散,得到區間+可信度形式的證據結構,從而在證據理論下進行隨機和認知不確定性的統一量化,分別實現了某測試系統的穩健優化設計和RAE 2822 翼型的氣動特性分析。

CBF 和CPF 分別是不確定性變量x概率分布的下界與上界,這與上一節中基于概率盒理論的不確定性表征是相通的。文獻[130]和[131]也指出,Dempster-Shafer 結構形成的CBF 和CPF 與概率盒二者等價。FULVIO 提出通過平均離散法或外離散法[132],也可將以概率包絡表示的概率盒變量轉化為證據結構,將概率盒上下邊界的縱向值域[0,1]等離散化為n個子區間,則相應的焦元和BPA 可表示為

基本可信度分配不必滿足概率可加性和單調性,因此證據理論滿足比概率理論更弱的公理,使得證據理論具備直接表達知識或信息缺乏造成的“不確定”和“不知道”的能力。同時,證據理論中的證據合成公式可以綜合不同專家或數據源的知識或數據,能夠處理不確定信息、不完備信息、不可靠信息甚至沖突信息,這是證據理論的顯著優勢。但證據理論要求各條證據之間相互獨立,有時這不易滿足;并且當變量維數較高時,通過證據理論對不確定性進行傳播,焦元上的極值分析計算面臨著嚴重的“維數災難”。

7.4 模糊理論

模糊理論[133]由Zadeh 教授首次提出。一個經典集合清楚地區分了集合元素和非集合元素,模糊集可看作經典集合的擴展,通過引入隸屬度函數來表示域內元素隸屬于模糊集的程度,將普通集合的特征函數從{0,1}推廣到閉區間[0,1],得到了模糊集合的定義為[134]

p(x)的大小反映了元素x對集合X的隸屬程度,p(x)的值越接近1,說明x隸屬于X的程度更高。由上述可知,隸屬度函數是常規實數的一般化,隸屬度函數不單獨引用一個值,而是引用一組可能的值,其中每個可能的值都有自己的權重,其范圍為0~1。模糊集合中的每個元素對模糊集合的隸屬程度都需要通過隸屬度函數來刻畫,因此正確合理地建立隸屬度函數是表達該模糊集合模糊度和模糊性的關鍵[135]。常用的隸屬度函數的類型主要有高斯型、梯形型和三角型等,關于模糊變量的隸屬度函數的確定方法可以參考Medasani 和Kim 等的相關研究[136]。在各種形狀的隸屬度函數中,三角模糊數(TFN)最流行,其隸屬度函數為

式中:a和c分別用于確定三角隸屬度函數左右邊界;b確定頂峰位置。

如圖16 所示,三角隸屬度函數的縱軸表示隸屬度函數p(x)的取值,α∈[0,1]表示α截集水平,通過特定的隸屬度α可以將輸入變量截成一系列水平截集,水平截集定義為

圖16 三角隸屬函數多水平截集示意Fig.16 Schematic of multi-level cut-sets for triangular membership function

當確定了隸屬度函數的類型和參數,即完成了基于模糊理論的不確定性表征,然后在[0,1]上生成不同的截集水平,后續的不確定性傳播則相當于一系列的區間分析。徐靜等[137]用模糊集概念表征洪水過程模擬中雨量量級的不確定性,運用遺傳算法對時段雨量在時間上進行隨機解集,并通過在各子流域上采用不同的時間解集模式以同時考慮降雨時程分配和空間分布的不確定性。Mohammadi 等[138]深入研究含能源集線器的電-氣聯合系統優化調度問題,在計及負荷和風電出力的模糊不確定性的基礎,采用梯形隸屬度函數建立了預測電價的模糊模型。

不同于經典集合表達的清晰概念,模糊理論通過隸屬度函數對模糊現象進行科學描述,使得類似“年輕”“多數”這樣的模糊定性問題定量化。隸屬度函數的確定類似經典概率統計里分布類型的假設,雖然目前對隸屬度函數如何確定有了一些相關研究,但總體來說,仍然相對依賴主觀而缺少客觀的標準或方法,這也直接影響了基于模糊理論對不確定性表征和傳播的準確性。

7.5 凸模型

20 世紀90 年代初,Ben Haim 和Elishakoff[139]提出了處理不確定性的非概率凸模型方法,將參數的不確定性表征為一個凸集合,不像概率表征需要其精確的概率分布,凸模型表征通過較少的樣本即可獲得不確定參數的邊界,因此其在很多復雜工程問題的不確定性分析中展現出很強的適用性。在現有非概率凸模型不確定性表征中,區間模型和橢球凸模型的使用最為廣泛。在此基礎上,近年來還出現了平行多面體模型、一般多面體凸集模型和超參數凸模型等新型的凸集模型[140-143]。

構造凸模型時只需要確定不確定性參數的邊界,而無需考慮內部的概率分布,因此在樣本數量有限情況下的不確定性表征建模優勢明顯[144]。上述提到的區間模型僅通過上下邊界描述單個變量的波動,假定所有的不確定參數之間相互獨立,其不確定域為超立方體,相關性的忽略使得整個不確定區域和問題解區間變大,導致計算結果精度下降。橢球凸模型將參數不確定性表征為多維橢球,通過橢球的大小和形狀描述不確定性的大小以及變量的相關程度[145],能夠很好地處理各不確定參數之間相關的問題。圖17為考慮3 個不確定性參數的區間模型和橢球凸模型,可以直觀地看出,區間模型不考慮不確定參數的相關性,參數之間相互獨立;橢球凸模型考慮參數的相關性,并且邊界光滑可導;橢球凸模型避免了一些極端的不確定性參數組合情況的出現,比如出現在三維區間模型角落附近的不確定性參數組合[146]。

圖17 考慮3 個不確定參數的區間模型和橢球凸模型Fig.17 Interval model and ellipsoid convex model considering three uncertain parameters

對任意有界不確定參數x=[x1,x2,…,xn]T,有,橢球凸模型可表示為[147]

已知xi不確定性邊界的情況下,基于經驗通常取為不確定性的默認值或名義值,可用區間中值替代,ei則為區間邊界半徑。在已有少量數據樣本可用的情況下,還可以采用最小體積橢球法或NATAF 法確定最佳的橢球凸模型參數,關于該方法的具體原理可參考文獻[145]和[148]。

Zhu 等[148]提出了一種基于坐標系旋轉變換的橢球模型構造方法,該方法遍歷基于樣本的橢球主軸組合,以此尋找包絡樣本的最小體積橢球。Jiang 等[145]提出了不確定性多維橢球體的有效建模方法,并建立了非概率凸模型的相關分析技術。Bai 等[149]提出了基于非概率可靠性分析的響應面法,高效地構造了多維橢球體來表征不確定性參數。Kang 等[150]系統地研究構建了在給定一組樣本數據的情況下構造最小體積橢球凸模型的數學公式,很好地表征了參數認知不確定性,并展示了它在現有的有界不確定結構非概率可靠性分析和優化設計中的應用。邱志平等提出了多種能高效求解結構在凸模型不確定域上的響應邊界的快速算法,形成了眾多的研究成果[151-153]。

目前多數文獻研究中的橢球模型仍然是基于經驗和假設,但對于基于試驗數據樣本建立橢球模型的研究也逐漸為學術界所關注的重點,使得基于橢球凸模型的參數認知不確定性表征理論也日趨完備。

7.6 不確定理論

為了表征和量化工程實踐中廣泛存在的隨機和認知不確定性,國內外學者進行了很多嘗試和研究,發展了上述一些相對比較成熟的理論和方法。清華大學劉寶碇教授近20 年來開創了一種新的研究不確定現象的公理化數學分支,稱為不確定理論(Uncertainty Theory),并致力于不確定理論的研究、應用和推廣。2007 年德國Springer 出版的《Uncertainty Theory》一書標志著這一理論的正式提出[154],劉寶碇教授認為:“事件發生的頻率已知稱為隨機,否則稱為不確定”,例如擲硬幣正面朝上的頻率已知,因此是隨機的;墜落的蛋糕奶油哪一面著地的頻率未知,因此是不確定的。又或,當沒有足夠樣本來估計概率分布時,需要依靠專家的主觀信度去評估事件發生的可能性,不確定理論中提出的不確定測度(即信度)成為了解決工具。因此類似于研究隨機現象的概率理論,書中提到不確定理論是研究不確定現象的公理化數學系統。

劉寶碇教授發表的多項關于不確定理論的研究成果中,討論了“不確定理論是什么”“為什么要用不確定理論而不是概率理論”“隨機性和模糊性以及不確定之間的關系”等關鍵問題,給出了不確定理論關于規范性、單調性、對偶性、次可加性的4 條基本公理,定義了不確定空間和變量、不確定測度和分布以及不確定的數學特征、運算法則、基本性質等等,并派生出了不確定統計、不確定規劃、不確定過程、不確定集、不確定微分方程、不確定金融等數學分支和研究領域。如圖18 所示[155],劉寶碇教授認為,不確定理論是建立在概率論、可信性理論、信賴性理論3 個公理化體系基礎上的數學理論,廣義上還包括圖中所列的模糊隨機理論、隨機模糊理論等,即機會理論[156]。

圖18 不確定理論樹形圖[155]Fig.18 Tree chart of uncertainty theory[155]

《Uncertainty Theory》在定義不確定測度(即信度)時提到:不確定測度取決于個人對事件的認識,隨著認識狀態的變化,不確定測度也會發生變化,因此不確定測度是不確定理論能夠表征認知不確定性的關鍵。為了在實踐中應用不確定理論,首先根據不確定測度必須生成不確定分布函數。不確定變量ξ的不確定分布Φ定義為實數集上的函數,對于任意的實數x:

式中:M為件ξ≤x發生的不確定測度。

有了不確定分布的概念,即可通過不確定理論對不確定性進行表征。不確定理論定義了3 種不確定變量及其分布,分別為線性不確定變量L(a,b)、“之”字型不確定變量Z(a,b,c)、正態不確定變量N(e,σ),對應的不確定分布函數分別見式(44)~式(46)。

在不確定理論中,不確定變量所滿足的不確定分布主要由經驗和已有的數據規律進行選擇,體現了由于認知能力有限對客觀規律認識不足所造成的認知不確定性。對不確定分布參數來說,除了可通過少量試驗數據進行不確定分布參數a/b/c/e/σ的估計以外(例如不確定極大似然估計方法[157],將不確定分布函數導數取?。?,還可以通過專家和經驗進行分布參數的主觀確定,給出事件發生的信度。因此,不同的不確定分布中的未知參數可通過不確定估計、經驗確定和專家指定來獲得,從而實現不確定性表征[158]。

楊晗等[158]將不確定理論應用于某牌號Cr-Mo 鋼蠕變持久壽命的評估,根據工況經驗、手冊數據擬合、不確定極大似然估計分別表征了所考慮的4 個蠕變參數的正態不確定分布模型。王瑛等[159]在復雜裝備系統風險傳遞的圖形評審技術研究中,基于機會理論對某型戰機眼鏡蛇機動時飛行員處置不當的不確定性進行了表征,根據部隊專家針對飛行員處置不當對飛行安全影響的評價結果,將該不確定性表征為“之”字型不確定分布,通過專家信度確定了分布參數a/b/c。整體來看,不確定理論目前仍處于發展完善之中,研究成果以及工程上的應用主要集中在國內的一些研究人員,較于其它的非概率表征方法而言,不確定理論的工程實踐應用仍處于探索階段。

8 不確定性傳播

完成輸入量的不確定性表征之后就可進行不確定性傳播。對于概率表征方法,由于被表征為概率分布或若干已知分布的加權和,根據該概率分布、加權和分布可非常方便地進行抽樣,因此可直接采用基于概率理論的蒙特卡洛仿真或混沌多項式等方法進行不確定性傳播[23-24]。

對于區間變量,可單獨采用區間、證據、模糊集等諸多認知不確定性處理方法進行不確定性建模和傳播,也可采用概率表征方法。采用非概率表征,則要根據選擇的方法,基于區間分析、概率盒、證據理論、模糊集、凸模型等各自的理論來解決認知不確定性傳播的問題。若同時存在隨機和認知混合不確定性,可采用外層概率理論表征隨機不確定性、內層非概率方法表征認知不確定性的雙層嵌套的方式傳播混合不確定性,也可以將不確定性處理到同一個理論框架下進行傳播[88]。為了避免雙層循環計算量大的問題,文獻[41]提出了一種可同時處理隨機、稀疏和區間變量的數據驅動混沌多項式方法。Chen 和Qiu 針對隨機和區間變量,采用類似的思路構建混沌多項式模型,對復合材料結構進行不確定性分析[160]。Shah 等[35]提出了一種結合證據理論和混沌多項式展開的混合不確定性傳播方法,研究了攻角、馬赫數、SA 湍流模型系數不確定性對翼型RAE 2822 氣動特性的影響。屈小章等[161]基于概率理論和區間分析理論對混合不確定性系統進行可靠性分析,完成了葉片設計參數和葉輪轉速對風機氣動性能的影響評估。梁霄等[162]結合了概率盒理論和非嵌入混沌多項式方法,分別處理Sod 問題中多方指數的認知不確定性和炸藥密度的隨機不確定性,并將其應用于流體力學方程組迎風格式數值求解可信度評價的混合不確定性傳播。

9 結論和展望

本文面向基于數值模擬的工程設計,綜述了參數不確定性表征方法,概述了不確定性表征的研究目的和關鍵問題。根據不確定性因素的表現形式和可用信息,按照概率表征和非概率表征兩大類總結了目前主流的不確定性表征方法,介紹了各種不確定性表征方法的基本原理、適用范圍及其在工程實踐中的研究、發展和應用現狀。

1)不確定性表征的統一和共識

不確定性表征的概率方法均以經典概率統計為理論基礎,將不確定性變量建模為概率分布,后續進行不確定性傳播時可避免形成非概率表征下的嵌套雙重循環而導致的計算量大的問題,同時可非常方便地集成于現有的概率不確定性設計框架,這是其相比于非概率方法的最大優勢。但是,當不確定性變量信息非常少時,純概率表征方法顯然會導致較大誤差,包含的認知不確定性越大,就越不能用精確的概率分布來描述該量。此時,基于貝葉斯定理的概率表征方法提供了一條有效途徑。非概率表征方法在認知不確定性建模上更加合理,尤其當變量信息非常有限時。工程中尤其是航空航天領域由于裝備復雜昂貴、工作環境復雜,往往數據量非常少、專家信息也非常有限,小樣本下的不確定性表征是長期以來需要攻克的難題。為保證產品性能足夠可靠,往往指定不確定變量的上下界,因此區間理論特別適合工程不確定性表征和傳播,但后續區間擴張問題比較普遍。各種非概率表征方法基于不同的數學理論,都有其各自優勢,難以評價其在認知不確定性表征上的好壞。小樣本下,概率和非概率表征方法的合理性以及何種情況下應該用何類、何種方法,尚無廣泛認可的評判準則,應該用概率還是非概率表征尚未達成共識。

2)稀疏數據的數據增強

本文綜述的不確定性表征方法皆需根據不確定性變量的數據或專家信息對其進行建模。但數據缺乏導致的認知不確定性廣泛存在,實際中由于成本限制不可能任意增加物理觀測數據,數據增強技術為此提供了一條可借鑒的思路,利用生成對抗網絡等深度學習技術或仿真手段來生成不確定性變量的偽數據,從而提高數據量,最終實現較為精確的不確定性概率表征。但是,這類偽數據的可信度如何評價,以及如何有效考慮偽數據的可信度對不確定性表征的影響,是面臨的首要難題。

3)認知不確定性的降低

對認知不確定性進行表征和量化的目的是為了降低甚至消除它。很多認知不確定性變量,其并無實際物理意義,比如CFD 數值模擬的湍流模型系數,無法對其進行觀測,僅能根據專家經驗對其進行不確定性表征,復雜流動問題往往誤差很大。此時,可結合貝葉斯推理等統計推斷[163]或反向不確定性傳播方法[164],基于輸出的流場速度或壓力觀測數據,對湍流模型系數的不確定性表征模型進行修正,逐步提高參數不確定性表征的合理性,降低認知不確定性,進而更加有效地評估系統輸出的不確定性以供設計決策。開發高效的反向不確定性傳播方法,尤其是針對高維、強非線性、多不確定性輸入且具有不同形式表征的情況,尤為重要。

4)工程基準數據庫構建

目前不確定性表征理論和方法研究較為豐富,但多從數理統計領域出發,皆需根據不確定性變量的數據或專家信息對其進行建模,基本都應用于缺乏物理背景的數學問題,距離真正應用于工程還存在很大差距,學術和工業界研究較為脫節。在二者的合作下,可以結合工程問題和專家經驗建立若干類型(結構、氣動、熱等)的不確定性表征基準算例,隨著產品生命周期的推進逐步更新不確定性變量的數據信息,以供學術界發展和完善新理論和新方法。比如,美國國家跨聲速設施(National Transonic Facility,NTF)建立的不確定性模型,旨在研究氣動力/力矩和來流特性等的不確定性[165]。工程基準算例庫的構建,可極大促進不確定性表征以及后續傳播理論和方法的研究發展,更容易在新舊不確定性表征方法之間達成共識。

猜你喜歡
理論方法模型
一半模型
堅持理論創新
當代陜西(2022年5期)2022-04-19 12:10:18
神秘的混沌理論
理論創新 引領百年
相關于撓理論的Baer模
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 亚洲Av激情网五月天| 国产在线精品人成导航| 伊人成人在线视频| 视频二区中文无码| 久久精品国产精品青草app| 精品丝袜美腿国产一区| 无码中文AⅤ在线观看| 久久国产精品娇妻素人| 国产成人高精品免费视频| 国产精品无码AV片在线观看播放| 成人欧美日韩| 97国产精品视频人人做人人爱| 女人一级毛片| 国产在线无码一区二区三区| 美女潮喷出白浆在线观看视频| 免费激情网址| 在线观看热码亚洲av每日更新| 精品无码一区二区三区在线视频| 日本久久网站| 欧美自拍另类欧美综合图区| 欧美国产日韩一区二区三区精品影视| 久久婷婷六月| 99精品一区二区免费视频| 乱人伦中文视频在线观看免费| 欧美精品亚洲精品日韩专区va| 狠狠综合久久久久综| 中文字幕无码av专区久久| 国产成人无码综合亚洲日韩不卡| 成人小视频在线观看免费| 久久96热在精品国产高清| 欧美第九页| 国产精品久久久久久久久久98| 国产爽爽视频| 麻豆精品久久久久久久99蜜桃| 97视频精品全国免费观看| 国产精品9| 四虎影视无码永久免费观看| 亚洲视频免| a亚洲天堂| 亚洲综合色婷婷中文字幕| 亚洲日韩AV无码一区二区三区人 | 在线观看无码a∨| av在线5g无码天天| 国产手机在线小视频免费观看| 亚洲中文字幕国产av| 五月天香蕉视频国产亚| 欧美亚洲另类在线观看| 精品无码一区二区在线观看| 992tv国产人成在线观看| 久久香蕉国产线看精品| 亚洲无码高清一区| 在线观看视频99| 国产高潮流白浆视频| 久久国产亚洲欧美日韩精品| 亚洲愉拍一区二区精品| 欧美在线黄| 日韩午夜片| 无码啪啪精品天堂浪潮av| 国产精品黄色片| 久久黄色小视频| 国产美女精品在线| 国产毛片高清一级国语| 国产午夜在线观看视频| 999精品免费视频| 国产在线精品美女观看| 成人福利一区二区视频在线| 亚洲一区二区成人| 麻豆精品久久久久久久99蜜桃| 久久精品娱乐亚洲领先| 国产亚洲第一页| 色偷偷av男人的天堂不卡| 欧美在线视频不卡第一页| 制服无码网站| 亚洲美女视频一区| 国产自产视频一区二区三区| 亚洲第一区欧美国产综合| 日本亚洲成高清一区二区三区| 亚洲欧洲美色一区二区三区| 午夜精品一区二区蜜桃| 美女被狂躁www在线观看| 天天色天天综合| 亚洲男人的天堂在线|