999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于變分自編碼器的實驗設計①

2022-05-10 12:11:54張志博康達周
計算機系統應用 2022年3期
關鍵詞:實驗方法系統

張志博,康達周,3

1(南京航空航天大學 計算機科學與技術學院/人工智能學院,南京 211106)

2(南京航空航天大學 高安全系統的軟件開發與驗證技術工信部重點實驗室,南京 211106)

3(軟件新技術與產業化協同創新中心,南京 210023)

復雜系統[1]是一種包含很多相互作用子系統的系統.它具有非線性、高不確定性、高維度、多層次以及高相關性的特點.空氣動力系統[2]、股票市場系統[3]、暴雨洪澇人口風險系統[4]就是一些的復雜系統例子.為研究自然、工程和社會科學中的現象與原理,探究這些復雜系統的內在性質,人們對復雜系統建模并利用計算機對它們進行仿真與實驗,并讓實驗能夠盡可能地接近真實世界,不斷向著復雜化發展.比如,在武器裝備領域,為了測定直航魚雷[5]在不同復雜想定下的打擊范圍和命中能力,需要做大量的仿真實驗.為了讓實驗能在較小的代價下執行,需要進行高效實驗設計.但復雜系統的特點會給復雜系統實驗設計帶來非線性、相關性、不確定性和規模性等問題[6],傳統的實驗設計方法只能部分解決這些問題,例如:完全析因設計[7]適用于非線性系統,但需要的實驗樣本和實驗次數非常多;響應面設計[8]用于分析系統中因子間的相互作用,但當因子數量增多時,計算量會急劇增加;為了降低實驗中的不確定性,可以通過大量的隨機重復抽樣設計,但這同樣的會極大地增加實驗規模.以上問題都會使得復雜系統實驗設計最終走向規模性,即產生維度災難[9].正交設計[10]、均勻設計[11]、拉丁超立方設計[12]這類遵循“充滿空間”性質的實驗設計方法雖然可以通過優化實驗取樣來縮減實驗規模,但僅在均勻空間中最有效,對復雜系統實驗設計效率的提升有限.因此,迫切需要一種適用于復雜系統、可以大幅提高實驗效率的實驗設計方法.

變分自編碼器(variational auto-encoder,VAE)[13]是一種借鑒變分推斷原理的深度神經網絡,憑借其優秀的性能,近年來在圖像處理[14]、語音識別[15]、文本生成[16]等應用領域取得了巨大的成功.變分自編碼器作為一種生成模型,含有多個隱藏層,包括了編碼器、解碼器和隱變量空間.編碼器可以將復雜分布的樣本數據投影到簡單的隱變量空間,實現對樣本數據的特征提取.而解碼器可以通過還原在隱變量空間里取樣的數據,生成新的樣本.和一般生成模型只考慮重構損失函數不同的是,變分自編碼器同時考慮了重構損失函數和KL 損失函數,使得生成的樣本具有更強的泛化能力,可以提高樣本空間取點的覆蓋率,這給復雜系統實驗設計帶來了新的思路:一方面,如圖1所示,將復雜系統實驗的輸入樣本和輸出響應結果一同作為實驗歷史記錄數據訓練變分自編碼器,通過生成新的實驗樣本,綜合考慮復雜系統實驗輸入樣本xi的分布、輸出結果yi的分布和它們之間的對應關系yi=f(xi)的分布,使得3 個分布都盡可能地“充滿空間”,實現更加高效的實驗設計.另一方面,VAE 將復雜分布的輸入實驗樣本投影到的隱變量空間會盡可能滿足標準正態分布,而在符合標準正態分布的空間里進行實驗設計有3 個好處.

圖1 提高實驗設計效率的思路是使這3 個分布盡可能充滿空間

(1)通過適應隨機采樣,防止出現過擬合;

(2)隱變量空間具有良好的分布性質,易于抽樣處理;

(3)生成的樣本點是在隱變量空間采樣得到,可以通過調整采樣來進行優化.

基于上述分析,本文提出一種基于VAE的實驗設計方法,將復雜系統實驗歷史記錄數據投影到一個滿足正態分布的隱變量空間,并通過對隱變量空間采樣生成新的實驗設計方案.實驗結果表明,本文實驗設計方法系統性地解決了復雜系統自身特性導致的實驗設計規模性問題.

本文接下來的內容安排如下:第1 節詳細闡述了本文的方法;第2 節介紹了實驗有效性的評價方法;第3 節通過一個直航魚雷命中模型的案例對本文方法進行了驗證并展示與分析了實驗結果;第4 節總結了全文并得出了結論.

1 一種基于變分自編碼器的復雜系統實驗設計方法

本節首先形式化定義了待解決問題,然后詳細介紹了本文方法的總體架構和各模塊內容.

1.1 問題定義

復雜系統的特性可以表示為其輸入到輸出的一個函數:y=f(x)=f(x1,x2,···,xd),其中,x=(x1,x2,···,xd)是輸入變量的向量,d是因子的數目,y=(y1,y2,···,ydy)為該復雜系統對輸入x的響應,dy是響應的數目.

實驗設計目的之一是提高實驗設計取樣的有效性,即在相同實驗樣本數量的情況下,提高選取樣本的準確性.對于待比較的不同實驗設計方法,令每種實驗設計方法產生k個實驗樣本,可以通過這k個樣本所擬合出的模擬系統y′=f′(x)與真實系統f(x)的吻合程度來評價它們的實驗準確性.f′(x)與f(x)的吻合程度可以用均方根誤差(RMS E)、最大殘差(MRE)、平均絕對誤差(MAE)、R2決定系數表征:

在式(4)中,是復雜系統k個真實響應yi的平均值.RMSE、MRE、MAE越小,R2決定系數越接近1,意味著f′(x)與f(x)的吻合程度越高、越相關,即實驗取點越有效.因此,待解決的問題可以表示成:找到一種實驗設計方法E,用該方法生成的k個實驗樣本擬合復雜系統f(x)的模擬系統f′(x),并可以使得f′(x)與f(x)之間盡可能地吻合.

1.2 總體架構

基于變分自編碼器的實驗設計方法的總體架構如圖2所示,它包含了3 個模塊.

圖2 總體架構

實驗需求確定了實驗的背景、對象、參數以及屬性的取值范圍和概率分布,為本實驗設計方法的輸入.實驗設計方案即實驗樣本集Og為本實驗設計方法的輸出.實驗歷史記錄集Oh用于訓練本實驗設計方法的變分自編碼器.

基于變分自編碼器的實驗設計方法各個模塊的作用和總體步驟如下.

(1)依據實驗需求,設計并實施實驗,得到初次的實驗歷史記錄集.

(2)數據預處理模塊將實驗歷史記錄集轉化成變分自編碼器可以使用的實驗歷史記錄向量集.

(3)網絡學習模塊將此實驗歷史記錄向量集用作訓練集,訓練變分自編碼器.

(4)實驗設計模塊在訓練好的變分自編碼器的隱變量空間里采樣,利用解碼器還原采樣點生成實驗樣本,輸出復雜系統實驗設計方案.

(5)對輸出的復雜系統實驗設計方案實施實驗,并將得到的實驗歷史記錄加入原先的實驗歷史記錄集,得到新的實驗歷史記錄集,然后回到步驟(2)進行下一輪的實驗設計,使得實驗設計取樣得到進一步的優化.

1.3 數據預處理模塊

變分自編碼器的訓練集需要向量化或數值化的樣本,但是實驗歷史記錄并不一定都滿足這個條件.在訓練變分自編碼器的過程中,為了能讓損失函數更容易收斂到最佳結果,需要防止樣本中有因子取值范圍過大或存在極端值的情況.為此需要對實驗歷史記錄進行數據預處理.

對于實驗歷史記錄中無序離散值的屬性來說,需要對它進行獨熱編碼.對于有序離散值的屬性需要對它進行標簽編碼.

而對于實驗歷史記錄中連續數值,防止取值范圍過大或有極端值情況的策略是使用Minmax 歸一化:

其中,O是實驗歷史記錄集,實驗歷史記錄記錄Xi∈O,Xmax是實驗歷史記錄最大值,Xmin是實驗歷史記錄最小值.

因此,在數據預處理模塊,對于復雜系統實驗歷史記錄集Oh=((x1,y1),(x2,y2),···,(xn,yn))的每一個樣本(xi,yi)對它進行如下步驟:

(1)判斷實驗歷史記錄每個因子的類型.

1) 對實驗歷史記錄中的有序離散取值的屬性進行標簽編碼;

2) 對實驗歷史記錄中的無序離散取值的屬性進行獨熱編碼;

3) 對實驗歷史記錄中的連續數值的屬性進行歸一化.

(2)對步驟(1)中得到的結果進行向量組裝,得到數據預處理后的實驗歷史記錄.

數據預處理后的實驗歷史記錄記為ei=(e1,e2,···,ed′)∈Oe,Oe為數據預處理后的實驗歷史記錄集.通常數據預處理后樣本的維度不會低于數據預處理前實驗歷史記錄的維度,即d′≥d+dy.

本文方法用Python 庫SciKit-Learn[17]的preprocessing 模塊的OneHotEncoder 方法、LabelEncoder 方法和MinMaxScaler 方法實現數據的獨熱編碼、標簽編碼和歸一化.

1.4 網絡學習模塊

網絡學習模塊的主體部分是變分自編碼器.

變分自編碼器由編碼器q?(z|x)、解碼器pθ(z)pθ(x?|z)和一組隱變量z組成,x是輸入的樣本,x?是重構或生成的樣本.而編碼器由均值編碼器和方差編碼器組成.均值編碼器產生每個樣本專屬的在隱變量空間中的均值μi,方差編碼器產生每個樣本專屬的在隱變量空間中的方差 σ2i.從εi~N(0,1) 中 采樣,并通過zi=μi+σi·εi的重參數技巧,即可完成對隱變量z的采樣,經過此法采樣的z,滿足pθ(z)~N(0,1).

編碼器和真實后驗概率分布pθ(z|x)之間的相似度用KL散度衡量:

整個變分自編碼器訓練就是要去優化編碼器模型的參數 ?和解碼器模型的參數θ,使得學習的后驗概率分布和真實后驗概率分布盡可能地相似,即最小化它們之間的KL散度:

定義生成模型pθ(|z)服從伯努利分布,由文獻[18]的數學推導,得到變分自編碼器的損失函數為:

其中,第一項是變分自編碼器的KL損失函數,第二項是變分自編碼器的重構損失函數.

當完成對變分自編碼器的訓練后,就可使用解碼器生成新的樣本.網絡學習模塊的結構如圖3所示.

圖3 網絡學習模塊結構

由于當輸入樣本的維度不高時,使用深度生成模型變分自編碼器不一定能很好地學習出樣本的內在性質,為了獲得更精確的學習效果,需要酌情增加輸入樣本的維度.網絡學習模塊在常規變分自編碼器結構中增加了輸入層和輸出層.輸入層的作用是將輸入樣本的維度擴大m倍,與輸入層相對應的輸出層的作用是將維度擴大m倍的樣本再還原成原本維度的樣本.

網絡學習模塊的輸入是經過數據預處理的實驗歷史記錄集Oe中的樣本ei,ai=(a1,a2,···,ad′m)是ei經過輸入層的樣本.l為隱變量空間的維度,通常情況下d′m?l.網絡學習模塊的輸出是編碼器的參數和解碼器的參數.

1.5 實驗設計模塊

實驗設計模塊在由網絡學習模塊求出的隱變量空間里做抽樣實驗設計,將原本分布不均的復雜系統實驗歷史記錄空間投影到低維的服從標準正態分布的隱變量空間.因為訓練中引入了隨機的擾動,這個過程可以確保與原始實驗樣本編碼的潛在位置靠近的每個點都能被解碼為與原始實驗歷史記錄類似的實驗歷史記錄,從而迫使隱變量空間能夠連續地有意義.隱變量空間中任意兩個相鄰的點都會被解碼為高度相似的實驗歷史記錄.隱變量空間的連續性以及低維度,使得隱變量空間非常適合進行抽樣.實驗設計模塊結構如圖4所示.

圖4 實驗設計模塊結構

實驗設計模塊在隱變量空間里做實驗設計,相當于對隱變量z采 樣,讓z按標準正態分布隨機抽樣.完成隱變量空間的采樣后,隱變量z通過解碼器生成了具有d′m維的向量再經過輸出層的樣本維度還原生成了和網絡學習模塊輸入向量有相同維度d′的實驗歷史記錄向量

(1)判斷樣本向量中各個部分原先屬于哪個屬性并進行恢復;

1) 對樣本向量中經過歸一化的部分進行歸一化恢復;

2) 對樣本向量中經過獨熱編碼的部分進行獨熱編碼恢復;

3) 對樣本向量中經過標簽編碼的部分進行標簽編碼恢復;

(2)對步驟(1)中得到的結果進行向量組裝,得到經過恢復后的實驗樣本.

在Python 里,這些恢復函數可以用各自原函數的inverse_transform 方法實現.經過恢復后的實驗歷史記錄形如,但由于由變分自編碼器生成,并不是系統的真實響應,實驗歷史記錄中必須要去除這個.最終,由實驗設計模塊生成的樣本記為.

依據實驗設計需求,如果實驗需要做k次,則需要讓實驗設計模塊的流程進行k次,生成k個實驗樣本,這k個實驗樣本組成的集合即為本文方法生成的實驗設計方案.

2 實驗設計有效性評價方法

為評價本文實驗設計方法的有效性,可用生成的實驗樣本和它們對應的實驗響應去擬合真實復雜系統,并評估其誤差.由于支持向量回歸(support vector regression,SVR)模型[19]在表達式形式未知和小樣本的情況下具有良好的性能,這里選用SVR 來進行擬合.

SVR是支持向量機[20]在回歸問題上的應用,將輸入映射到高維空間,并用一個或一組超平面來對樣本點進行回歸.假定在高維空間中,樣本點是可以通過如下的線性函數擬合的:

其中,w和b是該線性函數的參數,SVR的損失函數可以表達成:

其中,C是可調的超參數,N是輸入樣本的數量,ξi-和ξi+是松弛變量.SVR的優化目標是通過優化參數w和b來最小化它的損失函數,即:

SVR 雖然將輸入樣本映射到了高維空間,但向量內積在原空間上更容易被計算出來,因此在高維空間上的向量內積運算使用核函數技巧[21].常見的核函數包括:線性核、多項式核、徑向基核和Sigmoid 核.

利用SVR 對實驗設計評價方法如下:

首先,在原始樣本空間中采樣n個樣本點,對每一個樣本點xi實施實驗,得到真實響應為:yi.將xi和yi組合得到真實樣本和真實響應組合的集合Ot=((x1,y1),(x2,y2),···,(xn,yn)),用作測試SVR 擬合效果的測試集.

然后,對每一個待測實驗設計方法Ej,令其生成含有k個樣本的實驗設計方案OgEj,對OgEj中每一個樣本點實施實驗,得到真實響應.對每一個Ej,將對應的和組合而成的集合用作SVR 擬合復雜系統的訓練集.

對每一個OsEj用SVR 擬合,得到的模擬復雜系統的函數記為:

將測試集中每個xi帶入每個模擬的復雜系統,得到每一個xi的預測響應

最后比較每種模擬的復雜系統的對測試集中所有xi的預測響應和真實響應yi之間的RMS E、MRE、MAE、R2,RMSE、MRE、MAE越低,R2越接近于1,說明擬合出的模擬復雜系統更接近真實復雜系統,即其對應的實驗設計方法表現更好.

3 實驗分析

本節選取了幾種常用的實驗設計方法作為基線,然后介紹了所使用的復雜系統模型和實驗設置.最后通過實驗得出了結果并對其進行了分析.

3.1 基線

基線實驗設計選擇拉丁超立方、K-means[22]和Maximin[23]實驗設計方法與本文方法相比較,因為它們是常用的實驗設計方法且支持在連續區間內的實驗取點.上述的這些基線實驗設計方法可以通過Python實驗設計庫doepy (https://github.com/tirthajyoti/doepy)實現.

3.2 復雜系統模型

直航魚雷在現代戰爭中是反制敵方艦船和潛水艇的有力武器,為了能提高直航魚雷的命中率和增加直航魚雷的打擊范圍,需要考慮多種影響直航魚雷發射的因素,建立直航魚雷的命中模型并通過大量的仿真實驗,得到清晰的影響直航魚雷的命中率和打擊范圍的關鍵因素和它們之間的關系,從而可以為實際作戰中直航魚雷的戰術運用提供指導.

本文實驗選用文獻[24]中的直航魚雷命中模型作為本文實驗設計方法驗證的復雜系統.直航魚雷命中模型的響應yQ是魚雷命中位置與打擊目標中心的相對距離(m).該響應由以下的輸入變量決定:目標速率(節)V、魚雷速率(節)VT、目標距離(鏈)D、目標舷角X、發射魚雷的提前角φ、目標距離觀測誤差 ΔD、魚雷航向誤差角 Δφ、目標方位角觀測誤差 Δβ、目標速率的觀測誤差 ΔV、魚雷速率的觀測誤差ΔVT、目標航向角的觀測誤差 ΔC.

在本文實驗中,V=15,VT=50,D=50,X∈[-180,180],ΔD∈[-15,15],Δ φ ∈[-3,3],Δ β ∈[-3,3],ΔV∈[-3,3],ΔVT∈[-3,3],ΔC∈[-3,3].N(μ,σ)是均值μ 標準差 σ的正態分布,其中,X服從N(70,5),ΔD服從N(0,5),Δφ 服從N(0,1),Δβ 服從N(0,1),ΔV服從N(0,1),ΔVT服從N(0,1),ΔC服從N(0,1).φ 由輸入變量V、VT、X決定:

整個直航魚雷命中模型的方程如式(13)所示:

3.3 實驗設置

在本次實驗中,變分自編碼器的隱變量空間的維度l設定為256,輸入層里維度擴大的倍數m設定為5 000,變分自編碼器訓練集Oh的大小設定為1 000,用標準正態分布隨機抽樣對隱變量z采樣,SVR的測試集Ot的大小設定為100,SVR的核函數設為線性核函數.

對每一種待測實驗設計方法,生成的實驗設計方案OgEj的樣本數大小k分別取5、10、15、20、25、30、35、40、45、50.限定k的最大值為50,即最多生成50 個樣本.

3.4 實驗結果

實驗結果如圖5所示.圖5是不同實驗設計方法在不同樣本數下分別按圖5(a)RMSE、圖5(b)MRE、圖5(c)MAE、圖5(d)R2決定系數這些指標對直航魚雷命中模型擬合效果比較的折線圖.

圖5 不同實驗設計方法在不同指標不同樣本數下對直航魚雷命中模型擬合效果的比較

從實驗結果可以看出,對直航魚雷命中模型的擬合,不論是在小樣本還是在一定樣本數下,本文方法均優于K-means 實驗設計方法,Maximin 實驗設計方法與拉丁超立方實驗設計方法.只有當樣本數k為15 時,Maximin 實驗設計方法的RMSE=28.96、MAE=23.55與本文方法在樣本數k為15 時的RMS E=27.49、MAE=22.71相差很小,擬合效果相近.隨著樣本數k的增加,本文方法的RMSE、MRE和MAE均能穩步減少,當樣本數k等于50 時,本文方法的RMSE=4.30、MRE=12.28、MAE=3.35均達到了各指標里所有實驗驗證結果中的最低值.其他基線實驗設計方法隨著樣本數k的增加,雖然它們的RMSE、MRE和MAE總體也是呈下降的趨勢,但并不穩定,有可能會在局部產生不降反升的情況,這也意味著本文方法不同于其他基線實驗設計方法,隨著樣本數k的增加并不會讓SVR 顯著的產生過擬合.從R2決定系數上看,在小樣本情況下,本文方法的R2決 定系數稍稍大于0,其他基線方法的R2決定系數均小于0,它們的預測響應均和真實響應的相關性很差,當樣本數k增加時,本文方法和基線實驗設計方法均能提高它們的R2決定系數并使它們最終都可以大于0,但只有本文方法的R2決定系數最終可以達到0.7 以上,即預測響應和真實響應高度相關,在樣本數k為50 時,本文方法的R2決定系數更是高達0.98.

表1是各個實驗設計方法的指標在低于或高于特定值時最少所需的樣本數k.表1中的未達到表示在最多取50 個樣本的情況下,指標仍然未低于或高于所要求的特定的數值.由表1可知,本文方法總能以最少的樣本量獲得最佳的實驗結果,即說明本文的方法和其他基線方法相比是最高效的.

表1 各個實驗設計方法的指標在低于或高于特定值時最少所需的樣本數k

綜上所述,本文實驗設計方法可以提高在復雜系統中的實驗設計效率,在擬合復雜系統時,本文實驗設計方法隨著樣本數的增加也不會產生顯著的過擬合,即使在小樣本的情況下,本文方法也能得到比較優秀的實驗設計方案.

4 結論

本文為解決復雜系統實驗設計中非線性、不確定性、高相關性和規模性導致的維度災難問題,提出了一種基于變分自編碼器的復雜系統實驗設計方法.首先,給出了基于變分自編碼器的復雜系統實驗設計方法的總體結構,詳細介紹了每個子模塊的目的和它們的功能,并給出了評價實驗設計優劣的方法.然后,本文通過對實際的直航魚雷命中模型的擬合,對本文方法、拉丁超立方、K-means和Maximin 實驗設計方法進行了比較實驗.最后,得出了本文方法可以提高復雜系統實驗效率的結論.

猜你喜歡
實驗方法系統
記一次有趣的實驗
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
做個怪怪長實驗
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 国产成人久久综合777777麻豆 | 日本国产精品一区久久久| 91色老久久精品偷偷蜜臀| 日韩久草视频| 亚洲中文字幕日产无码2021| 日韩毛片免费视频| 青草91视频免费观看| 美女被操91视频| 亚洲精品无码日韩国产不卡| 欧美精品v欧洲精品| 久草网视频在线| 一本色道久久88| 欧美国产日韩一区二区三区精品影视| 欧美一级在线播放| 97视频在线精品国自产拍| 91九色视频网| 国产亚洲精品无码专| 久久青草精品一区二区三区| 国产经典在线观看一区| 国产精品九九视频| 99免费视频观看| 国产黄在线观看| 一级一级一片免费| 国产成人永久免费视频| 免费在线看黄网址| 在线亚洲小视频| 一级毛片在线播放免费观看| 国产成人精品一区二区| 亚洲天堂视频网| 亚洲一级毛片免费看| 99在线视频精品| 亚洲第一香蕉视频| 亚洲日本中文字幕天堂网| 国产乱人免费视频| 天天躁狠狠躁| 国产亚洲视频中文字幕视频| 亚洲成人福利网站| 国产麻豆va精品视频| 毛片在线播放网址| a网站在线观看| 91福利一区二区三区| 亚洲人成色在线观看| 97亚洲色综久久精品| 91口爆吞精国产对白第三集 | 亚洲精品午夜无码电影网| 日本影院一区| AV无码国产在线看岛国岛| Aⅴ无码专区在线观看| 国产精品内射视频| 99在线观看视频免费| 五月婷婷丁香综合| 國產尤物AV尤物在線觀看| 久久黄色小视频| 国产亚洲视频中文字幕视频| 麻豆精品视频在线原创| 午夜福利网址| 久久久精品久久久久三级| 91啪在线| 欧美激情成人网| 亚洲日本精品一区二区| 亚洲无码在线午夜电影| 97久久免费视频| 欧美午夜精品| 四虎国产精品永久在线网址| 国产免费羞羞视频| 日韩在线网址| 国产美女无遮挡免费视频| 国产高清国内精品福利| 国产专区综合另类日韩一区| 成人精品免费视频| 欧美一区二区丝袜高跟鞋| 国产在线97| 亚洲视频一区| 免费人成网站在线高清| 欧美不卡二区| 性色在线视频精品| 欧美一级黄片一区2区| 欧美精品v| 色精品视频| 美女扒开下面流白浆在线试听| 国产精品网址在线观看你懂的| 久久99热这里只有精品免费看|