陳沛涵,趙唯以
(青島理工大學(xué) 土木工程學(xué)院,青島 266525)
鋼板混凝土(SC)墻是由鋼板和混凝土通過連接件連接而成的組合結(jié)構(gòu)。SC墻的外部鋼板代替了傳統(tǒng)鋼筋混凝土(RC)墻的鋼筋,并通過連接件和內(nèi)部素混凝土相連。這一結(jié)構(gòu)充分發(fā)揮了鋼材抗拉和混凝土抗壓的性能,使其具有承載力高、密閉性好、施工便捷等優(yōu)點(diǎn)。同時(shí),SC墻的抗沖擊性能也十分出色,相比RC墻,SC墻防止擊穿所需厚度可大幅降低,因此在核電廠房、防護(hù)結(jié)構(gòu)等工程中得到了廣泛應(yīng)用[1]。
在導(dǎo)彈、飛機(jī)等的沖擊作用下,結(jié)構(gòu)可能發(fā)生局部損傷,甚至貫穿破壞。大量RC墻的高速?zèng)_擊試驗(yàn)表明,即使墻體未發(fā)生貫穿,背沖擊側(cè)混凝土也會(huì)在沖擊波的作用下開裂、飛射,嚴(yán)重威脅內(nèi)部人員、設(shè)備的安全。而使用鋼板包覆混凝土是一種有效的加固措施,WALTER等[2]、BARR[3]、TSUBOTA等[4]的高速?zèng)_擊試驗(yàn)表明,在背側(cè)布置鋼板可以有效防止混凝土震塌破壞,提高墻體的抗沖擊性能。
MIZUNO等[5-7]對SC墻在飛機(jī)模型撞擊作用下的受力性能進(jìn)行了試驗(yàn)研究和數(shù)值模擬,與以往RC墻的試驗(yàn)結(jié)果相比,SC墻防止擊穿所需的厚度可以降低30%。SADIQ等[8]、LIU等[9]、BRUHL等[10]對MIZUNO等的試驗(yàn)建立了LS-DYNA有限元模型,并一致認(rèn)為Mat_084(Winfrith模型)可以更好地模擬混凝土在高速?zèng)_擊下的力學(xué)行為。HASHIMOTO 等[11]對12片RC墻、24片半SC墻以及4片SC墻在導(dǎo)彈撞擊作用下的受力性能進(jìn)行了試驗(yàn)研究,并基于能量原理提出了彈頭速度與變形之間的計(jì)算式。研究結(jié)果表明,在不同的沖擊速度下,半SC結(jié)構(gòu)或SC結(jié)構(gòu)的局部破壞表現(xiàn)為四種形式,如圖1所示:(a)沖擊物侵入目標(biāo);(b)目標(biāo)背沖擊側(cè)混凝土崩落造成鋼板鼓起;(c)沖擊物撕裂背側(cè)鋼板;(d)沖擊物貫穿目標(biāo)。

圖1 局部損壞效果[11]
結(jié)構(gòu)在高速?zèng)_擊下的破壞機(jī)理較為復(fù)雜,因此在設(shè)計(jì)中多采用經(jīng)驗(yàn)公式計(jì)算侵徹深度或沖擊物貫穿結(jié)構(gòu)的臨界速度。例如,基于大量RC墻的試驗(yàn)現(xiàn)象和數(shù)據(jù),已有多個(gè)計(jì)算侵入深度或是防止目標(biāo)貫穿所需厚度的經(jīng)驗(yàn)公式[12]。針對SC墻,BARR[3]以等效配筋率考慮背側(cè)鋼板對結(jié)構(gòu)抗沖擊性能的貢獻(xiàn),提出了沖擊物的穿透速度經(jīng)驗(yàn)公式。WALTER等[2]、GRISARO等[13]將背側(cè)鋼板折算為一定厚度的混凝土,并按照RC墻計(jì)算防止穿透所需要的板厚。BRUHL等[10]根據(jù)已有文獻(xiàn)中的高速?zèng)_擊試驗(yàn)匯編了數(shù)據(jù)庫,并在混凝土和鋼板的穿透經(jīng)驗(yàn)公式的基礎(chǔ)上提出了SC結(jié)構(gòu)抗沖擊的三步設(shè)計(jì)法,該方法目前已被美國AISC N690s1-15規(guī)范[14]建議采用。KIM等[15-17]通過不同尺度SC墻的沖擊試驗(yàn)對局部損傷模式進(jìn)行了研究,結(jié)果表明三步設(shè)計(jì)法具有一定的保守性。
上述研究對SC墻局部損傷的計(jì)算均采用了經(jīng)驗(yàn)公式法,而這些經(jīng)驗(yàn)公式所使用的傳統(tǒng)擬合方法需要預(yù)先假定某種特定的非線性函數(shù)形式,再確定函數(shù)中的待定參數(shù),其計(jì)算結(jié)果往往偏保守。BRUHL等[10]利用三步法對130組被導(dǎo)彈沖擊的SC墻進(jìn)行損傷判別,其中有61組未被穿透的試件被偏保守地預(yù)測為穿透,總體準(zhǔn)確率僅為51.5%。面對這樣的強(qiáng)非線性問題,使用機(jī)器學(xué)習(xí)方法具有一定的優(yōu)勢。本文基于貝葉斯優(yōu)化(BO)和支持向量機(jī)(SVM)算法,建立了高速?zèng)_擊下SC墻局部損傷模式的BO-SVM分類模型,并通過F1得分、G-mean值、分類準(zhǔn)確率評價(jià)模型的預(yù)測精度。研究結(jié)果表明,BO-SVM模型能夠快速、準(zhǔn)確地預(yù)測SC墻的沖擊局部損傷模式,其預(yù)測精度優(yōu)于傳統(tǒng)計(jì)算方法,且優(yōu)于K臨近(KNN)和隨機(jī)森林(RF)等其他常用機(jī)器學(xué)習(xí)算法。
SVM算法建立在Vapnik-Chervonenkis維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理的基礎(chǔ)上,能保證找到的極值解是全局最優(yōu)解而非局部最小值。因此,SVM算法能夠避免過擬合,對未知樣本有較好的泛化能力,可以很好地解決工程中的分類問題,但SVM算法具有較多的超參數(shù),且超參數(shù)的調(diào)整直接影響模型的分類準(zhǔn)確率,需對超參數(shù)進(jìn)行反復(fù)調(diào)試才能得到最優(yōu)的SVM模型[18]。
在現(xiàn)實(shí)問題中,輸入?yún)?shù)和輸出值之間通常具有高度的非線性。因此,需要利用非線性函數(shù)將數(shù)據(jù)映射到高維特征空間中,然后在高維特征空間中構(gòu)建一個(gè)最優(yōu)超平面,使所有數(shù)據(jù)點(diǎn)到該超平面的距離最大。超平面可以表示為
f(x)=wφ(x)+b
(1)
式中:φ(x)為非線性映射函數(shù);w為權(quán)重;b為偏置。
如圖2所示,在SVM模型中,假設(shè)f(x)與目標(biāo)輸出值y之間的差別絕對值大于ε時(shí),均為預(yù)測正確。只有當(dāng)誤差小于ε時(shí),才計(jì)算損失。ε-不敏感損失函數(shù)可表示為

圖2 SVM模型

(2)
為使所有數(shù)據(jù)點(diǎn)到超平面的距離大于一定的值,根據(jù)風(fēng)險(xiǎn)最小原理可得:
(3)
式中:C為懲罰參數(shù);N為訓(xùn)練集樣本個(gè)數(shù)。

(4)
限制條件為

(5)
該優(yōu)化問題的目標(biāo)函數(shù)為二次函數(shù),限制條件為線性不等式,可以構(gòu)造Lagrange函數(shù),并轉(zhuǎn)化為對偶問題,解得
(6)
使用核函數(shù)可以避免在高維空間中進(jìn)行內(nèi)積計(jì)算。常用的核函數(shù)包括線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)等。
KNN是一種常用的有監(jiān)督學(xué)習(xí)算法[19],為了判斷未知樣本的類別,KNN算法按照某種距離模式對未知樣本與訓(xùn)練樣本之間的距離進(jìn)行計(jì)算,選擇與未知樣本距離最小的k個(gè)樣本作為其k近鄰,并根據(jù)未知樣本的k個(gè)最近鄰判斷預(yù)測樣本的類別。KNN方法計(jì)算簡單且易于實(shí)現(xiàn),對處理不規(guī)則數(shù)據(jù)的分類問題具有足夠精度,但該方法高度依賴數(shù)據(jù)樣本的精度,若樣本中存在錯(cuò)誤數(shù)據(jù),會(huì)直接影響其準(zhǔn)確率。
隨機(jī)森林(RF)屬于集成學(xué)習(xí)的一種[20],其核心思想是以決策樹為基學(xué)習(xí)器構(gòu)建Bagging集成,并在決策樹的訓(xùn)練過程中引入隨機(jī)屬性選擇。隨機(jī)森林具有結(jié)構(gòu)簡單、容易實(shí)現(xiàn)、計(jì)算開銷小等優(yōu)點(diǎn),但對于小樣本數(shù)據(jù)或特征較少的數(shù)據(jù),可能不能產(chǎn)生較好的分類。對于分類問題,其分類精度通常與基學(xué)習(xí)器的數(shù)量選擇有關(guān)。RF算法除了可以進(jìn)行分類外還可以對參數(shù)進(jìn)行靈敏度分析,通過每個(gè)特征在隨機(jī)森林中決策樹上的貢獻(xiàn)值從而比較不同特征對最終結(jié)果的貢獻(xiàn)程度。
貝葉斯優(yōu)化(BO)算法是一種常用的模型超參數(shù)優(yōu)化方法[21]。假設(shè)一組超參數(shù)的組合為X=x1,x2, …,xn,不同的超參數(shù)組合會(huì)使模型取得不同的效果,而貝葉斯優(yōu)化的目的則是選擇出使SVM模型效果最好的超參數(shù)。
貝葉斯優(yōu)化可以轉(zhuǎn)化為如下問題:存在一個(gè)函數(shù)f(x),需要找到一個(gè)x∈X,使
(7)
式中:x為超參數(shù)。
由于并不能判斷函數(shù)f(x)的凹凸性,所以需要基于序列模型求解問題,其算法如下:
第一步:確定函數(shù)f(x)、超參數(shù)搜索空間X和采集函數(shù)S[22]。
第二步:確定數(shù)據(jù)集D,該數(shù)據(jù)集中每一對數(shù)組表示為(x,y),x是一組超參數(shù),y表示超參數(shù)對應(yīng)的輸出結(jié)果。
第三步:對數(shù)據(jù)集D擬合得到模型M,并求出模型的具體函數(shù)表示。
ρ(y|x,D)=FITMODLE(M,D)
(8)
第四步:求出使S(x,p)取得最大值所對應(yīng)的變量點(diǎn)x(或x的集合),即
(9)
xi即為采集函數(shù)選擇出的一組超參數(shù)。
第五步:將xi代入函數(shù)f(x)中,得到輸出值yi。
第六步:更新數(shù)據(jù)集D。
D=D∪(xi,yi)
(10)
第七步:返回第三步,繼續(xù)選擇超參數(shù)x,循環(huán)T次停止。
為了解決數(shù)據(jù)集不平衡的問題,本文采用了SMOTE過采樣技術(shù)。SMOTE算法是CHAWLA等提出的一種過采樣算法[23],如圖3所示,該算法將少數(shù)類樣本進(jìn)行分析并根據(jù)少數(shù)類樣本人工合成新樣本添加到數(shù)據(jù)集中,可有效解決少數(shù)樣本量過少的問題,但是SMOTE算法在擴(kuò)大數(shù)據(jù)規(guī)模的同時(shí)增加了模型訓(xùn)練的復(fù)雜度,會(huì)導(dǎo)致模型訓(xùn)練時(shí)間的增加。其生成新樣本的過程如下:

圖3 SMOTE采樣原理
1) 對于少數(shù)類樣本集中每一個(gè)樣本x,以歐氏距離為標(biāo)準(zhǔn)計(jì)算它到所有樣本的距離,得到其k近鄰。
2) 根據(jù)樣本不平衡比例設(shè)置一個(gè)采樣比例以確定采樣倍率N。
3) 隨機(jī)選擇k近鄰中的一個(gè)進(jìn)行線性插值,進(jìn)而合成少數(shù)類樣本。其合成公式為
xnew=x+rand(0,1)×|x-y|
(11)
式中:x為少數(shù)類樣本;y為近鄰樣本。
機(jī)器學(xué)習(xí)算法中的超參數(shù)往往決定著模型最終的性能,而傳統(tǒng)的機(jī)器學(xué)習(xí)模型往往只能通過試錯(cuò)法來確定其超參數(shù)。本文提出的BO-SVM模型,主要通過BO算法優(yōu)化SVM模型的3個(gè)超參數(shù)以及SMOTE算法平衡樣本數(shù)據(jù),所優(yōu)化的3個(gè)超參數(shù)分別為K(Kernel)、C和G(Gamma)。其中,K為決定SVM核函數(shù)類型的超參數(shù);C為懲罰參數(shù),影響著SVM分類器對數(shù)據(jù)分類的嚴(yán)格程度;G為選用RBF作為核函數(shù)后自帶的一個(gè)參數(shù),決定了數(shù)據(jù)映射到新的特征空間后的分布,當(dāng)選用RBF以外的核函數(shù)時(shí),不賦予G值。
使用Python語言建立BO-SVM模型。如圖4所示,BO-SVM模型的算法主要包含七個(gè)步驟:

圖4 BO-SVM模型建立過程
第一步:收集高速?zèng)_擊下SC墻局部損傷模式數(shù)據(jù)。
第二步:對收集的數(shù)據(jù)進(jìn)行5折交叉驗(yàn)證。在這一步驟中,SC墻數(shù)據(jù)被分為5個(gè)數(shù)據(jù)集,其中4個(gè)數(shù)據(jù)集用來訓(xùn)練,另1個(gè)數(shù)據(jù)集用來測試。整個(gè)交叉驗(yàn)證過程中,BO-SVM模型被訓(xùn)練和測試了5次。
第三步:對劃分的訓(xùn)練集進(jìn)行SMOTE過采樣。
第四步:建立SVM模型作為基礎(chǔ)模型。
第五步:使用BO優(yōu)化SVM。對過采樣后的訓(xùn)練集進(jìn)行訓(xùn)練,尋找效果最好的模型對應(yīng)的超參數(shù)。這一步驟使用BO算法對SVM模型的K,C和G3個(gè)超參數(shù)進(jìn)行優(yōu)化。其中,K的搜索范圍為linear(線性核)、polynomial(多項(xiàng)式核)、rbf(高斯核)三種類型的核函數(shù);C的搜索范圍為[0.001, 1000];G的搜索范圍為[0.001, 1000]。
第六步:使用獲得的超參數(shù)構(gòu)建最終的BO-SVM模型,并在測試集上進(jìn)一步測試模型效果。
第七步:從第二步開始重復(fù)該過程,其中交叉驗(yàn)證過程生成另一個(gè)訓(xùn)練測試集。
本文使用準(zhǔn)確率(Accuracy)、F1得分(F1-score)和G-mean 3個(gè)指標(biāo)來度量分類模型的性能。以上指標(biāo)均需根據(jù)表1所示的樣本混淆矩陣來進(jìn)行計(jì)算。

表1 混淆矩陣
1) 準(zhǔn)確率(Accuracy)。準(zhǔn)確率可以衡量模型的整體分類效果,準(zhǔn)確率越接近1,分類效果越好,其計(jì)算公式如下:
(12)
式中:A為準(zhǔn)確率(Accuracy)。
2) F1得分(F1-Score)。F1-Score[24]為查準(zhǔn)率(Precision)和召回率(Recall)的調(diào)和值。其中,Precision為正確預(yù)測為某類占全部預(yù)測為某類的比例,Recall為正確預(yù)測為某類占全部實(shí)際為某類的比例。F1-Score越接近1,分類效果越好,其計(jì)算公式如下:
(13)
(14)
(15)
式中:P為查準(zhǔn)率(Precision);R為召回率(Recall);F為F1得分(F1-Score)。
3) G-mean[25]是各類樣本召回率的幾何平均值。相對于其他指標(biāo),G-mean對判別模型在少數(shù)類別上的判別效果更敏感,只有當(dāng)各類樣本分類精度均較高時(shí),G-mean才會(huì)較大。G-mean越接近1,分類效果越好,對于多分類問題,其計(jì)算公式如下:
(16)
式中:M為各類樣本召回率的幾何平均值(G-mean)。
本文在BRUHL等[10]匯編的130組樣本組成的數(shù)據(jù)庫基礎(chǔ)上,增加了LEE等[15]、KIM等[16-17]和XU等[26]報(bào)道的試驗(yàn)樣本。由于鋼板撕裂破壞為沖擊物恰好穿透試件且無殘余速度的臨界破壞模式,且該類別的試驗(yàn)樣本較少,因此在研究中偏于保守地將其歸類為貫穿破壞模式。同時(shí),剔除僅含有前鋼板的樣本,最終數(shù)據(jù)庫中共采集到163組樣本。
數(shù)據(jù)庫中的樣本均為研究人員對鋼板混凝土墻進(jìn)行的高速?zèng)_擊試驗(yàn)得到。如圖5所示,沖擊物由氣槍射出,垂直射向鋼板混凝土墻,通過高速攝像機(jī)記錄整個(gè)碰撞過程。試驗(yàn)完成后,觀察試件的局部變形和失效模式。表2提供了各研究人員通過高速?zèng)_擊試驗(yàn)得到的3種損傷模式的樣本數(shù)。

表2 數(shù)據(jù)庫試驗(yàn)結(jié)果匯總[10,15-17] 組

圖5 高速?zèng)_擊試驗(yàn)裝置
由表2可知,最終采集到的163組試驗(yàn)樣本共包含3個(gè)輸出類別:侵入——40組樣本;鼓起——75組樣本;貫穿——48組樣本。輸入包含10個(gè)特征,輸入特征見表3。

表3 訓(xùn)練模型的特征描述
2.2.1 輸入?yún)?shù)靈敏度分析
從現(xiàn)有的試驗(yàn)數(shù)據(jù)中共采集到如表3所示的10個(gè)輸入?yún)?shù),輸入過多對結(jié)果貢獻(xiàn)程度較小的參數(shù)可能會(huì)導(dǎo)致建立的機(jī)器學(xué)習(xí)模型產(chǎn)生過擬合現(xiàn)象,而以往的研究并未具體討論各個(gè)輸入?yún)?shù)對最終結(jié)果的影響程度,因此使用RF算法對模型輸入?yún)?shù)進(jìn)行靈敏度分析,并剔除對結(jié)果影響極小或者無關(guān)的參數(shù)。
如圖6所示,根據(jù)RF算法分析得到的權(quán)重可知混凝土厚度Tc為影響SC墻損傷模式最重要的參數(shù),其次,沖擊初速度v0和混凝土抗壓強(qiáng)度fc也是判斷損壞模式的關(guān)鍵指標(biāo),這可以為高速?zèng)_擊下的參數(shù)優(yōu)化提供參考。同時(shí),從圖6中可以看出,每個(gè)輸入?yún)?shù)都對結(jié)果有明顯影響,因此不對輸入?yún)?shù)進(jìn)行剔除。

圖6 模型各輸入?yún)?shù)重要程度
2.2.2 數(shù)據(jù)過采樣
從采集到的數(shù)據(jù)可以看出,各個(gè)類別的樣本數(shù)量分布不均,損傷模式為侵入和貫穿的樣本數(shù)明顯少于損傷模式為鼓起的樣本數(shù)。因?qū)Σ黄胶獾臄?shù)據(jù)集的分類預(yù)測會(huì)產(chǎn)生較大誤差[27],往往會(huì)使預(yù)測結(jié)果偏向多數(shù)類,故采用SMOTE采樣算法[28]對侵入類和貫穿類數(shù)據(jù)進(jìn)行過采樣,為少數(shù)類別生成更多的數(shù)據(jù)。同時(shí),使用交叉驗(yàn)證將數(shù)據(jù)集分為5個(gè)部分,其中1個(gè)數(shù)據(jù)集用于性能評估,剩余4個(gè)數(shù)據(jù)集用于模型訓(xùn)練和選擇,此過程有助于使模型產(chǎn)生更可靠的結(jié)果[29]。
按照圖4所示流程建立BO-SVM模型并與SVM(有過采樣)模型、SVM模型、KNN模型和隨機(jī)森林(RF)模型進(jìn)行對比。為盡量降低模型誤差,除BO-SVM模型以外的4個(gè)模型超參數(shù)均采用試錯(cuò)法進(jìn)行選擇。因此,由試錯(cuò)法選擇的基礎(chǔ)SVM模型K=’rbf’,C=20,G=4.6;在KNN模型中,鄰居數(shù)k過小會(huì)導(dǎo)致過擬合,k過大會(huì)使整體模型變得簡單,從而導(dǎo)致精度不夠。經(jīng)試錯(cuò)過程選擇k_neighbors=10,p=1;RF模型的決策樹數(shù)目ntree=500。最終所提出的BO-SVM模型K=’polynomial’,C=546,其余超參數(shù)與基礎(chǔ)SVM模型相同。
5個(gè)模型的平均F1-Score結(jié)果見表4,可以看出BO-SVM模型的F1-Score為0.73,高于其他4個(gè)模型,這表明提出的BO-SVM模型具有較高的預(yù)測能力。

表4 不同模型評價(jià)指標(biāo)結(jié)果
由表4可以看出,BO-SVM模型的G-mean值為0.73,高于其他4個(gè)模型。SVM(有過采樣)模型的G-mean值為0.60,大于SVM模型的0.55,這說明SMOTE過采樣增加了SVM模型對正負(fù)類樣本的判別效果。可以看出,BO-SVM模型無論是對多數(shù)類還是少數(shù)類樣本,都有較好的判別效果。
由表4和圖7可知,BO-SVM模型的平均分類準(zhǔn)確率為74.23%,高于其他4個(gè)模型,表明取得最佳超參數(shù)的BO-SVM模型獲得了較高的平均準(zhǔn)確率。同時(shí), SVM(有過采樣)模型對于鼓起破壞模式預(yù)測精度低于SVM模型,但對于侵入類和貫穿類的預(yù)測精度均高于SVM模型,這是因?yàn)镾MOTE過采樣對少數(shù)類產(chǎn)生了一部分偽樣本,從而影響其對多數(shù)類的判別,但也使SVM(有過采樣)模型對少數(shù)類別預(yù)測的精度有所提高,使整個(gè)模型更加均衡。對比KNN模型和RF模型,RF模型的準(zhǔn)確率優(yōu)于SVM(有過采樣)模型僅次于SVM模型,且RF模型對侵入類和貫穿類的預(yù)測精度較低,表明RF模型對少數(shù)類的預(yù)測效果較差??偟膩碚f,盡管BO-SVM模型對鼓起類的預(yù)測精度略小于部分模型,但其平均精度仍然更高,且BO-SVM模型對3個(gè)損傷水平的準(zhǔn)確性比其他模型更加均衡,這有助于更好地預(yù)測未知數(shù)據(jù)。
1) 本文提出的BO-SVM模型平均準(zhǔn)確率達(dá)到74.23 %,遠(yuǎn)優(yōu)于傳統(tǒng)的理論計(jì)算方法,優(yōu)于包括未BO優(yōu)化下的SVM(有和沒有過采樣)模型、KNN模型、RF模型在內(nèi)的傳統(tǒng)機(jī)器學(xué)習(xí)模型。
2) BO方法和SMOTE算法成功達(dá)到尋找模型最佳超參數(shù)和平衡模型樣本的目的,使BO-SVM模型在F1-Score值(0.73)和G-mean值(0.73)方面實(shí)現(xiàn)了更高的損傷預(yù)測能力。
3) BO-SVM模型可用作實(shí)際設(shè)計(jì)中預(yù)測SC墻局部損傷水平的工具,特別是在初始設(shè)計(jì)階段。
4) 利用隨機(jī)森林算法初步分析了各輸入?yún)?shù)對損壞模式影響的重要程度,為高速?zèng)_擊下的參數(shù)優(yōu)化提供參考。
5) 該研究僅限于考慮SVM模型的3個(gè)超參數(shù),下一步應(yīng)考慮對其他超參數(shù)優(yōu)化以及更優(yōu)秀的過采樣技術(shù)提高模型性能。