陳祝丹,李大字*,劉 軍,高 科
(1.北京化工大學(xué) 信息科學(xué)與技術(shù)學(xué)院,北京 100029;2.北京化工大學(xué) 材料科學(xué)與工程學(xué)院,北京 100029)
玻璃化溫度(Tg)作為聚合物的重要工藝指標(biāo),指聚合物高彈態(tài)與玻璃態(tài)之間的轉(zhuǎn)換溫度。溶聚丁苯橡膠(SSBR)[1]在Tg以上表現(xiàn)為具有高彈性的高彈態(tài),在Tg以下表現(xiàn)為具有脆性的玻璃態(tài)。由于橡膠的Tg會(huì)影響其物理性能、阻尼性能、耐熱性能等,其一直是橡膠性質(zhì)的重要指標(biāo)。
影響合成橡膠Tg的因素包括聚合物中各組分含量和微觀(guān)結(jié)構(gòu)等[2-3]。合成橡膠的Tg通常采用差示掃描量熱儀、動(dòng)態(tài)熱機(jī)械分析儀等測(cè)試[4-6],Tg測(cè)試值會(huì)隨測(cè)試方法和條件的變化而改變,且無(wú)法預(yù)測(cè)Tg,即測(cè)試缺乏擴(kuò)展性和靈活性;測(cè)試過(guò)程需進(jìn)行重復(fù)試驗(yàn),消耗大量的人力和物力,測(cè)試結(jié)果還會(huì)受到設(shè)備的影響。不同苯乙烯和丁二烯含量的SSBR的Tg不同,要實(shí)現(xiàn)其良好表征,目前測(cè)試方法的預(yù)測(cè)分析能力受到極大地限制。
隨著機(jī)器學(xué)習(xí)在材料學(xué)科的應(yīng)用越來(lái)越廣泛[7-9],研究學(xué)者開(kāi)始開(kāi)發(fā)新的方法研究高聚物的Tg測(cè)試。通過(guò)神經(jīng)網(wǎng)絡(luò)來(lái)建立高聚物的Tg預(yù)測(cè)模型是一種普遍且備受關(guān)注的方法[10],但神經(jīng)網(wǎng)絡(luò)也有很多不足。神經(jīng)網(wǎng)絡(luò)需要依賴(lài)訓(xùn)練數(shù)據(jù),數(shù)據(jù)的多樣性和數(shù)量對(duì)網(wǎng)絡(luò)性能具有重大影響。橡膠每次合成和表征都需要研究人員進(jìn)行設(shè)計(jì)和反復(fù)試驗(yàn),這限制了訓(xùn)練數(shù)據(jù)的多樣性。
高斯過(guò)程回歸[11]是基于統(tǒng)計(jì)學(xué)理論,可以在模型搭建的過(guò)程中自適應(yīng)地得到超參數(shù),并給予預(yù)測(cè)輸出明確的概率解釋。因此,與反向傳播(BP)神經(jīng)網(wǎng)絡(luò)相比,高斯過(guò)程回歸具有更少的參數(shù)和更快的收斂速度,以及對(duì)小樣本、非線(xiàn)性問(wèn)題具有難以取代的優(yōu)勢(shì)[12]。
本工作以實(shí)例數(shù)據(jù)為樣本,利用高斯過(guò)程回歸模型分析苯乙烯和丁二烯含量對(duì)SSBR的Tg的影響,從而預(yù)測(cè)Tg,以期為實(shí)際生產(chǎn)過(guò)程中預(yù)測(cè)和控制橡膠的Tg提供參考。
高斯過(guò)程回歸是一種貝葉斯學(xué)習(xí)框架下的無(wú)參數(shù)核方法[13-14]。通過(guò)直接對(duì)函數(shù)建模,產(chǎn)生非參數(shù)模型。對(duì)訓(xùn)練輸入數(shù)據(jù)X=x1,x2,x3,…,xn,x*及其對(duì)應(yīng)輸出數(shù)據(jù)Y=y(tǒng)1,y2,y3,…,yn,y*建立的回歸方程為

式中:回歸函數(shù)f(X)不需要指定具體形式,可以認(rèn)為是在高斯回歸過(guò)程中采樣得到的一個(gè)無(wú)窮維的點(diǎn);N(0,n2σ)表示均值為0、方差為n2σ的噪聲;G(0,K)是均值為0、協(xié)方差為K的高斯回歸過(guò)程;對(duì)于新輸入x*和對(duì)應(yīng)輸出y*仍有相同的映射關(guān)系。
利用協(xié)方差函數(shù),即核函數(shù)反映高斯回歸過(guò)程中數(shù)據(jù)點(diǎn)之間的相互關(guān)系,本課題選取徑向基(RBF)核函數(shù)作為協(xié)方差函數(shù):

式中,K(x,x′)是x與x′之間的協(xié)方差,σf和l為可調(diào)節(jié)的參數(shù)。
要求取一個(gè)新輸入x*及其對(duì)應(yīng)輸出y*依然滿(mǎn)足上述高斯分布,利用上述協(xié)方差矩陣可以得出式(3)和(4):

根據(jù)貝葉斯回歸方法,預(yù)測(cè)數(shù)據(jù)y*的條件分布P(y*|y)服從如下高斯分布:

分布的均值可以作為y*的估計(jì)值:

分布的協(xié)方差表示預(yù)測(cè)值的不確定性:

因此,高斯過(guò)程回歸模型不僅可以模擬任何黑盒模型,還可以計(jì)算置信區(qū)間,即計(jì)算模擬的不確定性。
本課題采用數(shù)據(jù)從文獻(xiàn)[15]中獲取,在橡膠合成過(guò)程中,采用復(fù)合結(jié)構(gòu)調(diào)節(jié)劑調(diào)節(jié)苯乙烯和丁二烯含量,合成了多種結(jié)構(gòu)的SSBR,研究苯乙烯含量對(duì)SSBR的Tg的影響。試樣包含12種苯乙烯含量的SSBR,其苯乙烯含量為5%~45%,丁二烯含量為24%~78%。不同苯乙烯和丁二烯含量SSBR的Tg如表1所示。其中,1#—8#試樣數(shù)據(jù)構(gòu)建高斯過(guò)程回歸模型,9#—12#試樣數(shù)據(jù)驗(yàn)證模型的有效性。

表1 不同苯乙烯和丁二烯含量的SSBR的TgTab.1 Tg of SSBR with different styrene and butadiene contents
利用表1中1#—8#試樣數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),參數(shù)設(shè)置為σf和l,建立高斯過(guò)程回歸模型。同時(shí),利用相同的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),本課題構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型作為對(duì)比試驗(yàn)。為了提高BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)能力,對(duì)訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)進(jìn)行了歸一化處理。通過(guò)多次試驗(yàn),優(yōu)化選取了2-8-1網(wǎng)絡(luò)結(jié)構(gòu),即網(wǎng)絡(luò)有3層,輸入層包含2個(gè)節(jié)點(diǎn)、隱含層包括8個(gè)節(jié)點(diǎn)、輸出層包含1個(gè)節(jié)點(diǎn),學(xué)習(xí)率設(shè)為0.2。
SSBR的Tg測(cè)試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)輸出結(jié)果如表2所示。測(cè)試誤差采用絕對(duì)誤差和相對(duì)誤差來(lái)表示,前者反映誤差的大小,后者是絕對(duì)誤差占真值的百分比,可以反映誤差的偏離程度。
從表2可以看出,BP神經(jīng)網(wǎng)絡(luò)模型Tg預(yù)測(cè)值的最大絕對(duì)誤差和最大相對(duì)誤差分別高達(dá)26.47 ℃和44.9%,高斯過(guò)程回歸模型預(yù)測(cè)的最大絕對(duì)誤差和最大相對(duì)誤差分別為2.37 ℃和5.5%,后者結(jié)果更理想。高斯過(guò)程回歸模型的偏差遠(yuǎn)小于BP神經(jīng)網(wǎng)絡(luò)模型,表明高斯過(guò)程回歸模型的可靠性和有效性。

表2 SSBR的Tg測(cè)試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)輸出結(jié)果Tab.2 Testing data and train data output results of SSBR
為了了解2種模型的有效性和泛化性,對(duì)苯乙烯含量為5%~45%和丁二烯含量為24%~78%的SSBR的Tg進(jìn)行預(yù)測(cè),在設(shè)定范圍內(nèi)均勻采取40 000組含量值作為輸入,求高斯過(guò)程回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型對(duì)應(yīng)預(yù)測(cè)的Tg,并將預(yù)測(cè)結(jié)果繪制成3D圖像,如圖1和2所示。

圖1 高斯過(guò)程回歸模型預(yù)測(cè)SSBR的Tg的3D圖像Fig.1 3D image of Tg of SSBR by Gaussian process regression model
從圖1可以看出,SSBR的Tg與苯乙烯和丁二烯含量的有關(guān)。在苯乙烯含量不變時(shí),Tg隨丁二烯含量增大而升高;在丁二烯含量不變時(shí),Tg隨苯乙烯含量增大而升高。高斯過(guò)程回歸模型的輸出結(jié)果與試驗(yàn)數(shù)據(jù)分析結(jié)果[15]一致,這也證明了該模型的可靠性和有效性。
從圖2可以看出,BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的三維曲面不符合已知的映射關(guān)系。根據(jù)BP神經(jīng)網(wǎng)絡(luò)的特性推想模型效果不佳的原因是訓(xùn)練數(shù)據(jù)過(guò)少,從而B(niǎo)P神經(jīng)網(wǎng)絡(luò)中的參數(shù)訓(xùn)練不完全。

圖2 BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)SSBR的Tg的3D圖像Fig.2 3D image of Tg of SSBR by BP neural network model
(1)通過(guò)實(shí)例數(shù)據(jù)分析表明,高斯過(guò)程回歸建立的SSBR的Tg預(yù)測(cè)模型切實(shí)可行,還可對(duì)一定范圍內(nèi)苯乙烯和丁二烯含量對(duì)SSBR的Tg的影響進(jìn)行定性和定量分析。
(2)與BP神經(jīng)網(wǎng)絡(luò)模型相比,高斯過(guò)程回歸模型解決小樣本問(wèn)題具有優(yōu)越性,可為更多復(fù)雜耗時(shí)的試驗(yàn)數(shù)據(jù)預(yù)測(cè)提供有效解決方案。
(3)高斯過(guò)程回歸模型可通過(guò)添加更多Tg數(shù)據(jù),即通過(guò)增加學(xué)習(xí)數(shù)據(jù),進(jìn)一步提高模型的預(yù)測(cè)精度和可靠性。