王志祥, 李建閣
(1.長安大學 公路學院, 陜西 西安 710064; 2.廣東華路交通科技有限公司, 廣東 廣州 510420)
苯乙烯-丁二烯-苯乙烯嵌段共聚物(SBS)改性瀝青路面有效減少了車轍、坑槽、裂縫等早期病害的出現[1-2],增加了1~2 a使用壽命,提高了服務水平,因此SBS改性瀝青的研究及應用備受青睞[3-4].SBS用量的劇增,導致了其價格上漲,以次充好、缺斤短兩的現象偶有發生,使改性瀝青中SBS的含量及其性能無法保證.傳統評價SBS含量的方法主要基于改性瀝青的儲存穩定性,對其針入度、延度、軟化點和黏度等物理性能進行測試,但該測試方法耗時長、準確性和重現性較差[5-6];采用熒光顯微鏡定量檢測SBS含量,準確性較低[7];化學滴定方法雖然能夠測試改性瀝青中SBS的含量,但耗時長達2h,并且會釋放有毒氣體,危害試驗人員身體健康[8];通過傅里葉變換紅外光譜(FTIR)儀測定改性瀝青的紅外譜圖[9],基于特征峰與SBS含量的線性相關性,建立不同SBS含量改性瀝青標準曲線,可以測定改性瀝青中SBS的含量[10],但是其制樣的均勻性難以保證,紅外光譜峰的識別與提取、數據處理繁瑣且復雜,這給改性瀝青中SBS含量的測定帶來了困難[11].深度神經網絡(DNN)在精準預測方面具有顯著優勢[12].基于DNN,本文提出了改性瀝青中SBS含量的預測模型(DNN模型),旨在精準預測改性瀝青中SBS的含量,提升瀝青的質量,改善瀝青路面的使用品質.
瀝青采用Shell-70#基質瀝青(BA),其性能指標見表1.改性劑為韓國LG411星型SBS與LG501線型SBS的混合物,二者摻配比(1)文中涉及的比值、用量、含量等均為質量比或質量分數.為1∶1;SBS顆粒色澤光亮,粒度均勻,雜質含量較少,無明顯黏聚性,其性能指標見表2.根據工程經驗,采用工業硫磺穩定劑(用量為瀝青質量的2‰)增強SBS與瀝青之間的黏聚力,確保改性瀝青的儲存穩定性.

表1 基質瀝青的性能指標

表2 SBS的性能指標
采用配備ZnSe ATR附件的Controls Cary 630型FTIR,測試溫度控制在20℃左右,光譜范圍為4000~650cm-1,波數精度高于0.005cm-1,掃描次數為32次,分辨率為4cm-1.


圖1 基質瀝青及SBS改性瀝青的紅外光譜圖
2.1.1降噪
制備7種SBS改性瀝青和1種基質瀝青的FTIR測試樣品,每種樣品30個,共得到240個樣本.對其進行FTIR測試,得到240個FTIR圖譜特征數據,并進行DNN訓練與測試.FTIR圖譜采用Savitzky-Golay過濾器進行平滑預處理,減少噪聲干擾[14-15],同時對異常光譜進行剔除,得到227個有效FTIR圖譜.隨機抽取180個有效FTIR圖譜作為DNN訓練樣本,樣本編號為1~180,剩余的47個有效FTIR圖譜作為DNN測試樣本,樣本編號為1~47.
2.1.2降維
每個FTIR圖譜均包含900個特征(維度),227個圖譜共有227×900個特征.采用奇異值分解算法對特征值數據的主成分進行降維,將輸入數據轉換成1組線性無關的特征值和相應的特征向量[16].在保留能夠代表原始數據95%以上特征的前提下進行降維,最終得到227×512個特征數據.
將降噪+降維后的數據作為DNN訓練和測試樣本的數據庫,其樣本信息見表3.表3中,N為數據預處理后的數據數量,Ntrain為用來訓練的數據數量,Ntest為用來測試的數據數量.

表3 數據庫樣本信息
為保證神經元直接快速并準確傳遞有效信息,對DNN結構進行設計,建立的DNN結構體系見圖2.由圖2可見:DNN由輸入層、輸出層和11個隱藏層組成,隱藏層從第2層到第12層依次排列,以提高學習的深度和模型表達能力;隱藏層神經元節點數分別設置為512、256、256、128、128、64、64、32、32、16和16,以提高計算機的處理效率,加快優化速度;同1層神經元之間沒有聯系,但它們與下1個相鄰層的每個神經元完全相連;將式(1)中SBS改性瀝青FTIR數據的特征向量X導入到包含512個神經元的輸入層中;X(k)為X中的1個元素,為第k個樣本FTIR數據的特征向量,k=1,2,3,…,m,m為樣本數;根據輸入值X,由式(3)計算得出SBS含量的輸出特征向量Y.

圖2 DNN結構體系
X=(X(1),X(2),…,X(k),…,X(m))T
(1)
(2)
(3)
(4)
(5)

為避免在DNN的反向傳播過程中出現梯度消失現象,提高計算速度和精度,同時降低DNN參數的依賴性與過度擬合的概率,采用ReLU(梯度總是0或1)作為激活函數[17]:
f(x)=ReLU(x)=max(0,x)
(6)
式中:x表示輸入值;f(x)表示輸出值.

2.4.1損失函數
DNN訓練通常采用損失函數J,使DNN模型輸出特征向量Y的預測值與事先已知的用來監督預測模型的并和預測值相對應的真實值y(目標值)無限接近.用均方誤差(MSE)作為損失函數J,并以MSE作為模型預測精度的評價指標,MSE值越小,模型預測精度越高.MSE的計算公式為:
(7)
2.4.2學習方法
學習在DNN訓練中起著關鍵作用.學習過程為:首先將預處理后的數據以矩陣的形式輸入到DNN中,進行無監督學習,該過程為前向傳播中的特征學習,權重和偏差特征向量的初始值用于訓練第1層并生成用于訓練第2層的特征向量數據;依次利用產生的特征向量數據對下1層進行訓練,直到最后1層完成訓練后,得到各層相應的權重和偏差特征向量數據;最后對數據標記后進行監督學習,以調整DNN參數的權重和偏差特征向量.依據損失函數,采用小批量隨機梯度下降法對每次迭代的參數進行更新,設置batch size為20,參數更新如式(8)、(9)所示.
(8)
(9)

2.4.3初始化、規范化和歸一化

(10)
式中:ninput和noutput分別為輸入、輸出層連接的神經元個數.
為了降低DNN訓練過程中過擬合出現的概率,常采dropout對DNN進行規范化,在每次迭代中,隨機隱藏一半的神經元,在正向和反向傳播中,隱藏的神經元都不會被激活.
通過批量歸一化,固定輸入層數據,優化求解過程,確保梯度穩定,加快收斂速度和學習速度,防止梯度消失.特征向量X與矩陣特征值Z之間的關系為:
(11)
式中:μ、σ分別為特征向量X中批量數據的平均值和標準差;γ、β分別為由DNN訓練得到的尺度因子和位移因子;ζ為平滑因子,為無窮小的數字,防止除數為零.
2.4.4DNN模型的效率
本文使用的計算機處理器為Inter(R)core(TM) i7-8700 CPU@3.20GHz,顯卡類型為Nvidia Geforce GTX 10708G GPU.通過CPU加速對DNN進行訓練,前向傳播學習和后向反饋學習時間分別為8.22、25.37s.
DNN測試的目的是分析預測模型準確性.采用測試樣本進行DNN測試,若測試樣本的均方誤差小于訓練樣本,說明模型預測準確性較好;否則,應重新調整網絡結構及其參數,直至測試樣本的均方誤差小于訓練樣本為止.
其他條件相同,以MSE作為評價指標,研究了降噪+降維、僅降維、僅降噪3種數據預處理對DNN模型預測精度的影響,結果見表4.

表4 數據預處理對DNN模型預測精度的影響
由表4可見,對比沒有經過數據預處理的DNN模型預測精度,僅降維預處理使MSE降低了6%左右,而僅降噪預處理使MSE降低了64%,降維+降噪預處理的綜合作用使MSE降低了70%,因此數據的降維、降噪等預處理對建立較為精確、魯棒性較好的預測模型有重要的作用.
對訓練樣本集設置不同的迭代次數(Nlit),研究其對模型預測精度的影響,結果見圖3.由圖3可見:隨著訓練樣本集的迭代次數從100次增加到3000 次,DNN模型的MSE逐漸減小,從3.338減小到0.057;前1800次迭代,MSE波動較為明顯,單次的迭代不一定使神經網絡向目標方向發展,但是整體趨向目標,通過反復迭代,調整權重和偏差,使網絡逐漸穩定;當迭代次數從1800次增加到2100 次,MSE緩慢下降,保持穩定在0.057;當迭代次數從2100次增加到3000次,MSE呈現小幅度波動.考慮訓練速度,迭代次數選擇2100次.

圖3 迭代次數對DNN模型預測精度的影響
對數據進行降維+降噪處理,迭代次數為2100次.訓練樣本與測試樣本wSBS的預測值(PV)與目標值(TV)見圖4、5.由圖4可見:訓練樣本的預測值在目標值附近小幅波動;樣本編號為100之前,預測值與目標值基本呈現正偏差狀態;樣本編號在100之后,預測值與目標值出現負偏差,且呈小幅波動整體穩定狀態.由圖5可見:測試樣本的預測值在目標值附近小幅波動,wSBS的預測值穩定在目標值附近.

圖4 訓練樣本的預測值與目標值

圖5 測試樣本的預測值與目標值
為進一步評價DNN模型的擬合優度,將訓練樣本集和測試樣本集中SBS改性瀝青的wSBS預測平均值與目標值進行相關性分析,結果見圖6.由圖6 可見,wSBS預測值的平均值與目標值相關系數R2達到0.9989,而測試樣本預測值的平均值與目標值相關性更好,R2達到0.9996,這也說明了DNN模型的準確性和適用性,通過預測平均值的計算,可以使預測值逼近目標值.

圖6 不同SBS含量的預測值的平均值與目標值的相關性分析

(12)
由表5可見:DNN模型的預測平均值與目標值線性相關系數R2為0.9989,模型預測精度優于SCM和RFM模型;對于同一目標值wSBS=4.7%的樣本,RFM模型精度優于SCM模型,而DNN模型具有更高的精度,達到98.756%.一方面,說明了DNN模型可以準確預測不局限于預測模型訓練集中的wSBS(3.0%、3.5%、4.0%、4.5%、5.0%、5.5%、6.0%),且能預測wSBS為3.0%~6.0%區間任意含量值;另一方面,也說明了DNN模型的預測值更逼近目標值,wSBS目標值為4.3%、5.1%的樣本測試結果具有相同的結論;wSBS目標值4.3%、4.7%、5.1%的樣本測試精度中,wSBS=4.7%的樣本測試精度最高,測試結果最為精確.

表5 3種預測模型預測精度比較
為了驗證DNN模型的敏感性與適用性,選擇不同品牌和標號的基質瀝青(Shell-70#、韓國SK-70#、新加坡IRPC-90#)、SBS(LG411、LG501、LCY3501、LCY3411)制備不同wSBS的SBS改性瀝青,按照本文所述方法測試其FTIR圖譜,同時用神經網絡學習修正的DNN模型,對一定數量樣本的驗證集進行測定及精度評價,結果見表6.

表6 不同改性瀝青SBS含量結果
由表6可見:DNN模型能夠準確預測不同基質瀝青和SBS改性瀝青中的SBS含量,且其預測值與目標值差值均在0.10%的范圍內,精度最低為97.78%,最高為98.75%.由此可見,DNN模型具有很好的敏感性和適用性,能用于準確預測不同種類的SBS改性瀝青中SBS含量.
(1)在進行深度神經網絡(DNN)訓練之前,對數據進行降噪和降維等預處理,可以提高DNN模型的預測精度;相比于沒有進行數據預處理,經過預處理的DNN模型的均方誤差MSE降低了70%.
(2)訓練樣本集的MSE值最終保持在0.057,目標值與預測值接近,DNN模型具有良好的準確性.DNN模型對SBS改性瀝青中SBS含量的預測精度在97%以上,高于標準曲線法和隨機森林法.
(3)基于DNN改性瀝青中SBS含量預測模型對不同基質瀝青與SBS改性瀝青中SBS含量預測具有較好的敏感性和適用性.