張 研,王鵬鵬,吳哲康
(1.廣西巖土力學與工程重點實驗室,桂林 541004;2.桂林理工大學土木與建筑工程學院,桂林 541004)
近些年來,隨著我國建筑行業的不斷發展,工程中對混凝土材料的使用越發廣泛,且對其綜合性能的要求也越來越高[1-3]。影響混凝土性能的因素主要包括內部組成因素、外部環境因素和混凝土本身具有的特性等[4-6],混凝土綜合性能易受多因素的共同作用影響,造成混凝土綜合性能指標與其影響因素之間存在復雜的非線性映射關系。混凝土綜合性能指標可用于指導混凝土結構的合理施工,如何快速獲取該指標成為工程師和科研工作者關注的重點內容和問題。
針對上述內容和問題眾,多學者對不同混凝土性能與影響因素之間的關系開展了一系列研究,如:高冠一等[7]研究了混凝土抗碳化性能與影響因素之間的關系;謝吉程等[8]對機制砂混凝土展開了研究,建立了機制砂混凝土的耐磨性與多因素之間的計算模型。盡管在試驗中,能夠按照規范規程來制備混凝土,但仍存在成本高、控制因素多、浪費人力、時間不足等問題。
近年來,隨著人工智能的不斷發展,機器學習方法逐漸應用到土木工程相關領域[9-10],特別是在利用機器學習方法建立非線性映射關系方面效果突出,如:李地紅等[11]通過BP神經網絡模型建立混凝土綜合性能與主要影響因素之間的關系,為混凝土綜合性能的預測提供了理論借鑒。但BP神經網絡建立起來的模型,其自身存在過擬合、網絡結構難以確定等不完善之處。因此,亟待建立高效、合理的模型,從而對混凝土的綜合性能進行精準預測。
相關向量機(relevance vector machine, RVM)[12-13]是基于支持向量機發展而來,其學習的最大特點是具有稀疏性,利用該模型能極大地提高預測能力和效率[14-15]。因此,本文將參考具體實例數據,選取混凝土28 d強度、坍落擴展度及表觀密度為性能評價指標,建立混凝土綜合性能(28 d強度、坍落擴展度及表觀密度)與其各影響因素間的非線性映射關系,進行擬合訓練來達到預測混凝土28 d強度、坍落擴展度及表觀密度的目的。該模型為全面、準確地解決混凝土性能指標預測、獲取以及評價等方面問題提供了全新的方法和思路。
RVM[16-17]是基于貝葉斯原理運用到回歸問題的,在數據訓練中獲得的稀疏化模型。RVM模型原理如下[18-20]:如果訓練數據集為{xn,tn|n=0,1,2,…,N},那么令tn獨立分布,建立tn的函數關系式。
tn=y(xn;ω)+ξn
(1)
(2)

(3)
式中:yc為核函數中心;δ為高斯核寬度。
設tn為相互獨立分布,則似然函數表達為:
(4)
式中:t=(t1,…,tN)T;權向量ω=[ω0,ω1,…,ωN]T;Φ為核函數組成的N×(N+1)階矩陣;σ2為高斯噪聲方差。

(5)
其中,關于權重對應的參數全是獨立分布的,進一步減緩了函數計算的復雜性,先驗超參數αn為N+1維超參數,α=(α0,α1,…,αN),α作為權值ω的先驗超參數,假定超參數α和噪聲參數σ2服從Gamma先驗概率分布:
(6)
P(σ2)=Gamma(c,d)
(7)
Gamma(a,b)=Γ(a)-1baαa-1e-ba
(8)

(9)
為了使上述參數沒有先驗知識,通常情況下規定非常小的參數數值,一般規定:a=b=c=d=0。
基于以上參數訓練樣本后的ω概率分布如下:
(10)
式中:∑=(σ-2ΦTΦ+A)-1,表示方差;μ=σ-2ΣΦTt,表示均值;A=diag(α0,α1,…,αN)為對角矩陣。
(11)
(12)

混凝土的綜合性能受多重因素的綜合作用,通過收集文獻中的試驗數據得到了主要影響因素。采用RVM模型,以混凝土28 d強度、坍落擴展度及表觀密度為性能評價指標,建立混凝土綜合性能指標與影響因素之間的非線性映射關系。根據文獻[11]及混凝土強度的直接影響因素選取壓碎指標(粗骨料)、壓碎指標(細骨料)、細度模數、減水劑、坍落度、7 d強度等6個主要因素作為輸入數據,混凝土綜合性能指標(28 d強度、坍落擴展度及表觀密度)作為輸出數據,混凝土綜合性能樣本集見表1。根據RVM回歸預測模型的原理,建立基于RVM的混凝土綜合性能模型,如圖1所示。

表1 混凝土綜合性能樣本集[11]Table 1 Sample collection of concrete comprehensive performance[11]

圖1 基于RVM的混凝土綜合性能模型Fig.1 Concrete comprehensive performance model based on RVM
(1)收集混凝土試驗時所得到的數據,并對數據進行分析與整理,把樣本數據中的6個主要影響因素作為輸入數據,把評價混凝土綜合性能的3個指標(28 d強度、坍落擴展度及表觀密度)作為輸出數據。由于不同因素采用的單位量級差別過大會影響RVM模型預測精度,因此需要對數據進行標準化處理(見式(13))。
(13)

(14)
(2)以標準化處理后的輸入數據和輸出數據為基礎建立訓練集并用于擬合訓練,得到模型預測參數的估計值。選取部分樣本數據作為學習樣本,剩余樣本數據作為預測樣本,對剩余樣本的真實值和預測值進行對比,檢測模型的預測效果。
(3)運用建立起來的RVM模型,以學習樣本的預測值與實測值的誤差作為精度依據,不斷設置、調整模型中的超參數和迭代次數,從而找到符合該性能指標精度要求的RVM模型參數。
(4)通過調整得到符合精度要求的模型最優超參數和精度,以此RVM預測模型對預測樣本進行預測分析。通過對樣本實測值與相應預測值進行多個指標的對比分析(相對誤差、平均相對誤差等),來驗證建立起來的RVM預測模型是否具有準確性和可靠性。
19組混凝土試驗的數據如表1所示,利用上述RVM預測模型進行應用分析。在相同的數據集樣本下與文獻[11]中利用BP神經網絡得到的預測結果進行對比分析,其中,選取前14組數據作為訓練學習樣本,而剩余的5組數據作為預測樣本;選取壓碎指標(粗骨料)、壓碎指標(細骨料)、細度模數、減水劑、坍落度、7 d強度6個主要影響因素作為輸入數據,混凝土的28 d強度、坍落擴展度及表觀密度3個指標作為輸出數據,在對這3個指標進行預測時,需根據混凝土的每一個綜合性能評價指標不斷設置模型中的超參數和迭代次數,從而找到符合該性能指標精度要求的RVM模型參數,建立該指標的RVM預測模型。該RVM模型主要針對小樣本數據。
該程序是通過調節高斯核寬度δ和迭代次數進行精準預測的,寬度參數δ、高斯核函數中心xc、可調參數在核函數的性能中起著重要的作用,高斯核函數本身較為穩定,其收斂范圍寬闊,預測結果較為平穩。其中:高斯核寬度對預測結果有較大影響,若取值較小將會使方法過高估計,導致預測結果偏差較大;若取值較大將使方法低估,會對訓練數據中的噪聲過于敏感,使得方法的穩定性降低。迭代次數與精度作為程序收斂的兩個條件,若取值太小將達不到本文所需精度要求,因此迭代次數通常取較大整數值,保證程序能夠精度收斂。另外,訓練樣本數量多少對RVM模型參數的取值有一定的影響,其中高斯核寬度隨著訓練樣本數量改變而變化,迭代次數取值越大其預測值越接近實際值,且訓練樣本數據越多,該模型所得到的預測結果越準確。
對于該樣本數量下的模型,通常將高斯核寬度取2左右的數值進行調節,并由公式(3)進行檢驗。通過不斷調節δ,得出符合混凝土28 d強度預測模型的最優高斯核寬度δ=1.7,此時預測值和實測值較為接近,通過調節迭代次數來進行加強訓練,當迭代次數為100時,預測值和實測值的平均相對誤差為0.050%,達到了最小值。符合混凝土坍落擴展度預測模型的最優高斯核寬度為δ=1.4,此時預測值和實測值較為接近,通過調節迭代次數來進行加強訓練,當迭代次數為100時,預測值和實測值的平均相對誤差為0.034%,達到了最小值。符合混凝土表觀密度預測模型的最優高斯核寬度為δ=1.6,此時預測值和實測值較為接近,通過調節迭代次數來進行加強訓練,當迭代次數為100時,預測值和實測值的平均相對誤差為0.049%,達到了最小值。
基于表1中的訓練樣本,調整選取最優超參數及迭代次數,建立RVM預測模型,對樣本進行預測,結果如表2~表4所示,且表中給出了文獻[11]中BP神經網絡模型采用同樣數據時的預測結果。結果顯示:RVM模型得到的混凝土綜合性能指標28 d強度、坍落擴展度及表觀密度的預測值與實際值接近度更高,其中最大的相對誤差絕對值為混凝土28 d強度進行預測的15號樣本,為0.128%;而利用BP神經網絡模型得到的混凝土28 d強度預測值的最大相對誤差由18號樣本得到,高達24.41%。現將這兩種預測模型的各個預測樣本結果進行直觀對比,如圖2~圖4所示。

表2 BP神經網絡模型和RVM模型的28 d強度預測結果及實測值比較Table 2 Comparison of 28 d strength prediction results and measured values between BP neural network model and RVM model

表3 BP神經網絡模型和RVM模型的坍落擴展度預測結果及實測值比較Table 3 Comparison of slump extension prediction results and measured values between BP neural network model and RVM model

續表

表4 BP神經網絡模型和RVM模型的表觀密度預測結果及實測值比較Table 4 Comparison of apparent density prediction results and measured values between BP neural network model and RVM model

圖2 BP神經網絡模型和RVM模型的混凝土 28 d強度預測結果比較Fig.2 Comparison of prediction results of concrete 28 d strength between BP neural network model and RVM model

圖3 BP神經網絡模型和RVM模型的混凝土 坍落擴展度預測結果比較Fig.3 Comparison of prediction results of concrete slump extension between BP neural network model and RVM model

圖4 BP神經網絡模型和RVM模型的混凝土 表觀密度預測結果比較Fig.4 Comparison of prediction results of concrete apparent density between BP neural network model and RVM model
從圖2~圖4可以看出:利用RVM模型得到的各預測值與實測值的接近程度明顯高于BP神經網絡模型得到的預測結果與實測值的接近程度。另外,觀察到利用BP神經網絡模型得到的混凝土28 d強度,其18及19號樣本的預測值很明顯已經偏離實測值;混凝土坍落擴展度,其17、18及19號樣本的預測值也已偏離實測值;混凝土表觀密度,其16及19號樣本的預測值與實測值偏離程度較高。而利用RVM模型得到的混凝土綜合性能指標的預測結果卻很好。因此,相比于BP神經網絡模型,RVM模型獲得的預測結果精度更好、更高。現通過文獻[20]中的平均相對誤差(ARE)和均方差(FMSE)這兩個指標來更好地對比這兩種模型整體預測精度和離散情況,計算公式如下:
(15)
(16)
式中:y′i為實測值;yi為預測值;n為樣本個數。
表5為RVM模型和BP神經網絡模型混凝土性能指標的平均相對誤差及均方差,由表中計算結果可知:RVM模型對混凝土綜合性能指標預測結果的平均相對誤差只有0.050%、0.034%、0.049%,均方差為0.037、0.196、1.855;而利用BP神經網絡模型,其平均相對誤差為10.84%、8.31%、0.95%,均方差為6.84、50.95、30.08。為了更加清晰地對比RVM模型和BP神經網絡模型的平均相對誤差和均方差的大小,結果如圖5和圖6所示。

表5 RVM模型和BP神經網絡模型混凝土性能指標的平均相對誤差及均方差Table 5 Average relative error and mean square error of concrete performance index of RVM model and BP neural network model

圖5 RVM模型和BP神經網絡模型的平均相對誤差Fig.5 Average relative error of RVM model and BP neural network model

圖6 RVM模型和BP神經網絡模型的均方差Fig.6 Mean square error of RVM model and BP neural network model
由此看出,無論是從平均相對誤差,還是均方差,RVM模型更優于BP神經網絡模型。根據對比結果可得,相比于BP神經網絡預測模型,本文提出的預測混凝土綜合性能的RVM模型整體預測精度更高,得到的樣本預測值離散性更小。
(1)在相同的樣本數據條件下,RVM模型得到的結果比由BP神經網絡模型得到的結果更好,RVM模型獲得的預測值與實測值的接近程度更高;另外,RVM模型預測結果的平均相對誤差及均方差均小于BP神經網絡模型預測的結果,說明RVM模型具有精度高、離散度小等優點,更容易達到預期結果。
(2)利用RVM模型得到的混凝土各性能指標(28 d強度、坍落擴展度、表觀密度)與實際值相比,其平均相對誤差僅為0.050%、0.034%、0.049%,進一步表明RVM模型的預測值與試驗實際值偏差不大,準確度高,其預測精度是可靠的。
(3)為了使RVM模型精確度更高,更有說服力,可在實際應用中收集更多試驗數據,總結出更完善的非線性映射關系,降低數據的偶然性,使各影響因素之間的非映射關系更加完善,從而使建立的預測混凝土綜合性能的RVM模型更具有實用性和廣泛性。