劉永紅 屈希峰



混凝土強度關乎土木結構安全,影響混凝土強度的因素諸多,文章采用機器學習LGBM回歸算法分析臺灣重華大學信息管理系葉怡成教授的混凝土強度試驗相關數據,通過數據分析驗證影響混凝土強度各因素的重要性,并回歸預測混凝土強度。該分析方法可用在其他室內試驗或監測檢測領域,為決策提供依據。
土木工程; 機器學習; 混凝土強度; LGBM回歸算法
TU528B〗
[定稿日期]2021-06-22
[作者簡介]劉永紅(1979~),男,碩士,高級工程師,從事巖土工程設計與施工工作。
混凝土強度是現代土木工程結構安全的基本保障,更是建筑施工從業人員在項目中經常要面對的重要問題。一般情況下,混凝土具有較高的抗壓強度(抗拉強度相對較低,約為抗壓強度120~110),因此,抗壓強度是施工過程中控制和評定混凝土質量的主要指標。根據GB 50010-2010《混凝土結構設計規范》規定:“混凝土強度等級應按立方體抗壓強度標準值確定。立方體抗壓強度標準值系指按照標準做法制作養護的邊長為150 mm的立方體試件,在28 d齡期用標準試驗方法測得的具有95 %保證率的抗壓強度”[5-6]。
根據工程經驗,混凝土強度與水灰比、濕度、溫度及骨料等因素密切相關。例如:相同水泥強度等級下,水灰比越小,水泥石的強度就越高,其與骨料之間的黏結力也就越大,混凝土強度也就越高。假如濕度不足,會減緩水泥水化反應,進而會使得混凝土結構變得松散,滲水性變大,導致混凝土的強度降低。其次,混凝土硬化的關鍵在于水泥的水化作用是否充分,溫度升高時,水泥水化速度加快,混凝土強度上升也快。混凝土強度最主要取決于水泥石強度與骨料表面的黏結強度,增大骨料的強度也有助于提升混凝土強度。本文通過分析臺灣重華大學信息管理系葉怡成教授的混凝土強度試驗數據,通過數據分析證實以上工程試驗結論,并采用LGBM回歸算法預測混凝土強度[1]、[8]。
1 數據描述
本文所采用的Concrete Compressive Strength數據集[9],該數據集中包含1 030組數據,每組數據由9個參數組成,分別為:水泥、礦渣、粉煤灰、水、減水劑、粗骨料、細骨料、養護齡期、抗壓強度(表1、表2)。
從表2檢測結果整體描述可以看出該數據集無缺失值以及各數據的分布范圍。
2 特征重要性分析
2.1 特性向量相關性
統計學的相關系數經常使用的有3種:皮爾森(pearson)相關系數和斯皮爾曼(spearman)相關系數和肯德爾(kendall)相關系數。其中,皮爾森相關系數是衡量線性關聯性的程度,p的一個幾何解釋是其代表兩個變量的取值根據均值集中后構成的向量之間夾角的余弦,計算如公式(1)所示。
如果有兩個向量:X、Y,最終計算出的相關系數的含義可以有如下理解:
(1)當相關系數為0時,X和Y兩變量無關系。
(2)當X的值增大(減小),Y值增大(減小),兩個變量為正相關,相關系數在0.00與1.00之間。
(3)當X的值增大(減小),Y值減小(增大),兩個變量為負相關,相關系數在-1.00與0.00之間。
相關系數的絕對值越大,相關性越強,相關系數越接近于1或-1,相關度越強,相關系數越接近于0,相關度越弱。經計算分析,與混凝土強度(目標集)相關的前8列數據(測試集)的相關性如圖1所示。
ρx,y=cov(X,Y)σxσy=EX-μxY-μyσxσy=
E(XY)-E(X)E(Y)EX2-E2(X)EY2-E2(Y)(1)
根據圖1可以看出,減水劑與粉煤灰呈正相關;減水劑與水呈負相關;減水劑與礦渣無關系。
2.2 特征重要性排行
為進一步分析各因素對混凝土強度的影響程度,對各特征向量的重要性進行排行,如圖2所示。
根據圖2,可以看出減水劑和水泥對混凝土的強度影響較大,究其原因,它們決定著水泥石強度與骨料表面的黏結強度;而隨著養護齡期增加,混凝土中的水化反應更充分,粘結強度更高。礦渣和粉煤灰都能部分替代水泥,節約成本,改善混凝土的和易性;但其會加大混凝土收縮量,細度不達標時還可能造成泌水。粗細骨料自身抗壓強度很高,其對混凝土強度的影響相對較小。除了參與化學反應的少量水之外,其他多余的水主要是增加混凝土和易性,這部分水與混凝土強度呈負相關,更進一步說明了減水劑的重要性。
3 LGBM回歸分析
3.1 LGBM計算原理
LGBM由微軟提供,它和XGBoost一樣是對GBDT(梯度下降樹)的高效實現,原理上它和GBDT及XGBoost類似,都采用損失函數的負梯度作為當前決策樹的殘差近似值,去擬合新的決策樹。LGBM采用histogram算法,其核心是將連續的浮點特征離散成k個離散值,并構造寬度為k的Histogram。然后遍歷訓練數據,統計每個離散值在直方圖中的累計統計量。在進行特征選擇時,只需要根據直方圖的離散值,遍歷尋找最優的分割點[2-3]。
假設訓練集有n個實例x1…xn,特征維度為s。每次梯度迭時,模型數據變量的損失函數的負梯度方向表示為g1,…,gn,決策樹通過最優切分點(最大信息增益點)將數據分到各個節點。GBDT通過分割后的方差衡量信息增益,例如O表示某個固定節點的訓練集,分割特征j的分割點d定義為:
Vj|O(d)=1nO∑xi∈O:xij≤dgi2njl|O(d)+∑xi∈O:xij>dgi2njr|O(d)(2)
式中:
nO=∑Ixi∈O,njlo=∑Ixi∈O:xi≥d,njr|O=
∑Ixi∈O:xi>d
遍歷每個特征的每個分裂點,找到dj=argmaxdVj(d),并計算最大的信息增益Vj(dj),然后,將數據根據特征j的分裂點dj將數據分到左右子節點[4]、[7]。
3.2 LGBM回歸分析
本文分析使用Python語言,安裝LGBM庫,在Jupyter Notebook中加載數據進行分析(圖3)。
圖3中,Best Fit為離散點的最佳擬合曲線,Identiy為回歸預測曲線,直觀體現了預測的一致性。R2即r2_score,數值計算采用式(2),區間通常在(0,1)之間;模型越好R2越趨近1,模型越差R2越趨近0。
3.3 模型測試
隨機選擇5行數據進程測試,用機器學習訓練好的模型進行預測,結果見表3。
4 結論
(1)減水劑和水泥對混凝土的強度影響較大,若設計或施工過程中弄錯混凝土標號,將會導致嚴重工程質量事故。
(2)未養護或養護不到位,會導致混凝土強度不足、前期強度增長慢等病害。
(3)礦渣和粉煤灰對混凝土強度也有較大貢獻,可部分替代水泥。
(4)水量與混凝土強度負相關,施工過程中要嚴格控制加水量。
(5)采用LGBM回歸分析預測混凝土強度,誤差可以滿足工程需要。若野外室內試驗條件有限,可以通過影響因素預預估混凝土強度。
(6)本文的分析方法可用在其他室內試驗或監測檢測領域,為決策提供依據。
參考文獻
[1] 李航.統計學習方法[M].北京:清華大學出版社,2012.
[2] 盧錦玲,郭魯豫,張夢雪,等.基于MGS-LGBM算法的電力系統暫態穩定評估[J].電力科學與工程,2020(3):1-9.
[3] 張旭東,錢仲文,沈思琪,等.一種基于LSTM與LGBM的電力負荷預測算法[J].系統工程,2019,37(1):152-158.
[4] 王向鵬. 基于不平衡三分類LGBM模型的貸后風險預警研究[D].蘭州:蘭州大學,2019.
[5] 李輝.基于BP神經網絡的水泥細度軟測量方法[J].中國水泥,2016(7):107-109.
[6] 李仲欣,韋灼彬,沈錦林.相關向量機在珊瑚混凝土抗壓強度預測中的應用[J].混凝土,2016(7):1-6.
[7] 唐華松,姚耀文.數據挖掘中決策樹算法的探討[J].計算機應用研究,2001,18(8):18-19.
[8] XGBoost:A Scalable Tree Boosting System. Chen T,Guestrin C. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining . 2016.
[9] Yeh I.C. Modeling of strength of high performance concrete using artificial neural networks[J]. Cement and Concrete Research,1998,28(12):1797-1808.
3045501908295