張全太,劉泉聲,黃 興
(1.武漢大學(xué) 土木建筑工程學(xué)院 巖土與結(jié)構(gòu)工程安全湖北省重點實驗室,湖北 武漢 430072;2.中國科學(xué)院武漢巖土力學(xué)研究所 巖土力學(xué)與工程國家重點實驗室,湖北 武漢 430071;3.盾構(gòu)及掘進技術(shù)國家重點實驗室,河南 鄭州 450001)
TBM(全斷面隧道掘進機)工法具有“安全、施工速度快、環(huán)保、成本低”等優(yōu)點[1],已成為深埋長大隧(巷)道施工的首選和發(fā)展方向。TBM工法在水利、交通領(lǐng)域隧道建設(shè)已廣泛應(yīng)用,近年來正在成為我國煤礦井巷掘進的新模式,已成功應(yīng)用于山西大同塔山煤礦主平硐[2]、神華補連塔煤礦斜井、淮南張集煤礦瓦斯抽采巷等井巷的建設(shè)。TBM掘進性能預(yù)測在TBM可掘進性評價、施工設(shè)計指導(dǎo)和工期規(guī)劃中具有重要作用,其中凈掘進速率(PR)是指TBM一次連續(xù)掘進過程中挖掘長度與相對應(yīng)挖掘時間的比值,可以直觀地描述TBM的掘進效率,對于合理規(guī)劃施工周期和成本估計具有重要作用。因此,開發(fā)TBM凈掘進速率預(yù)測模型在隧(巷)道開挖和設(shè)計工作的早期階段都具有重要意義。
國內(nèi)外學(xué)者基于不同的輸入?yún)?shù)和建模方法,已經(jīng)開發(fā)了一些PR預(yù)測模型。在國內(nèi),溫森等[3]基于美國紐約皇后輸水隧洞掘進數(shù)據(jù)和巖體參數(shù),采用Monte Carlo-BP神經(jīng)網(wǎng)絡(luò)建立了PR預(yù)測模型;王健等[4]以基于RMR的巖體質(zhì)量評價指標(biāo)為輸入?yún)?shù),通過統(tǒng)計回歸分析方法建立了PR預(yù)測模型;閆長斌等[5]以圍巖力學(xué)參數(shù)和巖體指標(biāo)參數(shù)為輸入,通過統(tǒng)計回歸分析方法建立了TBM凈掘進速率預(yù)測模型。在國外,美國科羅拉多礦業(yè)學(xué)院基于室內(nèi)切割試驗數(shù)據(jù),采用回歸分析方法開發(fā)了CSM模型[6];挪威科技大學(xué)基于大量的TBM隧道施工性能數(shù)據(jù)和地質(zhì)資料,對巖體參數(shù)和機器參數(shù)進行回歸分析后得到了NTNU模型[7];Yagiz等基于美國紐約皇后隧道數(shù)據(jù),采用了統(tǒng)計回歸分析[8]、人工神經(jīng)網(wǎng)絡(luò)[9]、粒子群算法[10]等建立了PR預(yù)測模型。
國內(nèi)外學(xué)者雖然基于不同的輸入?yún)?shù)和建模方法對PR預(yù)測進行了研究,但仍然存在一些不足,主要表現(xiàn)在:建模方法單一,無法對比不同方法建立模型的優(yōu)劣,難以得到最優(yōu)模型;人工神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)模型超參數(shù)的選取依賴人為經(jīng)驗,模型性能優(yōu)劣隨機性較大;基于人工神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)建立的模型算法單一,缺乏與其他算法融合優(yōu)化。此外,目前在不同模型的多指標(biāo)綜合評價中常用的“排名法”僅能實現(xiàn)定性比較,無法實現(xiàn)更為細(xì)致的定量評價。因此,本文基于文獻[11]中馬來西亞Pahang-Selangor隧洞的樣本數(shù)據(jù),分別采用統(tǒng)計回歸分析、人工神經(jīng)網(wǎng)絡(luò)、機器學(xué)習(xí)方法建立11個PR預(yù)測模型,在人工神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)方法中融合貝葉斯算法對模型超參數(shù)進行自動優(yōu)化選取;然后將人工神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)算法與集成學(xué)習(xí)算法融合建立6個多算法融合的PR預(yù)測模型。最后提出一種新的歸一多指標(biāo)模型評價方法(歸一法),同時使用已有的排名法和新提出的歸一法對所有模型進行多指標(biāo)綜合評價,根據(jù)評價結(jié)果對比分析排名法和歸一法的效果。研究成果為合理評估TBM隧(巷)道施工周期,預(yù)估工程成本提供了理論依據(jù)。
由于TBM掘進速度快,監(jiān)測環(huán)境復(fù)雜,巖體參數(shù)獲取困難、獲取數(shù)據(jù)量有限,而文獻[11]公開發(fā)表了詳細(xì)的巖體參數(shù)和TBM掘進數(shù)據(jù),因此本研究擬基于文獻[11]公開發(fā)表的馬來西亞Pahang-Selangor隧道數(shù)據(jù)展開研究。收集的數(shù)據(jù)分為兩類:一是從現(xiàn)場測試和TBM設(shè)備收集,包括巖石質(zhì)量指標(biāo)(Rock Quality Designation,RQD)、巖石質(zhì)量評級(Rock Mass Rating,RMR)、巖石風(fēng)化程度(Degree of Rock Weathering,WZ)、TBM推力(Thrust Force,TF)和TBM刀盤轉(zhuǎn)速(Revolutions Per Minute,RPM);二是實驗室測試,包括巖石單軸抗壓強度(Uniaxial Compressive Strength,UCS)和巴西劈裂強度(Brazilian Tensile Strength,BTS)。每10m收集一次數(shù)據(jù),共計100組數(shù)據(jù),其中新鮮巖石53組,輕微風(fēng)化巖石28組,中度風(fēng)化巖石19組,數(shù)據(jù)類型覆蓋較全面。在后續(xù)建模過程中,新鮮、輕微風(fēng)化和中度風(fēng)化巖石分別用1、2和3表示。
對各個變量與PR進行一元回歸分析,得到一元線性回歸模型,見表1。由表1可知,PR與RQD、UCS、RMR和BTS呈負(fù)相關(guān),與WZ、TF和RPM呈正相關(guān),各個變量與PR的相關(guān)程度由高到低依次為UCS、TF、BTS、RMR、RQD、RPM和WZ。

表1 一元線性回歸模型
為便于進行多元線性回歸分析,對上述7個參數(shù)進行線性化處理[12],即令RQD′=PRRQD、UCS′=PRUCS、RMR′=PRRMR、BTS′=PRBTS、WZ′=PRWZ、TF′=PRTF和RPM′=PRRPM得到線性化后的數(shù)據(jù)。假設(shè)線性化后的各參數(shù)與PR的函數(shù)關(guān)系為:
PRALL=a0+a1·RQD′+a2·UCS′+a3·RMR′+
a4·BTS′+a5·WZ′+a6·TF′+a7·RPM′
(1)
式中,a0、a1、a2、a3、a4、a5、a6、a7為回歸系數(shù)。
根據(jù)式(1)對線性化后的數(shù)據(jù)進行擬合,得到多元線性回歸預(yù)測模型為:
PRALL=-0.32849+0.18519·RQD′+0.34488·
UCS′+0.20269·RMR′+0.10743·BTS′-0.20825·
WZ′+0.41776·TF′+0.0883·RPM′
(2)
將表1的線性化變換公式代入式(2)得到多元線性回歸預(yù)測模型為:
PRALL=3.34332-0.00296·RQD-0.00458·
UCS-0.00691·RMR-0.02082·BTS-0.08002·
WZ+0.00145·TF+0.00363·RPM
(3)
基于式(3)得到的PR預(yù)測值與實測值對比分析,如圖1所示。多元線性回歸模型預(yù)測值與實測值的決定系數(shù)為0.924,相關(guān)系數(shù)為0.961,表明該模型具有良好的預(yù)測能力。

圖1 多元線性回歸模型預(yù)測值與實測值統(tǒng)計分析
超參數(shù)對人工智能和機器學(xué)習(xí)模型預(yù)測性能的優(yōu)劣具有重要影響,且不少超參數(shù)為連續(xù)超參數(shù),通過人工試算的方法難以選取合適的值。
目前常用的超參數(shù)優(yōu)化方法有網(wǎng)格搜索法[13]、隨機搜索法和貝葉斯優(yōu)化。網(wǎng)格搜索法對所有的超參數(shù)取值組合進行測試,尋找優(yōu)化的超參數(shù),適用于離散超參數(shù)的優(yōu)化;隨機搜索是在給定搜索空間中隨機選取超參數(shù)組合進行測試,優(yōu)化得到的結(jié)果隨機性較強;貝葉斯優(yōu)化在給定的搜索空間中先隨機選擇幾組超參數(shù)進行初始測試,根據(jù)測試結(jié)果建立超參數(shù)組合與優(yōu)化目標(biāo)的映射關(guān)系,用于指導(dǎo)下一組超參數(shù)的選擇。每一組超參數(shù)測試結(jié)束后都會用于修正映射關(guān)系,使得到的下一組超參數(shù)優(yōu)化效果更好。因此本文將貝葉斯算法與人工神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)算法融合,優(yōu)化模型超參數(shù)。應(yīng)當(dāng)注意的是,模型超參數(shù)優(yōu)化空間的復(fù)雜度隨優(yōu)化個數(shù)的增加呈指數(shù)增加。應(yīng)當(dāng)選擇對模型性能有重要影響的超參數(shù)進行優(yōu)化,一般不超過三個,避免優(yōu)化結(jié)果陷入局部最小值。
ANN是指由大量的處理單元(神經(jīng)元)互相連接而形成的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)[14],對于復(fù)雜的函數(shù)關(guān)系具有良好的擬合能力。根據(jù)Komogorov定理和Hornik存在性定理,含有一個隱含層的神經(jīng)網(wǎng)絡(luò)可以精確實現(xiàn)任意連續(xù)函數(shù),且隱含層個數(shù)增加容易造成模型過擬合。因此本文建立一個三層的ANN模型,輸入層包含7個神經(jīng)元,輸出層包含1個神經(jīng)元。ANN中對模型收斂速度和預(yù)測效果影響最大的兩個超參數(shù)是隱含層神經(jīng)元個數(shù)N和學(xué)習(xí)率lr,對這兩個超參數(shù)進行優(yōu)化選取,隱含層神經(jīng)元個數(shù)優(yōu)化空間為[5,20]內(nèi)的整數(shù),學(xué)習(xí)率的優(yōu)化空間為(0,1)。優(yōu)化過程如圖2所示,最終取得優(yōu)化超參數(shù)N=17,lr=0.061。基于上述超參數(shù)建立ANN模型。

圖2 ANN超參數(shù)優(yōu)化過程
支持向量回歸是在支持向量機中引入核函數(shù)用來解決回歸問題,該模型可以解決樣本數(shù)量較少時的機器學(xué)習(xí)問題,且對于非線性、高維度問題具有較好的擬合能力[15]。分類與回歸樹既可用于分類問題,也可用于回歸問題[16],在每個節(jié)點通過一個特征的選擇進行分類或回歸,計算復(fù)雜度較低,對中間缺失值不敏感,且模型的可解釋性較強。
支持向量回歸中不敏感損失系數(shù)ε決定回歸函數(shù)對樣本數(shù)據(jù)的不敏感區(qū)域的寬度;懲罰系數(shù)C反映了算法對超出ε的樣本數(shù)據(jù)的懲罰程度,其值影響模型的復(fù)雜性和穩(wěn)定性。對上述兩個超參數(shù)進行優(yōu)化選取,優(yōu)化空間均為(0,1)。優(yōu)化過程如圖3所示,最終取得優(yōu)化超參數(shù)C=0.543,ε=0.278?;谏鲜龀瑓?shù)建立SVR模型。

圖3 SVR超參數(shù)優(yōu)化過程
分類與回歸樹中樹的最大深度max_depth對模型的復(fù)雜程度和預(yù)測精度具有重要影響,對該參數(shù)進行優(yōu)化,優(yōu)化空間為[5,20]內(nèi)的整數(shù)。優(yōu)化過程如圖4所示,最終取得優(yōu)化超參數(shù)max_depth=8?;谏鲜龀瑓?shù)建立CART模型。

圖4 CART超參數(shù)優(yōu)化過程
Bagging(套袋算法)通過平均的思想改善了模型的泛化誤差,使預(yù)測結(jié)果出現(xiàn)較大誤差的概率降低。該算法以有放回的方法從樣本集中隨機抽取一定數(shù)量的樣本組成子訓(xùn)練集,用k個子訓(xùn)練集分別訓(xùn)練得到k個弱學(xué)習(xí)器,各個弱學(xué)習(xí)器獨立預(yù)測,按一定權(quán)重將各個弱學(xué)習(xí)器預(yù)測結(jié)果加權(quán)求和得到最終的預(yù)測結(jié)果。AdaBoost(自適應(yīng)提升算法)通過在迭代訓(xùn)練過程中重點學(xué)習(xí)預(yù)測誤差較大的樣本以提高預(yù)測精度。該算法在訓(xùn)練過程中對于預(yù)測誤差較大的樣本賦予更大的權(quán)重,使其在下一次訓(xùn)練時被弱學(xué)習(xí)器給予更多關(guān)注,提高該樣本的預(yù)測準(zhǔn)確率,最終訓(xùn)練得到多個弱學(xué)習(xí)器,按一定權(quán)重將各個弱學(xué)習(xí)器預(yù)測結(jié)果加權(quán)求和得到最終的預(yù)測結(jié)果。
將上述的套袋算法和自適應(yīng)提升算法,分別與ANN、SVR和CART算法融合,建立Bag-ANN、Bag-SVR、Bag-CART、Ada-ANN、Ada-SVR和Ada-CART多算法融合模型,融合模型中弱學(xué)習(xí)器個數(shù)均設(shè)為10,ANN、SVR和CART的超參數(shù)均采用2.2和2.3節(jié)融合了貝葉斯算法得到的優(yōu)化超參數(shù)。
本文的樣本集包含100個樣本,在ANN和ML模型中為保證訓(xùn)練和測試樣本集不同,且訓(xùn)練集具有足夠的訓(xùn)練樣本,每次將99個樣本設(shè)為訓(xùn)練集,剩余1個樣本設(shè)為測試集,循環(huán)100次,并計算各個模型的評價指標(biāo)均方誤差(Mean Square Error,MSE)、平均絕對誤差(Mean Absolute Error,MAE)、平均絕對百分誤差(Mean Absolute Percentage Error,MAPE)、決定系數(shù)R2和相關(guān)系數(shù)r。
對于一個模型,R2和r越接近1,MSE、MAE和MAPE越小說明模型預(yù)測能力越好,不同指標(biāo)評價模型預(yù)測能力的傾向不一致(傾向性一致是指模型預(yù)測能力越好,評價指標(biāo)越大的傾向),因此本文對MSE、MAE和MAPE做如下變換:
回歸模型中不同評價指標(biāo)的側(cè)重方面不同,單一指標(biāo)對不同模型的評價缺乏全面性,因此需要對不同模型進行多指標(biāo)綜合評價。Zorlu等[17]學(xué)者于2008年提出的排名法是目前常用的多指標(biāo)綜合評價方法,其流程為:①對M個模型同一評價指標(biāo)i分別進行排名;②將同一模型的m個不同評價指標(biāo)排名相加作為該模型的多指標(biāo)評價排名,如圖5所示。基于排名法得到各個模型的評價結(jié)果見表2。

圖5 排名法

表2 排名法評價結(jié)果
對于排名法,如果模型1的A、B指標(biāo)比模型2的A、B指標(biāo)好,但相差不大,而模型2的C指標(biāo)比模型1的C指標(biāo)好,且相差較大,排名法的結(jié)果為模型1優(yōu)于模型2。但實際情況,更傾向于模型2優(yōu)于模型1。造成上述問題的原因在于排名法僅能考慮同一評價指標(biāo)的相對大小關(guān)系,忽略了同一評價指標(biāo)差值大小對模型評價的影響,因此容易造成模型評價不準(zhǔn)確。


圖6 歸一法

歸一法得到各個模型的評價結(jié)果見表3。對比表2和表3可以發(fā)現(xiàn),兩種方法對各個模型的評價排名基本一致,表明本文提出的歸一法是合理的。排名法評價結(jié)果(表2)中模型13和16排名均為10,模型7和9排名均為15,表明排名法對于性能差別不大的模型無法精確評價;而歸一法評價結(jié)果(表3)中模型13排名為10,模型16排名為11,模型7排名為15,模型9排名16,表明歸一法相較于排名法對于性能差別不大的模型也可以精確識別。歸一法優(yōu)于排名法的原因主要在于歸一法不僅考慮了不同模型同一評價指標(biāo)的相對大小關(guān)系,同時也考慮了同一評價指標(biāo)差值大小對模型評價的影響,而排名法僅能考慮前者。因此,歸一法相較于排名法對各個模型的多指標(biāo)綜合評價更加準(zhǔn)確細(xì)致。

表3 歸一法評價結(jié)果
從整體來看,基于SRA建立的模型具有明確的函數(shù)關(guān)系,屬于“白箱子”模型,易于分析各個變量對PR的影響,模型可解釋性較強;基于ANN、ML和多算法融合建立的模型屬于“黑箱子”模型,可解釋性較差,但預(yù)測精度較高。
基于SRA建立的模型中一元回歸模型的預(yù)測能力均較低,多元回歸模型比基于RQD、WZ、RPM建立的一元回歸模型預(yù)測能力好,比基于UCS、RMR、BTS、TF建立的一元回歸模型預(yù)測能力差。一元線性回歸模型形式簡單,應(yīng)用要求低,適用于僅獲取了個別參數(shù)而又需要對PR進行預(yù)測評估的情況,但對于參數(shù)的準(zhǔn)確獲取要求較高,否則容易造成較大誤差;多元回歸預(yù)測模型需要的參數(shù)較多,但預(yù)測準(zhǔn)確性及對單個變量測量的容錯性均較高。
基于ANN、ML和多算法融合建立的模型中多算法融合對于ANN和CART模型預(yù)測能力均有提升,且對ANN模型預(yù)測能力提升明顯,表明多算法融合相較于單一算法具有明顯優(yōu)勢,在應(yīng)用人工智能方法解決土木工程中的問題時應(yīng)注重結(jié)合不同算法的優(yōu)勢,提高應(yīng)用效果。由表2及表3可知,預(yù)測性能最好的模型為Bag-CART,其次是Ada-CART,第三是CART,表明本文建立的17個模型中,CART模型和基于CART的多算法融合模型最適合于PR預(yù)測。
基于CART模型對7個輸入?yún)?shù)的重要性進行了打分和排序,將結(jié)果和2.2節(jié)輸入?yún)?shù)相關(guān)性排序列于表4??梢?,基于統(tǒng)計回歸分析方法和基于機器學(xué)習(xí)方法對輸入?yún)?shù)的重要性排序基本一致。

表4 CART模型輸入?yún)?shù)重要性打分及排序
基于馬來西亞Pahang-Selangor隧洞100組巖體和TBM掘進參數(shù),采用SRA、ANN、ML和多算法融合方法建立了17個PR預(yù)測模型,并提出了一種新的歸一多指標(biāo)綜合評價方法用于選擇最優(yōu)模型,主要得到以下結(jié)論:
1)TBM凈掘進速率一元回歸模型預(yù)測能力由高到低依次為PRUCS、PRTF、PRBTS、PRRMR、PRRQD、PRRPM和PRWZ,但從整體來看,一元回歸模型的預(yù)測能力均較低;多元回歸模型比基于RQD、WZ、RPM建立的一元回歸模型預(yù)測能力好,比基于UCS、RMR、BTS、TF建立的一元回歸模型預(yù)測能力差。
2)多算法融合對于ANN和CART模型預(yù)測能力均有提升,且對ANN模型預(yù)測能力提升較為明顯,但多算法融合也導(dǎo)致SVR模型預(yù)測能力略微降低;在本文建立的17個模型中,CART模型和多算法融合模型Bag-CART和Ada-CART的預(yù)測能力更好,更適用于PR預(yù)測。
3)本文提出的歸一法通過“評價指標(biāo)傾向一致性轉(zhuǎn)換、歸一化、求和、排序”等步驟實現(xiàn)了多模型定量地多指標(biāo)綜合評價,與Zorlu等提出的排名法相比,不僅考慮了不同模型同一評價指標(biāo)的相對大小關(guān)系,也考慮了同一評價指標(biāo)差值大小對模型評價的影響。
4)本文建立的凈掘進速率(PR)預(yù)測模型對于TBM掘進性能預(yù)測、合理評估TBM隧(巷)道施工周期、預(yù)估工程成本具有重要的借鑒和指導(dǎo)意義;提出的歸一法實現(xiàn)了模型多指標(biāo)綜合評價從定性分析到定量分析,對于準(zhǔn)確細(xì)致識別不同模型的預(yù)測性能具有重要意義。