張童康,師 蕓,童 鋒,劉麗霞,閆倩倩
(1.中國煤炭地質總局航測遙感局,陜西 西安 710199;2.西安科技大學測繪科學與技術學院,陜西 西安 710054;3.自然資源部煤炭資源勘查與綜合利用重點實驗室,陜西 西安 710021)
長期以來,由于煤礦開采造成的地表塌陷、地裂縫等災害,是煤礦采后環境治理急需解決的問題。地下煤層開采會破壞周圍覆巖的應力平衡,使巖層產生滑移,引起地表變形,隨著工作面的推進巖層的變形情況越發嚴重[1]。為了更好地保護地表建筑物和基礎設施,有必要對開采造成的地表移動進行預計和保護。目前,概率積分法是應用最廣泛的開采沉陷預計方法[2-4],其預計結果的好壞主要由預計參數的準確性決定[5-7]。由于概率積分法預計參數受到復雜的地質因素和采礦條件的影響,用簡單的數學方法難以表達[8],通過建立地表移動觀測站進行實測求參數也容易受到多種條件的限制,難以滿足礦區安全生產的要求。 隨著計算機技術的發展,各種機器學習法被人們熟知并應用,主要以神經網絡模型[9]、支持向量機[10]為代表,已有大量實驗證明,利用機器學習方法求取概率積分法參數,具有精度高、易操作、實效性強等優勢[11-13]。 目前,較為常用的機器學習參數預測法為BP(back propagation)神經網絡算法,但BP神經網絡易受到初始權值和閾值的不穩定性影響,預測結果不夠精確,很多學者通過遺傳算法[14-15]、粒子群算法[16]對BP神經網絡的權值和閾值進行優化,這些方法可以在一定程度上提高BP神經網絡的預測精度,但仍然無法避免BP算法自身的缺陷。 灰狼優化算法[17](grey wolf optimization,GWO)是一種種群智能優化算法,主要有操作簡單、參數少、易實現的特點,但由于狼群在尋優的過程中受到收斂因子和搜索方式的影響,導致灰狼優化算法的收斂速度慢,且容易陷入局部最優。因此,本文提出了一種改進的灰狼優化算法,該算法主要對收斂因子a和對灰狼位置更新方式進行了改進,并利用改進后的灰狼優化算法對BP神經網絡初始權值和閾值進行優化,構建改進的GWO-BP預測模型,對概率積分法的預計參數進行預測。為了驗證所提出算法的精度,將該算法的參數預測結果與支持向量機回歸算法(support vector regression,SVR)的預測結果以及偏最小二乘[18](partial least-square,PLS)算法的預測精度進行對比驗證和結果分析。
GWO優化算法[19]是根據狼群搜索捕獵活動所得到的一種種群智能優化算法。狼群存在著嚴格的等級分配關系,一般將適應度值最高的三個灰狼個體作為α狼、β狼和δ狼[20],在進行狩獵時主要由這3只狼負責,狩獵行為公式見式(1)和式(2)。

(1)
C=2r1
(2)

位置更新公式見式(3)~式(5)。

(3)
A=2ar2-a
(4)
a=2-2×t/T
(5)
式中:r2為均勻隨機數;A為系數向量;a為從2到0線性遞減的收斂因子;t為當前迭代次數;T為最大迭代次數。
尋優具體步驟見式(6)~式(12)。

(6)

(7)

(8)

(9)

(10)

(11)

(12)
式中,Dα、Dβ、Dδ分別為狼群個體的位置到α、β和δ狼所在位置的距離。
由于GWO優化算法在尋優過程中往往存在著收斂速度較慢且易陷入局部最優的缺點,造成這些缺點的主要原因有:①收斂因子a是線性遞減的,不能滿足算法的開發能力;②根據適應度值最優的3個灰狼的平均位置得到最優解時,更新策略不靈活,搜索不能滿足全局最優,在一些優化算法中不能得到最優解。
針對這些問題,本文對灰狼優化算法進行了改進,改進策略及分析如下所述。
1) 收斂因子a的改進。從式(9)~式(11)可以看出,灰狼算法的搜索方式主要是由系數向量A所決定的。從式(4)可以看出,A的取值主要取決于收斂因子a的大小,在傳統的灰狼算法中,a值是隨著迭代次數的增加從2線性遞減到0,但是真正的灰狼在搜索過程中是一個非線性的變化過程,傳統的收斂因子計算方式存在一定缺陷,基于此,本文提出了一種非線性的收斂因子計算公式,見式(13)。

(13)
為了進一步對比本文提出的收斂因子公式和傳統灰狼算法收斂因子公式的差異,繪制了收斂因子隨迭代次數增加的變化圖,如圖1所示。原始的灰狼算法采用的是線性收斂方式,收斂因子在前期和后期的變化率一致,因此不能滿足搜索過程要求先慢后快的變化方式。而改進后的a曲線在前期的收斂速度較慢,可以滿足全局搜索的要求,在迭代后期收斂速度明顯加快,可以滿足局部精確搜索的要求。因此本文提出的收斂因子a的改進方法更適用于狼群在尋優中的搜索過程。

圖1 收斂曲線對比圖Fig.1 Contrast graph of convergence curve
2) 位置更新方法的改進。粒子群算法具有良好的全局尋優能力,將速度矢量考慮到粒子的更新過程中,可以得到最優的位置信息。本文結合PSO算法中位置的更新公式[21]對灰狼的位置進行更新,具體公式見式(14)。

(14)
式中:t為迭代次數;Xi和Vi分別為第i個灰狼的位置和速度矢量。
Vi可用式(15)計算得到。

(15)


(16)

BP神經網絡是一種信號前向傳遞、誤差反向傳遞的神經網絡模型。模型能夠在非線性映射上取得很好的效果,并且還具備良好的自學習和自適應能力[22]。圖3為BP神經網絡的圖形結構,主要由數據層、隱含層和輸出層3層前饋網組成。

圖2 收斂速度對比圖Fig.2 Contrast graph of convergence speed

圖3 BP神經三層網絡模型Fig.3 Back-propagation network three-layernetwork mode
網絡選用S型傳遞函數見式(17)。

(17)
通過整體擬合目標誤差函數,見式(18)。

(18)

BP神經網絡主要通過有監督學習的方式訓練網絡模型,當一對學習命令輸入到網絡后,可以將數據層的神經元激活,然后向各隱含層傳播,最后經過輸出層輸出對應于輸入模式的網絡映射。 為了使期望的輸出結果和實際輸出結果的誤差最小,在訓練的過程中從輸出層反向傳播到數據層時不斷對權值進行改正,這種誤差修正主要依據誤差反向傳播算法。
概率積分法的預計參數主要有5個,分別為下沉系數q、水平移動系數b、主要影響正切角tanU、拐點偏移距s/H和開采傳播角θ。這些參數都受到了復雜地質采礦條件的影響,主要的影響因素有覆巖巖性、松散層厚度、煤層采厚和采深等因素。文獻[23]給出了全國208個典型工作面的地質采礦實測數據,本文選取了其中40個工作面的實測數據作為訓練樣本和測試樣本,其中,訓練集為1~35號樣本數據,測試集為36~40號樣本數據,用于驗證模型訓練結果的精度。根據可定量原則,選取6種地質采礦因素作為輸入層,分別為覆巖平均堅固系數f、采厚M、采深H、松散層厚度W、煤層傾角∝和采動程度n,具體數據見表1。
本文將采用多輸入層對應單一輸出層,以6個地質采礦因子作為輸入層,分別對應五個單一的概率積分法參數,建立五個獨立的網絡模型結構,每個網絡模型結構中有6個輸入節點和1個輸出節點,隱含層神經元個數一般通過多次訓練和結果對比得到。本文選取的各個模型隱含層神經元節點數分別為:下沉系數15個、水平移動系數13個、主要影響角正切21個、拐點偏移距19個、開采影響傳播角7個。

表1 學習訓練和測試樣本Table 1 Training and testing samples

續表1
改進的GWO-BP算法流程圖見圖4,具體實施步驟如下所述。

圖4 改進的GWO-BP算法流程圖Fig.4 Improved GWO-BP algorithm flow chart
1) 輸入數據,劃分訓練集和測試集。并對數據進行歸一化處理,見式(19)。

(19)
式中:x為輸入數據;y為歸一化后數據。
2) 確定灰狼的種群規模為20頭狼、最大迭代次數為100次和參數取值上下界(ub,lb)。
3) 確定神經網絡模型結構,對狼群進行隨機初始化,初始化公式見式(20)。
Xi=r0(ub-lb)+lb
(20)
式中:Xi為初始種群;r0為[0,1]間的隨機數。
4) 計算灰狼個體的適應度值,并將最優的3個適應度值的灰狼的位置記為Xα、Xβ和Xδ。
5) 根據式(2)、式(4)、式(13)更新參數C、A、a,根據更新的參數和式(14)和式(15)對灰狼的位置進行更新,根據式(16)得到獵物的最終位置。
6) 判斷是否達到最大迭代次數,若達到則輸出最優的權值和閾值,否則返回步驟4)繼續迭代。
7) 設置BP神經網絡的最大迭代次數為500次、學習率為0.1和目標誤差為5~10,將步驟6)得到的最優權值和閾值作為BP神經網絡的初始權值和閾值進行訓練和預測。
8) 輸出概率積分法預計參數。
9) 利用平均絕對百分比誤差(MAPE)作為評價計算結果的指標。利用Willmott的一致性指數(WIA)對模型的泛化性能進行評價。MAPE是相對誤差的一個指標,WIA在0~1之間變化,WIA值是各種回歸模型誤差程度的標準化度量,其定義見式(21)和式(22)。

(21)

(22)

本文提出的改進GWO-BP算法擁有良好的全局尋優能力可以使模型采用最優的初始權值和閾值進行訓練和預測,從而使模型更快收斂,預測精度更高。為了驗證IGWO-BP算法對概率積分法參數預測的準確性,將其與支持向量機回歸法的預測結果以及偏最小二乘法采用RBF核函數進行訓練,采用交叉驗證進行參數尋優。結果見表2~表4。
將3種方法的預測值分別與地表移動觀測實測值的計算結果進行對比,分析其平均絕對百分比誤差和一致性指數,見表5。
由表5可知,分別用最大相對誤差、平均絕對百分比誤和一致性指數作為評價指標對3種預測方法的預測精度進行分析。從結果可以看出,IGWO-BP的最大相對誤差和平均絕對百分比誤差整體都小于PLS算法和SVR算法的預測精度。從一致性指數來分析,一致性指數接近于1代表預測模型的泛化性能越好,從表5中可以看出,IGWO-BP模型的一致性指數最高,其次是SVR模型,PLS模型的一致性指數最低, 這與其模型的尺度單一有關[19], 說明IGWO-BP模型的泛化性能要優于SVR模型和PLS模型。為了能更清晰地對比3種預測模型的精度,特用3種模型的預測結果對實測結果進行擬合,擬合結果如圖5所示。

表2 PLS預測結果分析Table 2 Analysis of prediction results of PLS

表3 SVR預測結果分析Table 3 Analysis of prediction results of SVR

表4 IGWO-BP神經網絡預測結果分析Table 4 Analysis of prediction results of improvedGWO-BP neural network

表5 三種預測算法精度對比分析Table 5 Comparison and analysis of the accuracy ofthree prediction algorithms

圖5 三種預測方法與實測值擬合對比圖Fig.5 Comparison between three prediction methods and actual measured values
從圖5的擬合效果來看,IGWO-BP模型的整體擬合效果最好,進一步說明利用改進后GWO-BP模型預測結果明顯優于一致性指數模型預測結果和PLS模型預測結果,可以在求取概率積分法預計參數的實際工程中得以應用。
針對概率積分法預計參數難以求取的現狀,本文提出了一種改進的灰狼優化算法優化BP神經網絡的權值和閾值,從而對概率積分法預計參數進行求取的方法,并得到了以下結論。
1) 通過對灰狼優化算法的收斂因子a的改進,發現在收斂性能上,本文提出的收斂因子計算方法更符合算法的局部開發和全局搜索能力。
2) 通過對灰狼位置更新方式的改進,使得狼群在尋優的過程中可以保持頭狼的全局最優位置,從而更好帶領群狼搜索到獵物,收斂速度更快。
3) 對PLS模型、SVR模型和IGWO-BP模型的預測結果進行對比分析發現,IGWO-BP模型的預測結果精度最高,其次是SVR模型,PLS模型的預測精度最差。
4) 本文提出的IGWO-BP預測算法在回歸和預測上都有較好的性能,該算法所得到的預測結果與實測結果的誤差較小,符合工程要求,也能為缺少地表實測數據的礦區提供新的概率積分法預計參數求取方法,對該類礦區的開采沉陷預計以及防災減災工作都有重要的指導意義。