秋興國, 李靖
(西安科技大學 計算機科學與技術學院, 陜西 西安 710600)
礦井突水作為嚴重威脅煤礦生產安全的主要礦井災害之一,一旦發生會給礦區造成嚴重的經濟損失和人員傷亡[1]。對煤層突水進行預測,可在突水事故發生之前及時采取措施,從而減少突水事故,更有效地保障煤礦生產安全。傳統的突水預測方法主要包括突水系數法、阻水系數法及脆弱性指數法等[2-3]。這些方法已被廣泛應用于突水預測中,但仍存在缺陷,如突水系數法和阻水系數法考慮的因素都較少且計算精度低,脆弱性指數法需要多種屬性的支持且對原始數據的要求較高。
近年來,機器學習方法被越來越多地用于解決煤礦突水預測問題。潘輝等[4]針對底板突水非線性特征,利用粒子群優化(Particle Swarm Optimization,PSO) 算法優化BP神經網絡,建立了底板突水預測模型,但BP神經網絡訓練依賴大量數據,對小樣本突水事件的預測精度偏低。宋國娟[5]將PSO算法與極限學習機結合進行突水預測,Wang Ge等[6]利用PSO算法和蟻群優化算法分別對極限學習機進行優化,建立突水預測模型,但這2種算法在尋優時收斂速度都較慢。師煜等[7]利用遺傳算法和PSO算法優化隨機森林回歸模型,提高了突水預測精度。李穎[8]針對非線性、小樣本的底板突水問題,首次將支持向量機(Support Vecor Machine,SVM)模型用于底板突水預測,通過實驗驗證了該模型的有效性。張風達等[9]采用PSO算法優化SVM參數,提高了突水預測精度。智能群體算法一定程度上改善了機器學習模型參數選擇盲目的問題,但常用的智能優化算法如PSO算法、蟻群算法、果蠅優化算法[10]、遺傳算法等仍存在參數設置較多、收斂速度較慢或容易落入局部最優的缺陷。
鯨魚優化算法(Whale Optimization Algorithm,WOA)是依據鯨魚圍捕獵物的行為提出的一種智能優化算法[11]。WOA需設置的參數較少、結構簡單,適用于SVM模型的參數優化,但收斂速度較慢,且優化結果容易陷入局部最優。因此,為提高WOA的收斂速度,避免WOA在尋優過程中過早地陷入局部最優,提出了一種改進鯨魚優化算法(Improved Whale Optimization Algorithm,IWOA),從鯨魚種群初始化、調節因子非線性化及隨機差分進化(Differential Evolution, DE)3個方面入手對WOA進行改進。在此基礎上,提出了一種基于IWOA-SVM的煤礦突水預測模型,基于IWOA結構簡單、易實現、尋優能力強的優點[11],結合DE算法和混沌映射方法的特性改善WOA的全局搜索能力,對SVM的懲罰因子和核函數寬度進行尋優,從而提高突水預測的準確率和效率。
在WOA中,每頭鯨魚的位置代表問題的1個解,獵物的位置則指代問題的最優解。WOA分為開發階段和搜索階段:在開發階段,每只鯨魚都可以隨機選擇包圍獵物行為或螺旋泡沫網攻擊行為,螺旋狀上升游動并噴出氣泡來包圍搜捕獵物;探索階段的鯨魚則游走覓食,遠離當前最優參考位置,使算法具有一定的探索能力。
1.1.1 開發階段
(1) 包圍獵物。捕捉獵物時,鯨魚首先確定獵物的位置,然后包圍獵物。包圍獵物的行為可描述為
X(t+1)=X*(t)-A|CX*(t)-X(t)|
(1)
式中:X*(t),X(t)分別為迭代第t次時的最優位置向量和個體位置向量;A,C為系數向量,計算公式為

(2)

(2) 螺旋泡沫網攻擊。鯨魚沿著螺旋狀的軌跡運動,縮小包圍獵物的圓圈,最后捕捉獵物。該過程主要通過收縮包圍機制和螺旋更新位置2種行為描述,由于這2種行為是同時發生的,所以每只鯨魚在該過程中隨機選擇一種方式更新自己的位置。位置更新公式為
(3)
式中:D為迭代第t次時個體鯨魚到目標的距離,D=|X*(t)-X(t)|;b為常數;l為[-1,1]的隨機數;p為策略選擇閾值,取值范圍為[0,1]。
1.1.2 搜索階段
在搜索階段,WOA會隨機選取一頭鯨魚,以該鯨魚位置作為參考,迫使鯨魚遠離當前最優解的位置,尋找更好的獵物,其數學模型為
X(t+1)=Xrand(t)-A|CXrand(t)-X(t)|
(4)
式中Xrand(t)為迭代第t次時鯨魚種群中任意選擇的一個鯨魚的位置向量。
SVM模型可以較好地解決如煤礦突水預測這類具備高維數、小樣本、非線性特征的分類問題[8-9,12]。SVM的核心思想:對于一個在原始低維空間中難以處理的非線性問題,在核函數的作用下,將其轉變成一個更高維特征空間中的線性可分問題;在高維空間中找到一個分割樣本的超平面,使得分布在其兩邊的兩類樣本中,距離它最近的樣本對象之間的距離最大。對于給定的訓練樣本M={(x1,y1),(x2,y2),…,(xm,ym)}(m為訓練樣本總數),輸出向量yI∈{-1,1}(I=1,2,…,m),基于結構風險最小化原則建立的分類函數為

0<αI (5) 式中:xI,xJ為輸入特征向量;αI為拉格朗日乘子;k(xI,xJ)為核函數;c為懲罰因子;d為閾值。 核函數是SVM解決非線性分類問題的核心。目前應用最廣泛的核函數主要包括線性核函數、多項式核函數、Sigmoid核函數及高斯徑向基核函數(Radial Basis Function, RBF)4種。本文選用其中泛化能力較好的RBF核函數作為SVM的核函數,其具體表達式為 (6) 式中σ為核函數的寬度。 構建煤礦突水預測模型時,為了獲取更加精確的預測結果,需要優化SVM模型的懲罰因子c和核函數寬度σ。本文從鯨魚種群初始化、調節因子非線性化及隨機DE 3個方面入手對WOA進行改進,并將改進后的算法IWOA用于SVM參數尋優。 2.1.1 種群初始化 傳統WOA使用隨機初始化方法來確定初代鯨魚種群的位置,隨后每一個鯨魚都會在不斷迭代中向著最優位置靠近,直到算法收斂或達到最大迭代次數。如果鯨魚個體的初始位置與最優位置很近,那么該鯨魚很快就會到達最優位置,算法的收斂速度就會很快。但是隨機初始化方法在大多數情況下很難保證鯨魚初始位置距離最優位置很近。 針對這一缺陷,本文基于混沌映射的隨機性、遍歷性等特點豐富鯨魚種群的多樣性,提高鯨魚種群尋找到最優獵物的可能性。大量研究表明[13-15],將混沌映射應用在優化領域代替偽隨機數生產器生成混沌數,常常能取得比偽隨機數更好的效果。常用的混沌映射主要包括Logistic映射、Gussian 映射、Sine映射、Tent映射等。其中Tent映射在分布上更加均勻,能使算法的搜索效率更高,因此,本文使用Tent映射初始化鯨魚種群,初始化公式為 (7) 式中Xi為第i個鯨魚個體的初始位置向量。 2.1.2 調節因子非線性化 WOA通過調節因子a控制全局搜索能力,a越大,則算法在全局搜索上的表現力越強,在局部搜索上的表現力則相對較弱。原始調節因子a在迭代過程中線性地從2減小到0,這種線性變化難以應對復雜問題,在優化時易陷入局部最優。針對該問題,本文提出一種非線性變化策略,使調節因子a在整個迭代過程中從2到0先慢后快地減小,提升算法在迭代前期的全局搜索能力及迭代后期的局部搜索能力,從而加快收斂速度。優化后a的計算公式為 a=2-2(t/tmax)2 (8) 2.1.3 DE算法 WOA在尋優時所有鯨魚會朝著當前最優位置的鯨魚個體靠近,因此,若當前最優位置不是全局最優解,則整個種群就會錯誤地向局部最優聚攏,算法會陷入局部最優。針對這一缺點,本文引入DE算法的變異、交叉、選擇操作,以增強WOA的全局搜索能力。 (1) 變異。從鯨魚種群中隨機選擇2個鯨魚個體并生成差分向量,然后選擇另外一個鯨魚個體與加權差分向量求和,生成變異個體。變異個體計算公式為 hi(t)=X1(t)+F(X2(t)-X3(t)) (9) 式中F為縮放因子,F∈[0,2]。 (2) 交叉。將選定的目標鯨魚Xi(t)={Xi,1(t),Xi,2(t),…,Xi,n(t)}(n為鯨魚個體維數)與變異產生的新鯨魚hi(t)={hi,1(t),hi,2(t),…,hi,n(t)}進行交叉操作,從而生成新的子代鯨魚個體ui(t)={ui,1(t),ui,2(t),…,ui,n(t)},增加鯨魚種群的多樣性。交叉操作的表達式為 (10) 式中:j=1,2,…,n;q為交叉概率,q∈[0,1]。 (3) 選擇。在目標鯨魚和子代鯨魚之間進行選擇操作,將表現更好的鯨魚個體保留到下一代鯨群中,選擇公式為 (11) 式中S()為適應度函數。 煤礦突水受到多種因素的影響,本文將影響煤礦突水的多種因素作為模型的輸入特征向量,突水與安全2種突水結果作為數據的類別信息構成模型的輸出向量。 構建IWOA-SVM突水預測模型時,首先要實現IWOA。每個鯨魚個體由SVM的核函數寬度和懲罰因子2個參數構成,以突水預測結果與實際結果間的誤差最小化為目標建立目標函數,根據IWOA得到SVM模型的最優參數值。采用SVM模型對樣本數據進行預測,得出最終的突水預測結果?;贗WOA-SVM的煤礦突水預測流程如圖1所示。 礦井突水是指在采掘過程中帶壓水通過裂隙等突水通道涌入巷道的現象,一般指底板承壓含水層水突出。本文從突水水源、突水通道、影響突水指標3個角度出發分析突水機理,從而確定作為預測模型輸入特征的相關影響因素。 研究表明[16-19],煤層底板下的承壓含水層是煤礦突水的物質基礎,含水層的富水性對礦井突水量大小起決定性作用。水壓是導致底板突水的力源,而底板隔水層則對底板突水起抑制作用,隔水層越厚,抑制突水的能力越強。斷層與裂隙是底板突水的主要充水通道,斷層落差越大的地點越容易發生煤層底板突水,而陷落柱等地質構造與裂隙發育都有可能形成突水通道,加大突水概率。采高和煤層傾角均會影響礦井的充水強度,當煤層傾角和采高較大時會增加地下地層的壓力,減小隔水層厚度,增大突水概率,此外煤層開采后的垮落高度也會較大,塌陷及裂隙可能溝通含水層,從而造成突水。因此,在構建突水預測模型時,可以針對不同礦井的實際情況進行分析,選擇合適的影響因素,對模型的輸入特征進行調整。 圖1 基于IWOA-SVM的煤礦突水預測流程Fig.1 Water inrush prediction flow based on IWOA-SVM 本文收集整理了華北典型礦區的實測突水資料,根據華北典型礦區水文地質特征,將水壓z1、隔水層厚度z2、煤層傾角z3、斷層落差z4、斷層距工作面距離z5、采高z6共6個影響因素作為預測模型的輸入特征。從突水資料中選取55條數據構建數據樣本集,其中43個樣本作為訓練樣本,其余12個樣本作為測試樣本。 原始數據還存在各屬性參數的量綱和數量級不同的問題,如水壓的單位為帕(Pa),煤礦底板隔水層厚度的單位為米(m),不同的量綱和數量級都會影響預測結果的準確性。為了消除量綱和數量級不同的影響,在進行預測之前,先對數據集進行歸一化處理,將樣本的特征值轉換到[0,1]區間中,具體公式為 (12) 式中:z*為歸一化后的參數;z為原始參數;zmax,zmin為樣本數據中的最大值和最小值。 歸一化處理后的部分突水數據見表1,其中突水狀態中1表示突水,0表示不突水。 表1 歸一化處理后的部分突水數據Table 1 Partial water inrush data after normalization 使用Python實現IWOA對SVM模型的參數尋優。將標準誤差作為模型的評價指標,同時,通過對比PSO算法、DE算法、WOA、IWOA的尋優結果,評估IWOA的整體性能。 基于公平性原則,設置算法的種群大小均為35,最大迭代次數均為100,每個種群個體均是由SVM的參數c和σ構成的二維向量,參數范圍均為[0.01,100]。4種算法的尋優結果見表2,收斂曲線如圖2所示。 表2 4種算法的尋優結果Table 2 Optimizing results of four algorithms 分析表2結果可知,IWOA對訓練集的預測準確率為88.37%,PSO算法的準確率為60.47%,DE算法的準確率為83.72%,WOA的預測準確率為81.39%。相比于PSO,DE,WOA,本文提出的IWOA的預測準確率最高,標準誤差也最小,說明其收斂精度高,并且穩定性更強,魯棒性好。由圖2可以直觀地看出,IWOA在尋優過程中迭代到第8次時標準誤差已經收斂到最小值,PSO算法在迭代到100次時仍未收斂到最小值,而DE算法、WOA分別迭代到29次及43次時才收斂到最小值,說明IWOA的尋優能力更強且收斂速度更快。 圖2 4種算法的收斂曲線Fig.2 Convergence curves of four algorithms 使用IWOA對SVM模型的參數進行尋優,最終確定基于IWOA-SVM的煤礦突水預測模型的2個參數分別為c=6.517,σ=0.418。 煤礦突水預測是一個二分類問題,本文使用預測準確率作為評價指標,預測準確率越接近1,表明突水預測模型的預測結果越準確。 使用IWOA計算出的最優懲罰因子和核函數寬度參數構建SVM模型,對測試樣本進行預測,模型預測結果與實際結果如圖3所示。可以看出,基于IWOA-SVM的模型對12個測試樣本的預測結果與實際突水結果均重疊。 圖3 IWOA-SVM預測結果Fig.3 IWOA-SVM prediction results 為了驗證本文所提算法應用于煤礦突水預測時的準確性,在相同的數據集和實驗條件下,使用傳統的突水系數法、SVM、WOA-SVM及IWOA-SVM分別進行煤礦突水預測,并對預測結果進行比較,見表3。 從表3可以看出,傳統突水系數法、SVM及WOA-SVM在突水測試集上的預測準確率分別為75%、83.33%和91.67%,而本文提出的IWOA-SVM在是否突水這一分類問題上的預測準確率達到100%,預測結果與實際結果相符。 分析IWOA-SVM算法的特性,IWOA在尋優前期的全局搜索能力強、在迭代后期的局部搜索能力強這一特質能夠加快IWOA在搜索SVM模型最優參數時的收斂速度,每個鯨魚擁有的交叉、變異、選擇能力增強了IWOA的全局搜索能力,避免了其在尋優過程中過早陷入局部最優,這是WOA-SVM無法做到的。因此,IWOA-SVM模型在煤礦突水預測中表現出更高的準確率和穩定性。 (1) IWOA引入非線性思想優化調節因子,利用混沌映射和差分進化的思想優化鯨魚種群,從而提高傳統WOA的全局搜索能力及收斂速度。 (2) 根據煤礦突水數據小樣本、非線性的特征,選取SVM模型進行突水預測。為了確定SVM的最優參數,有效提高預測精度和速度,基于IWOA對其進行參數尋優。 (3) 實驗結果表明:與PSO算法、DE算法、WOA相比,IWOA的預測準確率最高,標準誤差最小,且收斂速度快,魯棒性好;IWOA-SVM的預測準確率達到100%,與傳統的突水系數法、SVM、WOA-SVM相比,IWOA-SVM表現出更高的準確率和穩定性。2 基于IWOA-SVM的煤礦突水預測模型
2.1 參數優化

2.2 預測流程
3 實驗分析
3.1 模型輸入特征與數據處理


3.2 參數確定


3.3 突水預測結果

4 結論