劉曉悅,張雪梅,楊偉
(華北理工大學 電氣工程學院,河北 唐山 063210)
隨著礦山越來越深層的開采,巖爆現象極易發生,這些潛在的危險已經影響了礦山的正常開采。巖爆是一種動態破壞現象,是由采礦擾動導致地下工程圍巖中累積的應變能突然釋放而引起的[1],它不僅可威脅到礦山人員和設備的安全,而且可影響到礦山建設項目的正常發展。由于現階段的巖爆預測模型仍存在需要改進的地方,因此,為了保證礦山進行安全平穩的進行深層開采,探索新的理論和方法預測巖爆十分迫切。
準確進行預測巖爆是預防巖爆發生的關鍵。該項研究采用基于粗糙集理論對采取的巖爆數據進行約簡,去除掉不重要的數據,使PNN網絡的輸入個數減少,降低了PNN網絡的復雜性。選擇合適的平滑因子,利用PNN訓練并建立礦山巖爆預測模型。
粗糙集理論(rough set theory, RS)具有在處理大量數據、消除冗余信息和處理不確定性信息等方面的優勢[2]。
1.1.1決策表
S= (U,A,V,f) 是一個信息系統。其中:U為論域;A為屬性的非空有限集合,A=C∪D,C∩D≠φ,C稱為條件屬性集合,D稱為決策屬性集合;V是所有屬性的值域集合;f是信息函數集。對于U中的任意元素x,f:U×A→V,S是決策表。
1.1.2不可分辨關系
由粗糙集理論可知,知識庫表示一個關系系統,記作K=(U,R),近似空間稱為K,論域U上的一個等價關系是R,稱為關于K的不可分辨關系,記為:
IND(R)={(x,y)∈U×U|?a∈A,f(x,a)=f(y,a)}
(1)
其中U/IND(R) 是論域U的劃分,里面包含的任意元素稱為等價類。
1.1.3下近似集和上近似集
子集X關于R的下近似集和上近似集分別為:

(2)
POSR(X)=R(x)稱為X的R正域。
1.1.4屬性約簡
在信息系統的知識庫中, 不僅不同知識 (屬性) 其作用不同, 而且還有許多多余屬性。因此,知識約簡不僅保證知識庫的分類能力不變, 還要把冗余的知識刪除掉。
如果IND(R) =IND(R-{r}) , 稱r在R中是可被約去的知識;如果P=R-{r}是獨立的, 則P是R的一個知識約簡。
在不同的環境和地質條件下,對于影響巖爆發生的因素也會有所不同,所以巖爆預測決策表,就是在保持巖爆發生烈度正確歸類的條件下,把巖爆預測決策表中不相關或不重要的影響因素刪除掉,最后形成1個最優屬性集的決策表。
概率神經網絡(Probabilistic Neural Network,PNN)是在1989年由D. F. Specht提出的一種以徑向基神經網絡為基礎的前饋神經網絡[3], 其中的基函數是高斯函數,并且在故障診斷等模式分類領域應用十分廣泛。
概率神經網絡的結構[4]如圖1所示。

圖1 概率神經網絡拓撲結構
相比較BP人工神經網絡而言,PNN網絡的主要優點是:容錯能力強、收斂速度快、訓練容易、結構簡單等。從以上優點可得,該項目采用概率神經網絡來構建巖爆預測模型,并且為了減少PNN網絡的輸入向量將訓練的復雜度降低,提高PNN巖爆預測模型的準確率,利用粗糙集理論刪除了冗余的數據。
建立巖爆評價指標體系的原則是評價指標應能反映巖爆的主要特征和圍巖的性質,并能方便地獲取數據,選取了5個具有代表性的指標。
巖爆烈度等級通常分為4級:I級(無巖爆活動)、II級(輕度巖爆活動)、III級(中度巖爆活動)、IV級(劇烈巖爆活動)。巖爆預測指標離散化區間[5]如表 1 所示。

表1 巖爆等級分類標準表
決策表構建以巖爆烈度等級指標為條件屬性, 巖爆等級為決策屬性構建決策表,U表示巖爆實例樣本即論域U={1, 2, 3, ……,20},條件屬性集C={C1,C2,C3,C4,C5},決策屬性集D=g0gggggg,其中:C1為巖石取樣處的埋深H,C2為巖石單軸抗壓強度σc,C3為應力系數σθ/σc,C4為脆性系數σc/σt,C5為巖石沖擊傾向性指數Wet,D為巖爆等級。將文獻[6]中選取的礦山巖爆實例數據進行離散化處理和屬性值的約簡,得到簡化后的決策表如表2所示。

表2 屬性值約簡后的巖爆預測決策表
論域分別按條件屬性和決策屬性進行等價類劃分得:
U/IND(C)={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15},{16},{17},{18},{19},{20}}
U/IND(D)={{1,2,3,4,5},{6,7,8,9,10},{11,12,13,14,15},{16,17,18,19,20}}
分別依次去掉一個條件屬性后的論域等價類劃分得:
U/IND(C-C1)={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15},{16},{17},{18},{19},{20}}
U/IND(C-C2)={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15},{16},{17},{18},{19},{20}}
U/IND(C-C3)={{1,9},{2,8},{3},{4},{5,19},{6},{7},{8},{9},{10,14},{11,12},{13},{15},{16,18},{17},{20}}
U/IND(C-C4)={{1},{2},{3},{4},{5},{6,19},{7},{8},{9},{10},{11},{12},{13},{14},{15},{16},{17},{18,20}}
U/IND(C-C5)={{1},{2},{3},{4},{5},{6},{7},{8},{9,14},{10},{11},{12},{13},{15},{16},{17},{18},{19},{20}}
各條件屬性下的決策屬性的正域:
POCC(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20}
POCC-C1(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20}=POCC(D)
所以,C1在C中是不必要的。
POCC-C2(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20}=POCC(D)
所以,C2在C中是不必要的。
POCC-C3(D)={3,4,6,7,8,9,13,15,17,20}≠POCC(D)
所以,C3在C中是必要的。
POCC-C4(D)={1,2,3,4,5,7,8,9,10,11,12,13,14,15,16,17}≠POCC(D)
所以,C4在C中是必要的。
POCC-C5(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,15,16,17,18,19,20}≠POCC(D)
所以,C5在C中是必要的。
由此可知:該預測決策表中,屬性C3、C4、C5是必要的,而屬性C1和C2不是必要的。通過進一步分析,該預測決策表的相對約簡為X={C3,C4,C5},所以得到的影響巖爆發生的主要因素是應力系數σθ/σc、脆性系數σc/σt和巖石彈性變形能指數Wet。
PNN礦山巖爆預測模型的建立過程:(1)建立巖爆預測等級的劃分標準,進行各指標值的離散化處理;(2)屬性值約簡。根據粗糙集理論,將礦山巖爆影響因素進行約簡,刪除掉不必要的屬性,得到影響巖爆發生的關鍵因素;(3)由于不同的物理量有不同的量綱,所以需要對樣本數據按照屬性進行歸一化處理,這樣可以減小誤差;(4)調整平滑因子的大小,確定最優的PNN網絡;(5)訓練典型巖爆樣本和巖爆等級之間的對應關系,最后使用經過訓練后的PNN網絡確定測試樣本的巖爆級別。
輸入向量是上述粗糙集理論的屬性約簡結果,為3個巖爆預測指標,所以輸入層神經元個數是3;訓練樣本數據15組;所以模式層神經元個數是15;因為有4類巖爆烈度等級,所以累加層和輸出層神經元個數是4。由上述可知,建立的PNN網絡的拓撲網絡結構是3×15×4×4。將數據進行歸一化之后,先輸入15組訓練樣本對PNN進行訓練,然后使用剩下的5組測試樣本來測試PNN網絡的性能。
對于PNN網絡性能來說,平滑因子(SPREAD)的選擇非常重要,因為如果平滑因子太小,很容易導致網絡過度擬合;反之,如果平滑因子太大,則無法完全區分細節[7]。PNN網絡接近線性分類器。所以需要通過調整平滑因子的大小,確定最佳的PNN模型。通過MATLAB中的newpnn函數建立PNN。經過對平滑因子大小多次的調整,當SPREAD=0.41時,PNN具有極高的收斂性,神經網絡訓練效果達到最佳。
利用PNN網絡進行訓練后得到的樣本誤差平方和變化曲線如圖2所示。

圖2 PNN網絡誤差平方和變化曲線
由圖2可以看出, 訓練以后的概率神經網絡具有極高的收斂性。
PNN模型對訓練樣本和預測樣本的結果如圖3和圖4所示。

圖3 訓練樣本預測結果

圖4 測試樣本預測結果
由圖3和圖4可知:隨機選擇的5組測試樣本中,只有2號樣本預測結果有誤,其它的樣本預測結果和實際結果完全一致,這就表明RS—PNN巖爆預測模型具有較強適用性。
為了進一步驗證巖爆預測模型RS-PNN模型的準確性,必須與不同的巖爆預測模型對同樣的巖爆數據進行預測對比。
從文獻[8]中選取30組礦山巖爆數據,根據粗糙集理論,將礦山巖爆影響因素進行約簡,得到巖爆影響的主控因素為巖石單軸抗壓強度σc、應力系數σθ/σc和沖擊傾向性指數Wet。將約簡后得到的結果進行數據歸一化,隨機選擇20組作為訓練樣本,剩下10組作為測試樣本,經PNN模型預測的巖爆結果如表3所示。

表3 不同預測模型預測結果對比
其中,表3當中其它模型的預測結果數據選自文獻[8],比較以上3種模型對10個樣本的測試結果,發現3種模型預測正確率分別為90%、70%和80%,說明RS-PNN模型相對于SVM模型和ANN模型而言,具有更高的準確率,因此RS-PNN模型具有一定的可行性。
(1)利用粗糙集理論中的知識約簡消除了巖爆數據冗余信息,獲得適合該地質、環境條件下巖爆發生的主控因素。粗糙集理論將PNN的輸入進行簡化,減小了概率神經網絡訓練的復雜度,顯著簡化了計算的過程,提高了巖爆預測的準確率。
(2)平滑因子(SPREAD)對于PNN網絡性能來說是十分關鍵的參數,因此需要通過調整平滑因子的大小,確定最優的PNN模型。
(3)將建立的粗糙理論集和概率神經網絡(RS-PNN)模型與支持向量機(SVM)模型和人工神經網絡(ANN)模型的預測結果進行對比,發現RS-PNN模型確實具有更高的巖爆預測準確率。