謝道文,施式亮
(1. 中南大學 資源與安全工程學院,湖南 長沙,410083;2. 湖南科技大學 信息與電氣工程學院,湖南 湘潭,411201;3. 湖南科技大學 能源與安全工程學院,湖南 湘潭,411201)
近年來,煤礦水害事故、突水淹井、淹采區和重大未遂水害事故多發,并有逐步上升的趨勢[1],造成重大人員傷亡和財產損失。為吸取事故教訓,防治水害事故,加強煤礦安全生產工作、開展突水預測預報研究工作顯得尤為重要,其中對礦井涌水量進行準確的預測是一項必要的研究措施。目前,礦井涌水量預測大體上可以分為確定性分析方法和不確定性(隨機)分析方法2類[2]。黃存捍等[3]將時間序列最小嵌入維數作為支持向量機的輸入節點,并據此建立礦井涌水量預測模型;鮑道亮等[4]應用灰色系統理論,建立GM(1,1)灰色預測模型,對煤礦涌水量進行動態預測;姜素等[5-7]采用神經網絡方法建立了預測模型;陳玉華等[8]則采用混沌時間序列分析方法對礦井涌水量進行了預測。以上各種方法原理不同,結果表示方式不一,各有其優缺點和最佳應用環境。礦井涌水受許多不確定性因素影響,而且礦井涌水的數量也存在大量的不確定性,而模糊性和隨機性是不確定性最基本的2個方面。李德仁等[9]提出的云模型是一種不確定定量定性互換模型,它把不確定概念的模糊性和隨機性有機地結合在一起,實現了不確定語言值與定量數值之間的自然轉換。以往的研究常常把不確定的兩方面割裂開來。近年來,馬爾可夫鏈的理論和方法廣泛地應用于徑流、電力、經濟等領域的預測研究,并取得很好的效果,但是,對礦井涌水量的預測尚未涉及。為此,本文作者應用云理論和加權馬爾可夫預測法建立云加權馬爾可夫預測模型(C-WMM),用于礦井涌水量的定性預測。
云是利用語言值表示某個定性概念與其定量表示之間不確定性轉換模型, 它主要反映自然語言中概念的 2種不確定性, 即模糊性(邊界的亦此亦彼性)和隨機性(發生的概率),并把兩者完全集成在一起,構成定性和定量間的映射。
設 U是一個用精確數據值表示的定量論域,X?U,T是U空間上的定性概念。若元素x(x∈X)對T的隸屬的確定度 CT(x)∈ [ 0,1]是1個有穩定傾向的隨機數(式1),則概念 T從論域 U到到區間[0,1]的映射在數域空間的分布稱為云(Cloud)。每個x稱為1個云滴(x,CT(x)),云就是由許許多多這樣的云滴構成的[9]。


云模型有多種形式,有Γ云、梯形云、正態云和三角云等。正態云模型是基本的云模型,是表征語言原子的有力工具之一。在正態云模型的基礎上,增加某個或某些參數,根據不同的用途可以生產不同的形態的云模型,有左升云、左降云、右升云和右降云等。
云的數字特性反映了定性概念的定量特征,用期望Ex、熵En和超熵He來表征[9],其中:期望Ex指在論域空間中最能夠代表此定性概念的點;熵En代表1個定性概念的可度量粒度和不確定性,表示定性概念的模糊度,是定性概念亦此亦彼的度量;超熵He是熵的不確定度量,間接地反映了云的厚度。
云發生器[9](Cloud generator,簡稱 CG)是指被軟件模塊化或硬件固化了的云模型生成算法, 云發生器建立定性和定量之間的相互聯系、相互依存,定性中有定量的映射關系, 定量中有定性的映射關系, 主要包括正向云發生器、逆向云發生器、X條件云發生器、Y條件云發生器。
正向云發生器是從定性到定量的映射, 其輸入是云的數字特征 (Ex,En和He)和云滴數量N,輸出是N個云滴在數域空間的定量位置及每個云滴代表概念的確定度,具體算法如下。

步驟4:帶有確定度CT(xi)的成為數域中的一個云滴;
步驟5:重復步驟1~4,直至產生要求的N個云滴為止。
梯形云的數字特征可用期望值Ex1和 Ex2、熵 En1和En2、超熵He1和He26個變量來表征[10]。
期望值Ex1和Ex2:是概念在論域中的左右半云中隸屬度為1的x,區間[Ex1,Ex2]的x是100%隸屬于這個定性概念。
熵En1和En2:是表示定性概念左、右半云模糊度的度量,反映了在論域中可被這個概念所接受的數值范圍。
超熵He1和He2:反映了左、右半云的云滴離散程度。超熵越大, 云滴離散度越大, 隸屬度的隨機性越大,云的厚度也越大。
顯然, 左右半云期望曲線是1條正態型曲線。具體算法如下。

步驟8:重復步驟1~7,直至產生要求的N個云滴為止。
對于左半升梯形云與右半降梯形云,一般用 Ex1和Ex2、熵En、超熵He4個變量表征。
給定正態云的 3個變量(Ex,En和He)和特定的x下的云發生器稱為X條件正態云發生器。X條件云發生器生成的云滴位于同一條豎直線上,橫坐標數值均為x,縱坐標隸屬度值呈概率分布。具體算法如下[9]。

步驟4:重復步驟1~3,直至產生要求的N個云滴為止。
以左半升梯形云與右半降梯形云為例,來討論X條件梯形云發生器的算法。給定左半升梯形云或右半降梯形云的4個變量(Ex1,Ex2,En,He)和特定的x條件下的梯形云發生器稱為相應的 X條件梯形云發生器。X條件左半升梯形云發生器的具體算法如下。

步驟3:輸出1個云滴drop(x,CT(x))。
步驟4:重復步驟1~3,直至產生N個云滴為止。
而X條件右半降梯形云發生器的算法與左半升梯形云的大致相同,只需把步驟2改為:若x≤Ex1,則產生1個正態隨機數
以上各算法都使用MATLAB軟件實現。
在事物的發展過程中,若每次狀態的轉移都僅與現在時刻的狀態有關,而與過去的狀態無關,或者說,事物的狀態的“過去”與“將來”是無關的,兩者是相互獨立的,這樣的狀態轉移過程就稱為馬爾可夫過程(Markov process)。嚴格的定義如下[11]。

則稱{ Xt, t ∈T}為馬爾可夫鏈,簡稱馬氏鏈。定義表明:系統在t+s時刻的狀態只與t時刻的狀態有關,而與t時刻以前的狀態無關,這個性質就是馬氏性。因為本文應用馬爾可夫鏈的目的是對系統未來的狀態進行預測,故這里介紹的概念都限定在預測理論的框架中,即假定的狀態空間是有限的,而且馬氏鏈是齊次的。
加權馬爾可夫鏈預測[12]是對疊加馬爾可夫鏈預測法進行改進,在疊加馬爾可夫鏈的基礎上,對不同的預測值賦予1個權值,再進行加權求和。一般確定系數的方法是通過對觀測數據進行自相關分析。對于觀測序列,若序列的n階自相關系數越大,則說明n步的概率轉移矩陣所描述的系統狀態變化就越穩定、可靠,可以賦予較大的權重。
在加權馬爾可夫鏈預測法中,通過已知樣本序列x1,x2,…,xn,預測 n+1 時刻的狀態;可利用 xn,xn-1,…,xn-k+1,時刻的狀態作為初始狀態,計算步長為1,2,…,k時的馬氏鏈預測值,再把所得的預測值加權求和,找出最大值所對應的狀態即為所求的第n+1時刻的狀態。
各步長馬氏鏈預測值的權重通過觀測數據序列的各階自相關系數而求得。各步長的自相關系數ρs,可由下式求得:

式中:ρs為第 s階的自相關系數;s=1,2,…,k;xl為l時刻的觀測值;x為樣本序列的均值。根據式(3),對各階自相關系數進行規范化處理。

最后可利用ws作為s步概率轉移矩陣預測結果的權系數,再將同一狀態的各預測概率加權和作為最終的預測概率,即

則 pk(j) =max{ pk(i), i ∈ E }所對應的j即為該時刻指標值的預測狀態。
云加權馬爾可夫預測模型(C-WMM)的建立步驟如下。
(1) 劃分狀態概念的云,確定劃分狀態的數量及區間。建立各狀態概念云模型,實現定量到定性概念的轉換。對于邊界狀態概念,一般采用左半升梯形云與右半降梯形,中間狀態采用正態云模型來描述。
(2) 確定馬爾可夫狀態空間及權重。確定樣本序列所對應的狀態概念。將各年份的礦井涌水量作為Ex輸入X條件云發生器,獲得對各個狀態概念的隸屬度;根據極大判定法思想[13](如圖 1所示),確定涌水量的狀態等級,即涌水量的狀態等級屬于輸出最大隸屬度的X條件云發生器所對應的狀態概念。由于存在隨機性,在重疊區中同一屬性值在不同情況下可能會分配給不同的云,但最多分配給2朵不同的云,這與人類認知分類情況顯然是吻合的。若有n個樣本出現2種不同的狀態輸出,則共有2n中不同情形的馬爾可夫狀態空間。進行多次模擬,把不同情形出現的概率作為權重,以加權求和計算最終的預測概率。
(3) 計算各步長的馬爾可夫鏈轉移矩陣。不同的狀態空間對應不同的馬爾可夫鏈轉移矩陣。分別計算不同狀態空間下各步長的馬爾可夫鏈轉移矩陣。
(4) 計算各步長的權重。根據式(2)和(3)計算各階自相關系數和各種步長的馬爾可夫鏈權重。

圖1 極大判定法原理圖Fig.1 Schematic diagram of great determination method
(5) 計算預測樣本的狀態在各種情形下的預測概率矩陣。
(6) 計算最終的預測概率矩陣,并進行狀態預測。
對各情形下預測概率加權求和即得到最終的預測概率。最大概率所對應的狀態就是預測樣本所對應的狀態。
下面以文獻[3]中鶴壁四礦 1982—1999年礦井涌水量為例,如表1所示。應用云加權馬爾可夫模型對2000—2001年的礦井涌水量狀態進行定性預測,具體的預測步驟如下。
(1) 劃分狀態概念。由表 1可計算鶴壁四礦歷年礦井涌水量序列均值x=1 351.3,均方差x=593.5。利用樣本均值-方差分級法,所得分級標準見表2。將年礦井涌水量劃分為5個狀態,此劃分屬于“硬劃分”。并以此為基礎,應用云理論建立狀態概念的云模型,實現狀態概念的“軟劃分”。
分別對涌水量的 5個狀態進行狀態概念的云劃分,狀態1對應左半升梯形云,狀態2~4對應正態云,狀態5對應右半降梯形云,如圖2所示,分別表示為:C1(2 146.4,2348,67.2,2),C2(1 769.4,49.5,2),C3(1 351.3,98.9,2),C4(906.2,49.5,2),C5(538.2,648,36.6,2)。
(2) 確立狀態空間及權重。在本研究中,1982年巷道涌水量狀態在通過X條件云發生器輸出時,出現2種隨機輸出,即狀態4和狀態5。在樣本均值-方差分級標準中,狀態4和狀態5的分界閥值為757.8 m3/h,而1982年巷道涌水量為758 m3/h,若采用“硬劃分”,則應屬于狀態 4。由于存在模糊性和隨機性,這種亦此亦彼特性,比“硬劃分”的非此亦彼更科學、合理,更加符合人類的思維。由于其他年份的巷道涌水量與硬劃分狀態的分界閥值有一定的差距,所以,在通過X條件云發生器輸出時,狀態也是基本確定的,見表1。本文把1982年巷道涌水量狀態為4的情形稱為情形1,狀態為5的情形稱為情形2。

表1 鶴壁四礦歷年礦井涌水量及其狀態(情形1)Table 1 Historical mine water inrush of the 4th mine in Hebi (Case 1) m3/h

表2 礦井涌水量狀態分級表Table 2 State grading table of mine water inrush
以1 000次為1組進行模擬,出現情形1的頻率為612,出現情形2的頻率為388。雖然每組模擬實驗出現的結果不同,但結果趨近于情形1的頻率大約為600,情形2的頻率大約為400,本文取[0.6,0.4]作為它們的權重。

圖2 狀態等級概念的云劃分Fig.2 State concept partition based on cloud theory
(3) 計算馬爾可夫鏈的轉移矩陣。根據切普曼-柯爾莫哥洛夫方程[14],經計算可得情形1各步長的馬爾可夫鏈的轉移概率矩陣如下:
情形 2各步長的馬爾可夫鏈的轉移概率矩陣如下:

(4) 計算權重。根據式(2)計算可得各階自相關系數和各種步長的馬爾可夫鏈權重,如表3所示。
(5) 計算預測值在各種情形下的預測概率矩陣,結果見表4。由表4可知對于情形1,2000年鶴壁四礦礦井巷道涌水量預測值所屬各狀態的概率矩陣為:[0.205 1 0 0.143 9 0.280 2 0.370 7]
2000年情形2礦井涌水量狀態預測結果,見表5。由表5可知情形2所屬各狀態的概率矩陣為:
[0.205 1 0 0.095 9 0.300 4 0.398 5]

表3 各階自相關系數和各步長的馬爾可夫鏈權重Table 3 Self-correlation coefficients and weight for each step’s Markov chain
(6) 計算最終預測概率矩陣,并進行預測。2000年鶴壁四礦礦井巷道涌水量預測值所屬概率矩陣為:

根據最大隸書度原則,2000年鶴壁四礦礦井巷道涌水量的預測狀態為 5,而 2000年實際的涌水量為578.8 m3/h,通過X條件云發生器輸出的狀態也為5,預測狀態與實際相符。再利用2000年鶴壁四礦礦井巷道涌水量的預測狀態預測2001年的狀態,結果見表6和表7。
由表6和表7,同理可得2001年鶴壁四礦礦井巷道涌水量的所屬各狀態的概率矩陣分別為:

同理,2001年鶴壁四礦礦井巷道涌水量預測值所屬概率矩陣為:


表4 2000年情形1的礦井涌水量狀態預測Table 4 State prediction of mine water inrush in 2000 for Case 1

表5 2000年情形2礦井涌水量狀態預測Table 5 State prediction of mine water inrush in 2000 for Case 2

表6 2001年情形1礦井涌水量狀態預測Table 6 State prediction of mine water inrush in 2001 for Case 1

表7 2001年情形2礦井涌水量狀態預測Table 7 State prediction of mine water inrush in 2001 for Case 2
所以,2001年鶴壁四礦礦井涌水量預測狀態也為5。而2001年涌水量為496.3 m3/h,屬于狀態5的概念劃分。預測狀態與實際狀態相符。
(1) 建立云加權馬爾可夫預測模型,并應用其對多年礦井涌水量進行預測,預測值所屬狀態與實際值相吻合,為實際生產中預防礦井突水事故的發生提供了一個新思路。這種預測是定性預測,而不是具體值;劃分的狀態越多,預測結果越接近實際值。
(2) 應用云理論對狀態概念進行“軟劃分”,綜合考慮模糊性和隨機性,摒棄了非此亦彼的“硬劃分”。
(3) 由于云模型的隨機性,每次各情形出現的次數雖不同,但具有一定的趨勢,并不影響最后的預測結果。
[1] 張正浩. 煤礦水害防治技術[M]. 北京: 煤炭工業出版社,2010: 112.ZHANG Zheng-hao. Water hazards prevention and control technology in coal mine[M]. Beijing: China Coal Industry Publishing House, 2010: 112.
[2] 杜敏銘, 鄧英爾, 許模. 礦井涌水量預測方法綜述[J]. 四川地質學報, 2009, 29(1): 70-73.DU Min-ming, DENG Ying-er, XU Mo. Review of methodology for prediction of water yield of mine[J]. Acta Geologica Sichuan,2009, 29(1): 70-73.
[3] 黃存捍, 馮濤, 王衛軍, 等. 基于分形和支持向量機礦井涌水量的預測[J]. 煤炭學報, 2010, 35(5): 806-810.HUANG Cun-han, FENG Tao, WANG Wei-jun, et al. Mine water inrush prediction based on fractal and support vector machines[J]. Journal of China Coal Society, 2010, 35(5):806-810.
[4] 鮑道亮, 劉宏錦. 基于GM(1,1)模型的礦井涌水量預測[J]. 龍巖學院學報, 2010, 28(2): 32-34.BAO Dao-liang, LIU Hong-jin. Prediction of water discharge based on GM (1,1) model[J]. Journal of Longyan University,2010, 28(2): 32-34.
[5] 姜素, 孫亞軍, 楊蘭, 等. 基于 BP神經網絡方法的礦井涌水量預測[J]. 中國煤田地質, 2007, 19(2): 38-40.JIANG Su, SUN Ya-jun, YANG Lan, et al. Mine inrush water prediction based on BP neural network method[J]. Coal Geology of China, 2007, 19(2): 38-40.
[6] 梁冰, 李剛, 王宗林. 基于BP神經網絡的降雨充水礦井涌水量預測[J]. 中國地質災害與防治學報, 2009, 20(1): 122-125.LIANG Bing, LI Gang, WANG Zong-lin. Prediction of water inflow of mine with rainfall yield based on BP artificial neural network[J]. The Chinese Journal of Geological Hazard and Control, 2009, 20(1): 122-125.
[7] 吳翠娟. 基于神經網絡的礦井涌水量預測研究[J]. 中國煤炭,2009, 35(10): 105-107.WU Cui-juan. A study on the nervous network based mine water inflow forecasts[J]. China Coal, 2009, 35(10): 105-107.
[8] 陳玉華, 楊永國, 彭高輝. 礦井涌水量混沌時間序列分析與預測[J]. 煤田地質與勘探, 2008, 36(4): 34-36.CHEN Yu-hua, YANG Yong-guo, PENG Gao-hui. Chaotic time series analysis and prediction for mine water inflow[J]. Coal Geology & Exploration, 2008, 36(4): 34-36.
[9] 李德仁, 王樹良, 李德毅. 空間數據挖掘理論與應用[M]. 北京: 科學出版社, 2006: 337-349.LI De-ren, WANG Shu-liang, LI De-yi. Spatial data mining theories and applications[M]. Beijing: Science Press, 2006:337-349.
[10] 王兆紅. 基于梯形云的數量型關聯規則挖掘方法[J]. 信息技術與信息化, 2005(6): 98-100.WANG Zhao-hong. Quantitative association rules mining method based on trapezium-cloud model[J].Shandong Electronics, 2005(6): 98-100.
[11] 鄭小平, 高金吉, 劉夢婷. 事故預測理論與方法[M]. 北京:清華大學出版社, 2009: 165-170.ZHENG Xiao-ping, GAO Jin-ji, LIU Meng-ting. Theories and methods of accident prediction[M]. Beijing: Tsinghua University Press, 2009: 165-170.
[12] 夏樂天. 梅雨強度的指數權馬爾可夫鏈預測[J]. 水利學報,2005, 36(8): 988-993.XIA Le-tian. Prediction of plum rain intensity based on index weighted Markov Chain[J]. Journal of Hydraulic Engineering,2005, 36(8): 988-993.
[13] 李德毅, 杜鹢. 不確定性人工智能[M]. 北京: 國防工業出版社, 2005: 229-230.LI De-yi, DU Yi. Artificial intelligence with uncertainty[M].Beijing: National Defence Industry Press, 2005: 229-230.
[14] 蔣承儀. 灰色馬爾柯夫預測模型[J]. 重慶建筑大學學報, 1996,18(3): 117-123.JIANG Cheng- yi. Grey Markov forecasting model[J]. Journal of Chongqing Jianzhu University, 1996, 18(3): 117-123.