蘇俏俏,黃平華,丁風帆,胡永勝,郜鴻飛
(河南理工大學 資源環境學院,河南 焦作 454000)
中國是一個煤炭生產大國,2015年煤炭消耗量占總能源消耗量的63.7%,隨著能源的快速消耗,同時也帶來了環境污染和地下水突水事故。礦井水害已經造成了較大的經濟損失,并威脅到了人類生命[1],迅速、準確地判定礦井突水水源對于礦區防治水工作具有重要意義。礦井突水水源判別方法是依靠相關科學技術手段對礦井突水來源進行分析和判斷的理論方法[2]。水化學數據是地下水本質的特征[3],由于各含水層賦存的巖石成分以及補徑排途徑不同,其水化學組成存在差異。因此,采用突水點的水化學組分來判別水源的歸屬是快速、準確的。同時水化學分析水樣來源要與研究區水文地質相互結合,提高水源識別的可靠性[4]。在國內外學者的共同努力下,礦井突水水源判別的研究方法理論已日趨成熟。常用的主要類型有水位水溫判別法[5]、同位素法[6]、多元統計分析法[8-11]以及非線性分析等方法[12-14]。
近年來,我國學者也開展了各方面的研究工作。李燕等[15]運用水化學離子成分守恒分析方法定量分析了礦井涌水的成分,從而確定了突水來源;潘國營等[16]運用氫氧同位素對礦區突水水源進行了有效的判別;陳陸望等[17]研究了利用微量元素結合貝葉斯判別線性模型分析臨渙礦區突水水源模式;王心義等[18-19]運用模糊可變集理論結合不同的權重識別了礦井水源;毛志勇等[20-21]采用神經網絡理論對于突水水源進行了準確識別,這些研究方法均取得了較好的成果。然而,目前的研究成果在以下幾方面還存在不足:①由于煤礦開采導致含水層之間水力聯系愈加緊密,不同含水層間可能會通過裂隙發生混合作用,所采取的水樣不一定能夠真實反映其所在含水層的水化學特征;②這些方法大部分未考慮水化學指標間的信息重疊對水源判別精度的影響;③建立的水源識別模型未進行交叉驗證,不能充分估計已建模型在未知水樣預測時的準確度。
為此,本文利用Piper三線圖方法剔除了異常水樣,選用剩余水樣作為訓練樣本,并結合PCA法進行主要水化學指標數據的提取,最后通過LOOCV法選出分類性能較好的模型,建立Piper-PCA-Fisher礦井突水水源判別模型。從地下水水化學成分角度探究典型水樣的篩選,再結合多元統計模型進行突水水源識別,從而考慮水化學特征對突水水源的影響,為以后礦井突水預測提供一種新思路。
焦作煤田位于太行山隆起帶與華北平原沉降帶之間的過渡地段,屬太行山東南麓山前沖、洪積緩傾斜平原,總的地勢為西北高東南低,微向東南傾斜。由于該區受北東向、北西和近東西向3組高角度斷裂的影響與控制,基巖地層被切割破碎,導致各含水層之間發生了一定的水力聯系。按照地層的巖性、厚度、含水空間特征及埋藏條件等,區內可劃分4種類型的含水巖組,即第三、第四系砂礫巖孔隙含水巖組,二疊系砂巖裂隙含水巖組,石炭系薄層灰巖巖溶裂隙含水巖組,奧陶系中統厚層灰巖裂隙溶洞含水巖組。
研究從焦作礦區的井水、太行山泉水、煤礦區地下水中采集第四系地下含水層樣品12個;二疊系砂巖地下含水層樣品7個;石炭系灰巖地下含水層樣品10個;奧陶系灰巖地下含水層樣品12個,待判樣本11個,測試結果見表1。

表1 焦作礦區地下水水樣水化學指標含量Tab.1 Water chemical index content of groundwater sample in Jiaozuo Mining Area mg/L

從焦作礦區的主要突水含水層采集52個水樣,除去11個待判水樣,將41個水樣經過Piper三線圖進行水化學分析。從圖1中可以看出,水質類型主要呈Ca-HCO3-Mg-Na、HCO3-Ca-Mg-Na等過渡類型,少量呈HCO3-Na型和HCO3-Mg-Ca、HCO3-Ca-Mg型。因為水樣Q3、水樣Q4、水樣Q11以鈣鎂離子為主,水樣Q12呈HCO3-Na型水,與大部分水樣分布不同。所以它們不宜作為第四系水典型水樣。石炭系和奧陶系灰巖水樣水質類型主要呈HCO3-Mg-Ca型,少數呈HCO3-Na型、SO4-Na型、HCO3-Mg-Na-Ca型。由于水樣1呈現混合HCO3-Mg-Na-Ca型,水樣O5出現 SO4-Na型,水樣C5、C10呈現HCO3-Na型。所以不宜作為灰巖水典型水樣。二疊系砂巖水樣水質類型主要呈HCO3-Na型,少量呈HCO3-Mg-Ca型。因為水樣CS6呈HCO3-Mg-Ca型水,與其他水樣相差較大,所以它不宜作為二疊系砂巖水典型水樣。剔除9個異常樣本后,選取了32個作為訓練樣本。其中訓練樣本中第四系水樣有8個,石炭系和奧陶系水樣有18個,二疊系水樣有6個。

圖1 焦作礦區水樣化學成分Piper圖Fig.1 Piper trilinear map of chemical composition of water sample in Jiaozuo Mining Area

首先對各突水水源指標進行主成分分析,根據變量信息貢獻率一般為85%以上的原則,綜合考慮判別指標的聯系,選取前3個主成分,其累計方差貢獻率達90.6%,可以概括原始變量的基本信息,表征該區的水化學特征信息[14-15]。
根據PCA分析,提取出了新的判別指標Y1、Y2、Y3,與原始指標之間的關系表達式(公式中用Na+代替Na++K+):
(1)
然后根據表1中選取的32個樣本作為訓練數據,利用主成分分析得到的3個判別指標。將這3個類型的第四系砂礫孔隙含水層(Ⅰ)、石炭系和奧陶系灰巖含水層(Ⅱ)、二疊系砂巖含水層(Ⅲ)作為Fisher判別分析的3個正態總體,經過計算后得到Fisher線性判別函數,各判別函數表達式:
(2)
Fisher判別理論通過計算待判水樣判別函數值與3類水源組別的中心值的距離來判別該水樣屬于哪一個含水層。式(2)為典則判別函數的附加特征值,其第1類和第2類判別函數代表了樣品全部的信息。因此,所示為運用第1和第2判別函數進行分組的結果(圖2),據此可以清晰地看到各水樣投影點的位置,并根據水樣點距離各含水層中心點的平方馬氏距離進行判別來源。第1和第2判別函數在各組別的中心值見表2。

圖2 第1和第2判別函數的分組Fig.2 Group of the first and second discriminant functions

表2 典則判別函數在各類別含水層的中心值Tab.2 Central value of criterion discriminant function in each type of aquifer
為了驗證本文采用方法的有效性,采用將表1中的訓練數據逐個回代到已建立的Piper-PCA-Fisher模型中,其中樣本中有4個水樣(Q2、Q6、Q7、Q8)回判錯誤,判別正確率為87.5%,與傳統的方法相比,利用傳統方法的Fisher判別模型回判錯了9個水樣,正確率為75.6%。
同時采用留一交叉驗證法評估模型的穩定性,在交叉驗證中,樣本總體分類準確率越高,模型的預判分類性能越好。留一交叉驗證法對樣本總體分類的準確率達到81.3%,而傳統模型則為61%。通過交叉驗證、預判準確率綜合比較認為,Piper-PCA-Fisher的礦井突水水源識別模型能夠有效提升Fisher模型對突水水源的判別精度,具有更為優越的預測性能。2種模型交叉驗證分類結果見表3。

表3 2種模型交叉驗證分類結果Tab.3 Cross validation classification results of two models
利用學習好的模型對焦作礦區的11個隨機選取的待判樣本(表1)進行判別,并與傳統的模型進行對比,預判結果見表4。由表4可以看出,Piper-PCA-Fisher水源識別模型判別準確率達到91%。傳統Fisher水源識別模型的判別正確率為72.7%。水樣D1實際為第四系水,但是該模型誤判成了灰巖水。原因可能是從水化學成分來看,第四系水水質類型主要呈HCO3-Mg-Na-Ca、HCO3-Ca-Mg-Na等過渡類型;灰巖水水質類型主要呈HCO3-Mg-Ca型,少量呈HCO3-Mg-Na-Ca型,兩者水化學類型相似,影響了判別結果。從地質因素分析來看,深部灰巖含水層地下水通過斷裂構造和第四系底部砂礫石含水層松散孔隙水和風化裂隙水發生水力聯系,導致水源誤判。

表4 預測樣本的判別分類結果Tab.4 Discriminant results of testing samples
(1)采用Piper圖對各突水水源含水層水樣進行篩選,能夠有效識別出異常水樣或發生混合的水樣。其中第四系含水層以HCO3-Mg-Na-Ca等過渡類型為主,表明第四系含水層可能發生了混合作用;灰巖含水層以HCO3-Mg-Ca型為主;二疊系含水層以HCO3-Na型為主。
(2)用主成分分析對原始數據進行特征提取,消除了判別時信息冗余造成的影響。這3個主成分為判別因子,建立了焦作礦區礦井突水水源Fisher判別模型。
(3)在礦井突水水源判別中,Piper-PCA-Fisher模型有較高的判別準確率(91%),判別效果明顯優于傳統Fisher判別模型(72.7%),為有效地識別礦井突水水源提供了一種新的思路。
(4)由于建立的突水水源模型是某一時間段礦區采集的水質資料,但是考慮礦區水文地質條件的復雜性和含水層受時間、溫度、人為等不同因素的影響,因此,要在充分分析研究區的基礎上廣泛收集不同時間段的數據以增強模型的實用性能力。