文章編號:1674-6139(2025)08-0136-05
中圖分類號:X832文獻標志碼:B
Construction of Water Pollution Monitoring Model Integrating Fuzzy Clustering Algorithmand EWT-KPCA Method
ZhengFengshou’,Ye Yanlei2,Tao Weixiang (1.Zhengyuan Geographic Information Group Co.,Ltd.,Beijing ,China; 2.Beijing Zhengyuan Mathematics Information Technology Co.,Ltd.,Beijing 10130o,China)
Abstract:Minewastewaterpllutionseriouslyfectsthelocalecologyadresidents’live.Toadresstis,esearchhasoposeda waterpolutionmonitoringodelthatintegatesfuzzyclusteringagoritsandempiicalwavelettransform.Experimentaldatashows thatmonelials,lel.ialyf,d model1lyeeed,,ndoalalsspecielyexpetalataicatetatetefsd water quality anomaly detection model is approximately 0.8% ,which is relatively low and suitable for detecting water quality anomalies. Theproposedmonitoringodelprovidespowerfultechnicalsupprtforal-timemonitoringofinewaterpolution,elpig topromptly identifyandaddresspollution issues,thereby protecting theecological environmentand residents'health.
Key words:fuzzy clustering algorithm;EWT;KPCA;water pollution monitoring
前言
礦山開采作為推動經濟發展的重要一環,其背后卻隱藏著對地表水質的深刻影響。這些影響不僅體現在水量的減少上,更在于水質的嚴重污染和當地生態系統的不可逆破壞,對環境和人類健康構成雙重威脅[1-2]。礦山廢水中含有大量有害物質,對水體生態造成了極為惡劣的影響,因此,建立有效的礦山廢水污染監測模型對于加強礦山水質管理至關重要。礦山污水處理監測技術扮演著至關重要的角色,它實時檢測污水處理過程中的關鍵指標,如污水pH值、濁度、懸浮物含量等。通過實時檢測這些指標,可以及時發現處理過程中的異常情況,并采取相應的措施,保證污水的處理效果[3]。目前,煤礦廢水處理在線監測技術已經相當成熟。常見的監測設備包括濁度傳感器、高錳酸鹽指數傳感器、氨氮傳感器等。這些傳感器能夠實時監測污水的各項指標,并通過數據采集系統將監測數據傳輸給中央控制系統,實現對處理過程的自動控制和調整[4-5]。為了提高礦山廢水污染監測準確率,研究提出融合模糊聚類算法和基于經驗小波變換(EmpiricalWaveletTransform,EWT)分析方法的水污染監測模型。研究的創新性在于采用了多種方法對水質信號進行分析,有助于提升礦山廢水污染監測準確性。
1融合模糊聚類算法和EWT-KPCA方法的水污染監測模型構建
1.1基于長短期記憶神經網絡的水質預測模型
礦山廢水污染源于采礦作業排放的有毒有害物質,沖擊水生生態系統,導致水體功能喪失[6]。采礦作業產生廢水主要污染物包括酸性廢水、重金屬及營養富集[7]。采礦和選礦過程中用水量大,由于技術限制加速廢水形成,包括礦井、選礦及其他廢水。為解決煤礦廢水問題,研究提出基于長短期記憶神經網絡的水質檢測模型。
礦山水污染檢測需獲取水環境監測部門數據,通過實時監測分析和水質殘差序列分析判斷水質是否被污染。檢測步驟包括采樣、水質預處理、化學儀器分析、數據處理和結論得出。鑒于礦山水污染檢測對水質信號時序性的要求,研究引入長短期記憶神經網絡(LongShort-Term Memory,LSTM)。LSTM屬于時間遞歸網絡,具有獨特設計結構,適用于長時間事件處理。相比循環神經網絡,LSTM單元結構更復雜,記憶能力強,因此非常適合處理水質檢測這類需要長時間記憶的問題。LSTM引入三個門控來控制信息的流動和以往,輸入門計
算公式如式(1):
it=σ(Wi[xt,ht-1]+bi)
式(1)中, i 表示輸入門的開關狀態, W 表示權重, x 表示輸入序列的值, h 表示隱藏狀態, b 表示偏置。遺忘門計算公式如式(2):
ft=σ(Wf[xt,ht-1]+bf)
式(2)中 , 表示遺忘門的開關狀態。輸出門計算公式如式(3):
式(3)中, σo 表示輸出門的開關狀態。候選細胞狀態計算公式如式(4):
式(4)中, ct′ 表示候選細胞狀態,tanh表示雙曲正切函數。細胞狀態計算公式如式(5):
ct=ft*ct-1+it*ct′
式(5)中, ct 表示當前時刻細胞狀態。隱藏狀態計算公式如式(6):
為解決LSTM在提取水質數據時空間特性不足的問題,研究外部卷積神經網絡(ConvolutionalNeu-ralNetworks,CNN)以及注意力機制(ExternalAtten-tion,EA)。CNN是一種前饋網絡,具有卷積計算和深度結構,在計算機視覺領域被廣泛應用,展現出優秀的水質信號分類能力。EA機制在自注意力機制(Self-Attention,SA)基礎上,將key置于網絡外部以學習數據集全局狀況。基于此,提出了基于CNN-EA-LSTM的水質檢測模型。該模型建立水質檢測指標,用CNN篩選特征數據,EA機制學習并分配權值,再將特征向量發送到相鄰輸入向量。最后將LSTM與CNN和EA機制進行連接并對水質數據進行檢測。
1.2融合模糊聚類算法和EWT-KPCA方法的水質檢測模型
煤礦礦山廢水監測需建立水質異常預測和水質檢測模型。前者預測水質劣化,有助于應對廢水污染;后者實時檢測水質,實現全過程管理。為解決水質時序信號誤報問題,提出融合模糊聚類算法和基于EWT的優化水質檢測模型,EWT通過濾波處理傅立葉譜的連續組成部分。此外,引入核主成分分析法(KernelPrincipalComponent Anal-ysis,KPCA)應對非線性數據,從而提高數據可分性。為解決水質數據檢測指標繁雜及樣本參數含噪聲問題,采用KPCA方法降維分析并保留特征,減少模型輸入。將原始水質數據升維做主成分分析處理,對運用函數映射的協方差矩陣進行分解,如式(7)所示:
λV=CV
式(7)中, c 表示協方差矩陣,入表示協方差矩陣的特征值, V 表示協方差矩陣的特征向量。把模糊數學方法引入聚類分析即產生了模糊聚類分析方法。模糊聚類允許樣本以一定的隸屬度屬于多個聚類,從而提供更細致和客觀的分類結果。該算法通過優化目標函數來劃分數據集,隸屬度是優化變量之一。在此基礎上引入核函數。為改進異常檢測性能,研究提出的多尺度特征融合水質異常檢測方法流程圖見圖1。
由圖1可知,EWT分解水質數據后,通過KCPA處理分解部分,通過降維分析信號特征,并篩選異常特征信號。水質異常檢測是多方法、多模型過程,需優化檢測模型并分析時序信號。研究提出的方法需比較預測模型值與實際監測值,再分析殘差序列和時序信號,根據分析結果將正常信號和異常信號進行分類。
2 融合模糊聚類算法和EWT-KPCA方法的水污染監測模型分析
為驗證融合模糊聚類算法和EWT-KPCA方法的水污染監測模型的有效性,實驗評估了基于長短期記憶神經網絡的水質預測模型性能。利用EWT分解不同水質信號的特征,并用KFCM進行分析。實驗采用某礦山2019年6月至2024年1月的5560組水質監測數據,每5小時采樣一次,將數據分為 85% 的訓練集和 15% 的測試集以驗證模型可行性。
實驗為驗證基于長短期記憶神經網絡水質預測模型的有效性,選取化學需氧量、總磷、氨氮和電導率作為相關指標。將研究提出的CNN-EA-LSTM模型與CNN-EA和CNN-LSTM模型做對比實驗可以更直觀地觀察其性能情況,見圖2。
由圖2(a)可知,CNN-EA-LSTM對化學需氧量的預測值與實際值最為相似,實際值最大為7mg/L ,預測模型中CNN-EA-LSTM最大為6.9mg/L 。由圖2(b)可知,CNN-EA-LSTM對總磷的預測值與實際值最為相似,實際值最大為0.174mg/L ,預測模型中CNN-EA-LSTM最大為0.172mg/L 。由圖2(c)可知,CNN-EA-LSTM對氨氮的預測值與實際值最為相似,實際值最大為3.5mg/L ,預測模型中CNN-EA-LSTM最大為3.5mg/L 。由圖2(d)可知,CNN-EA-LSTM對電導率的預測值與實際值最為相似,實際值最大為468ms/cm ,預測模型中CNN-EA-LSTM最大為466ms/cm 。數據表明,CNN-EA-LSTM水質預測模型測量結果最準確,性能最好。將水質信號特征利用KFCM聚類后的效果圖見圖3。
圖2不同模型對水質指標預測對比圖
圖3KFCM聚類對比圖
由圖3(a)可知,研究選取的4個指標融合在一起,不能有效進行水質判斷。由圖3(b)可知,通過KFCM聚類后,4個指標被聚類為不同的簇,水質指標此時能夠滿足檢測需求。運用優化水質異常檢測模型對水質信號進行檢測,結果見圖4。
圖4優化水質異常檢測模型檢測結果輸入圖
由圖4(a)可知,在1000 種水質信號中分別有50 種異常信號,950種正常信號。由圖4(b)可知,在異常強度為1的水質檢測中,共有8種異常信號檢測出現錯誤。由圖4(c)可知,在異常強度為1.5的水質檢測中,共有9種異常信號檢測出現錯誤。由圖4(d)可知,在異常強度為2的水質檢測中,共有7種異常信號檢測出現錯誤。由圖4(e)可知,在異常強度為2.5的水質檢測中,共有8種異常信號檢測出現錯誤。實驗數據說明,研究提出的優化水質異常檢測模型檢測結果的錯誤率在 0.8% 左右,錯誤率較小,可以被用于水質異常檢測之中。
3結論
礦山廢水水質監測對礦山水質管理至關重要。研究首先提出了基于LSTM的水質預測模型,隨后針對不同水質情況利用EWT進行分解,得到固有模態分量的特征,并利用KFCM進行檢測分析。最后,提出了融合模糊聚類算法和EWT-KPCA方法的水污染監測模型。實驗結果顯示,CNN-EA-LSTM模型在預測化學需氧量、總磷、氨氮及電導率方面表現最優,預測值與實際值高度接近,如化學需氧量實際最大值為 7mg/L ,CNN-EA-LSTM預測最大值為 6.9mg/L 。在融合模糊聚類與EWT-KPCA的水污染檢測模型中,錯誤率僅為 0.8% 左右。數據表明,CNN-EA-LSTM水質預測模型精度最高,而水污染檢測模型同樣具備高準確性。實驗充分驗證了所提礦山水質污染監測模型的有效性和實用性,為礦山水質管理提供了有力支持。
參考文獻:
[1]高云龍,李建鵬,鄭興莘,等.基于自適應近鄰信息的模糊C均值聚類算法[J].光學精密工程,2024,32(7):1045-1058.
[2]李萍,劉金金.基于改進模糊聚類算法的大數據隨機挖掘仿真[J].計算機仿真,2024,41(2):496-499;521.
[3]郭怡寧,劉鐵新,董自巖,等.基于改進模糊算法的節理分組軟件開發[J].金屬礦山,2024(2):219-224.
[4]傅瑩穎,葛泉波,李春喜,等.基于GA-IPSO-KPCA和變權組合模型的電動汽車充電方法[J].控制工程,2024,31(4):712-721.
[5]陸水,李振鵬,李軍,等.基于ICEEMDAN多尺度熵與NGO-HKELM的轉子故障診斷[J].組合機床與自動化加工技術,2024(4):175-180.
[6]LakshmikanthaV,HiriyannagowdaA,ManjunathA,et al.IoT based smart water quality monitoring system[J].Global TransitionsProceedings,2021,2(2):181-186.
[7]姜泉良,趙成如,王媛媛,等.河套灌區地表水污染溯源分析[J].環境科學研究,2024,37(1):92-101.