張雅+宋耀蓮+趙繼東+龍華+邵玉斌+杜慶治



摘要:預測水質變化趨勢能及時準確發現水質惡化的原因,對指導工農業生產及水質治理有較大意義。但是目前對高原湖泊水質預測算法的研究還很匱乏,為了解決高原湖泊水質預測問題,在有限的水質數據資源的情況下,首先對數據進行預處理,然后再對水質進行Markov算法預測。理論分析和仿真結果驗證洱海水質不同化學因子的預測精度達到83.33%以上,相對傳統的Markov預測算法在預測精度上有了很大提高。
關鍵詞:水質預測;高原湖泊;Markov算法;MATLAB
DOIDOI:10.11907/rjdk.172162
中圖分類號:TP312
文獻標識碼:A文章編號文章編號:16727800(2018)001009504
Abstract:The prediction of the water quality change trend can accurately find the cause of water deterioration, and has great significance for guiding industrial and agricultural production and water quality management. At present, the study of plateau lakes water quality forecasting algorithm is deficient. To solve this problem, this paper prepares and analyzes limited data in advance. Then we apply Markov forecast to the Erhai plateau lake water quality. Finally,theory analyses and simulation results illustrate that prediction accuracy of different chemical factor is more than 83.33%, which is improved significantly compared with traditional Markov forecast.
Key Words:water quality prediction; plateau lakes; Markov forecast; MATLAB
0引言
隨著社會和經濟的發展,對水資源的保護與合理利用已經受到了極大的關注。河道水質狀態直接影響到了沿岸居民的飲用水質量。水是生命之源,也是生態的基礎和生產的關鍵。河道水資源污染已經成了我國經濟和社會發展面臨的主要難題。
水質變化趨勢預測是維護與管理當前水質的重要依據,通過預測可以了解當地水域環境質量演變趨勢,從而及時發現水質惡化原因并制定相應的治理措施。隨著環境科學研究的進一步深入,水質預測模型的方式也層出不窮,主要包括灰度、人工神經網絡、決策樹和Markov預測模型等,但其算法的預測結果并不是那么理想。文獻[1]中作者采用決策樹的算法針對在線監測站得到的未經處理的水質數據進行水質預測,但其預測精度只有80%。文獻[2]中選用灰度系統和神經網絡相結合的模型算法來預測地表水質,雖然相對單獨的灰度或者神經網絡的算法預測精度有所提高,但最后的水質預測精度并不高。文獻[3]中設計了一種基于ANN算法和GIS技術的水質預測軟件,對青島產芝水庫水質進行了預測,但是誤差率仍高達10%。文獻[4]中采用未確知綜合評價方法與Markov算法結合的水質預測模型,對安徽淝河水質狀態預測結果精度非常高。文獻[5]中利用灰度模型對淡水湖泊鄱陽湖水質進行預測,預測模型最大方差比也只達到37.728 4%。文獻[6]采用ANN與Markov結合的水質預測模型對吐露港的水質發展趨勢預測效果較好,但還存在一定誤差。文獻[7]中采用學習矢量化網絡水質預測模型分別對三個省份的某一河流監測點水質進行預測,但文中并沒有關于高原湖泊水質預測的相關描述。
雖然之前有些論文的水質預測算法精度相對很高,但是并未應用到高原湖泊上,只是對特定河流或者地表水質,而且大多并未對水質數據進行預處理。因此本文首先對得到的2000-2015年洱海高原湖泊監測點湖心3的左下層和左上層數據進行平均處理(以每一個點位表層、底層的水質監測值得算術平均結果作為該位點的水質監測結果)即為水質數據。共有2000-2015年的175條數據,選擇2000-2014年的數據作為訓練數據來預測2015年12個月份的數據。
1改進型Markov水質預測模型
1.1算法實現過程
能夠表征水質變化的因子很多,比如說洱海流域氣候概況、洱海入湖水量、水化學因子、水生生物指標、透水體明度等[13]。本文采用有代表性的溶解氧、總氮、總磷三種水化學因子作為表征洱海水質的變化趨勢。
由于大理州環境監測站對洱海水質進行每月一次監測,且每個監測點分別采集水面0.5m及距湖底0.5m深處的水樣進行分析,其監測結果基本能反映洱海全湖的總磷、總氮及溶解氧的現狀[12]。所以選擇洱海湖內某一監測點的月監測值為研究樣本集合。
本文提出了一種改進型Markov水質預測算法,如圖1所示。針對某一種化學因子從2000-2015年的上下層175×2條數據,對應月份的數據進行均值處理得到2000-2015年的175條數據集合,取2000-2014年的163條數據作為訓練數據;首先對這163條數據集合進行數據預處理,然后經過Markov算法訓練得到狀態轉移概率矩陣,再根據初始狀態預測2015年12個月份的水質狀況。
1.2數據預處理endprint
從洱海流域局得到粗糙的水質數據,按照國家水質標準得到的水質狀態大多處于水質狀態邊緣區域,水質狀態區分比較模糊,所以單純的進行監測點上下層數據的均值平均得到的水質狀態并不能很精確的描述水質狀態。
針對上面描述的水質數據存在的問題,提出了一種比較科學的水質狀態劃分預處理方法,具體步驟如下。
第一步:水質分類標準Q的確定。
水質數據的分類標準Q由整數和小數兩部分組成,表示為:
式(1)中,N1代表第i項水質指標(化學因子)的水質類別;N2代表監測數據在X1類水質變化區間中所處的位置。
第二步:N1的確定。
由于洱海的水質從未出現過VI類水質的情況,所以可由監測數據與國家標準的比較確定N1,具體含義為:
N1=1,表示該化學因子的指標為I類水;
N1=2,表示該化學因子的指標為II類水;
N1=3,表示該化學因子的指標為III類水;
N1=4,表示該化學因子的指標為IV類水;
N1=5,表示該化學因子的指標為V類水;
N1=6,表示該化學因子的指標為劣V類水。
第三步:N2的確定。
針對所選的表征水質狀態的化學因子指標,在地表水環境質量標準(GB3838-2002)中,溶解氧質量濃度隨水質類別數的增大而減少,其余指標如總氮、總磷等指標值隨水質類別數的增大而增加,因此水質的分類標準Qi按溶解氧和非溶解氧指標分別計算。
非溶解氧指標(總氮、總磷):
1.3馬爾科夫(Markov)預測模型
馬爾科夫鏈,描述了一種狀態序列,它是一種每個狀態值取決于前面有限個狀態的隨機過程。也可以說下一個狀態出現的概率只與當前的狀態有關系,跟其他狀態無關。
若Xn,(n={1,2,…,k})是滿足Markov鏈特征的一個隨機序列,那么就滿足下面的條件概率:
其中x為過程中的某個狀態,公式(4)可以看作是馬爾可夫性質。
不同時間步驟的狀態轉移概率矩陣是分析馬爾科夫鏈的基本工具。一般來說,如果把兩個連續時間序列的狀態劃分的數目為n,這個轉移矩陣的大小是n×n。矩陣的每一個元素pij代表了一個狀態轉移到另外一個時間點的狀態的概率。一步轉移矩陣P定義為:
式(5)中,pij代表了t時刻的狀態轉移到(t+1)時刻狀態的概率,并近似的計算為:
式(6)中,nij是先前的時間序列數據中狀態i轉移到狀態j的次數。并且可以證明的是,矩陣中狀態的轉移概率都在[0,1]區間內且轉移矩陣每一行的和為1。
當然,上面論述的僅僅是一階馬爾可夫模型,討論的也只是一步轉移概率矩陣,如果是想預測后面很多未知時間點的轉態,可以由Markov過程的性質得到:
式(7)中,t代表某一個時間點,(t+1)表示推后時間點t一個時間間隔的時間點;pTt表示t時刻研究對象的狀態向量,并且大小為n×1的列矩陣,取得哪一個狀態就把對應狀態位取1,否則為0。
2實驗結果及分析
圖4、圖5、圖6是溶解氧、總氮和總磷分別在經典Markov預測法和改進型Markov預測算法下的預測值與實際值的對比圖,從圖中可得到如下的結果。
(1)由圖4可知,2015年12個月份中溶解氧在傳統Markov算法下水質狀態的預測精度為41.67%,但是采用改進型Markov算法預測的溶解氧的水質狀態的精度為83.33%,相對傳統的Markov水質預測算法其預測精度有很大提高,且從這兩幅圖上可以看出由溶解氧表征的水質狀態為II類水,并有向III類水發展的趨勢。
(2)由圖5可知,2015年12個月份中總氮在傳統Markov算法下水質狀態的預測精度有41.67%,但是采用改進型Markov算法預測的總氮的水質狀態的精度為83.33%,相對傳統的Markov水質預測算法的預測結果已經提高很多,且從這兩幅圖上可以看出由總氮表征的水質狀態為III類水,并將長期穩定在III類水。
(3)由圖6可知,2015年12個月份中總磷在傳統Markov算法下水質狀態的預測精度是75.0%,但是采用改進型Markov算法預測的總氮的水質狀態的精度為100%,相對傳統的Markov算法的預測精度有明顯提高,且從這兩幅圖上可以看出由總磷表征的水質狀態為III類水,并將長期穩定在III類水。
3結語
本文采用改進型的Markov算法對高原湖泊洱海水質狀態進行預測,相對傳統的Markov水質預測算法其預測精度有很大提高,其中溶解氧、總氮和總磷的預測精度相對于傳統Markov分別提高了41.66%、41.66%和25.00%。
本文中無論哪種化學因子的水質預測結果,水質狀態都集中在II類和III類水。由國家水質評價標準[17]可知本文中預測的整個洱海流域的水質狀態為III類水,且目前將長期穩定在III類水質狀態,與實際相關部門得到的2015年洱海整體水質狀態完全吻合,驗證了本文算法的正確性。
參考文獻:
[1]Lu, Jinsuo, and T. Huang.J Lu, T HUANG. Data mining on forecast raw water quality from online monitoring station based on decisionmaking Tree[C]. International Conference on Networked Computing and Advanced Information Management, Ncm 2009, Fifth International Joint Conference on Inc, Ims and Idc: Inc 2009: International Conference on Networked Computing, Ims 2009: International Conference on Advanced Information Management and Service, IDC 2009: International Conference on Digital Content, Multimedia Technology and ITS Applications, Seoul, Korea, 2009:706709.endprint
[2]ZHU, CHANGJUN, et al. Prediction of groundwater quality using organic grey neural network model[J]. International Workshop on Intelligent Systems and Applications IEEE,2009:14.
[3]S SONG, X ZHENG, F LI. Surface water quality forecasting based on ANN and GIS for the Chanzhi Reservoir[C]. International Conference on Information Science and Engineering IEEE,2010:40944097.
[4]LIU, JUN E, F AN, et al. The water quality evaluation based on the unascertained Markov forecast model[C]. Chinese Control and Decision Conference,2010:11801183.
[5]YANG, LIN, Q CAO. Poyang lake water quality model for dynamic prediction[C]. Fourth International Conference on Computational and Information Sciences,2012:12141216.
[6]LI, XIU J SONG. A new ANNMarkov chain methodology for water quality prediction[C]. International Joint Conference on Neural Networks,2015:16.
[7]ZHANG YING, LI MEI. An evaluation model of water quality based on learning vector quantization neural network[C]. Proceedings of the 35th Chinese Control Conference July Cheng du International Joint Conference on Neural Networks,2016:2729.
[8]XIE, ZHENG WEN, K Y SU. Improved grey model base on exponential smoothing for river water pollution prediction[C]. International Conference on Bioinformatics and Biomedical Engineering IEEE,2010:14.
[9]黎尚豪,俞敏娟,李光正,等.云南高原湖泊調查[J].海洋與湖沼,1963(2):87114.
[10]杜寶漢.大理州環境保護思考與對策[M].北京:作家出版社,2006.
[11]宋岸,肖舉強.洱海流域富營養化成囚及教訓[J].廠東化工,2010,8(37):133134.
[12]李澤坤,楊萍萍,蘇社飛.20042013年洱海富營養化變化趨勢[J].環境科學導刊,2015,34(1):13.
[13]羊華.洱海20052014年水質狀況及變化分析[J].水利信息化,2016(1):2528.
[14]李文章,張莉,王圣瑞,等.洱海上覆水溶解性有機氮特征及其與湖泊水質關系[J].中國環境科學,2016,36(6):18671876.
[15]王永美.洱海化學需氧量變化趨勢及影響因素分析[J].環境科學導刊,2016,35(1):57.
[16]楊曉雪.洱海總磷、總氮污染現狀分析[J].環境科學導刊,2006,25(z1):113115,112.
[17]李會仙,吳豐昌,陳艷卿,等.我國水質標準與國外水質標準/基準的對比分析[J].中國給水排水,2012,28(8):1518.
(責任編輯:劉亭亭)endprint