基于馬爾可夫鏈的河流水質污染預測模型研究
王 騰1,熊仲華2,杜慶治1*,邵玉斌1
(1.昆明理工大學信息工程與自動化學院,云南昆明 650500;2.大理州洱海流域保護局,云南大理 671000)
摘要基于馬爾可夫鏈的河流水質污染預測模型,采用河流水質污染的指標數據,得到水質污染的時間序列值;劃分水質污染趨勢的狀態空間;建立狀態轉移矩陣,從而預測水質污染趨勢變化區間。結果表明,該模型能夠有效地預測河流水質污染的走勢,進而能夠為相關的環保部門提供治理河流的有效依據,從而達到保護農業灌溉用水的目的。
關鍵詞河流;污染度;水質;馬爾可夫鏈
中圖分類號S181.3;TP391
基金項目云南省科技廳重點項目(2014RA051)。
作者簡介王騰(1988- ),男,云南石屏人,碩士研究生,研究方向:移動通信和水質預測。*
收稿日期2015-07-30
Study on Prediction Model of River Water Quality Contamination Based on Markov Chain
WANG Teng1, XIONG Zhong-hua2, DU Qing-zhi1*et al(1. College of Information Engineering and Automation, Kunming University of Science and Technology, Kunming, Yunnan 650500; 2. Erhai Lake Basin Protection Agency of Dali, Dali, Yunnan 671000)
AbstractThis paper proposes a predictive model for river pollution using Markov chain, in which we use the relative data of environmental pollution to get the time sequential-value. The interval of the variation tendency of water pollution can be predicted with the state spaces and the state transition matrix. According to the experimental results, it is proved that this model can effectively predict the trend of river pollution, so as to provide the effective basis for the management of water environment and achieve the purpose of protecting agricultural irrigation water.
Key wordsRivers; Contamination; Water quality; Markov chain

環境保護歷來是人們關心的問題,隨著各地區經濟的快速發展和人口的不斷增加,使得大量的工業生產污水以及生活污水排入河流中,不但影響了水環境的質量,導致河流中的生物無法生存,也使得我國農業灌溉用水銳減,水污染日益嚴重。以往的水質污染預測模型,大部分是根據BP神經網絡[1-3]、灰色模型理論[4],并結合化學、物理、生物等因素對污染物的輸出以及擴散,來對水質污染程度進行預測[5-10]。雖然這些方法對于水質污染有一定的預測效果,但它僅僅針對一些特定環境下的水質預測,實現預測比較復雜,誤差也相對較大,故不能準確地預測水質污染情況。筆者提出了一種基于馬爾可夫鏈的河流水質污染預測模型,首先分析河流中水的5種化學成分,依次為需氧量COD、氨氮量、固體懸浮物濃度SS、pH和總磷TP,通過使用加權求和的方法計算水質污染程度值,進一步得到水質污染程度變化值,然后基于劃分狀態區間的污染趨勢,用馬爾可夫鏈來構建狀態轉移矩陣,得到最終的預測結果。
1基于馬爾可夫鏈的水質污染度剖析
1.1水質污染程度描述河流水質污染程度越來越引起人們的關注,這不僅關系到人們的生活環境,也影響了動植物的生存,尤其是農作物的灌溉用水問題。因此,使用化學需氧量COD、氨氮量、固體懸浮物濃度SS、pH和總磷為評價指標,通過加權求和計算水質污染度,來評價河流水質的污染程度。所用數據主要來源于洱源縣環保局永安江在線自動監測系統,數據的抓取時間是2014年6月29日。抓取指標主要包括化學需氧量COD、氨氮濃度、固體懸浮物濃度SS、pH和總磷。數據總樣本數為301條,去掉無效或錯誤數據11條,得到有效記錄290條。這290條水質數據的獲取時間區間為2014年5月10日~6月11日。使用B、C、D、E、F分別表示河流中5種水成分的總量,在不同時間(T)內5種水成分含量分別用Bi、Ci、Di、Ei、Fi來表示,這里i=1,2,…,n。由于在同一時刻河流不同位置的監測數據有差異,故需要對所測河流的化學需氧量COD、氨氮量、固體懸浮物濃度SS、pH和總磷TP進行細化統計(表1)。

表1 河流水質數據統計表
河流在不同時間同一位置的化學需氧量、氨氮量、固體懸浮物濃度、pH和總磷可以表示為:
式中,Y∈(B,C,D,E,F);x,g=1,2,…,n;X∈(b,c,d,e,f)。河流中的化學需氧量、氨氮量、懸浮物濃度、pH和總磷5種水成分的總量分別表示為:
然后,通過加權求和的方法,可得到水質污染度指標H的表達式:
H=w1B+w2C+w3D+w4E+w5F
式中,wi(i=1,2,3,4,5)分別是河流中化學需氧量、氨氮量、固體懸浮物濃度、pH和總磷的權重。采用主觀賦權算法來確定這5種水成分的權重值,通過多名專家對多條河流歷史數據權值的詳細分析,得到每一位專家給出的權重值,然后將得到的權重值利用方根法進行演算,得到權重值分別為w1=0.276 2,w2=0.182 7,w3=0.202 1,w4=0.112 8,w5=0.226 2。
1.2馬爾可夫模型分析根據河流水質的當前狀態,利用馬爾可夫模型來預測將來各個時刻水質發生變化的概率。水質污染程度是隨時間變化的,故可以看成是時間序列的向量,用H=[H1,H2…Hn]表示,其中n代表水質污染度的時間段。
1.2.1狀態空間的劃分。水質污染的變化是一個非平穩的隨機過程,它的時間和狀態的劃分可用離散的過程來表示。首先根據水質污染程度H=[H1,H2,…,Hn],計算每一個水質污染度的趨勢變化:ΔHi=Hi+1-Hi,進而可以得到水質污染趨勢值ΔH=[ΔH1,ΔH2,…,ΔHn-1]。根據河流水質污染的歷史數據,得到水質污染趨勢的n個狀態S=(S1,S2,…,Sn)。通過閾值法來設置得到水污染狀態的趨勢,并依據已知數據的研究確定水質污染程度趨勢值分布在4個狀態區間內。當水質污染趨勢值ΔH>0,設置為S1(污染度急劇升高)、S2(污染度快速下降)兩個區間;水質污染趨勢值ΔH<0時,設置為S3(污染度急劇升高)、S4(污染度快速下降)兩個區間。其中,S1=(ΔHmax/2,ΔHmax);S2=(0,ΔHmax/2);S3=(ΔHmin/2,0);S4=(ΔHmin,ΔHmin/2),其中ΔHmin=min[ΔH1,ΔH2,…ΔHn-1],ΔHmax=max[ΔH1,ΔH2,…ΔHn-1]。
1.2.2建立狀態改變矩陣。將水污染程度從現在所處于的狀態變化到下一個階段所處狀態的數量統計出來。由表2可知,目前的水質污染程度趨勢呈現為S1狀態,下一階段仍呈現出S1狀態的統計值為n11,呈現出S2狀態的統計值n12,呈現出S3狀態的統計值n13,呈現出S4狀態的統計值n14。對于現在水質污染趨勢值所呈現出的狀態S2、S3、S4,都使用上面的方法進行統計。

表2 水污染程度狀態改變表



2結果與分析
2.1水質污染度計算鑒于水質污染程度的計算表達式較為復雜多變,因此對其進行標準化,公式[11]為:

式中,max(xi)表示污染程度的最大值;min(xi)表示最小值。水質總體污染程度變化范圍為[0,100]。通過加權求和的方法,計算出2014年5月10日~6月11日洱源縣環保局永安江的水質污染程度(表3)。

表3 2014年5月10日~6月11日永安江水質污染度
2.2水質污染度趨勢值和狀態區間劃分2014年5月10日~6月5日永安江水質污染度趨勢值見表4。通過訓練表4中2014年5月10日~6月5日獲取的水質污染度趨勢值數據,計算出水質污染變化趨勢值的狀態轉移矩陣為:

表4 2014年5月10日~6月5日永安江水質污染度趨勢值

日期水質污染度趨勢值日期水質污染度趨勢值5月10日0.2355月24日-0.1445月11日0.0535月25日0.0565月12日0.0715月26日0.3395月13日0.1095月27日-0.1695月14日0.1525月28日0.0415月15日0.1145月29日0.1015月16日0.5615月30日0.1525月17日0.2615月31日-0.5815月18日0.1036月1日0.1485月19日-0.3976月2日0.1515月20日-0.2046月3日-0.5965月21日0.5846月4日0.4845月22日-0.2876月5日0.0445月23日-0.160
將剛開始的水質污染趨勢值對應的向量設置為P0=(1,0,0,0)。以剛開始設定的向量以及狀態轉移矩陣作為基礎,從而預測2014年6月7~11日水質污染趨勢值所處狀態的概率,得到以下方程組:
依據馬爾可夫鏈的穩定條件求解此方程組,得到水質污染度發展趨勢穩定后各狀態的向量,即π=[π(1),π(2),π(3),π(4)]=(8/27,14/27,1/9,2/27)。由表5可知,基于馬爾可夫鏈的洱源縣永安江水質污染度的預測趨勢區間前4個與實際情況相符,基本符合河流水質污染程度趨勢的變化。說明該模型能有效合理地判別水質污染度的發展趨勢。

表5 2014年6月7~11日永安江水質污染度趨勢值的預測結果
2.3馬爾可夫鏈與BP神經網絡的對比在實際中,BP神經網絡模型也可以用來預測水質污染程度。依據BP神經網絡模型的原理,該模型只能進行一步預測,即通過當前狀態m以及以前狀態的預測值來預測下一狀態m+1。隨后將m+1狀態的預測值默認為初始值來預測m+2狀態時的值,以此類推,來預測以后的水質污染度的變化趨勢。以洱源縣環保局永安江水質監測為例,將馬爾可夫鏈的水質污染程度預測模型與BP神經網絡模型進行了對比。由表6可知,BP神經網絡模型的預測準確率不及馬爾科夫鏈模型。

表6 馬爾可夫鏈模型與BP神經網絡模型的誤差分析
3結論
針對現實中河流水質污染嚴重影響到農業灌溉的問題,首先提出了水質污染度的預測方法,然后建立基于馬爾可夫鏈的水質污染趨勢預測模型。最后,通過選取洱源縣環保局永安江水成分的監測數據進行實證分析,構建狀態空間,得到未來一段時間水質污染度發展趨勢的預測區間,并將趨勢預測值與實測值進行對比。結果表明,該模型可以預測未來一段時間內河流水質污染程度的發展趨勢,從而為水污染治理和農業灌溉用水保護提供依據。
參考文獻
[1] 陳繼光,祝令德.基于神經網絡的馬爾可夫預測模型[J].計算機工程與應用,2006(6):225-227.
[2] 李向兵.基于BP神經網絡與加權模糊的馬爾可夫的糧食預測模型[J].甘肅聯合大學學報(自然科學版),2013(2):8-13.
[3]劉倪,葉金印.基于RBF神經網絡馬爾可夫模型的淮河流域汛期暴雨量預測[J].浙江農業科學,2014(8):1256-1259.
[4] 韓曉光,李博宇,管智贇.基于灰色關聯分析指標篩選的RBF神經網絡-馬爾可夫鏈的空質量氣預測模型[J].南開大學學報(自然科學版),2013(2):22-27.
[5] 閆欣榮,史忠科.渭河寶雞段的水環境容量與水質分析[J].陜西師范大學學報(自然科學版),2004,32(6):29-32.
[6] 康繼田.長江水質評價及預測的Markov 鏈模型[J].湖北工業大學學報,2006,21(6):101-104.
[7] 王丙參,何萬生,夏鴻鳴.基于馬爾可夫鏈的渭河天水段水質預測模型[J].高師理科學刊,2012(3):4-7.
[8] THOMAS B,SOLEIMANI-MOHSENI M.Artificial neural network models for indoor temperature prediction:Investigations in two buildings [J].Neural computing & ppplications,2007,16(1):81-89.
[9] 陳振偉,王茜,黃繼紅.一種新的水質預測模型的仿真實現[J].電腦知識與技術,2010(36):10366-10368.
[10] 陳友超.小湖(庫)水質預測模式的應用研究[J].海峽科學,2011(6):80-81.
[11] 葉宗欲.關于指標綜合評價中指標正向化和無量綱化方法的選擇[J].浙江統計,2003(4):24-25.
