于 慧,孫寶盛,李亞楠,張 燕,齊庚申
(天津大學(xué)環(huán)境科學(xué)與工程學(xué)院,天津 300072)
應(yīng)用灰色模糊馬爾科夫鏈預(yù)測海河水質(zhì)變化趨勢
于 慧,孫寶盛*,李亞楠,張 燕,齊庚申
(天津大學(xué)環(huán)境科學(xué)與工程學(xué)院,天津 300072)
灰色 GM(1,1)模型在水質(zhì)預(yù)測中得到了較為廣泛的運用,但其存在灰色偏差與抗干擾能力弱的局限性,針對這一問題,將馬爾科夫鏈理論與模糊集合理論引入灰色GM(1,1)預(yù)測模型,并應(yīng)用該模型對海河三岔口斷面的DO、CODMn和NH3-N 3項指標(biāo)2012~2016年的濃度變化趨勢進(jìn)行預(yù)測.結(jié)果表明,2004~2016年,DO及NH3-N濃度大致呈上升趨勢,預(yù)計2016年分別可達(dá)9.15,1.47mg/L;CODMn濃度呈下降趨勢,預(yù)計2016年可達(dá)3.91mg/L.以2012年的數(shù)據(jù)做驗證,灰色模糊馬爾科夫鏈模型的預(yù)測精度最高,可作為科學(xué)的水質(zhì)預(yù)測方法.
GM(1,1)模型;模糊分類;馬爾科夫模型
水質(zhì)預(yù)測是水環(huán)境規(guī)劃、評價和管理工作的基礎(chǔ),通過預(yù)測,可以了解當(dāng)?shù)厮颦h(huán)境質(zhì)量演變趨勢,進(jìn)而及時發(fā)現(xiàn)水質(zhì)惡化的原因并采取相應(yīng)的治理措施[1-3].目前,常用的預(yù)測方法有數(shù)理統(tǒng)計預(yù)測法、灰色系統(tǒng)理論預(yù)測法、神經(jīng)網(wǎng)絡(luò)模型預(yù)測法、水質(zhì)模擬模型預(yù)測法、混沌理論預(yù)測法等[4].受水文、水質(zhì)監(jiān)測條件的限制,水質(zhì)預(yù)測過程中往往缺乏長期的水質(zhì)資料,而灰色系統(tǒng)分析法對于信息不完整(或不完全)情況,具有良好的適用性[5-8].但灰色模型預(yù)測由于其原始數(shù)據(jù)的起伏性和無序性等,難以將預(yù)測帶限制在一個較小的范圍之內(nèi),導(dǎo)致灰色預(yù)測模型在大多數(shù)情況之下是粗糙的[9].有研究指出,可以通過對灰色預(yù)測模型的結(jié)果進(jìn)行馬爾科夫鏈改進(jìn)來提高其預(yù)測的準(zhǔn)確性[10-12].因此,本文把模糊集合理論與馬爾科夫鏈理論引入灰色預(yù)測算法中,提出灰色模糊馬爾科夫鏈預(yù)測方法,并用殘差修正模型對計算過程進(jìn)行優(yōu)化.一定程度地解決了影響灰色預(yù)測精度提高的存在灰色偏差與抗干擾能力弱的問題.本文結(jié)合水質(zhì)標(biāo)準(zhǔn),應(yīng)用灰色模糊馬爾科夫鏈預(yù)測模型,對海河三岔口段的水質(zhì)進(jìn)行預(yù)測.
海河,起自天津下西部的南運河、子牙河相交的的三岔河口西,東至大沽口入海,全長 70km,流域面積達(dá) 26.36萬 km2,大陸季風(fēng)性氣候區(qū),平均年降水量為548mm,海河水系上游支流繁多分散,下游集中,河道容泄能力上大下小,極易形成洪峰.海河地處津京唐工業(yè)區(qū),重工業(yè)發(fā)達(dá)再加上地處華北的水資源緊張地區(qū),氣候干燥,降水少,蒸發(fā)量大,河流徑流量小,海河是一條污染較嚴(yán)重的河流[13-15].海河區(qū)域概況示意見圖1.

圖1 海河流域區(qū)域概況示意Fig.1 Regional overview diagram
2.1 GM(1,1)模型
GM(1,1)模型是最常用的灰色預(yù)測模型,它是灰色系統(tǒng)理論中一種動態(tài)序列處理方法,將隨機量當(dāng)作在一定范圍變化的灰色量,隨機過程當(dāng)作在一定時區(qū)變化的灰色過程,并認(rèn)為微分方程是背景值與各階灰導(dǎo)數(shù)的某種組合.用于數(shù)列預(yù)測的 GM(1,1)模型的特點是利用單變量時間序列數(shù)據(jù)進(jìn)行預(yù)測.將無規(guī)律的原始數(shù)據(jù)經(jīng)生成后,使其變?yōu)檩^有規(guī)律的生成數(shù)列再建模,因此GM(1,1)模型實際上是生成數(shù)列模型,一般用微分方程描述.它是一個單變量預(yù)測的一階微分方程模型,其離散時間響應(yīng)函數(shù)近似呈指數(shù)規(guī)律.
本文采用2004~2012年監(jiān)測周報中的數(shù)據(jù),對每個監(jiān)測斷面選取溶解氧(DO)、高錳酸鹽指數(shù)(CODMn) 和氨氮(NH3-N) 3個監(jiān)測指標(biāo)作為研究對象,進(jìn)行年平均計算處理后作為實測數(shù)據(jù)進(jìn)行預(yù)測.采用 2004~2011年的數(shù)據(jù)建模,使用2012年份數(shù)據(jù)驗證.以預(yù)測DO的變化趨勢為例,其濃度見表1.

表1 2004~2012年海河三岔口斷面的溶解氧濃度(mg/L)Table 1 The concentration of DO at three fork section of Haihe River during 2004~2012(mg/L)
設(shè)原始數(shù)據(jù)序列為 X(0),則 X(0)=(χ(0)(1), χ(0)(2),…,χ(0)(n))=(9.21,8.16,8.53,9.24,8.18,7.00,8. 55,8.57,9.68)為了減弱極端值的影響,強化原始數(shù)列的大致趨勢,采用滑動平均法對原始數(shù)列進(jìn)行改造,記原始數(shù)列為{χ(0)(t)};t=1,2,…,n,滑動平均值計算公式如下∶

對于兩端點的計算用以下公式∶

由此可得∶X′(0)= (8.95,8.52,8.62,8.80,8.15, 7.68,8.17,8.84,9.40)
2.1.1 取得累加生成數(shù)列[16]對 X′(0)做 1-AGO得累加生成數(shù)列X′(1),公式為∶

2.1.2 對X′(0)進(jìn)行光滑性檢驗 準(zhǔn)光滑性檢驗公式為∶

當(dāng)ρ(k) <0.5時滿足光滑條件,其值見表2.

表2 準(zhǔn)光滑性檢驗Table 2 Quasi smoothness test
由表2可以看出,當(dāng)k>2后滿足光滑條件.
2.1.3 檢驗 X′(1)是否具有指數(shù)規(guī)律 準(zhǔn)指數(shù)規(guī)律檢驗公式為∶

當(dāng)σ(k)∈[1,1.5]可以建立GM(1,1)模型,其結(jié)果見表3.

表3 準(zhǔn)指數(shù)規(guī)律檢驗Table 3 Quasi exponential law test
由表3可以看出,當(dāng)k>2后滿足準(zhǔn)指數(shù)規(guī)律.
2.1.4 確定數(shù)據(jù)矩陣B,Y

2.1.5 計算參數(shù)列?a

2.1.6 確定微分方程,求時間響應(yīng)函數(shù) 白化微分方程為∶

白化微分方程的解,即時間響應(yīng)函數(shù)∶

計算可得∶

擬合結(jié)果見表4.
2.1.7 精度檢驗 由表4、表5可得,溶解氧的平均相對誤差為5.8%為3級精度,采用后驗差法對模型群進(jìn)行均方差比值分析為0.64為3級精度,采用后驗差法對模型群進(jìn)行小誤差概率分析為0.89為2級精度.GM(1,1)模型預(yù)測精度勉強合格,但有待于改進(jìn),因此后續(xù)使用馬爾科夫鏈進(jìn)行修正預(yù)測.

表4 擬合結(jié)果Table 4 The fitting results

表5 精度檢驗等級參照Table 5 Testing of the accuracy grade reference table
2.2 馬爾科夫鏈的基本原理
馬爾可夫過程是具有所謂馬爾可夫性的一類特殊的隨機過程.它既適合于時間序列,又適合于空間序列.其基本特征是無后效性,即當(dāng)系統(tǒng)在某時刻ti所處的狀態(tài)已知,系統(tǒng)在時刻t,t>ti處的狀態(tài)只會與系統(tǒng)在時刻 ti處的狀態(tài)有關(guān),與系統(tǒng)在時刻ti之前的狀態(tài)無關(guān).
馬爾可夫過程稱為馬爾科夫鏈.一個n階馬爾科夫鏈由n個狀態(tài)集合{E1,E2,…,En}和一組轉(zhuǎn)移概率 pij{i,j=1,2,…,n}確定.轉(zhuǎn)移概率pij{i,j=1,2,…,n}反應(yīng)了各種隨機因素的影響程度,故馬爾科夫鏈可用于隨機波動性較大的問題,在這一點上可以彌補灰色模型的不足.
2.3 模糊分類
模糊分類是以模糊集合論作為基礎(chǔ),運用數(shù)學(xué)模型計算它對于所有集合的隸屬度,然后根據(jù)隸屬度的大小確定分類歸屬的一種針對不確定事物的分析方法[17].
將原始時序數(shù)據(jù)與灰色預(yù)測曲線的相對殘差作為劃分標(biāo)準(zhǔn),將系統(tǒng)劃分為m個狀態(tài),任意一個狀態(tài)可以表示為

式中,δi-1、δi分別為第 i個劃分標(biāo)準(zhǔn)的相對殘差上下界限;而Θi-1、Θi分別為第i個狀態(tài)的取值區(qū)域上下界限.
根據(jù)馬爾科夫鏈隨機過程分析方法的應(yīng)用經(jīng)驗及相對殘差幅度分布情況,可做如下狀態(tài)劃分.
狀態(tài) 1∶相對殘差幅度<-24%,表示極度高估狀態(tài),該年為強下降年份.在9年中沒有出現(xiàn)這種極端情況.
狀態(tài)2∶相對殘差幅度為-24% ~ -8%,表示高估狀態(tài),該年為弱下降年份.
狀態(tài)3∶相對殘差幅度為-8% ~ 8%,表示一般狀態(tài),該年為正常年份.
狀態(tài)4∶相對殘差幅度為8%~24%,表示低估狀態(tài),該年為弱上升年份.
狀態(tài)5∶相對殘差幅度>24%,表示極度低估狀態(tài),該年為強上升年份.在9年中沒有出現(xiàn)這種極端情況.
由于不存在處于狀態(tài)1和狀態(tài)5的預(yù)測點,因此僅考慮狀態(tài) 2、3、4,將每個狀態(tài)定義為模糊集,用三角形法構(gòu)造每個模糊集的隸屬函數(shù),如下式.

根據(jù)隸屬函數(shù)計算出每點數(shù)據(jù)的模糊狀態(tài)向量,根據(jù)最大隸屬原則確定每點數(shù)據(jù)所屬狀態(tài),統(tǒng)計出系統(tǒng)狀態(tài)轉(zhuǎn)移情況(表6),并由此得到狀態(tài)轉(zhuǎn)移矩陣P.

表6 狀態(tài)一步轉(zhuǎn)移次數(shù)統(tǒng)計Table 6 The statistics of state step transfer frequency
狀態(tài)轉(zhuǎn)移概率∶

式中,Mij為由狀態(tài)Θi經(jīng)過1步轉(zhuǎn)移到狀態(tài)Θj的原始數(shù)據(jù)的個數(shù);Mi為處于狀態(tài) Θi的原始數(shù)據(jù)個數(shù);Pij為由狀態(tài)Θi經(jīng)過1步轉(zhuǎn)移到狀態(tài)Θj的概率.
概率狀態(tài)矩陣∶

故∶

2.4 預(yù)測
2011年相對殘差為-1.17%,計算的其狀態(tài)模糊向量為(0.075,0.925,0).應(yīng)用馬爾科夫鏈計算出2012~2016年模糊狀態(tài)向量,再通過加權(quán)求和法算出相對殘差預(yù)測值[18-20],最后得到預(yù)測結(jié)果.預(yù)測結(jié)果如表7.溶解氧濃度的變化趨勢如圖2所示.
由圖2可以看出,2004~2016年DO的濃度雖有小幅波動,但總體呈上升趨勢,且都維持在8mg/L以上,因此該指標(biāo)優(yōu)于一級標(biāo)準(zhǔn)(7.5mg/L),預(yù)計2016年將達(dá)到9.15mg/L.DO濃度上升的原因可能是有關(guān)部門采取的一系列治理海河的措施取得了成效使海河水質(zhì)有所好轉(zhuǎn).

表7 海河三岔口斷面溶解氧濃度預(yù)測結(jié)果Table 7 Forecasting values of DO at three fork section of Haihe River

圖2 溶解氧濃度變化趨勢Fig.2 The tendency change of DO’s concentration
應(yīng)用灰色模糊馬爾科夫鏈預(yù)測海河三岔口斷面的CODMn濃度和NH3-N濃度大小,計算過程同上,CODMn的原始數(shù)據(jù)及 GM(1,1)模型的擬合計算結(jié)果見表8,NH3-N的原始數(shù)據(jù)及GM(1,1)模型的擬合計算結(jié)果見表9.

表8 2004~2012年海河三岔口斷面高錳酸鹽指數(shù)的實際值及GM(1,1)與殘差GM(1,1)模型的模擬值(mg/L)Table 8 The concentration and the fitting results of CODMnat three fork section of Haihe River during 2004~2012 (mg/L)
其中高錳酸鹽指數(shù)濃度的模擬結(jié)果的平均相對誤差為 0.15,氨氮濃度的模擬結(jié)果的平均相對誤差為 0.22,均不符合精度要求.故采用殘差修正模型對原模型進(jìn)行修正[21].具體過程如下∶

對ε(0)(t) 建立 GM(1,1)模型,其時間響應(yīng)函數(shù)為∶

將殘差GM(1,1)模型代入原模型∶


CODMn的殘差修正模型的模擬值見表8,NH3-N的殘差修正模型的模擬值見表 9.高錳酸鹽指數(shù)及氨氮濃度的模擬結(jié)果的平均相對誤差均為0.05,均符合精度要求.馬爾科夫鏈的預(yù)測結(jié)果如表10所示.

表9 2004~2012年海河三岔口斷面氨氮濃度的實際值及GM(1,1)與殘差GM(1,1)模型的模擬值(mg/L)Table 9 The concentration and the fitting results of NH3-N at three fork section of Haihe River during 2004~2012 (mg/L)
高錳酸鹽指數(shù)濃度和氨氮濃度的變化趨勢如圖3所示.

表10 海河三岔口斷面的高錳酸鹽指數(shù)及氨氮濃度馬爾科夫鏈預(yù)測結(jié)果(mg/L)Table 10 Forecasting values of CODMnand NH3-N at three fork section of Haihe River (mg/L)

圖3 高錳酸鹽指數(shù)濃度和氨氮濃度的變化趨勢Fig.3 The tendency change of CODMnand NH3-N’s concentration
由圖 3可以看出,2004~2016年 CODMn和NH3-N的濃度均有小幅波動,但總體上 CODMn濃度呈下降趨勢,NH3-N 濃度呈上升趨勢. CODMn濃度一直保持在遠(yuǎn)低于一級標(biāo)準(zhǔn)規(guī)定的15mg/L,預(yù)計2016年將達(dá)到3.91mg/L,由于不可能無限降低,預(yù)計幾年后將會趨于一較小值. NH3-N濃度一直在0.5mg/L以上,劣于國家一級標(biāo)準(zhǔn),若不加以控制,預(yù)計 2016年將達(dá)到1.47mg/L.CODMn濃度下降的原因也應(yīng)是治理海河的措施取得了良好效果,NH3-N濃度上升的原因可能是所采取的措施主要是針對點源污染,而海河水體中的氨氮還有很多來自非點源污染,這部分污染源并未得到有效控制.
用2012年的數(shù)據(jù)對模型精度進(jìn)行對比驗證,由表4及表7計算可得,DO的GM(1,1)模型與GM(1,1)-馬爾科夫鏈預(yù)測模型模擬結(jié)果的相對誤差分別為 9.81%,7.5%;由表 8及表 10可得, CODMn的 GM(1,1)模型,殘差 GM(1,1)模型與GM(1,1)-馬爾科夫鏈預(yù)測模型的相對誤差分別為5.99%,-3.7%,-3.35%;NH3-N的GM(1,1)模型,殘差 GM(1,1)模型與 GM(1,1)-馬爾科夫鏈預(yù)測模型的相對誤差分別為 8.15%,3.7%,2.96%.3項指標(biāo)均為 GM(1,1)-馬爾科鏈夫預(yù)測模型的相對誤差最低,預(yù)測精度最高,其結(jié)果更具有效性.
3.1 使用 GM(1,1)預(yù)測模型對海河三岔口斷面的 DO、CODMn和 NH3-N 3項指標(biāo)進(jìn)行模擬時,DO的模擬結(jié)果勉強符合精度要求,CODMn和NH3-N均不符合精度要求.分析原因可能是原始數(shù)據(jù)波動性較大,且灰色預(yù)測存在灰色偏差與抗干擾能力弱的問題.
3.2 通過對模型精度進(jìn)行對比驗證,GM(1,1)-馬爾科夫鏈預(yù)測模型的相對誤差最低,預(yù)測精度最高,說明其預(yù)測結(jié)果更具有效性、合理性.分析原因是馬爾科夫鏈可用于隨機波動性較大的問題,這一點上可以彌補灰色模型的不足.
3.3 經(jīng)預(yù)測,海河三岔口斷面的 DO濃度及NH3-N濃度呈上升趨勢,CODMn濃度呈下降趨勢.DO及 CODMn一直優(yōu)于國家一級標(biāo)準(zhǔn),而NH3-N一直劣于國家一級標(biāo)準(zhǔn).預(yù)計 2016年DO、CODMn和NH3-N濃度分別可達(dá)9.15,3.91, 1.47mg/L.雖然海河的治理措施取得了一定效果,但仍需進(jìn)一步整治,尤其是對NH3-N濃度的控制,不僅針對點源污染,非點源污染也應(yīng)采取相應(yīng)治理措施.
[1] 劉子巖,羅固源,呂青峰,等.灰色模型理論對長江次級河流水質(zhì)污染的短期預(yù)測模擬 [J]. 三峽環(huán)境與生態(tài), 2011,33(3):47-50.
[2] 冉延平,何萬生,雷旭暉.應(yīng)用灰色GM(1,1)模型及其改進(jìn)模型預(yù)測渭河天水段水質(zhì) [J]. 水資源與水工程學(xué)報, 2011,22(5):88-91.
[3] 邱 林,黃 鑫,李洪良.基于模糊權(quán)馬爾可夫模型的綜合水質(zhì)預(yù)測 [J]. 人民長江, 2007,38(1):75-77.
[4] 李如忠.水質(zhì)預(yù)測理論模式研究進(jìn)展與趨勢分析 [J]. 合肥工業(yè)大學(xué)學(xué)報, 2006,29(1):26-30.
[5] 鄒志紅,王樂娟.湖泊富營養(yǎng)化趨勢的灰色馬爾柯夫預(yù)測 [J].環(huán)境科學(xué)學(xué)報, 2009,29(2):427-432.
[6] 王澤斌,馬 云,葉 珍,等.應(yīng)用 GM(1,1)模型預(yù)測阿什河水質(zhì)變化趨勢 [J]. 環(huán)境科學(xué)與管理, 2011,36(4):24-39.
[7] 鄧 嬋,張新政,羅作煌,等.灰色神經(jīng)網(wǎng)絡(luò)組合模型在區(qū)域水質(zhì)預(yù)測中的應(yīng)用 [J]. 科學(xué)技術(shù)與工程, 2009,9(9):2457-2458.
[8] LIU S F,DENG J L.The rang suitable for GM(1,1) [J]. Journal of Grey System, 1999,11(1):34-37.
[9] Deng J L. Spectrum mapping in grey theory [J]. The Journal of Grey System, 2000,12(2):116-120.
[10] 孫盼盼,李洪波.基于灰色模糊馬爾可夫鏈的中國出境旅游規(guī)模預(yù)測 [J]. 樂山師范學(xué)院學(xué)報, 2010,25(12):39-42.
[11] 高 蔚.基于 Markov理論的改進(jìn)灰色 GM(1,1)預(yù)測模型研究[J]. 計算機工程與科學(xué), 2011,33(2):159-163.
[12] Wang Z X, Hipel K W, Wang Q, et al. An optimized NGBM(1,1) model for forecasting the qualified discharge rate of industrial wastewater in China [J]. Applied Mathematical Modelling, 2011, 35(12):5524-5532.
[13] 王 宏,楊霓云,沈英娃,等.海河流域幾種典型有機污染物安全性評 [J]. 環(huán)境科學(xué)研究, 2003,16(6):35-37.
[14] Gao X L, Chen C T A. Heavy metal pollution status in surface sediments of the coastal Bohai Bay [J]. Water Research, 2012, 46(6):1901-1911.
[15] Liu Jia Hong, Qin Da Yong, Wang Hao, et al. Dualistic water cycle pattern and its evolution in Haihe River basin [J]. Chinese Science Bulletin, 2010,55(16):1688-1697.
[16] 郭銳利,鄭欽玉,劉 娟,等.基于熵值法和 GM(1,1)模型的重慶城市生態(tài)系統(tǒng)健康評價 [J]. 中國環(huán)境科學(xué), 2012,32(6):1148-1152.
[17] 謝建文,張元標(biāo),王志偉,等.基于無偏灰色模糊馬爾可夫鏈法的鐵路貨運量預(yù)測研究 [J]. 鐵道學(xué)報, 2009,31(1):1-7.
[18] 趙琳琳,夏樂天.灰色馬爾可夫鏈模型的改進(jìn)及其應(yīng)用 [J]. 河海大學(xué)學(xué)報, 2007,35(4):487-490.
[19] 游 珍,杜傳亮,李永濤.基于灰色-馬爾可夫耦合模型的區(qū)域建設(shè)用地需求預(yù)測 [J]. 生態(tài)環(huán)境, 2007,16(5):1528-1532.
[20] Wei H, Yang H S, Tian D P, et al. Dam safety monitoring model mased on Markov Chain [J]. Advanced Materials Research, 2011,255(4):3626-3631.
[21] 尚曉鍶,林衛(wèi)東,唐艷葵,等.指數(shù)平滑和 GM(1,1)組合法在水質(zhì)預(yù)測中的應(yīng)用—以邕江水源地鐵、錳濃度為例 [J]. 環(huán)境科學(xué)與技術(shù), 2011,34(1):191-195.
Water quality prediction of Haihe River using grey-fuzzy-markov chain model.
YU Hui, SUN Bao-sheng*, LI Ya-nan, ZHANG Yan, QI Geng-shen
(School of Environmental Science and Engineering, Tianjin University, Tianjin 300072, China). China Environmental Science, 2014,34(3):810~816
The GM(1,1) model has been widely used in the prediction of water quality. But it had the disadvantages of grey bias and weak anti-jamming capability. To solve this problem, the markov chain theory and fuzzy classification were introduced into the grey forecasting model and a new method named the Grey-Fuzzy-Markov Chain Model was proposed. In this paper, the tendency changes of DO,CODMnand NH3-N’s concentration were predicted in Haihe River from 2012 to 2016. The results showed that from 2004 to 2016 the concentration of DO and NH3-N would increase to 9.15 and 1.47mg/L respectively in 2016. Meanwhile the CODMnwould decrease to 3.91mg/L in 2016. The concentration of DO,CODMnand NH3-N in 2012 were forecasted to check the precision of this model. The precision of the Grey-Fuzzy-Markov model was better than the GM(1,1) model and it would be a scientific method for the prediction of water quality.
GM(1, 1) model;fuzzy classification;Markov Mode
X824
:A
:1000-6923(2014)03-0810-07
于 慧(1989-),女,山東德州人,天津大學(xué)碩士研究生,主要從事環(huán)境影響評價研究.
2013-07-10
天津市自然科學(xué)基金重點資助項目(07JCZDJC02100)
* 責(zé)任作者, 副教授, baosheng_sun@sina.com