郭 楊,丁振軍
(遼寧省生態環境監測中心,遼寧 沈陽 110161)
水資源是人類生存不可或缺的物質資源,也是生態環境的重要組成部分,水資源水體的質量一直受到人們的廣泛關注。遼河流域是全國七大流域之一,是國家重點治理的“三河三湖”之一。遼河流域的水環境質量的好壞直接影響流域人們的健康。隨著遼寧省水污染治理力度的加大,遼河流域水質明顯改善。根據2020年中國環境公報顯示,遼河流域為輕度污染,主要污染指標為化學需氧量、高錳酸鹽指數和五日生化需氧量[1]。在水環境質量管理和控制的工作中,需要了解和掌握水環境質量在未來的變化趨勢,遼河流域水質能否繼續保持良好態勢,是否存在超標風險,對全省未來水環境形勢進行預判對未來水污染防治工作方向可以提供參考。
目前較為常用的水質預測方法有灰色系統理論法[2~4]、人工神經網絡法[5,6]和時間序列分析法[7]等。其中時間序列法是指基于歷史數據利用統計方法建立模型預估未來水質情況。時間序列預測方法分為自回歸模型(AR)、移動平均模型(MA)、自回歸移動平均模型(ARIMA)等,尤其以ARIMA模型最為經典,它融合了時間序列和回歸分析優點,并且適用于平穩時間序列,在預測分析中應用最為廣泛。童俊以氨氮為例,構建SVR-ARIMA組合模型預測了金澤水庫取水口的水質[8]。Parmar等使用自回歸整合移動平均時間序列模型預估了未來的水質參數值,為水質管理決策提供基礎[9],羅學科等采用ARIMA-SVR組合方法預測了巢湖水域pH值和溶解氧濃度[10]。顧杰等基于ARIMA模型與BP神經網絡算法對嘉興市河道水質進行了預測[11]。李娜等利用ARIMA預測了太湖水體Chl-a濃度[12],江南等采用ARIMA乘積季節模型擬合序列,建立氟化物時間序列預測模型,預測了氟化物月均濃度[13]。謝建輝等利用AMIMA模型預測了化學需氧量和氨氮兩個指標未來1天的濃度[14]。杜鑫運用ARMA模型對遼河流域東陵大橋斷面COD水質變化趨勢進行了預測,結果顯示COD呈現增長態勢[15]。“十三五”期間,遼河流域治理取得較大成就,水生態環境質量改善明顯。但隨著經濟結構的轉型升級,水資源開發利用率高,遼河流域人均水資源量不足全國1/3,水污染防治形式依然十分嚴峻。為更好掌握未來水質變化情況,有必要基于歷史監測數據對遼河流域水質狀況進行預測,為水污染治理規劃提供引導方向,減少盲目性,以實現精準治污。
建立ARIMA模型的步驟一般包括確定時序是平穩的→找到一個(或幾個)合理的模型(即選定可能的p值和q值)擬合模型→從統計假設和預測準確性等角度評估模型→預測。本次預測選取遼河流域部分水質類別為Ⅳ類以上的斷面作為研究對象,基于2016~2020年監測數據,對COD、氨氮、總磷等主要指標建立時間序列進行預測。選取預測一個斷面的氨氮濃度為例來說明預測過程。
將數據轉化為時間序列,畫出時序圖判斷平穩性,如原始數據平穩無需對數據進行變換,原始數據不平穩對數據進行差分,觀察差分后數據是否為平穩。在R語言中加載forecast包和tidyverse包:library(forecast)library(tidyverse),讀取斷面數據:water <-read.csv("斷面.csv",sep = ",",header = T),將數據轉化為時間序列格式:waterts <-ts(water$氨氮,start=c(2015,1),end=c(2020,12),frequency=12),查看氨氮數據趨勢圖:plot.ts(waterts)(圖1、圖2)。

圖1 原始數據時序圖

圖2 數據一階差分后時序圖
原始數據呈現出兩個先升后降的趨勢。需對原始數據進行差分,差分階數為1:waterdiff <-diff(waterts, differences=1),查看差分后數據趨勢:plot.ts(waterdiff)。原始數據一階差分后數據點似乎呈現出平穩分布狀態。
平穩后查看ACF和PACF的結果:acf(waterdiff,lag.max = 30);pacf(waterdiff,lag.max = 30)(圖3、圖4)。

圖3 ACF

圖4 PACF
一般結合ACF和PACF圖選擇參數p和q。我們通過程序包中的auto.arima()函數自動計算合適的(p,d,q)值:auto.arima(waterts,trace=T)。根據auto.arima()計算結果,選用(1,1,1)非季節性模型進行參數估計:waterarima1 <-arima(waterts,order=c(1,1,1),method="ML")。
對殘差序列進行白噪聲檢驗:Box.test(waterarima1$residuals,type="Box-Pierce",lag = 1);Box-Pierce test;data:waterarima1$residuals;X-squared=0.17719,df=1,p-value=0.6738,得出p=0.6738>0.05,殘差序列白噪聲檢驗說明,模型顯著成立,ARIMA(1,1,1)模型對該時間序列擬合成功。
采用forecast()函數預測1年后數據:waterforecast <-forecast(waterarima1,h=12),并將預測結果作圖:plot(waterforecast),預測顯示為藍線,淺灰色和深灰色區域分別代表95%置信區間河80%置信區間(圖5)。

圖5 氨氮預測結果
ARIMA(1,1,1)能夠用于氨氮濃度預測。基于以上條件對選取的全部斷面的其他主要指標濃度進行了預測。結果顯示,在經濟環境、自然條件狀況及環保治理力度不變的情況下,未來一年預測的斷面中,COD、BOD5、高錳酸鹽指數濃度總體保持穩定,個別斷面氨氮、總磷濃度存在升高的趨勢,在“十四五”期間應重點關注主要污染物濃度存在上升趨勢的斷面,提前做好相關管控計劃,避免水質反彈惡化,實現精準施策。
本次研究采用ARIMA模型對遼河流域部分斷面的主要指標未來濃度進行了預測,取得較好結果。水環境防治的重要依據就是對水質的污染情況進行預測并制定相應的治理措施,達到提前對水環境進行變化趨勢分析的效果。ARIMA是對單因素短期預測效果較好,但在實際中,一方面,河流水質受水體內部各物質之間存在相互影響;另一方面,遼河流域水質也受降水等自然情況及水資源開發利用、環保治理力度等人為因素的影響,因此在河流水質情況預測時要充分考慮各因素的影響來篩選出合適的預測方法。