史紅偉,陳 祺,王云龍,李鵬程
(1.長春理工大學電子信息工程學院,吉林 長春 130022;2.長春水務投資發展集團有限公司,吉林 長春 130022)
伴隨著城鎮化的快速發展和城鎮人口的急劇增加,城鎮的污水量急劇增加,污水處理壓力大增。多數污水處理廠存在水質不確定性高,工藝優化困難的問題。為實現工藝優化,需要展開工藝參數對出水水質影響的研究,實現以工藝和環境參數為依據的出廠水質預測,再根據預測情況實時調整污水處理工藝,使得污水處理過程在保證污水處理效果的前提下兼顧水資源治理和節能減排的需求。目前我國縣一級已普及污水處理廠,且多采用CASS 工藝進行污水處理[1]。CASS 工藝具有占地少、效率高等特點,與MBR、A2O 處理工藝相比,CASS 工藝采取間歇式處理,其工藝調整更加復雜[2],目前并沒有針對CASS 工藝污水處理出水水質預測方法的研究。
現有的預測模型主要分為3 種:基于確定生化反應的機理模型、基于傳統統計學的預測方法、基于數據驅動的機器學習模型。其中,基于確定生化反應的機理模型需要對污水處理過程中的生化反應進行建模,但由于污水指標眾多且污水處理過程中反應復雜,導致這類模型預測準確度不高[3]。基于統計學的預測模型是對影響污水廠出水的各個因素與污水廠出水之間的影響因子建立的數學統計模型,由于影響污水廠出水水質的因素眾多且污水數據非線性程度高,所以這類模型難以取得較好的預測效果[4]。基于數據驅動的機器學習模型是指僅需確定模型輸入輸出類型、而無需機理過程就能建立非線性模型[5],因此這類模型在面對復雜問題時具有較好的預測效果,特別是在過去數年中,算力快速提升使得機器學習發展更加快速,應用更加廣泛,在水質預測[6]、PM2.5[7]、風電功率[8]方面取得了較好效果,ELSARAITI M[9]使用LSTM 來建立時間序列的預測模型,與統計學方面的模型(ARIMA)相比,預測的誤差更小,精度更高。近年來更多的學者將機器學習應用與污水廠出水預測方面,陳威等[10]使用人工神經網絡建立污水出水水質預測模型,能對出水COD 和NH3-N 預測變化趨勢進行較好的預測,但對局部指標變化預測效果欠佳;林佳敏[11]等將BP 神經網絡和ARIMA 結合,姚怡帆[12]利用Stacking 集成思想結合多種機器學習方法對出水總氮進行預測,相比與單一算法預測效果更佳,但這種結合多種算法的預測模型相比于單一模型更容易過擬合,對樣本質量要求更高,同時對計算資源和時間的要求較高。上述模型進行預測時只采用污水處理廠監測到的數據,而忽視了污水處理過程中環境因素的影響,因此本文將影響污水處理過程的因素序列引入一同計算,從而進一步提高污水出水預測準確率。
本文使用機器學習中的神經網絡來進行水質預測,在序列預測問題中,最常使用的是RNN 及其變種[13]。在黃河水質[14]和光伏電壓[15]這一類復雜序列上先利用CNN 提取特征后再由RNN 進行預測,可以得到比單RNN 網絡更精準的預測結果。由于污水出廠水質指標復雜、時序非線性程度高、污水處理過程中反應復雜無序等問題,簡單的順序結構神經網絡難以進行準確預測。因此,本文提出了一種基于encoder-decoder 結構的神經網絡,這一結構可以很好解決復雜序列問題[16,17]。此結構在復雜水質預測應用中,由廠入水處與廠出水處兩點的多個水質指標而建立。encoder 的輸入為廠入水處歷史結構和影響污水處理過程的因素,decoder 的輸入的為廠出水處歷史數據,decoder 輸出為廠出水處未來水質指標預測數據。將實際采集到的數據輸入到神經網絡中進行學習,經過學習后的神經網絡可以很好的再現水質變化的動態過程,獲得一種能高效準確預測污水廠出水水質的模型,可以為后續的工藝優化和模型預測控制提供很好的前提支撐。
本文采用門控循環神經網絡(Gated Recurrent Unit,GRU)組成encoder-decoder 結構的神經網絡,其中GRU 是Cho 等[18]在2003年提出的一種LSTM 神經網絡的簡化網絡。相比于LSTM結構的3 個“門”,GRU 將其簡化至兩個“門”:“更新門”和“重置門”。單個GRU 如圖1所示,其主要組成為重置門和更新門。因為使用的門結構更少,GRU 參數更少,計算過程簡化,比LSTM模型訓練更快。

圖1 GRU神經網絡Fig.1 GRU Neural Networks
編碼器-解碼器是神經網絡的一種框架結構,廣泛應用于機器翻譯、文本識別、語音識別[19]。通過encoder 提取豐富的特征并生成包含輸入的全局信息的矢量C,然后將矢量C 輸入到decoder 中,最后通過encoder 解碼得到預測數據。在多指標預測時由于輸入輸出長度不同會導致某些預測指標效果不佳,在encoder-decoder 結構中將影響出水水質的因素通過encoder 編碼成一個向量后再輸入到decoder 中,而decoder 第二路輸入和輸出長度一致從而避免預測效果失衡。在長期預測中由于常見包含RNN 及其變種的算法在預測多步時間序列時會將上一次預測值作為歷史數據而導致之后預測數據誤差越來越大,而解碼器編碼器將時間序列表達為向量進而避免這種問題。
文中ED-GRU 模型的結構如圖2所示。首先,定義一個單層GRU 作為編碼器對影響廠出水水質的其他因素(入廠水水質、環境)的歷史數據進行編碼。然后,定義一個單層GRU模型作為解碼器,該解碼器有兩個輸入,一個輸入為通過編碼器對影響廠出水水質的其他因素歷史數據提取出的全局信息,另一輸入為廠出水歷史數據,最終通過解碼器輸出廠出水未來預測數據。其中n代表歷史數據步長,m代表預測未來數據步長。

圖2 ED-GRU神經網絡Fig.2 ED-GRU neural network
模型采取多指標預測策略,需要對每個輸入輸出進行指標選擇。根據城鎮污水處理廠排放標準(GB18918-2002)[20],城鎮污水處理廠出水處需要對COD、BOD5、SS、TN、TP、NH3-N、pH等指標進行實時監測。為了研究廠出水指標內的時序關系,本文將以上指標的歷史值作為decoder的另一輸入,以上指標的預測值作為模型輸出。但實際生產過程中,由于設備或人為因素導致部分廠出水水質指標無法采集或數據大幅度異常。為了提高預測準確度,本文從污水處理過程中的生化反應方面選擇影響出水水質的因素。污水處理生化反應過程中,進水水質作為反應物對生成物(出水水質)有著決定性影響。此外,降水量、溫度等環境因素也會影響生化反應物載體活性污泥處理效率和出水水質[21]。因此,將廠入水處水質和環境因素的歷史指標作為encoder 輸入,通過encoder 編碼后提取出這些影響因素對廠出水影響因子的全局向量,進一步提高模型在復雜環境下的預測性能。該模型具體數據劃分如圖3所示。

圖3 神經網絡輸入輸出數據劃分Fig.3 Neural network input and output data division
以GRU 神經網絡作為編碼器和解碼器按照encoder-decoder結構構建了一種污水廠出水水質預測模型。實驗模型為EDGRU、ED-LSTM,通過與順序結構的GRU、LSTM 模型對比來驗證encoder-decoder結構模型的性能。
為了更好的對比模型性能,本文從兩個不同的時間維度(短期預測和長期預測)對模型性能進行分析。其中,短期預測更偏向模型對污水水質局部變化的預測能力,而長期預測更傾向模型對未來水質總體趨勢的預測能力。其中均采用步長為20 的歷史數據(n=20),短期預測采取步長為1 的未來數據(m=1),長期預測采取步長為20的未來數據(m=20)。將由上述4個模型分別進行短期和長期預測,通過參數對比獲得最優模型。
為了得到最優模型,需要在訓練過程中對模型參數進行一些調整,具體實驗流程如圖4所示。

圖4 實驗流程圖Fig.4 Experimental flow chart
其中模型參數調整包括dropout 系數、正則化系數、batch_size。迭代次數為2 000,同時在模型訓練過程中調用tensorflow 中的ModelCheckpoint 函數對模型訓練過程中測試集損失值最小時的模型參數進行保存。最后利用驗證集對各個最優模型進行預測性能比較。實驗過程中不變參數如表1所示。

表1 不變參數表Tab.1 Table of invariant parameters
因為數據是從現場直接采集的,受設備故障以及人為操作失誤等問題而導致數據可能存在缺失或者異常值,因此在使用窗口函數對數據劃分前需要對數據進行以下處理:
(1)檢測數據中的異常值(超大值、負值、零值)并進行刪除留下空缺。
(2)利用線性插值法補齊缺失值,線性插值法的計算公式入式(1)所示:
式中:xk為要補齊的值;xw為xk前面最近的已知數據;xr為xk后面最近的已知數據。
(3)將數據進行標準化處理,可以加快梯度下降速度。如式(2)所示
式中:x′為標準化后的值;xmean為本指標序列平均值;xstd為本指標序列的標準偏差。
在對數據進行基本處理后需要對數據進行劃分。由于順序模型和encoder-decoder 模型的輸入不同。順序模型的輸入為廠出水處歷史數據+廠入水處歷史數據,encoder 輸入為廠入水處歷史數據,decoder 輸入為廠出水處歷史數據,兩種框架的輸出均為廠出水處未來預測值。本文從兩個時間維度上對模型性能進行分析,其中短期預測模型的輸出為未來單步數據,長期預測時模型輸出為未來20 步的數據。本文模型輸入均為歷史20步,數據流如圖5所示。

圖5 模型輸入輸出數據流圖Fig.5 Model input and output data flow diagram
將處理好的數據集按照6∶2∶2劃分為訓練集、測試集、驗證集。訓練集用于訓練模型,測試集對訓練模型進行篩選,找出最佳的參數,驗證集僅用于對訓練好的模型進行性能評估。
研究所使用的數據來源于吉林省某污水廠,記錄了2020年1月1日至2020年3月30日的相關數據,包括廠出水處數據(出水COD、NH3-N、TP、TN)和影響因素(進水COD、入水NH3-N、溫度、降水量)。采樣間隔為30 min,共計4 320 個時間點數據。本文采用以上數據對模型進行訓練及預測,以預測廠出水處數據為目標,故將出水處水質指標的未來預測值作為標簽向量。數據經過劃分后短期預測中訓練集數為2 580,測試集及驗證集數量為860;在長期預測中訓練集數為2 568,測試集及驗證集數量為856。
實驗硬件環境為Intel i7-11800H 處理器,16G 內存,NVIDIA GTX3070 顯卡。軟件環境為jupyter notebook,使用Python 語言編寫程序,使用Google研發的tensorflow 機器學習接口搭建神經網絡,使用sklearn庫計算各個指標。
為了對比本文encoder-decoder 結構神經網絡和順序結構神經網絡的預測效果,選擇擬合優度(R2)、均方根誤差(RMSE)對模型進行性能評價,使用公式如下所示。
R2的值在0~1 之間,越接近1 表明模型的擬合程度越高。RMSE表示預測值與真實值偏差的平方和與觀察次數比值的平方根,其值越小表示預測模型的偏差程度越小。
將驗證集輸入到訓練好的各個模型中得到預測值,將預測值和真實值進行對比,圖6 為驗證集中100 步的出水COD 通過各個模型單步預測效果圖。

圖6 模型預測效果對比圖Fig.6 Comparison of model prediction results
通過4 種模型預測對比圖(圖6)可看出,4 種模型的預測值與真實值的變化趨勢基本一致,其中ED-GRU、GRU 模型的預測曲線和真實值曲線擬合度較高,說明ED-GRU、GRU 模型對復雜序列有較強的特征提取能力,不僅能準確預測水質變化趨勢,還能對水質局部變化進行較好的預測。最終通過兩種指標量化各個出水指標預測效果,表2為短期預測指標表。

表2 模型短期預測指標對比表Tab.2 Comparison of model short-term forecast indicators
由表2可以得出如下結論:
(1)ED-GRU 污水出水預測模型中的出水COD、出水NH3-N、出水TP、出水TN 指標的均方根誤差為0.755 1、0.219 7、0.073 4、0.314 6,擬合優度系數為0.901 3、0.933 2、0.916 7、0.953 2。結果證明,ED-GRU 在短期預測時的預測結果與真實值的誤差小、擬合程度高、水質預測精度更高。
(2)encoder-decoder 結構的兩種污水出水預測模型與傳統順序結構的LSTM、GRU 相比,預測進度有所提升。特別是EDGRU 模型相比順序結構的GRU 模型均方根誤差分別降低了13.95%、38.42%、25.25%、11.92%,擬合優度增加了5.25%、2.66%、10.75%、2.25%。結構證明encoder-decoder 結構可以提升復雜水質環境下的污水廠出水水質預測模型的預測準確度。
(3)ED-GRU 模型比同結構下的ED-LSTM 模型預測準確度高,這是由于GRU具有更少的門控單元,因此參數更少、計算量更小、訓練速度更快,可以降低由訓練過程中的過擬合現象造成的影響并提高迭代速度,因此ED-GRU 模型具有更高的泛用性。
綜上所述,研究提出的ED-GRU 模型在預測出水COD、出水NH3-N、出水TP、出水TN水質指標在短期預測有著較高的預測精度。對比LSTM、GRU 和ED-GRU 模型,污水出水預測模型ED-GRU在短期預測精度上有不同程度的提升。
對于模型在長期預測有效性及穩定性進行評估,將模型輸出設置為預測未來20步,圖7為一次預測時各個模型對出水TP的預測效果。


圖7 模型預測值與真實值對比圖Fig.7 Plot of model predicted versus true values
圖7順序結構與encoder-decoder 結構對比中的真實值是相同的,為了更直觀對比模型性能對圖標幅值進行了修改,從0.170~0.270 到0.220~0.235。其中順序結構在進行長序列預測時,部分點偏離真實值,預測效果不佳。encoder-decoder 結構模型進行長序列預測時,能較好的預測出水質趨勢,相比于順序結構偏離較小,預測效果有一定提升。
通過表3可知:

表3 模型長期預測指標對比表Tab.3 Comparison of model long-term forecast indicators
(1)時間步長對預測結果影響較大,在長期預測時模型準確度相比短期預測準確度都有著較大的差距。模型在以較長時間步長進行預測時,會將上一個預測結果考慮在內,所以在長步長預測時,模型預測準確性有所下降。
(2)ED-GRU 污水出水預測模型中的出水COD、出水NH3-N、出水TP、出水TN 指標的均方根誤差為1.720 4、1.768 9、0.447 8、0.831 6,擬合優度系數為0.484 9、0.550 7、0.450 2、0.759 5。結果證明,ED-GRU 在短期預測時的預測結果與真實值的誤差小、擬合程度高、水質預測精度高。
(3)ED-GRU 和ED-LSTM 模型相比順序結構的GRU 和LSTM模型準確度更優。其中ED-GRU相比順序結構GRU模型均方根誤差分別降低了40.21%、27.95%、34.16%、25.22%,擬合優度增加了65.38%、53.69%、38.18%、17.44%。說明encoderdecoder 結構能夠緩解長步長預測時的模型誤差迅速增加的趨勢,實現更為準確的污水出水水質長期預測。
綜上所述,研究提出的ED-GRU 模型不論時短期預測還是長期預測,在對復雜水質環境下的污水出水預測有著較高的預測精度。對比常用的順序結構的LSTM 和GRU 和ED-LSTM 水質預測模型,ED-GRU 在預測精度上有不同程度的提升,說明ED-GRU 模型預測的方法在對于復雜程度高、高非線性的數據具有更好的擬合能力和魯棒性。特別是在長期預測時encoderdecoder結構的模型對長步長預測有著更強的特征提取能力。
(1)提出了一種基于encoder-decoder 結構的神經網絡,實驗表明encoder-decoder 結構的神經網絡比順序結構神經網絡有更好的預測效果,特別是ED-GRU 網絡在對本例CASS 工藝污水出水COD、出水NH3-N、出水TP、出水TN 指標預測中取得了良好的效果,相比順序結構GRU 模型在短期預測中RMSE降低11.92%~38.42%,R2增加2.25%~10.75%,能夠預測出水質在短期內的變化趨勢;在長期預測中RMSE降低25.22%~41.21%以上,R2增加17.44%~65.38%,可以預測出水質在未來變化的總體趨勢。
(2)采取了多指標輸入來預測多指標輸出策略,將影響污水處理過程的環境因素引入,這可以讓模型在復雜環境中應用。本文使用污水廠出水入水處兩點數據進行預測,可以根據污水處理廠的實際情況進行分析并采取不同的預測指標進行預測,具有一定實際意義。
(3)在未來的工作中,可以嘗試更多的算法對模型預測效果進行提升特別是在長期預測中,并且可以為將來神經網絡和預測控制模型進行結合,根據污水出水預測數據對污水處理工藝進行優化。