999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于RNN的水廠過濾過程研究

2024-09-26 00:00:00張維璽洪雷
現代信息科技 2024年14期

摘 要:當下飲用水標準不斷提高,傳統水質預測方法存在明顯不足。對使用循環神經網絡(RNN)處理時間序列數據進行了研究。主要針對全年數據、夏季數據、冬季數據進行分析,結果顯示全年數據最優模型MSE和MAE為0.004 7、

0.054 1;冬季數據最優模型MSE和MAE為0.005 1、0.054 4;夏季數據的模擬效果相對較差,其最低MSE和MAE值為

0.285 9、0.470 4。說明RNN在對大量的水質數據進行預測時,其模擬有效且擬合精度很高,但對數據量少、數據情況復雜的模型模擬時,其擬合效果并不是很好。

關鍵詞:過濾水質預測;循環神經網絡;時間序列;最優模型

中圖分類號:TP18 文獻標識碼:A 文章編號:2096-4706(2024)14-0140-05

Research on the Filtration Process of Water Plants Based on RNN

ZHANG Weixi, HONG Lei

(School of Environmental and Municipal Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China)

Abstract: The current drinking water standards are constantly improving, and traditional water quality prediction methods have obvious shortcomings. A study is conducted on the use of Recurrent Neural Networks (RNNs) for processing time series data. The analysis mainly focuses on annual data, summer data and winter data, and the results show that the optimal model MSE and MAE models for annual data are 0.004 7 and 0.054 1, respectively. The optimal model MSE and MAE for winter data are 0.005 1 and 0.054 4, respectively. The simulation effect of summer data is relatively poor, with the lowest MSE and MAE values of 0.285 9 and 0.470 4. It shows that when RNN is used to predict a large amount of water quality data, its simulation is effective and the fitting accuracy is high. However, when simulating models with small amounts of data and complex data situations, the fitting effect is not very good.

Keywords: filtration water quality prediction; Recurrent Neural Networks; time series; optimal model

DOI:10.19850/j.cnki.2096-4706.2024.14.029

0 引 言

水是人們生存必不可少的資源,隨著科技的發展,人們對生活品質的要求也越來越高。飲用水與人的生命健康息息相關,飲用水的安全也成了人們健康生存的基本保障[1]。

隨著計算機和人工智能等新一代技術的廣泛應用,傳統自來水廠在數字化轉型和工業4.0的大背景下,將經歷一次前所未有的深刻變革[2]。未來水廠建設的目標是進一步提高水廠運行的安全性和可靠性,同時降低能耗和用水量,以保證供水質量。未來自來水廠的相應設計應具備以下四個關鍵特征:凈化單元的模塊化、凈化過程的“綠色化”、回收材料的再利用、控制方式的智能化[3]。

在水質數據處理中,傳統的處理方法往往只適用于基本線性和動態特性不隨時間變化的情況,而機器學習能夠很好地反映過濾過程中眾多變量之間存在的復雜非線性關系。機器學習就是通過計算機來模擬人類學習的一種算法,是人工智能的一個重要分支。人工神經網絡是一種可用于處理具有多個輸入節點和多個輸出節點的實際問題的網絡結構,是實現機器學習的一種模型。

1 RNN模型及建模流程

循環神經網絡(RNN)是一種遞歸神經網絡,常用來進行關于時間序列問題的數據建模[4-5]。循環神經網絡的內部結構與普通神經網絡不同,除了前向反饋和后向反饋,在其輸入數據時不僅有當前時刻的輸入,還有上一時刻的輸出,通過內部循環的方式,將內部的神經網絡多次利用,將時間序列數據中的關鍵信息持久化、記憶化,使其擁有較強的處理時間序列的能力[6]。具體的表現形式為網絡會對前面的信息進行記憶并應用于當前輸出的計算中,即隱藏層之間的節點不再是無連接而是有連接的[7]。RNN模型的循環展開結構示意圖如圖1所示。

從圖1可看出,RNN隱藏層通過時間序列連接在一起,第一層表示t = 0時刻,第二層表示t = 1時刻,以此類推直到模型的時間步長。雖然RNN也通過反向傳播實現梯度下降,但反饋方式與其他神經網絡有所不同。RNN會將誤差反饋到過去,某一時刻誤差輸出的梯度是由來自輸出層的梯度與下一時刻反饋回來的輸出的誤差之和組成,這樣網絡就可以通過對全部時刻的誤差進行反饋計算梯度,對權重和偏置進更新。

本文在RNN的建模中采用的底層數據庫是基于TensorFlow的Keras框架建立的水質預測模型,具體編程語言為Python,編輯工具采用了Jupyter Notebook。而建立RNN模型可分為五個步驟[7]:

1)劃分訓練集與測試集。

2)參數設置。

3)模型訓練。

4)模型評估。

5)最優模型預測。

RNN的建模流程如圖2所示。

2 數據采集與處理

2.1 數據采集

本文采集的數據是西北某水廠2022年12個月每日的水質數據,共365組數據。采集的水質數據有進水流量、溫度、pH、過濾時間、進水濁度、出水濁度、混凝劑投加量、消毒劑投加量、余氯等水質指標。根據本文的要求,所需要的水質數據分別是濾池進水流量、溫度、pH、過濾時間、進水濁度、出水濁度。由于模擬時的數據是單個過濾池的進水流量,因此要將單池流量計算出來,即總流量除以濾池個數,然后把這些數據摘選出來并存在新的Excel表格中。

2.2 數據預處理

2.2.1 缺失值處理

在對任何缺失的水質時間序列數據進行插補之前,需要考慮的重要問題是數據的缺失率及其可能存在的缺失規律,缺失率是指缺失的數據占總數據的比例。結合水質時間序列缺失的實際情況和相應的插補研究。本文的數據缺失值極少,只有個別數據缺失,屬于輕微缺失。故采用算術平均值插補法處理缺失值[8]。

2.2.2 數據歸一化

歸一化方法有兩種形式,一種是把數變為(0,1)之間的小數,一種是把有量綱表達式變為無量綱表達式。主要是為了數據處理方便而提出來的,把數據映射到0~1范圍之內處理,會更加便捷快速[9]。

數據的不同表現形式通常會對模型訓練產生不同的影響,而原始數據中的特征屬性列之間各自都有不同的單位(量綱),如m3/h、NTU、℃等,并且大小差異很大,導致屬性間不可比較,為了消除量綱帶來的負面影響,需要對數據各節點做歸一化處理,本論文選用min-max歸一化。公式如下:

(1)

式(1)中n表示對應的屬性,即流量、溫度、pH等;i表示數據的編號;xni表示某一屬性歸一化后的數值;xi表示某一屬性的數據;xmin表示該屬性數據中的最小值,xmax表示該屬性數據中的最大值。歸一化后的數據會在(0,1)之間,可以加快模型的收斂速度,并且有助于提高模型的預測精度。

2.2.3 劃分訓練集與測試集

本論文采集的數據共有365組,按照訓練集數據與測試集數據的比例為3:1來劃分,即訓練集數據有273個,測試集數據有92個。

又考慮到溫度對水質數據有很大的影響,故分別將夏季與冬季的時間序列數據單獨拿出來進行訓練。夏季采集5、6、7、8月的數據進行訓練,共有123組數據,按照訓練集數據與測試集數據的比例為3:1來劃分,即訓練集數據有92個,測試集數據有31個。冬季采集12、1、2、3月的數據進行訓練,共有121組數據,按照訓練集數據與測試集數據的比例為3:1來劃分,即訓練集數據有90個,測試集數據有31個。

3 檢測結果與分析

3.1 模型評價指標

檢驗過濾效果的指標為均方誤差(Mean Squared Error, MSE)[10]和平均絕對誤差(Mean Absolute Error, MAE)[11]。

3.1.1 均方誤差

均方誤差主要是用于解決回歸問題的損失函數。公式如下:

(2)

式(2)中MSE表示均方誤差向量組,y表示預測值的向量組, 表示實際值的向量組,下標i表示向量組中第i個數據。

3.1.2 平均絕對誤差

平均絕對誤差是所有單個觀測值與算術平均值的偏差的絕對值的平均。與平均誤差相比,平均絕對誤差由于離差被絕對值化,不會出現正負相抵消的情況,因此平均絕對誤差能更好地反映預測值誤差的實際情況。公式如下:

(3)

式(3)中MAE表示平均絕對誤差向量組,y表示預測值的向量組, 表示實際值的向量組,下標i表示向量組中第i個數據。

3.2 測試集模擬結果

本文提出了基于RNN的過濾水質預測模型,為提高預測的準確度,會先對模型的隱藏層數進行選擇,然后在實驗中不斷調整時間步長t、各隱藏層神經元個數、網絡迭代次數epochs和批量大小以達到最佳預測性能。最后通過MSE和MAE值進行性能比較,找到最優預測模型。

3.2.1 全年數據建立RNN模型

定義其初始時間步長為30,隱藏層為分別設置1層、2層和3層,隱藏層神經元數為128,激活函數使用tanh,優化器使用SGD,學習率為0.001,設置訓練輪數epochs為500,批次大小為30,然后使用Sequential進行建模。損失函數(loss)用均方誤差(MSE)定義,度量指標(metrics)使用平均絕對誤差(MAE)衡量。其不同RNN隱藏層的誤差曲線圖和MAE曲線圖模擬結果如圖3、圖4所示[12]。

由圖3、圖4可知,不同隱藏層個數所訓練模型的效果不同。根據誤差曲線圖和MAE曲線圖顯示,兩個RNN隱藏層和三個RNN隱藏層時,其訓練效果并不好,預測結果不穩定。而一個RNN隱藏層時,模型的誤差很小,且曲線擬合效果好,其MSE和MAE分別為0.009 8、0.078 8。接下來會通過調節訓練參數對模型進行優化。

由表1可看出,神經元為180時其MSE、MAE值最低,分別為0.004 7、0.054 1。

由表2可知,epochs為500時,模型擬合精度最

高,MSE、MAE值分別為0.004 7、0.054 1。時間步長t,批次大小的優化同表2,得到的最優時間步長為30,最優批次大小為30。

通過不斷優化模型參數,得到的最優模型參數是時間步長為30、隱藏層神經元數為180、網絡迭代次數epochs為500、批次大小為30。最優模型的MSE和MAE分別為0.004 7、0.054 1,運行時間為94.30 s,相比于最開始的0.009 8、0.078 8,MSE和MAE分別降低了0.005 1、0.024 7。

3.2.2 冬季數據建立RNN模型

定義其初始時間步長為30,隱藏層為分別設置1層、2層、3層和4層,隱藏層神經元數均為64,激活函數使用tanh,優化器使用SGD,學習率為0.001,設置訓練輪數epochs為500,批次大小為10。損失函數(loss)用均方誤差(MSE)定義,度量指標(metrics)使用平均絕對誤差(MAE)衡量。其不同RNN隱藏層的誤差曲線圖和MAE曲線圖模擬結果如圖5、圖6所示。

由圖5、圖6可知,不同隱藏層個數所訓練模型的效果不同。根據誤差曲線圖和MAE曲線圖顯示,當RNN隱藏層為3層和4層時其損失較小,曲線擬合效果更好。3層隱藏層其MSE為0.012 1,MAE為0.087 1,訓練時間為71.08 s,4層隱藏層其MSE為0.008 7,MAE為0.073 6,訓練時間為138.13 s。接下來會通過調節訓練參數對模型進行優化。

由表3可看出,當有3層隱藏層,epochs為800時其MSE、MAE值最低,分別為0.005 1、0.054 4。

神經元個數、時間步長、批次大小的參數優化同表3,得到最優參數是各隱藏層神經元為64,64,64,時間步長為30,批次大小為10。通過不斷優化模型參數,最優模型的MSE和MAE分別為0.005 1、0.054 4,運行時間為107 s,相比于最開始的0.012 1,0.087 1,MSE和MAE值分別降低了0.007 0、0.032 7。

3.2.3 夏季數據建立LSTM模型

定義其初始時間步長為10,隱藏層為分別設置1層、2層、3層和4層,隱藏層神經元數均為64,激活函數使用tanh,優化器使用Adam,學習率為0.001,設置訓練輪數epochs為500,批次大小為10。損失函數(loss)用均方誤差(MSE)定義,度量指標(metrics)使用平均絕對誤差(MAE)衡量。其不同RNN隱藏層的誤差曲線圖和MAE曲線圖模擬結果如圖7、圖8所示。

由圖7、圖8可明顯看出,在使用RNN神經網絡對夏季數據進行模擬時,模擬效果非常差,其最低MSE和MAE值分別為0.285 9、0.470 4。

3.3 結果分析

通過對全年數據、夏季數據、冬季數據分別使用RNN進行模擬??芍陻祿M的最優模型參數是時間步長為30、隱藏層神經元數為180、網絡迭代次數epochs為500、批次大小為30。最優模型的MSE和MAE分別為0.004 7、0.054 1,運行時間為94.30 s,相比于最開始的0.009 8、0.078 8,MSE和MAE分別降低了0.005 1、0.024 7。冬季數據模擬的最優模型參數是時間步長為30,各隱藏層神經元為64,64,64,批次大小為10。最優模型的MSE和MAE分別為0.005 1、0.054 4,運行時間為107 s,相比于最開始的0.012 1,0.087 1,MSE和MAE值分別降低了0.007 0、0.032 7。而夏季數據在使用RNN對夏季數據進行模擬時,模擬效果非常差,其最低MSE和MAE值分別為0.285 9、0.470 4。

說明同一個神經網絡模型在模擬不同數據集時,其模擬效果也是不同的。如全年數據和夏季數據,兩個數據集的模擬效果非常接近,但是全年數據的運行時間卻比冬季數據的短,證明在使用RNN模型對數據集進行訓練時,數據量越大,訓練的迭代次數越少,訓練的難度越小。而夏季數據的模擬效果之所以差,一是因為夏季的水質數據波動非常大,用少量的數據訓練時,RNN無法捕捉其參數間的特征和規律;二是因為RNN模型結構還存在缺陷。

4 結 論

本文提出了一種基于RNN的水質預測方法,通過采集西北某水廠2022年一年的數據,對未來的出水濁度指標進行預測。可知在同一種數據類型不同數據量的情況下,RNN模型的擬合結果會存在差異:

1)全年數據和冬季數據的模擬效果非常接近,但是全年數據的運行時間卻比夏季數據的短,說明RNN神經網絡的數據量越大,訓練的迭代次數越少,訓練的難度越小。

2)在同樣數據量,不同時間點的情況下,模型性能也會存在差異。相比于冬季數據集,夏季數據集的模型難以擬合,因為夏季的水質數據波動非常大,用少量的數據訓練時,RNN無法捕捉其參數間的特征和規律。

由此說明,RNN在對大量的水質數據進行預測時,其模擬是有效的,且擬合精度也是非常高的,所以RNN對水廠未來的過濾水質預測是可行的,可以進一步提高凈水廠智能化水平。但是當RNN模擬數據量少、數據情況復雜的模型時,其擬合效果并不是很好。所以,RNN更適合用于長期數據的模擬。

參考文獻:

[1] 張金松,李冬梅.新《生活飲用水衛生標準》推動供水行業水質保障體系化建設 [J].給水排水,2022,58(8):6-12.

[2] 陸繼誠.從“自動化”到“智慧化”——智慧水廠建設的新思路 [J].給水排水,2017,53(11):1-3.

[3] 孫凝,趙順萍,解鵬,等.智慧水廠管理平臺的研究與實踐 [J].給水排水,2022,58(1):151-155.

[4] YU Y,SI X S,HU C H,et al. A Review of Recurrent Neural Networks: LSTM Cells and Network Architectures [J].Neural Computation,2019,31(7):1235-1270.

[5] 何詩揚,汪玲,朱岱寅,等.基于時空記憶解耦RNN的雷暴預測方法 [J].系統工程與電子技術,2023,45(11):3474-3480.

[6] 鄒可可,李中原,穆小玲,等.基于LSTM-GRU的污水水質預測模型研究 [J].能源與環保,2021,43(12):59-63.

[7] 董云程.基于ARIMA-LSTM的城市供水量組合預測模型研究 [D].昆明:昆明理工大學,2021.

[8] 楊哲.基于GAN的智能氣象網關數據補全技術研究 [D].上海:華東師范大學,2022.

[9] 唐亦舜,徐慶,劉振鴻,等.基于優化非線性自回歸神經網絡模型的水質預測 [J].東華大學學報:自然科學版,2022,48(3):93-100.

[10] 徐瑞.基于SARIMA-LSTM的北侖河口水質預測方法研究及應用 [D].重慶:重慶大學,2019.

[11] 談昊然.深度—寬度學習模型及在降水量預測中的應用 [D].南京:南京信息工程大學,2022.

[12] CHO M,KIM C,JUNG K,et al. Water Level Prediction Model Applying a Long Short-Term Memory(LSTM)-Gated Recurrent Unit(GRU) Method for Flood Prediction [J].Water,2022,14(14):2221(2022-07-14).https://www.mdpi.com/2073-4441/14/14/2221.

作者簡介:張維璽(1998.12—),男,漢族,陜西寶雞人,碩士在讀,研究方向:機器學習在水處理中的應用;洪雷(1971.10—),男,漢族,陜西咸陽人,副教授,博士研究生,研究方向:凈水處理中的數據模擬。

收稿日期:2024-01-02

主站蜘蛛池模板: 狠狠色婷婷丁香综合久久韩国| 性欧美久久| 国产swag在线观看| 亚洲中文字幕97久久精品少妇| 欧美成人a∨视频免费观看| 最新国产精品第1页| 伊人久久久久久久| 色婷婷成人| 欧美亚洲国产一区| 白浆免费视频国产精品视频| av在线手机播放| 99久久99这里只有免费的精品| 免费日韩在线视频| 亚洲第一极品精品无码| 伊人成色综合网| 国产成人91精品免费网址在线| 99久久精品视香蕉蕉| 亚洲精品va| 中文字幕人成乱码熟女免费| 一区二区午夜| 毛片手机在线看| 99视频在线观看免费| 国产超薄肉色丝袜网站| 色香蕉网站| 在线网站18禁| 一本久道久久综合多人| 国产成人亚洲综合A∨在线播放| 日韩欧美国产成人| 精品99在线观看| 日韩欧美中文| 国产青青草视频| 国产成人亚洲日韩欧美电影| 国内a级毛片| 国模私拍一区二区| 国产精品成人AⅤ在线一二三四| 日韩二区三区| 老司机久久精品视频| 日韩成人在线网站| 这里只有精品国产| 欧美区国产区| 国产成人AV综合久久| 国产成人综合亚洲欧美在| 四虎影视无码永久免费观看| 九色在线观看视频| 国产正在播放| 国产福利免费观看| 激情爆乳一区二区| 国产日产欧美精品| 中文字幕精品一区二区三区视频| 国产内射一区亚洲| 夜夜操天天摸| 国产人成午夜免费看| 国产精品毛片在线直播完整版| 亚洲色图在线观看| 国产在线八区| 91区国产福利在线观看午夜| 国产免费久久精品99re不卡| 欧洲亚洲一区| 国产97公开成人免费视频| 日韩精品一区二区深田咏美| 中文字幕日韩视频欧美一区| 噜噜噜久久| 国产精欧美一区二区三区| 亚洲欧美另类久久久精品播放的| 国产美女91呻吟求| 日韩精品成人网页视频在线| 欧美无专区| 三上悠亚在线精品二区| 欧美不卡视频一区发布| 亚洲男人的天堂在线| 国产成人精彩在线视频50| 免费Aⅴ片在线观看蜜芽Tⅴ| 无码在线激情片| 国产在线视频自拍| 中文字幕 91| 欧美三級片黃色三級片黃色1| 玩两个丰满老熟女久久网| 精品国产污污免费网站| 亚洲国产成人精品青青草原| 韩国福利一区| 在线不卡免费视频| 国产av一码二码三码无码|