摘 要:為克服單一模型的局限性、提高模型魯棒性,針對小型造紙廠單一工段的廢水處理數據集,首先利用核主成分分析(KPCA)降維技術,有效提取數據關鍵特征,再采用裝袋集成 (Bagging) 算法集成多個可有效建模廢水時間序列特征的長短期記憶網絡(LSTM) 學習器,建立 KPCA-Bagging-LSTM 造紙廢水出水指標預測模型。結果表明,KPCA-Bagging-LSTM 模型的決定系數 (R2) 達0.76,顯著優于其他方法;均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)分別為3.55 mg/L和4.01%,表明該模型具有更低的預測誤差和更高的精度。本研究通過特征降維和集成學習提升了KPCA-Bagging-LSTM模型的性能,為造紙廢水COD等出水指標預測提供了有效的解決方案。
關鍵詞:造紙廢水過程處理;數據降維;長短期記憶網絡;集成學習;軟測量模型
中圖分類號:TS736+. 4 文獻標識碼:A DOI:10. 11981/j. issn. 1000?6842. 2025. 02. 173
隨著我國經濟快速增長和社會生活水平提高,人們對紙制品的需求不斷增加[1-2]。根據中國造紙協會的調查數據顯示,截至2024年,全國約有2 600家紙和紙板生產企業,2024 年全國紙及紙板的生產量達13 625 萬 t,較 2023 年增長了 5.09%。制漿造紙過程需消耗大量能源和水資源,并產生一定廢水和固體廢物。隨著紙制品生產規模的擴大,造紙過程所帶來的環境污染問題也日益凸顯。
制漿造紙企業通常采用一系列設備和方法監測造紙廢水化學需氧量 (chemical oxygen demand,COD)和生物需氧量(biological oxygen demand,BOD)等出水指標。在線監測[3]、定期取樣分析等傳統的監測方法存在數據延遲、人為誤差等缺點,缺乏準確性和實時性[4]。相較而言,軟測量模型作為一種新興的監測技術,具有實時性強、成本低、準確性高、智能化程度高等優勢[5],已逐步被應用于造紙廢水出水指標的監測分析。……