陳 威 陳會娟 沈 彥
1.上海市城市建設設計研究總院(集團)有限公司 上海 200125
2.上海西派埃智能化系統有限公司 上海 200233
曝氣生物濾池(Biological Aerated Filter,簡稱BAF)工藝是一種生物膜法污水處理工藝,具有去除COD、SS、脫氮、除磷的作用,因而得到廣泛應用。但在這一方法中,需為生物濾池提供適量的氧氣以降解污水中的有機物,生物曝氣量是污水處理廠能耗的主要來源,也是導致污水處理廠高能耗的重要因素之一,因此,生物濾池曝氣量優化預測對污水處理工藝優化運行及節能降耗具有重要的意義。
目前國內外學者所提控制方法主要包括傳統的人工就地控制、衡量控制、溶解氧-閥門PID (Proportion-Integral-Differential, PID) 及模糊控制、專家控制等智能控制技術[1~3]。但傳統的生物曝氣控制過程中溶解氧(Dissolved Oxygen, DO)波動較大、閥門調節頻率高,不但造成出水水質不穩定,而且造成了曝氣量浪費;模糊控制和專家控制是基于模糊數學知識或專家知識將經驗轉化成相應控制規則,進而用這些規則去控制系統,該方法在一定程度上可以減少DO波動,但存在鼓風機或閥門頻繁調節問題。隨著人工智能技術的逐步發展,國內外專家學者提出了人工神經網絡、模糊神經網絡、支持向量機(Support Vector Machine,SVM)等一些不依賴與數學模型的控制方法[4~8],該方法具有較強的自適應學習能力和非線性映射能力,其在污水處理仿真預測和實時控制等領域的應用也越來越廣泛,為污水處理廠優化運行提供指導。本文以某污水處理廠曝氣生物濾池工藝運行數據為依據,考慮與曝氣生物濾池密切相關的5個因素,包括進水COD、進水氨氮、生物濾池流量、溶解氧、濾池壓力參數,采用支持向量機回歸(Support Vector Regression, SVR)方法建立生物濾池曝氣量預測模型,為污水處理工藝的優化、高效和穩定運行提供理論指導。
某污水處理廠采用曝氣生物濾池工藝對城市生活污水進行處理,采用前置反硝化工藝,分DN池、CN池兩級,DN池和CN池各包含12格濾池。來水進入DN池后,被均勻地分配至每格濾池的配水室,由長柄濾頭的分配通過濾板、承托層及濾料,與生物膜充分接觸,降解含碳有機物;DN池出水進入CN池,CN池以相同的過濾方式進行濾水,但不同于DN池的是CN池是好氧濾池,采用管式曝氣器進行曝氣,現場布置12臺羅茨風機為CN池曝氣提供氣源,每臺風機供應1格濾池,且采用變頻調速控制。生物濾池過濾一段時間后,為提升濾池過濾效果,需對濾池進行反沖洗。在CN池和DN池,均安裝壓力表,以檢測濾層過濾阻力。基于曝氣生物濾池工藝原理,收集該污水處理廠2020.11~2021.4月半年的進水COD、進水氨氮、生物濾池流量、DO、CN池壓力、風機頻率、曝氣量數據,共43533組,如圖1~4所示。
由圖1~圖4可知,由于污水處理進水沖擊、生物濾池反沖洗、現場儀表等多方面因素的影響,所采集進水COD和氨氮數據有突然增高的異常值,DO、進水流量、曝氣風量和風機頻率受反沖洗過程的影響,風機需關閉,存在較多0值,因此,在建模之前,需對上述數據進行清理,利用清理后的數據建立相應模型。本文針對現場工藝情況,確定進水COD參數范圍為50~350mg/L,進水氨氮參數范圍為5~50mg/L,進水流量參數范圍為200~650m3/h,清除了該范圍外的異常數據,同時對反沖洗過程造成的波動數據進行了清除,數據處理之后的數據量為21642組。

圖1 污水處理廠進水COD和氨氮變化示意圖

圖4 羅茨風機頻率和曝氣量變化示意圖

圖2 濾池進水流量和DO變化示意圖

圖3 CN池壓力變化示意圖
基于數據清理之后的曝氣生物濾池工藝運行數據,以7:3的比例將數據劃分為訓練集和測試集,基于訓練集數據,以進水COD、進水氨氮、生物濾池流量、DO、CN池壓力為輸入參數,曝氣量為輸出參數,采用SVM方法建立曝氣量預測模型。
支持向量機是一類按監督學習方式對數據進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面,該方法使用鉸鏈損失函數計算經驗風險并在求解系統中加入了正則化項以優化結構風險,是一個具有稀疏性和穩健性的分類器[9,10]。而對于非線性問題,需在特征空間中尋找一個最優的分類超曲面將兩類數據樣本分開,通過引入核函數的方式,可通過一個非線性映射函數將原始問題的特征空間映射到具有更高維度的希爾伯特空間,進而將非線性問題轉化為線性可分問題[11]。支持向量機由分類問題推廣到回歸問題即支持向量機回歸(Support Vector Regression, SVR)。
對于本文所研究問題,訓練集T={(xi, yi), i=1,2,…,n},其中xi∈Rd,即數據為d維,xi對應上述的進水COD、進水氨氮、生物濾池流量、DO、CN池壓力輸入參數組成的自變量矩陣;yi∈R對應上述的曝氣量組成的因變量矩陣;n為樣本的組數。上述SVR為凸二次規劃尋優對偶問題,其表達式為:


b0可根據下式解出:

基于支持向量機原理,利用Python 編程語言機器學習庫Scikit-learn中的SVR算法建立曝氣量預測模型。其中核函數選擇徑向基核函數,核函數對應的超參數σ、懲罰因子C和不敏感系數根據模型訓練情況確定。訓練過程中,懲罰因子C的范圍設置為[1.0~50],步長為1.0;核函數超參數σ范圍為[0.1~10],步長為0.1;不敏感系數范圍為[0.001,3],步長為0.01;利用網絡搜索法進行參數尋優,以使訓練樣本均方根誤差最小,即:

式中,f(xi)為預測值(回歸值),yi是樣本原始值。
通過對訓練集進行不斷訓練和尋優,確定σ參數為0.2,C為1.0,為0.01,此時曝氣量預測值和實測值平均誤差為1.76%,變化曲線如圖5所示。

圖5 曝氣量預測結果(訓練集)
基于訓練集所訓練模型,利用預測集樣本對所建模型準確性進行驗證。將模型預測曝氣量與現場實測結果進行對比,結果如圖6所示。由圖6可知,模型預測曝氣量與實測結果吻合較好,其曝氣量實測值和預測值誤差在4.1%范圍內,驗證了所建模型的準確性。

圖6 曝氣量預測結果(預測集)
基于本文所建模型即可對污水處理廠曝氣生物濾池運行過程中的曝氣量進行預測,預測結果為污水處理工藝的優化、高效和穩定運行提供理論指導。
(1) 基于污水處理曝氣生物濾池工藝技術原理,考慮與曝氣生物濾池密切相關的5個因素,包括進水COD、進水氨氮、生物濾池流量、溶解氧(DO)、濾池壓力參數,采用支持向量機回歸方法建立污水處理曝氣量預測模型。
(2) 所建模型預測曝氣量與實測結果相吻合,曝氣量預測誤差在4.1%范圍內,具有較高的準確性。
(3) 利用所建模型可對污水處理廠曝氣生物濾池運行過程中的曝氣量進行預測,為污水處理工藝的優化、高效和穩定運行提供理論指導。