崔心惠,李文萱,朱山川,張祝威
(1.滁州職業技術學院電氣工程學院,安徽滁州 239000;2.南京電研電力自動化股份有限公司,江蘇南京 210000)
水污染導致日益凸顯的生態環境問題,已成為危害國民生命健康的關鍵問題之一[1]. 城市污水處理總量在人口不斷增長和經濟快速發展的過程中持續攀升,與此同時節能環保政策的實施力度也加大了對出水水質的嚴格把控. 由此可見,城市生活污水治理問題的好壞是決定人類未來生態環境質量高低的直接因素,而污水處理可有效緩解水資源匱乏以及減少環境污染問題. 在污水處理過程中廣受學者關注的一種生物處理技術稱為活性污泥法,其中溶解氧濃度(DO)、生化需氧量(BOD)、氨氮、化學需氧量(COD)等多種過程參數均是衡量污水處理過程中的重要指標. 因此,如何保證出水水質滿足污水排放要求并且盡可能地降低運行能源損失,就成為污水處理優化控制中亟待解決的問題[2-7].
針對污水處理過程中溶解氧控制問題,曹守啟等[8]利用粒子群優化算法對模糊參數進行修正進而提出一種溶解氧調控系統,對溶解氧的調控較其他算法更穩定,具有超調量低、響應速度更快的特點.而在污水處理過程中,缺氧和好氧環境并存且缺氧池的反硝化反應對出水水質的濃度有著直接影響,其中硝態氮是作為評估脫氮效果的重要指標. 因此,控制硝態氮濃度在合理的區域內,是進一步提高出水水質和降低能耗的前提. 無疑,污水處理優化控制的目的是在眾多受到排放指標限制且不斷變化的重要水質參數的約束條件下實現節能降耗,所以多目標優化控制在強耦合污水處理過程中的研究至關重要[9-10].
城市污水處理過程的多目標優化問題中,包含多個相制約、相耦合、甚至相矛盾的待優化的子目標. 其本質是以問題為基點,模擬生物演化規律和機理. 目前群智能優化算法因其固有的并行搜索能力逐漸被應用于求解復雜問題. 趙楊等[11]為了改善出水水質不達標和能耗過高問題,從變異策略和參數更新兩個方面對差分進化算法進行改進,提升了Pareto 解的多樣化,可有效滿足優化控制要求. 在多變量優化控制中,盧薇[12]將動態慣性權重加入多目標粒子群(MOPSO)算法,既能使局部和全局之間搜索能力達到平衡,還能提升了算法的收斂速度以及精度;將算法用于BSM1 仿真模型后,實現了出水水質濃度和能耗的有效降低,表明該方法具有良好的優化控制性能. 張璐等[13]提出了一種動態分解多目標粒子群優化控制策略(OC-DDMOPSO)來獲取操縱變量最優設定值,在自適應核函數的性能指標模型基礎上,達到污水處理過程優化控制目的,并在BSM1 仿真平臺上驗證可以實現改進水質、減小能耗效果. 趙小強等[14]提出一種改進的多目標布谷鳥算法對溶解氧以及硝態氮參數進行尋優,既增加種群多樣性,又提高了跳出局部最優的可能性,實驗證明該方法滿足降低能耗要求. 然而,通過多目標控制策略來獲取精準的控制變量優化設定值仍需進一步加強,所以針對具有挑戰性的污水處理過程中的多目標優化問題,本文引入貪婪機制和擁擠度計算對海洋捕食者算法進行改進,將盡可能多的解均勻覆蓋在Pareto 前沿,從而獲取最優溶解氧和硝態氮濃度設定值,采用PID 控制器對其進行跟蹤控制,解決多目標污水處理優化控制難的問題.
污水處理過程是一個動態、時滯、強耦合的非線性系統.微小的輸入波動都可能導致系統的輸出偏離,其中污水進水流量、污染組分繁雜以及各成分含量不穩定、污染負荷變化不確定、雷暴雨環境等都是造成污水處理過程龐雜的直接因素.如何對這些變量給予更好的評估且為污水處理系統提供更好的控制策略尤為重要.由此,歐盟科學技術與合作組織(COST)及國際水協會(IWA)共同定義并研發了“仿真基準模型”(Benchmark Simulation Model No.1,BSM1)[15-16],該模型專注于污水處理中各因素的動態變化模擬過程,其結構布局如圖1所示.生化反應池和二沉池組成主體結構,前者池內發生的反應用活性污泥ASM1模型來進行模擬,將整個生化反應池分為五個單元,分別為兩個容積為1 000 m3的缺氧池單元和三個容積為1 333 m3的好氧池單元;后者則利用二次指數沉淀速率來模擬污水的固液分離過程.經過生化反應池處理后的混合液,部分回流至第一單元,保證了曝氣池中懸浮物濃度一定,維持活性污泥系統穩定運行[17];剩余的通過二沉池進行上層清水的排除和下層底部污泥的少量排出.

圖1 BSM1模型結構布局
ASM1 內含13 種物質組分和8 個生化反應過程,充分呈現污水處理動態反應的機理特征. 由于過高的氮元素是導致水體富營養化的直接因素,水體污染對人類生活、生產發展以及生態發展起到一定的制約作用. 在生化反應池中,缺氧和好氧兩部分分別進行反硝化和硝化反應,主要目的是對導致水體富營養化的氮元素進行轉化,達到提升水質的效果.
缺氧池中的硝態氮是由好氧池中反應生成的硝態氮通過混合液回流而來,到達缺氧池后與進水流量匯集并于池中開始反硝化反應. 因此,有效控制好氧池的回流量是保證缺氧池中硝態氮在合理范圍值內且出水總氮達到排放要求的前提[18]. 回流量過大會促使缺氧池內的硝態氮濃度增加,同時可生物降解有機物的濃度會有所降低,減弱反硝化能力;回流量過小影響可生物降解有機物能力而無法充分反應. 在好氧池中,硝化菌把氧作為電子受體完成硝化反應去除水體中的氨氮. 溶解氧過低致使電子受體不足抑制硝化反應,此時絲狀菌將會迅速繁殖加速污泥膨脹;溶解氧濃度過高時會出現兩種情況:一是持續的鼓風機曝氣帶來的過度能耗損失,二是混合液回流中摻雜的溶解氧對缺氧池內反應環境的改變. 在此期間,曝氣能耗不僅影響溶解氧濃度還占污水處理廠總能耗的60%以上[19]. 所以通過適當調節曝氣量來控制溶解氧濃度是保證硝化反應正常進行以及降低能耗的關鍵手段.
實際的工程領域中,往往需要求解的問題不止一個. 而污水處理過程的優化控制目的是在出水水質滿足規定排放要求下盡可能地縮減能耗. 若要達到出水水質的正常排放要求,電氣控制設備需要長期運行進而導致能耗的增加;若要能耗盡可能的達到最少,意味反應過程的不完全,即出水水質超出規定值進而造成罰款. 這是一組相互矛盾的目標指標,需要對其建模來實現進一步分析. 該模型主要存在兩個方面的能耗,分別為曝氣能耗(Aeration Energy)和泵送能耗(Pumping Energy). 將能耗模型優化定義為[20]:

其中:EC代表總能耗,AE代表曝氣過程產生的能耗即曝氣能耗,PE代表運送污泥所產生的能耗即泵送能耗. 根據污水處理過程中的模型參數和反應變量,AE和PE分別定義為[20]:


其中:t0為開始時間,tf為結束時間,T為采樣周期,Vi為第i個生化反應單元的體積,KLai為第i個生化反應單元的曝氣量,SO,sat為溶解氧飽和濃度,Qa為內回流流量,Qr為外回流流量,Qw為剩余污泥流量.
活性污泥法的出水水質是對污水處理過程的除污效果的綜合性評價指標,也是對受納水體排放污染物所需支付的費用.EQ值越小,表征出水水質越好且所需處理費用更少,按基準定義如下[20]:

式中:SSe(t)為第t時刻出水固體懸浮物濃度;CODe(t)為第t時刻出水化學需氧量濃度;SNkj,e(t)為第t時刻出水凱氏氮濃度;SNO,e(t)為第t時刻出水硝態氮濃度;BODe(t)為第t時刻出水生化需氧量濃度.
由算式(1)-(4)可知,EC與KLai和Qa有關,EQ與五種出水水質參數化有關. 好氧池中的溶解氧濃度SO大小由KLai決定,缺氧池中硝態氮濃度SNO由Qa決定. 恰當的SO既能保證好氧區的微生物充分吸附和氧化分解有機污染物,還能降低曝氣能耗.同樣,恰當的SNO不僅可以保證反硝化反應的順序進行,達到良好的脫氮效果,還降低了泵送能耗. 由于污水處理中的能耗和出水水質指標的優化問題實質上歸類于多目標優化問題,設x1為溶解氧濃度設定值,x2為硝態氮濃度設定值,x=[x1,x2]是兩個尋優設定值形成的組合向量,fEQ和fEC分別為優化向量間的函數表達式.污水處理優化多目標可描述為:

其中:Ntot為總氮濃度,SNH為氨氮濃度. 在滿足上述約束條件外,還需要對優化設定的溶解氧濃度值和硝態氮值進行上下限值,由此建立多目標最小化問題.
海洋捕食者算法(Marine Predators Algorithm,MPA)是由Faramarzi等人于2020年根據海洋適者生存理論提出的一種高效元啟發算法[21]. 海洋捕食者通過交替的Lévy 和布朗游走選擇出最優的覓食策略. 首先需要將獵物位置進行初始化并均勻分布于搜索空間[22],數學描述如下:

式中Xmax、Xmin為搜索空間范圍.
根據捕食者和獵物相遇時的速度比將MPA 分為三個階段.
階段1:捕食者運動速度大于獵物速度時(V≥10)為迭代初期,此時捕食者處于勘探策略基本不動,數學模型如下:

階段2:捕食者與獵物運動速度相同時(V=1)為迭代中期,此階段勘探和開發的重要性并存. 獵物以Lévy 游走策略負責開發而捕食者以布朗運動負責勘探,數學描述如下:

式中:RL為Lévy 分布的隨機向量,CF為控制捕食者移動步長的自適應參數,滿足CF=(1-Iter/Max_Iter)2×Iter/Max_Iter.
階段3:捕食者比獵物移動速度慢時(V=0.1)為迭代中期,此時捕食者處于Lévy 運動開發策略.數學描述如下:

除上述階段外,魚類聚集裝置(FADs)或渦流效應也會對捕食者覓食行為產生影響.這使得MPA在尋優過程中可及時跳出局部,降低早熟收斂發生的概率.其數學描述如下:

式中:FADs=0.2,表示受到FADs影響的概率;U為隨機生成的向量數組,若數組小于0.2則將其更改為0,反之改為1;r為[0,1]內隨機數;r1、r2為獵物矩陣的隨機索引.
工程領域絕大部分問題都是由多個目標函數組成,僅依靠某一個最優目標值決定優劣關系是不合理的. 通過比較非支配排序關系可把種群中所存在的不被其他任何個體支配的解集放在目標空間映射中形成Pareto 前沿. 由于海洋捕食者算法在迭代尋優Pareto 解的過程中易出現收斂速度較慢且尋優過程穩定性不足等問題,本文從解集選擇上引入貪婪策略和擁擠度計算對標準海洋捕食者算法進行改進.
貪婪策略是在迭代過程中選擇出當前最優解并將其與上一次最優解進行比較從而獲得全局最優解的過程. 而Pareto 前沿是全局解與局部解并存形成的,二者僅在非支配范圍有所區分. 前者在所屬完整決策空間內是Pareto 非支配,后者在其鄰域范圍內是Pareto 非支配. 貪婪策略通過對非支配最優解的比較、存儲以及更新獲取一組非支配最優解. 更新如下:
(1)若當前迭代中產生一組新解比存檔中的解更好,則當前解可輸入存儲.
(2)若種群更新后的新解支配存檔空間內的一個或多個解,應將存檔中被支配的解刪除并替換為該新解.
(3)若種群更新后的新解與存檔中的解為非支配關系,則新解決也應作為Pareto 解中的一員添加到存檔中.
上述存檔更新確保了所有解都領先于其他解.當存檔容量不足時,若仍有新解滿足更新標準,該解將無法進行存儲進而導致最優解的丟失. 此時,需在存檔中隨機刪除一個解. 考慮到移除其他解的過程應對Pareto 解集分布的均勻性影響最小,本文采取對每個解都考慮一個預定義的距離,通過計算該距離內解的數量來衡量其各自的擁擠度.計算式為:

假設圖中小圓為存檔中任意解,計算其固定距離范圍內解的數量并對數量進行排序. 若數值越多則解所在區域擁擠度較高,應首選為需要待消除的解[23]. 反之,意味擁擠度較小,需要盡可能保存此類解,而擁堵最少的區域應只有一個解,具體如圖2所示.

圖2 移除最佳解過程圖
最后根據擁擠程度用輪盤賭的方法選擇其中一個待消除的解.每個解被選擇的概率公式為:

其中:K>1,Ni表示存檔中第i個解的相鄰解的數量,Pi表示第i個解被選擇的概率.
新舊解更替增加了種群多樣性,擴大了跳出局部解的概率,并加快了算法收斂速度.圖3是多目標海洋捕食者算法流程圖.

圖3 多目標海洋捕食者算法流程圖
選擇合適的函數對優化算法的性能和有效性進行測試是必不可少的重要環節. 本文選取CEC2019多模態多目標基準函數中的6個函數對MOMPA 算法尋優過程中的性能進行驗證,并用MOMPA 算法中的反世代距離(Inverted Generational Distance,IGD)和Pareto 鄰近度倒數(the reciprocal of Pareto proximity,rPSP)指標作為多目標優化算法的評估標準.IGD指標值越小表明Pareto 前沿所求值與真實值相接近,多目標優化算法的多樣性和收斂性越好. 反之,表明兩值相差遠,偏離大,分布性較差. 公式如下[24-25]:

式中:P★為優化算法所求的近似Pareto 前沿,P為真實Pareto 前沿,mindis(x,P)為x和P的最小歐式距離. 而rPSP則反映了計算和真實的Pareto 解之間的收斂性和覆蓋率. 從CEC2019 系列中選出6 種測試函數參數信息如表1所示.

表1 6種CEC2019測試函數參數信息
將多目標海洋捕食者算法與其他幾種優化算法進行對比,具體參數設置如表2所示.

表2 不同多目標優化算法的參數設置
為了更形象地對比各算法在CEC2019 測試函數上的逼近效果,選取測試函數中具有代表性的雙目標測試函數MMF8 和三目標測試函數MMF15 來進一步說明各算法收斂效果. 本次算法將單獨運行20次,迭代100次,其收斂圖如圖4和圖5所示.
從圖4和圖5可以看出,在雙目標和三目標測試函數上,MOMPA 算法尋優的解在Pareto 前沿上分布較為勻稱且覆蓋率更廣,保證了解的多樣性且均能獲得最優解;同時與標準Pareto 最優解數值相接近,能夠收斂于Pareto 前沿. 因此,MOMPA 算法可在解集中獲取范圍、質量以及分布上更好地解來解決多目標問題,給出水水質達標和能耗最小值提供了更最多選擇的可能性.

圖4 不同算法在MMF8上Pareto最優解集

圖5 不同算法在MMF15上Pareto最優解集
MOMPA 與 MOPSO、MODA、MOALO、MOMVO 和MSSA 算法在測試函數中的IGD和rPSP值如表3 和表4 所示. 從表3 和表4 的測試結果可以看出,本文所提出的MOMPA 算法整體IGD 均值和方差在MMF1、MMF2、MMF3、MMF8、MMF12都優于MOEA/D、MODA、MOALO、MOMVO、MSSA,雖然在MMF15 上略有不足但相差甚微. 在rPSP數值中,MOMPA和MOEA/D表現出較好的解的覆蓋率,二者對比下MOMPA 的rPSP指標更小且滿足大部分測試函數. 以上分析表明,MOMPA 算法在收斂性和多樣性上具有一定的優越性.

表3 不同優化算法的IGD值

表4 不同優化算法的rPSP值
為了驗證MOMPA 的有效性,將該算法應用于BSM1 仿真平臺,設置總的優化周期為14 d,性能指標優化周期為2 h,每個采樣間隔為15 min. 選取仿真數據分別是晴天、雨天和暴雨天下的污水數據.其中SO和SNO的優化范圍分別是0 ~2.5 mg/L 和0 ~2 mg/L.圖7給出MOMPA算法在晴天數據下對污水處理中SO和SNO優化控制曲線和誤差圖.
從圖7 可看出,在晴天天氣下,出水水質指標相對來說變化過程較平穩. 多目標海洋捕食者優化算法根據系統實際運行狀態呈現良好的跟蹤控制效果,跟蹤軌跡和設定值變化過程基本吻合,出水水質參數整體排放濃度的平均值在污水排放指標范圍內,達到了污水處理過程中的約束條件,驗證了MOMPA 在污水處理優化中的優越性,是進一步確保能耗達到最佳處理效果的先決條件.

圖7 晴天SO、SNO優化控制曲線和誤差圖
污水處理是一個動態的、強耦合的多變量多目標復雜系統,多目標優化污水處理問題解決的是可同時獲取使能耗和出水水質達到最佳效果的解. 針對二者組合優化問題,提出一種多目標海洋捕食者算法的污水處理優化控制方法,通過機理分析和仿真實驗得出結論有:
(1)鑒于海洋捕食者算法在迭代中不易跳出局部最優致使全局搜索能力受到限制,在保證MPA 算法本身機制的同時引入貪婪策略來保存尋優過程中發現的最佳非支配解,并通過擁擠度的計算對比將更優的解與內部存檔中的最優解進行更替,提出了一種多目標海洋捕食者算法,使得解集均勻分布在Pareto 前沿,有助于提高解的覆蓋率;用CEC2019測試函數驗證MOMPA 算法性能的有效性且提高了算法的收斂速度.
(2)在BSM1仿真平臺上,通過MOMPA 算法對污水處理過程中的SO與SNO的設定值不斷尋優,結果表明MOMPA 算法與其他算法相比具有很強的競爭力,不僅使得污水處理中出水水質達到排放要求而且能耗顯著降低.