劉忠輝 ,蔡高琰 ,梁炳基 ,駱德漢 ,何家峰
(1.廣東工業大學 信息工程學院,廣東 廣州510006;2.廣東浩迪創新科技有限公司,廣東 佛山528200)
目前國內外對污染物排放的監測主要是在各個環節安裝多種不同的傳感器,然后對每個環節的多個參數進行采集分析[1-3]。 針對不同的產污企業,各個環節需放置污染物監測傳感器可能不同,通過收集對比各傳感器的數據是否達到國家排放標準[4],來確定產污企業的治污效果是否達標。 當前傳統的監測手段存在幾個問題:一是企業排污管道、生產環節等環境復雜[5],設備安裝困難且容易失效;二是傳感器易受外界影響,加大水/風量都會使監測結果出現重大偏差,且復雜的系統結構容易出現通信等故障導致測量失靈[6];三是成本較高。 在這幾個問題的影響下,傳統監測系統難以推廣。 因此尋找一種既能減少或者杜絕人為因素干擾造成監測失效,又可降低安裝運行成本的解決方案是本文最主要的目的。 本文利用智能電表對用電數據進行采集與處理,結合機器學習中的誤差反向傳播神經網絡算法[7-8]構建工業用電設備分類模型,對設備進行啟停分析與遠程在線監管,實現了對工業環境下用電設備的監測,大大加強了監測的力度以及范圍,且具有低成本、易于推廣的優勢。
智能電表是建立在電子式電表的基礎之上的。隨著全球性智能電網建設的開始,電表不再僅作為單一計費儀表存在,而是向著智能化、系統化、模塊化和多元化的系統終端發展。 本方法使用的是通用型智能電表,具備對用電數據進行實時采集、分析、存儲等多種功能。 中央控制器MCU 采用HT6501,具有良好的計算能力和較快的處理速度,在智能電表領域十分常用。 其內核處理器采用ARM Cortex-M0,Flash、SRAM 分別為128 K、8 K,達到本方法的計算及存儲標準。計量芯片ATT7022E 采樣率高達14.4 kHz,用于對電流、電壓、功率等進行實時采集[9]。 本方法中智能電表的工作流程如圖1 所示。

圖1 電表工作流程
本方法中采用功率差值、電流時域差值、電流頻域特征作為用電設備的特征量,其中諧波系數采用快速傅里葉變換計算得到,并且考慮到智能電表的成本和多次實驗結論,此處采用電流前四項奇次諧波系數即可。 同時考慮到實際生產運行環境下要識別的用電設備電能參數較大,為減少不必要的數據上傳,此處設置電流波動閾值為1 A,即當電路中電流波動在1 A 的范圍內時,視為電路中正常波動,不做進一步處理,當電表檢測到電路中產生電流波動超過波動閾值,即視為電路中有用電設備的啟動或關停。

其中,I1表示功率波動前電路中的總電流,I2表示產生功率波動后的電路總電流,當ΔI 大于1 A,此時通過電流波動前后的兩個窗口計算出各類電能參數差值及電流前四項奇次諧波特征組成用電設備的特征矩陣。 同時,記錄時域電流的增減情況,當I2的幅值大于I1的幅值,此時電路中電流增大,表明有新用電設備啟動,當I2的幅值小于I1的幅值,此時電路中電流減小,表明電路中有用電設備關停,以此來判定產生的功率告警是用電設備的啟動或關停[10]。最后將諧波數據、電流增減標識、告警時間等相關電能參數進行信息組幀后上報至后臺服務器。
通過上述方法對不同用電設備的用電數據進行采集,并手動標記用電設備類型,建立用電設備特征數據集,用BP 神經網絡來構建識別分類模型,該模型參數較多,通過不斷地訓練和測試選擇合適的網絡層數、節點數、權值、激活函數等模型參數。以下為部分重點參數的選取過程:
(1)隱含層數確定:BP 神經網絡可以包含一至多個隱含層,經研究表明,3 層BP 神經網絡模型即可實現任意非線性映射,因此本方法在樣本數量不多的情況下選取的隱層數為1 層。
(2)各層神經元個數的確定:對于輸入層,由于用電設備特征向量的選擇有6 個維度,故而選取6個神經元;對于輸出層,采用“n-1”表示法,選取4個神經元,可以表示16 種分類標準,滿足實際環境的需要;對于隱含層,根據式(2)計算,選取4 個神經元。

式中,m 為輸入層節點數,p 為輸出層節點數,α為1 ~10 之間的常數。 最終網絡的拓撲結構如圖2所示。

圖2 BP 網絡拓撲結構
(3)轉移函數選取:由于每一層輸出都是上一層的線性函數,為了降低少量異常數據對分類結果的影響,采用單極性Sigmoid 函數作為轉移函數。
(4)初始權值的確定:BP 神經網絡采用反向誤差傳播算法不斷迭代更新確定最終的權值,因此需要給定一個初始值。初始值的選取對性能有一定影響,通常將其設置為一個較小的非零隨機數。 根據經驗值在區間(-2.4/N,2.4/N)中隨機選取,其中N為輸入端連接的節點個數。
(5)學習速率選擇:學習速率的初值一般在0 ~0.8 之間選擇,它將直接影響到整個網絡學習過程的速度、學習的穩定性,保證網絡能夠收斂于某個極小值。 如學習速率的值設定過大,訓練速度會加快,也會造成訓練結果不集中;如過小,則會使得學習時間過長,學習效率降低。
(6)全局誤差選擇:在BP 神經網絡運算時,輸出的結果與期望的結果進行對比,實際誤差與設定的誤差閾值對比,如果實際誤差小于誤差閾值則輸出,如果大于誤差閾值則返回繼續運算。 這個誤差閾值即是網絡全局誤差,它是網絡分類精度的衡量標準。 全局誤差較小, 則輸出結果少且精度高,但需進行循環計算量增大,會影響分類效率;全局誤差較大,則輸出多但精度不高,甚至在實際誤差遠遠小于全局誤差時, 神經網絡的運算過程無法完成,這時需要調整全局誤差。
理論研究表明,在隱含層神經元個數確定的情況下,存在一個最優的訓練次數。 為找出這個最優參數,本方法訓練時將訓練和測試交替進行,經過不斷分析和反復測試,得到兩種誤差曲線,如圖3 所示。

圖3 兩種數據誤差曲線
可以看出,當訓練次數在220 次左右時,訓練數據和測試數據的誤差都比較低,有較好的識別精度。故將上述最優訓練次數作為網絡學習的終止條件對數據進行BP 網絡訓練,最終網絡的其他各參數設置如下:初始權值p=0.1,學習速率因子η=0.6,給定網絡全局誤差E=0.05。 經過了220 次的學習,網絡模型收斂,獲得較好的分類結果。
根據相關環保部門要求,企業生產時的治污設備應該不晚于產污設備的開啟時間,停機時間應不早于產污設備停機時間,符合以上則是正常工作。通過對用電設備的精準識別,可以調庫對比設備啟停時間,分析企業是否按照要求正常工作。 如果有異常,則可以通過多種方式(短信、微信公眾號、手機終端等)將告警信息通知給產污企業或相關部門工作人員。
以實際生產情況下一個常見的情況為例進行闡述:假設佛山某印刷廠上午某時刻開啟了1 臺功率為36 kW 的印刷機,則要求在此或此前必須開啟了風機來進行污染物處理。 在整個生產過程中,若“治污設備運行時長”-“產污設備運行時長”≥δ(其中δ 為時間差, 要根據對應設備參數和國家標準確定),則表示是正常工作;若不滿足則平臺立刻產生告警信息并通知相關責任人,甚至可以根據實際要求對印刷機進行自動斷電處理。
根據實際生產環境, 在佛山市某汽車4S 店和印刷廠進行試點驗證。 主要生產設備有印刷機和汽車烤漆機、治污設備有風機和等離子設備及一些照明燈等其他背景負荷。 導出MongoDB 數據庫中的識別記錄分別如表1、表2 所示。
通過觀察表中記錄可以發現,該汽車4S 店10月21 日的設備啟停符合環保部門的要求,處于正常合法工作狀態。 該印刷廠10 月13 日設備的啟停符合環保部門的要求,可以判斷處于正常工作狀態。但是10 月14 日下午風機比印刷機先關閉,且風機運行總時間小于印刷機運行總時間,違反了環保部門的要求,可以判斷該廠生產處于非正常工作狀態,系統檢測到只有印刷機在運行時可以立刻上報告警信息。 通過調用后臺數據服務可以發現,該廠10 月13 日兩類設備運行時長一致,而10 月14 日產污設備比治污設備運行時間長,以作為監管部門的處罰依據。 后臺部分數據統計如圖4、圖5 所示。

表1 汽車4S 店設備識別記錄

圖4 汽車4S 店設備運行時長

圖5 印刷廠設備運行時長
基于電力數據分析的污染物排放檢測方法結合數據分析、機器學習等手段,可對排污單位的產污、治污和排污環節實施全過程監控。 通過分析污染源生產設備和治污設備的運行情況,實時掌握排污單位的生產狀況,以及進行停、限、錯峰生產等防控措施的執行情況。 通過進行聯動分析預警,及時發現排污單位環保違法違規行為,填補了環保局與企業之間的監管漏洞。 該研究為環境治理精準執法提供技術支撐,有助于降低環保部門的監管執法成本和工作壓力,對推動城市生產制造業的發展,提高城市污染治理水平,打好城市污染防治攻堅戰,打贏藍天保衛戰有重要的意義。

表2 印刷廠設備識別記錄