周忠冉,顧亞林,張俊杰
(南京南瑞信息通信科技有限公司,江蘇,南京 210003)
現有的基于云計算架構的電力物聯網會將這些數據全部傳入云端進行數據分析和處理,這不但會使云端背負較大的計算壓力,也會給數據傳輸路線造成巨大的寬帶負擔,因而這種模式已經無法滿足行業日益増長的數據處理需求[1-2]。本文基于邊緣計算架構設計了一種基于云邊協同架構的電力物聯網數據分類處理方法。本方法把在邊緣層匯總收集的原始數據利用隨機森林算法進行分類和處理,并反饋處理結果,相比較于傳統的云中心架構的電網數據處理方法,本方法提升了數據處理的速度,同時又避免了將數據上傳和等待數據返回的延遲,達到了對數據的快速響應。

(1)
其中,函數f(dj)為統計dj出現次數[3-5]。
數據集X依據第j個屬性劃分的對應基尼系數公式為
(2)
其中,|X|是集合X中元素的個數。
選擇對應基尼系數最小的第j個屬性作為其數據集分裂的依據進行分割數據集。
結合粒子群算法思想,選取CART樹的數量T以及數據子集大小k的最優解,縮短模型訓練時間,提升模型檢測準確率[6],每個粒子包含兩個屬性,分別為速度v和位置p。
假設對T和k進行初始化的次數為A,粒子空間維度為B,在該粒子空間中,每個粒子在解空間中單獨搜尋最優解,將其作為個體極值,則第a個粒子的個體極值表示為Pa={vab,pab},其中a=1,2,…,A,b=1,2,…,B。Pa通過學習自身歷史經驗和種群全體歷史經驗,更新速度v和位置p數值,第a個粒子更新的va和pa[7]表示為

βrandom(vab)(Pab-pab)
(3)
Pab=pab+vab
(4)

引入袋外數據誤差εodb來找到最優解,記為Pbest,對應的εodb表達式為
(5)
其中,εi表示第i棵CART樹的袋外誤差。由于隨機森林構建每一棵CART樹都是在數據集中選取一個子集進行構建,因此余下的數據集可以作為驗證數據集去評估該棵CART樹[8]。袋外誤差率在一定程度上可以體現隨機森林的分類準確率。
參數優化流程如下所示。
第一步 初始化次數為A,粒子空間維度為B,每個粒子初始速度和位置分別為va和pa。
第二步 將每個粒子帶入隨機森林模型,計算εodb。
第三步 對于粒子Pa,如果其對應的εodb 第四步 返回第二步,直到滿足最大迭代次數。 當獲取最佳CART樹的數量T以及數據子集大小k后,可以根據該參數構建隨機森林模型。 LSTM在RNN的基礎之上增加了一個長期狀態c來保存長期狀態,解決了梯度消失問題,非常適合處理時間序列的分類問題[9]。 LSTM神經單元的計算公式如下: ct=sigmod(ft)×ct-1+sigmod(it)×tanh(ct) (6) ht=sigmod(ot)×tanh(ct) (7) FCN將傳統CNN中的連接層全轉化成多個卷積層,故稱為全卷積網絡。當卷積層的層數為L,X為長度為F0且時間步長為t的特征輸入向量時,每層的濾波公式為 (8) 其中,l為當前的層數,Wl∈RFl×d×Fl-1為張量,bl∈RFl為偏置值,d為過濾持續時間,f(·)為校正線性單元。 LSTM-FCN通過在LSTM中加入注意機制,實現了LSTM-RNN中很難學習到的長時間依賴項,其架構如圖1所示。 圖1 LSTM-FCN 結構 本文提出的方法架構如圖2所示,分為設備層、邊緣層和云端層。設備層包含各個產生數據的設備終端,負責收集數據,進行數據預處理并將其發送到邊緣層;邊緣層為部署在設備層附近的數據處理器,其靠近設備終端,實時匯總預處理數據,就近提供數據處理等服務。通過改進的隨機森林模型將其分為正常上載數據和待處理數據,之后將正常上載數據和待處理數據的結果反饋給設備,實現設備的實時檢測。同時,將待處理數據上傳到云端層。在云端利用Bi-LSTM數據分類模型對這些數據進行分類存儲,利用大數據和專家系統進行全網的設備分析和用戶用量等的分析,再將分析結果下傳到對應的邊緣層,對涉及到的設備進行優化處理。 圖2 基于云邊協同架構的電力物聯網數據分類處理方法架構 在電力物聯網中,需要在邊緣層對數據進行處理,快速判斷設備的運行狀態并對其進行故障檢測,完成對異常情況的及時處理,防止更大的故障出現。而電表中的數據通常用于進行用量分析和需求分析,必須結合全網的數據進行分析,需要傳輸到云端層后進行處理[10]。 因此,設備層實時采集和匯總原始數據D后,對其進行數據預處理得到D′。根據數據的來源,邊緣層首先將數據進行初步分類,判斷數據是否為異常數據,將其分為正常上載數據UpD和待處理數據PeD。邊緣層直接將上載數據上傳到云端層進行進一步分類分析,同時將異常結果反饋給設備層,實現實時檢測。 對于獲得的預處理數據D′,在邊緣層使用優化的隨機森林進行故障檢測,偽代碼如圖2 所示。對數據D′采用滑動窗口方式進行特征提取,利用Bagging方法從原始數據集中隨機抽取訓練數據子集訓練T棵CART樹,利用測試數據集進行測試,輸出結果為綜合T棵CART樹的分類結果。完成后將故障檢測結果下傳到設備層,并將待處理數據PeD={Time,Type,Data},打包發送到云端層。 算法1 隨機森林故障檢測模型 圖2 故障檢測模型 在云端層,接收到來自邊緣層處理數據PeD,需要對這些數據進行分類存儲以便于之后的大數據分析。本文采用LSTM-FCN對數據進行分類,分類過程如下。 (1) 輸入數據傳入時間卷積塊,數據在塊中先通過時間卷積層,再使用批量歸一化,之后通過ReLU激活函數得到該塊的輸出,輸出再作為輸入傳送到下一個卷積塊,重復2次上述過程。 (2) 經過3個堆疊的時間卷積塊的數據進入全局平均池化層。 (3) 輸入數據同時被送入維度混洗層(dimension shuffle layer),之后將變幻后的數據輸入到由BasicLSTM和Attention LSTM組成的LSTM塊中,之后經過Dropout。 (4) 將全局平均池化層和LSTM塊的輸出進行串聯,發送到softmax分類層進行分類,得到分類結果。 實驗數據選取江蘇某市變電站2019年的數據作為樣本數據集,其中70%的數據作為訓練集,剩下30%作為測試集。為了驗證算法的性能,選取變電站1—6月的數據,選用SVM 方法、貝葉斯和本文的隨機森林模型算法進行比較,比較結果如圖3所示。 圖3 算法性能比較測試 從圖3可以看出,本文的隨機森林算法在準確率上基本優于其他2個算法,平均準確率在93%左右。 為驗證云端數據分類模型的性能,選取變電站2019年7月的數據,分成數量大小為50、100、150、200、250的數據集,使用本文的LSTM-FCN和傳統的LSTM、FCN進行比較,如圖4所示。從圖4可以看出,本文的LSTM-FCN算法在準確率上基本優于其他2個算法,平均準確率在94%左右。 圖4 算法準確率比較測試 選取變電站2019年1—5月的數據,分別分成5個數據集,使用本文的LSTM-FCN和傳統的LSTM、FCN進行比較,如圖5所示。從圖5可以看出,本文的LSTM-FCN算法在準確率上基本優于其他2個算法,平均準確率在94%左右。 圖5 算法準確率對比測試 現有的電力物聯網技術無法滿足行業日益増長的數據處理需求,本文基于電力物聯網架構云邊架構,設計了一種基于云邊協同架構的電力物聯網數據分類處理模型方法,利用隨機森林算法對感知層數據進行實時分類和處理,在云端層利用LSTM-FCN數據分類模型對這些數據進行分類存儲,測試結果證明了該模型方法具有較好的實用價值。下一步將針對低帶寬、長時延場景下的云邊協同數據處理技術進行研究,完善云邊協同模型,更好地支撐電力智慧物聯體系建設。1.3 LSTM-FCN

2 模型構建
2.1 模型架構

2.2 邊緣層數據分類
2.3 邊緣層故障檢測

2.4 云端數據分類
3 實驗驗證



4 總結