王計斌 陳大龍
南京華蘇科技有限公司
低壓配電系統作為與電力設備聯系最為密切的設備之一,其安全質量日益被人們所關注。為保證電力設備的正常運行和人們日常用電的安全性,必須提高相應的檢修技術。
低壓配電網與輸電網相比存在不少問題:運維人員水平參差不齊,對重要設備運行狀態和臺區內用戶用電情況缺乏主動感知的手段,運維工作停留在計劃檢修形式;由于缺乏數據收集的手段,無法建立信息化、智能化的運維體系;在配變側,變壓器、開關接點、綜合配電柜(JP柜)等缺乏負荷、動環監控方法,存在一定安全隱患,且設備運行壽命難以最優化;在線路側,低壓配電網線路故障難以有效排查和定位,缺乏智能化手段,人工巡檢工作量大、效率低,因多為事后響應,導致故障處理及時性效果有限;對于數據的處理缺乏現場一次設備的感知和狀態數據收集,因此無法對低壓配電線路/設備的狀態感知及異常進行精確定位;上層的生產管理系統無法實現運檢營銷數據的融合貫通,導致無法實現基于多元數據的故障研判、故障定位,在應用層加強大數據分析及應用,從傳統“被動搶修”變“主動運維”;目前低壓臺區拓撲還多以固定登記為主,沒有動態識別和分析。此外,配電房的安全管控也是以人工管理為主,并沒有引入先進的人工智能(Artificial Intelligence,AI)技術輔助決策和判斷。因此,低壓配電網運維體系的信息化、智能化改造需要更先進的技術手段來支撐,通過引進AI技術,結合物聯網監測、大數據分析、云計算等各種技術,為電力系統運維智能化提供相關技術支撐,實現供電服務能力和供電服務質量的提升。
高級計量架構(Advanced Metering Infrastructure,AMI)是智能電網的一個重要組成部分,它是集測量、采集、監控、存儲、分析、管理為一體的自動化及智能化的完整網絡和系統。系統支持國際電工委員會(International Electro technical Commission,IEC)國際標準的通信規約及轉發協議,涵蓋電網各種計量點及采集終端信息。通過對計量點(單三相智能電表)、智能開關、智能變壓器等的數據進行采集及用電監控,實時智能監控電網的電壓、電流、電能質量等供電可靠性的重要指標。
采用基于AMI系統采集的數據進行戶表關系拓撲識別,并在此基礎上開展線損分析及其它需求的管理應用,為整個電網的優化提供數據參考。通過AI算法對低壓配電臺區側各電力設備的拓撲關系識別。圖1為電力設備級聯關系圖,拓撲識別AI算法通過設備級聯關系實現拓撲識別過程。

圖1 電力設備級聯關系圖
出線柜與下級分支箱的拓撲識別算法如下:
步驟1:出線柜、分支箱、電表箱電流數據合集A,各分支箱采集的電流和的合集B;
步驟2:合集A中刪除分支箱電流以及小于合集B中最小值的電流數據形成合集C;
步驟3:合集C中各電流值依次與合集B電流值求差,并取最小的三個差值;
步驟4:依次反復求合集C與合集B最小差值形成方差合集D;
步驟5:按15min采集頻率,每天可采集96個點,先求方差合集D中平均值,再求取均方差;
步驟6:根據均方差中最小值確定該分支箱對應的上級出線柜(或分支箱);
步驟7:根據上下級關系,取某一時刻該分支箱進線電流值和對應上級電流值,若上級電流值為某分支箱分項電流值,則判定兩個分支箱級聯;若上級電流值不屬于任一分支箱分項電流值,則判定上級為出線柜。
分支箱與下級電表箱拓撲識別算法如下:
步驟1:合集A中刪除所有分支箱對應的上級出線柜(或分支箱)電流值,形成合集E;
步驟2:合集E中任意兩個電流輪流求差,E1、E2、EK差值合集數組;
步驟3:按15min采集頻率,每天可采集96個點,先求差值合集數組平均值,再求取均方差;根據均方差中最小值確定分支箱出線與電表箱的上下級關系。
如何識別單向電表是從屬于總表的哪個相位,這個問題在用戶集中的臺區尤待解決。通過不斷的設計和實驗,發現極端梯度提升(eXtreme Gradient Boosting,XGBoost)機器學習算法能夠有效解決這一問題。XGBoost是在梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)的基礎上對boosting方法進行的改進,內部決策樹使用的是回歸樹,特點在于能夠自動利用CPU的多線程進行并行計算,同時在算法上加以改進提高精度。
具體實現步驟如下:
(1)定義樹的復雜度。首先把樹拆分成結構部分q和葉子節點權重部分w,在這里w是一個向量,表示各葉子節點中的輸出值。

引入正則化項 來控制數的復雜度,從而實現有效的控制模型的過擬合。

(2)XGBoost中的Boosting Tree模型。與GBDT方法一樣,XGBoost的提升模型也是采用殘差,不同的是分裂結點選取的時候不一定是最小平方損失,其損失函數如下,較GBDT其根據樹模型的復雜度加入了一項正則化項:

(3)對目標函數進行改寫。在XGBoost中直接用泰勒展開式將損失函數展開成二項式函數(前提是損失函數一階、二階;連續可導),假設我們的葉節點區域為:

則我們的目標函數可以轉換成:

(4)樹結構的打分函數。上面的Obj值代表當指定一個樹結構時,在目標上面最多減少多少,我們可以把它稱為結構分數。對于求得Obj分數最小的樹結構,我們可以枚舉所有的可能性,然后對比結構分數來獲得最優的樹結構。然而這種方法計算消耗太大,更常用的是貪心法,每次嘗試對已經存在的葉節點(最開始的葉節點是根節點)進行分割,然后獲得分割后的增益為:

其中,L和R代表左右。
在這里以Gain作為判斷是否分割的條件,如果Gain<0,則此葉節點不做分割,然而這樣對于每次分割還是需要列出所有的分割方案。而實際中我們先將所有樣本按照從小到大排序,然后進行遍歷,查看每個節點是否需要分割,這樣的分割方式,我們就只要對樣本掃描一遍,就可以分割出、,然后根據Gain的分數進行分割。
圖像識別算法(詳見圖2算法流程)是對配電房內的圖形圖像、文字表單等進行識別,核心技術集成了模板匹配、字符位置可感知的文本檢測(Character Region Awareness For Text detection,CRAFT)字符檢測、表格檢測等多種方式,實現對字符的精確定位,Vgg16+BLSTM+CTC模型對字符進行識別,提升配電房運維安全管控措施以及工作效率。
具體實現步驟如圖2所示。

圖2 圖像識別業務流程圖
光學字符識別(Optical Character Recognition,OCR)是以圖像識別為基礎,通過計算機識別圖像中的信息來完成辨識任務,一般包含4個部分:
(1)圖像預處理。在進行圖像信息識別前,首先要對圖像進行預處理,過濾噪聲和干擾。如果圖像信息無法辨識,則需要對圖像進行處理,比如增強處理、顏色矯正等。
(2)圖像分割。對圖像進行分割,定位和分離需要識別的文字和圖形。
(3)圖像特征提取。從分割出來的文字中提取需要的特征,進行相關的參數計算和測量,并根據測量的結果進行分類。
(4)圖像識別。根據提取的特征量進行識別分類,確定對應的文字和圖像內容。
圖像識別采用卷積循環神經網絡(Convolutional Recurrent Neural Network,CRNN)網絡架構,主要包括三部分:(1)卷積層:從輸入圖像中提取特征序列;(2)長 短 期 記 憶(Long short-term memory,LSTM)層:預測每一幀的標簽分布,從卷積層獲取的特征序列的標簽(真實值)分布;(3)轉譯層:將每一幀的預測變為最終的標簽序列。
卷積循環神經網絡(Convolutional Recurrent Neural Network,CRNN)借助語音識別中解決不定長語音序列的思路。對于序列問題的解決,通常使用循環神經網絡(Rerrent Neural Network,RNN),為了消除RNN網絡常見的梯度爆炸問題,引出LSTM,這些算法在語音識別領域都已相當成熟,有很好的表現,現在就是設計特征,讓圖像特征可以有近似于語音的特征表達。
為驗證AI技術應用于低壓配電運維的效果,對相位識別、人員著裝識別、表單識別進行數據收集和實際測試。驗證上述AI算法的準確性和可用性。
為驗證本文提出的拓撲識別算法的可行性。以省內某臺區為例,安裝28臺采集終端,將設備通信地址配置到采集終端應用程序(Application,App)內,用于采集終端與管理系統的數據通信。采集終端采集出線柜出線電流、分支箱出線電流和電表箱進線電流等47組電流數據。利用算法模型輸出通信地址的級聯關系,再結合通信地址對應的電力設備關系表,最終得出電力設備的拓撲關系,下面為輸入輸出的參數信息。
采集輸入:
// 出線柜出線電流集合,通信地址 A相電流 B相電流 C相電流
{ "8197", 3.666, 3.6, 3.6 }, { "8198", 7.665, 7.5, 7.5 },
{ "8199", 11.664, 11.4, 11.4 }, { "8200", 6.066, 6.0, 6.0 },
{ "8201", 15.265, 15.1, 15.1 }, { "8202", 42.843, 42.3, 42.3 }
// 分支箱出線電流集合,通信地址 A相電流 B相電流 C相電流
{ "8203", 1.111, 1.1, 1.1 }, { "8204", 1.222, 1.2, 1.2 }, { "8205", 1.333, 1.3, 1.3 },
{ "8206", 2.444, 2.4, 2.4 }, { "8207", 2.555, 2.5, 2.5 }, { "8208", 2.666, 2.6, 2.6 },
{ "8209", 3.777, 3.7, 3.7 }, { "8210", 3.888, 3.8, 3.8 }, { "8211", 3.999, 3.9, 3.9 },
{ "8212", 1.011, 1.0, 1.0 }, { "8213", 2.022, 2.0, 2.0 }, { "8214", 3.033, 3.0, 3.0 },
{ "8215", 4.044, 4.0, 4.0 }, { "8216", 5.055, 5.0, 5.0 }, { "8217", 6.166, 6.1, 6.1 },
{ "8218", 7.077, 7.0, 7.0 }, { "8219", 8.088, 8.0, 8.0 }, {"8220", 27.678, 27.3, 27.3 },
{ "8221", 9.099, 9.0, 9.0 }, { "8222", 9.123, 9.1, 9.1 }, { "8223", 9.456, 9.2, 9.2 }
// 電表箱進線電流集合,通信地址 A相電流 B相電流 C相電流
{ "0004", 1.111, 1.1, 1.1 }, { "0005", 1.222, 1.2, 1.2 }, { "0006", 1.333, 1.3, 1.3 },
{ "0007", 2.444, 2.4, 2.4 }, { "0008", 2.555, 2.5, 2.5 }, { "0009", 2.666, 2.6, 2.6 },
{ "0010", 3.777, 3.7, 3.7 }, { "0011", 3.888, 3.8, 3.8 }, { "0012", 3.999, 3.9, 3.9 },
{ "0013", 1.011, 1.0, 1.0 }, { "0014", 2.022, 2.0, 2.0 }, { "0015", 3.033, 3.0, 3.0 },
{ "0016", 4.044, 4.0, 4.0 }, { "0017", 5.055, 5.0, 5.0 }, { "0018", 6.166, 6.1, 6.1 },
{ "0019", 7.077, 7.0, 7.0 }, { "0020", 8.088, 8.0, 8.0 }, { "0021", 9.099, 9.0, 9.0 },
{ "0022", 9.123, 9.1, 9.1 }, { "0023", 9.456, 9.2, 9.2 }
輸出關系:
出線柜===>>>分支箱
8197 (10.865999) ===>>> 423A (10.865999) ;8198 (22.665001) ===>>> 423B (22.664999)
8199 (34.463997) ===>>> 423C (34.464001) ;8200 (18.066000) ===>>> 423D (18.066002)
8201 (45.465004) ===>>> 423E (45.465000);8202 (127.442993) ===>>> 423F (127.443001)
分支箱 ===>>> 電表箱
8203 (3.311000) ===>>> 0004 (3.311000) ;8204 (3.622000) ===>>> 0005 (3.622000)
8205 (3.933000) ===>>> 0006 (3.933000) ;8206 (7.244000) ===>>> 0007 (7.244000)
8207 (7.555000) ===>>> 0008 (7.555000) ;8208 (7.866000) ===>>> 0009 (7.866000)
8209 (11.177000) ===>>> 0010 (11.177000) ;8210 (11.488000) ===>>> 0011 (11.488000)
8211 (11.799000) ===>>> 0012 (11.799000) ;8212 (3.011000) ===>>> 0013 (3.011000)
8213 (6.022000) ===>>> 0014 (6.022000) ;8214 (9.033000) ===>>> 0015 (9.033000)
8215 (12.044001) ===>>> 0016 (12.044001) ;8216 (15.055000) ===>>> 0017 (15.055000)
8217 (18.365999) ===>>> 0018 (18.365999) ;8218 (21.077000) ===>>> 0019 (21.077000)
8219 (24.088001) ===>>> 0020 (24.088001) ;8221 (27.098999) ===>>> 0021 (27.098999)
8222 (27.323000) ===>>> 0022 (27.323000) ;8223 (27.855999) ===>>> 0023 (27.855999)
選取其中一臺出線柜及其下級設備數據,在平臺中輸出并呈現圖3所示的拓撲圖關系頁面。

圖3 出線柜-分支箱-電表箱拓撲圖
收集省內某臺區72塊電表數據,并且對72塊電表進行勘站,獲取用電真實信息數據,以驗證上述聯合算法預測結果的準確性、穩定性。
為了確保數據的完整性,需要對數據進行異常值處理,對用戶電表數據進行檢驗,刪除采樣點中識別異常的數據和重復的識別數據。首先分別輸入臺區內1、3、4、5、6、7、8天的關口表和用戶電表數據,再分別輸出對應1、3、4、5、6、7、8天的相位識別數據。得到如下結論。
1天:識別出67塊表,錯誤識別17塊;
3天:識別出68塊表,錯誤識別7塊;
4天:識別出69塊表,無錯誤識別;
5天:識別出70塊表,無錯誤識別;
6天:識別出71塊表,無錯誤識別;
7天:識別出71塊表,無錯誤識別;
8天:識別出72塊表,無錯誤識別。
經過訓練測試之后,相位識別準確率得到了有效提高。
為驗證電力施工人員、安全帽識別的有效性,將安全帽及佩戴安全帽人員圖片作為測試集。在訓練時為減少運算量,提高檢出的速度,將原來VOC訓練集進行重新采樣。采樣中分別對常規的安全帽進行采樣,采集彩色圖片15000張,再轉換成灰度圖片15000張。
在大約訓練迭代到4000次時,模型已經有一定效果。通過目標分類識別,可進一步降低非人員誤報的機率,大約降低10%以上的誤報率。最后統計其在數據集上的查準率、查全率以及每秒識別幀數。其中查準率代表預測框中準確的數據比上預測框數據總數,查全率代表找到真實數據框數比上真實數據框總數。
由表1可知工人和安全帽識別精度在92.1%-94.2%,能夠很好地滿足施工現場識別安全帽佩戴情況,有著很好的識別效果。

表1 測試集實驗結果
手機攝像頭拍攝實驗表格后通過OCR算法模型對手寫的數據(整數和帶小數點數字)進行精準定位和自動識別,識別結果自動存儲,對比手工錄入測試。
經測試,利用圖像識別技術識別表格耗時為9秒,45組數據中識別錯誤3個,正確率93.3%;而手工錄入耗時達3分鐘,發生了錄入錯誤。由實驗結果可以看出,圖像識別錄入比手工錄入效率提高90%以上,正確率也大幅提高。
運用AI技術對低壓配電運維的新賦能,可以實現臺區拓撲自動識別,識別率達100%;單相電表的相位自動識別率達100%;工人和安全帽識別精度達到92.1%-94.2%,比傳統方式提高6%;AI識別表格速度從人工錄入的3分鐘提高到9秒,且正確率達到93.3%以上。通過AI技術賦能低壓配電運維,可以減少運維成本,提高運維效率,加強運維安全管控。拓撲識別分析技術已經成熟運用,已在多地試點成功,后期必將全面推廣。安全管控目標AI視覺識別今后還有很大提升空間,在可識別目標種類及可運用場景方面將逐步深入。