(廣東電網(wǎng)有限責任公司東莞供電局,廣東東莞 523000)
電網(wǎng)發(fā)現(xiàn)電壓、電流、功率等不平衡時,主站調(diào)度員首先確認主站數(shù)據(jù)庫中變比、拓撲等是否及時更新,相關通知報文是否處理。若主站數(shù)據(jù)庫正常則調(diào)度員會聯(lián)絡電廠、變電站值班人員根據(jù)現(xiàn)場設備排查問題,查看是否是數(shù)據(jù)源問題或通訊問題。整個排查過程無自動化解決方案,需要多方協(xié)同手工實時聯(lián)絡排查,過程費時費力,急需自動化排查方案。具體表現(xiàn)為電廠、變電站端送到主站的電壓、電流、功率等數(shù)據(jù)與主站本地對應端的量測數(shù)據(jù)之間存在嚴重的不平衡。有兩個原因:線路、變壓器等設備已更新,而主站系統(tǒng)中的對應參數(shù)未及時更新和不同設備的量測數(shù)據(jù)的同步存在延遲,本文通過聚類算法實現(xiàn)主站與電廠、變電站的數(shù)據(jù)同步,實現(xiàn)了數(shù)據(jù)質(zhì)量的提高。
線路功率平衡計算:一條母線所有端流入流出的功率與損耗功率應當平衡。若發(fā)現(xiàn)功率平衡誤差過大,結(jié)合報警信息,初步判斷數(shù)據(jù)同步出現(xiàn)問題。以圖1所示B2母線為例:

其中,PG2為發(fā)電機G2的有功功率輸出,PT2為變壓器T2的一次側(cè)有功功率輸入,PB2為母線B2的線路損耗。PB2一般遠小于PG2與PT2,因此當PG2與PT2差距過大時,可能是數(shù)據(jù)同步出現(xiàn)問題。其它參數(shù)說明如下PLi為負荷,Bi為母線,Gi為發(fā)電機和Ti為變壓器。
K-means[1,2]聚類算法是一種無監(jiān)督機器學習算法,其過程首先隨機選取K個對象目標定為初始的聚類中心,接著計算每一個對象和其它所有種子聚類中心相隔的距離,隨后,每個對象分配給離它距離最近的聚類中心。聚類中心以及被分配的對象就代表一個聚類。如果每分配一個樣本,聚類的中心位置會按照聚類中現(xiàn)有的對象進行重新計算。此過程將不斷重復直到滿足某個條件為止。終止條件設定為:沒有對象被重新分配給不同的聚類,找不到聚類中心再發(fā)生變化,得出的誤差平方和局部最小,具體步驟如下:
(1)首先確定一個k值,數(shù)據(jù)集將經(jīng)過聚類得到k個集合。(2)從待選數(shù)據(jù)集中隨機選擇k個數(shù)據(jù)點作為質(zhì)心。(3)針對數(shù)據(jù)集中每個點,算出其與每個質(zhì)心的長度(如歐式距離),劃分的原則遵循就近原則,離那個質(zhì)心近,就劃分到質(zhì)心所屬的集合。(4)如果所有數(shù)據(jù)被歸好集合后,合計有k個集合,接著重新算出每個集合的質(zhì)心。(5)如果剛剛計算出來的質(zhì)心和已有質(zhì)心之間的長度小于預先設置的閾值,就可以得出初步結(jié)論,聚類已經(jīng)達到期望的結(jié)果,算法終止。(6)假如新質(zhì)心和原質(zhì)心長度范圍變化很大,需要迭代第3、第4和第5步驟。

圖1 算法原理
首先開始主網(wǎng)本地數(shù)據(jù)稽核,并檢查主網(wǎng)數(shù)據(jù)設備、臺帳、表記資產(chǎn)等信息的完整性(包含設備編號、臺帳類信息、表資產(chǎn)編號信息和設備最后修改時間戳信息),檢查主網(wǎng)未處理的消息報文,提取未處理消息報文信息(時間信息、設備信息和參數(shù)修改信息),檢查設備編號與修改信息真實性,參數(shù)修改信息是否真實,如果不真實,記錄報文數(shù)據(jù),數(shù)據(jù)駁回,要求發(fā)送設備編號更多信息以檢驗數(shù)據(jù)真實性,如果數(shù)據(jù)真實修改參數(shù)信息、記錄修改報告;接著根據(jù)主網(wǎng)不平衡報警信息檢查主網(wǎng)線路平衡問題,通過有功平衡、無功平衡、電壓平衡和電流平衡四個指標篩選檢查真實存在不平衡設備,并記錄不平衡設備報警信息,使用K-Means聚類異常不平衡數(shù)據(jù),隨機生成聚類樣本中心,修正聚類中心,計算樣本間歐式距離重新聚類,如果樣本簇發(fā)生改變,分析聚類中心樣本異常數(shù)據(jù)特征,據(jù)此分類提升效率,根據(jù)變比錯誤、拓撲更新不及時和數(shù)據(jù)源問題判斷是否完成,主網(wǎng)數(shù)據(jù)同步機制校驗,如果完成校驗[3,4]。記錄不同步設備編號,出具主網(wǎng)數(shù)據(jù)不同步報告。
設備臺帳表資產(chǎn)信息檢查是否完整,如果信息檢查不完整,就判斷是否多次不完整,如果不是多次信息檢查不完整,就重新下載設備臺帳表計資產(chǎn)信息檢查;如果多次信息檢查不完整,將數(shù)據(jù)駁回出具報告并要求整改。如果信息完整,出現(xiàn)不平衡告警,并判斷是否有報文未處理、數(shù)據(jù)是否有時間戳、所有現(xiàn)場設備數(shù)據(jù)是否已經(jīng)獲得,如果沒有獲得,就判斷是否多次無法獲取完整數(shù)據(jù),要求現(xiàn)場發(fā)送所有設備數(shù)據(jù);如果上述3個條件都滿足,就可以結(jié)束質(zhì)量檢查,進行數(shù)據(jù)真實性校驗[5],數(shù)據(jù)質(zhì)量檢查關鍵步驟如下:
(1)檢查臺賬信息是否完整;(2)出現(xiàn)不平衡告警時,檢查是否有未處理的報文;(3)檢查量測數(shù)據(jù)是否有時間戳;(4)檢查現(xiàn)場發(fā)送的顯示設備等設備的實時數(shù)據(jù)是否已完整。
使用k-均值聚類方法將所有已知的告警點的數(shù)據(jù)分類,并依據(jù)電網(wǎng)經(jīng)驗,將每類異常數(shù)控(不平衡的有功數(shù)據(jù))與實際錯誤數(shù)據(jù)(變比)建立對應關系,流程圖2如下。

圖2 數(shù)據(jù)校驗流程
詢問電網(wǎng)公司應將數(shù)據(jù)集劃分為多少個簇,并隨機分配k個異常數(shù)據(jù)向量作為初始簇質(zhì)心位置[6],輸入一條異常數(shù)據(jù)向量,并找到離其最近的簇質(zhì)心,如果所有異常數(shù)據(jù)的中心已找到,輸入一個簇,并找到簇的質(zhì)心并更新;如果異常數(shù)據(jù)的中心沒有找到,則返回初始簇質(zhì)心位置。如果所有簇的質(zhì)心已更新,則判斷是否滿足終止準則;如果所有簇的質(zhì)心沒有更新,則返回到異常數(shù)據(jù)中心。如果數(shù)值不滿足終止準則,則返回到初始簇質(zhì)心位置;如果滿足終止條件,則輸出所有簇質(zhì)心,接著再輸入一個簇質(zhì)心,并依據(jù)電網(wǎng)公司經(jīng)驗賦值給一個對應的錯誤數(shù)據(jù)點;并判斷所有簇與錯誤點的對應關系是否建立,如果沒有建立,返回輸出所有質(zhì)心,如果建立,輸出所有簇和對應關系。異常數(shù)據(jù)向量的構(gòu)建方式如下:

聚類過程中,判斷距離的遠近使用歐式距離:

終止準則可以選取為均方誤差無明顯變化,均方誤差如下:N為樣本總數(shù),k為簇數(shù)量,p表示Ci內(nèi)的數(shù)據(jù)點,ci表示簇Ci的質(zhì)心。

當告警出現(xiàn)時,尋找本條告警數(shù)據(jù)的最近簇中心,對應錯誤類別即可判別為此告警的錯誤類別,當數(shù)據(jù)不完整時或要求修改參數(shù)不匹配時將數(shù)據(jù)駁回,要求電廠與變電站發(fā)送更多參數(shù)已檢查數(shù)據(jù)完整性與真實性。
本文提出基于基于聚類算法對主站與電廠、變電站的數(shù)據(jù)同步問題的解決辦法,從數(shù)據(jù)質(zhì)量檢查、數(shù)據(jù)校驗、數(shù)據(jù)修正和數(shù)據(jù)駁回三個個步驟解決了主站與電廠、變電站的數(shù)據(jù)同步問題,使數(shù)據(jù)質(zhì)量大大得到很大的改善。