季金豹,袁曉峰,漢新宇,厲文秀,楊波
(1.國網山東省電力公司日照供電公司,山東 日照 276800;2.國網山東省電力公司五蓮縣供電公司,山東 日照 262300)
電力系統的數據收集與利用對電力系統的安全運行具有重要作用[1-3]。采用高質量的數據對電力系統的生產運營和管理具有不可替代的作用,是電力調度自動化系統高質量決策的重要保障[4-5]。然而,數據的準確性、時效性和完整性等受到調度自動化系統主子站通道數據傳輸的影響[6-7]。因此,在電力調度自動化系統中,數據篩選方法、數據質量管理方法和評價方法被廣泛研究。
在辨識數據傳輸質量的方法中,應對多個數據傳輸通道進行綜合評價,篩選出數據傳輸質量高的傳輸通道,提供最大可靠性的數據。文獻[8]提出了一種儲能電站接入電網的電能質量評估分析方法,判斷數據是否在數據分布的置信區間內,從而完成數據質量辨識。但是,基于分布的數據質量評價對數據的規律性和數據量要求較高,并存在數據量大和數據分布不明顯的問題。文獻[9]利用相似性原理對數據進行橫向和縱向對比,針對傳輸數據的完整性和準確性等指標進行評估,確保數據傳輸質量。文獻[10]根據密度聚類和相關性分析方法對電力系統數據進行分析。雖然通過數據的相似性能夠很好地進行數據的對比,但是大量傳輸數據橫向和縱向的對比對服務器的計算和處理能力是一個嚴峻的考驗。
文獻[11]通過灰色關聯分析數據的周期性規律,對數據進行重組,分析數據因通信損失、儀表故障等問題致使數據質量下降的現象。文獻[12]采用基于灰色關聯分析和模糊聚類分析識別典型負荷曲線,辨識數據傳輸質量,避免因信道錯誤、儀表故障、設備停運等因素導致的異常數據與缺失值。灰色關聯分析法能夠根據關聯度對專家的主觀賦權進行綜合評判,但是對于客觀上的評價,灰色關聯分析法無法給出。文獻[13]利用層次分析法、熵權法和CRITIC 法對數據進行多方面綜合評價,評估數據傳輸的質量。文獻[14]針對評價指標的主觀與客觀權重的權衡問題,構建了基于層次分析法和指標相關性的方案評價方法。雖然,熵權法能夠針對不同的指標客觀地賦予權重,但是在當某一類指標數據偏離度較大的情況下,可能會造成對應的權重也過大,從而導致其他指標被弱化的現象[15-16]。
針對灰色關聯分析只能應對主觀賦權的問題,利用熵權法和自適應線性神經元算法確定指標的客觀賦權,提出多屬性評價方法和D-S 證據推理的主觀和客觀證據融合推理方法,從而完成對主子站通道質量的準確評價。該模型同時考慮不同的準則性質和不同的主客觀風險偏好,同時對多個數據通道指標綜合評價,以確保主子站通道數據傳輸質量。對山東某地區的主子站傳輸進行仿真和分析,驗證本文所提模型的有效性。
為了量化主子站各數據傳輸通道的多方面性能以及對于數據傳輸通道的需求,從數據傳輸通道的穩定性和可靠性兩個方面建立多屬性指標體系。
數據傳輸通道的穩定性評價指標反映的是數據通道的數據帶載能力和數據傳輸穩定程度,從傳輸通道的自身出發,提出了通道延遲上送次數(Delayed Delivery,DD)、通道數據不刷新次數(Data Not Refreshed,DNR)和傳輸通道投退次數(Switch Fall,SF)作為主子站傳輸通道的穩定性評價指標,并設三者指標值分別為IDD、IDNR和ISF。
不同的數據傳輸通道的DD、DNR 和SF 存在差異,IDD、IDNR和ISF的數值越小,則在數據傳輸的過程中表示數據的帶載能力強,數據傳輸穩定。因此在分析拓撲結構時,DD、DNR和SF是很重要的指標,能夠反映電力系統主子站傳輸通道傳輸數據的能力。
電力系統主子站傳輸通道的可靠性指標是定量評價傳輸通道的基礎,反應數據傳輸中的異常狀態。基于IEEE 的主子站傳輸通道可靠性評價指標選取了3 個指標:平均跳變數據(Average Jumping Data,AJD)、異常數據數目(Number of Abnormal Data,NOAD)和平均異常數據出現次數(Average Frequency of Abnormal Data,AFOAD)建立可靠性指標體系,并設其指標值分別為IAJD、INOAD和IAFOAD。
1)AJD 反映的是電力系統中主子站因為網絡的傳輸bug 而產生數據跳變的平均水平。當電力系統主子站數據傳輸通道發生波動時,在低可靠性網架結構中會造成數據跳變的情況,直到線路穩定后數據恢復正常。因此在評價可靠性時,AJD 是一個比較有參考價值的指標,其指標值為

式中:NAJD為所有數據跳變次數的集合;μx為第x次跳變持續的時間;IAJD,x為第x次跳變的數據。
2)因為外部原因和網絡的設置不同,各種bug和數據亂碼的情況時有發生,導致數據傳輸序列中出現異常數據。出現異常數據時,各個數據傳輸通道的異常數據不同,因此利用NOAD 和AFOAD 來綜合衡量電力系統主子站傳輸通道數據傳輸的可靠性。NOAD 反映的是電力系統主子站因外部擾動或者系統bug出現的異常數據數目,其指標值為

式中:NNOAD為所有異常數據跳變次數的集合;?x為第x次異常數據持續的時間;INOAD,x為第x次異常數據數目。
3)AFOAD反映的是電力系統主子站因外部擾動或者系統bug出現異常數據數目的平均水平,其指標值為

在實際工程中,多位專家對于傳輸通道數據質量的評價方案存在差異化,因此需要對多位專家方案進行評估,確定最終統一的方案。采用數據處理速度快、計算簡便的K-means 算法對多專家意見進行聚類賦權,對于所含方案數多的類型賦予一個較大的權重,相反則賦予一個較小的權重,使得方案的差異化能到充分評估。
假設有n個專家和m個評價指標,根據專家意見,構建n×m的數據評價矩陣[17],如式(4)所示。

式中:zij為第i個專家所提供方案的第j個評價指標數值。
通過K-means 算法將所提需求方案分為k類,第b類方案的聚類中心和所含方案數分別為cb和Nb。為了充分準確評估各個專家方案對于整體方案的影響,計算各方案的占比權重。假設專家i所提方案屬于類別b,則該方案的權重可以表示為
對上述權重進行歸一化處理,即

雖然,K-means 算法具有計算速度快,工程應用能力強的特點,但是在聚類時必須提前知道數據有多少類或組,不同的聚類數會直接影響聚類結果。因此,基于輪廓系數法,對K-means 算法進行改進,選出最優的聚類數值k。
輪廓系數法的核心指標是輪廓系數(Silhouette Coefficient,SC),在類別b下的輪廓系數定義如式(6)所示。

式中:kPCH為凝聚度,表示專家l所提方案與同簇的其他方案的平均距離;kDOS為分離度,表示專家l所提方案與最近簇中所有樣本的平均距離。

式中:E(zi,z)l為專家l所提方案zl與同簇的其他方案zi的距離。
求出所有樣本的輪廓系數后再求平均值就得到了平均輪廓系數。平均輪廓系數的取值范圍為[-1,1],且簇內樣本的距離越近,簇間樣本距離越遠,平均輪廓系數越大,聚類效果越好。因此,平均輪廓系數最大的k便是最佳聚類數。
基于熵權法的客觀賦權能夠根據信息的重要程度來確定客觀權重,熵值越小,表明信息量越多,相應的權重也就越大[18]。首先,數據評價矩陣中指標值越大表示越優秀指標定義為正向性指標,指標值越小表示越優秀的指標定義為負向性指標。因此,正向性和負向性指標的計算過程如式(9)和式(10)所示。

對正向性和負向性指標進行歸一化處理,歸一化后的第i個樣本的第j項指標表示為

第j個指標的熵值ej表示為

式中:K=1/lnm。如果pij=0,則定義
因此,熵權值的表達式表示為

熵權法能夠針對多個指標確定指標權重,但是可能會出現一類指標數據值離散程度大,從而導致指標的權重值過大,致使其他類型指標權重值偏小,出現數據淹沒現象,嚴重影響數據分析。基于自適應線性神經元算法將熵值法確定的指標初始權重作為自適應線性神經元算法的初始權重,通過迭代校正確定數據指標權重[19]。改進后的熵權法算法流程如圖1所示。

圖1 改進后的熵權法流程
通過自適應優化得到權重的期望值Ej為

當實際值Rj和預測期望值Ej不等時,存在計算誤差為

式中:ERR為實際值與預測期望值的預測誤差。
采用誤差梯度下降算法不斷地調整權重為

式中:負號表示梯度下降;η為比例系數。

因此,權重的更新迭代表達式為

D-S 證據理論能夠在無先驗概率的前提下對信息進行融合和推理,為主觀和客觀證據的分析融合提供了理論基礎[20-21]。基于主觀和客觀評價方法獲得的各項指標權重wa和wb,通過夾角余弦函數表示兩者之間的相似度,即

為了判定證據之間的矛盾程度,需先求得某一證據與其他證據之間的平均相似度


通過對權重進行重新分配,確定各個指標在整個數據評價中的占比權重為

結合主觀和客觀因素的電力系統主子站通道質量動態評價可以表示為

式中:Zn為樣本通道的第n個評價指標值。
將多屬性評價優選模型和證據推理模型植入到主子站傳輸網關的邊緣計算中,實現通道的優選。根據主子站的傳輸數據確定數據規范化后的系統指標數據參考值,如表1 所示。電力系統主子站通道的數據質量評估是高質量數據應用的基礎。選取3個主子站通道數據進行評估,典型日的逐時電負荷曲線如圖2所示。

表1 評價指標的參考值

圖2 典型日傳輸通道的負荷
圖2 中只展示24 h 整點的數據,其中,每小時內還包含60 個數據,因為數據量龐大,不做詳細展示。此外,通過選取6 個指標來評價通道數據質量,具體包括:數據的延遲上送、通道數據不刷新、數據跳變、異常數據數目、異常數據出現次數和投退次數。此外,根據專家意見,獲得評價指標的數據評價矩陣如表2所示。

表2 評價指標的數據評價矩陣
通過多屬性評價優選模型和證據推理模型計算得到6 個評價指標的權重,得到6 個主觀評價的證據源信息,如表3 所示。表3 中,wal為第l個主觀評價獲得的指標權重,l∈{1,2,3}。

表3 六個評價指標的主觀權重
通過改進的熵權法計算得到各個評價指標的客觀權重值,如表4 所示。表4 中,wbu為第u個主觀評價獲得的指標權重,u∈{1,2,3,…,6}。

表4 客觀評價的指標權重
通過對3 個主子站通道的動態質量的主觀評價、客觀評價和本文方法的3 種情況進行對比,評價結果如表5所示。從表5中可以看出,通過證據融合可以看出對于“通道樣本2”的數據支持度最高。按照信度函數值最大化的原則,選擇通道樣本1 作為當前數據傳輸通道的最優選擇。此外,從表5 中可以看出,本文所提出的主觀和客觀相融合的證據推理的結果支持度更高,能夠更全面評價數據并給出結果。

表5 通道樣本的評價值
為了驗證所提方法的有效性,將本文方法與網絡大數據評價、最大流方法、熵值法和CRITIC 4種評價方法結果進行比較。圖3和表6分別展示了上述5 種方法的評價值及本文方法與其他4 種方法的數據評價值和相對誤差。從圖3和表6中可以看出,本文提出的方法與其他4種數據動態評價方法相比,數據比較接近,能夠保持一個比較高的數據精度。此外,本文方法與其他4種方法的數據相對誤差也較小。

圖3 5種評價方法的對比

表6 本文方法與其他4種方法的相對誤差 單位:%
提出一種基于多屬性評價分析和D-S 證據推理的主子站通道質量動態評價模型,依據D-S 證據推理方法,結合主觀和客觀評價的信息進行融合,對主子站通道的數據質量進行動態評估,相比于主觀或者客觀的單一評價方法,考慮主觀和客觀相融合的多屬性評價分析方法能夠克服單一因素對于系統數據評價的影響,使得評價結果更加可靠有效,避免單一方法的局限性和片面性。此外,通過與不同的數據質量評價方法結果進行對比,驗證了本文所提模型在主子站通道數據質量評價中能夠保證所選擇的傳輸通道具有較好的數據質量,為決策者提供可靠的數據支撐,避免不良數據對決策的影響。