廖紹成
(國網浙江新昌縣供電有限公司,浙江紹興 312500)
公用變壓器的穩定運行是安全供電的基礎保障,因此需要及時且準確地了解公用變壓器的狀態信息[1-3]。傳統變壓器狀態信息聚類方法計算速度慢,準確度較差,因此在原有聚類方法的基礎上,提出了基于5G 通信的公用變壓器狀態信息聚類方法。通過定權判斷變壓器的狀態和健康等級,詳細介紹了其聚變算法和聚變過程。利用5G 通信對數據的處理優勢,能夠有效提升聚類計算速度,明確公用變壓器的運行狀態,有利于及時發現變壓器故障,對于變壓器的維修和升級具有重要意義。
相比傳統的人工故障檢測方法,定權法不易出現誤差,并且計算速度快,準確率較高,能夠有效提升公用變壓器的檢測效率[4-5]。
公用變壓器之間的相關支持度和置信度的計算如式(1)和式(2)所示:

其中,Q表示所計算狀態在某一時間段內出現的次數;m表示某一測試時間段內的總狀態量;e表示計算常數;v表示狀態信息采集速度;n表示狀態信息采集量。從上式可以看出,相關支持度描述某一狀態出現的頻率和出現的時間,而置信度描述該變壓器對此狀態的依賴程度[6]。
通過參考公用變壓器廠常出現的故障,將變壓器的運行狀態分為正常運行、過熱運行和放電運行3 種,其中過熱運行和放電運行屬于故障類型,根據采集狀態數據的權重計算結果,將權重高于20%列為Ⅰ級故障,權重在10%~20%列為Ⅱ級故障,權重在5%~10%列為Ⅲ級故障,權重低于5%視為正常運行,故障等級為Ⅳ,公用變壓器運行狀態對應的權重如表1 所示[7-8]。

表1 公用變壓器運行狀態對應的權重
狀態信息的權重計算公式如式(3)所示:

其中,N表示總狀態信息數量,xi表示采集信息i的規則先導數值。結合相關支持度和置信度計算出權重數值,數值越高,則表示公用變壓器的運行環境越惡劣,危險系數越高[9-10]。
為提高計算速度,簡化聚類計算流程,在5G 通信的基礎上,采用k 均值(簇均值)聚類算法,人為選定簇(k 值),減少選取的盲目性,其聚類算法的主要步驟如下所示:
1)首先設置空間半徑r,在空間范圍內隨機選取一組或一類狀態信息數據,每個數據的維度為D,并初始化數據各自的中心點。
2)計算每個數據點到空間中心點的距離,距離最近的空間中心點即為數據點的聚類中心。距離計算公式為:

其中,jil表示某個數據點具有的維度。
3)將此類數據中的中心數據作為新的中心點,計算每個數據點到新中心點的距離,計算公式如式(5)所示:

其中,R表示一類數據范圍的空間半徑。
4)重復上述計算步驟,直到每一類中心到達某一確定數據,從而選擇出運行結果最準確的數據點。
具體到公用變壓器的狀態信息聚類上,其數據點則代表當前變壓器運行的數據,數據點的各個維度則代表變壓器狀態的健康等級,在應用5G 通信加快聚類速度的同時,對數據點的維度取值規則也做出了優化,規定在允許范圍內維度的取值由輕到重選取最佳整數值[11-12]。
基于5G 通信的公用變壓器狀態信息的聚類過程分為主成分分析和聚類分析兩部分,其具體過程如圖1 所示。

圖1 公用變壓器狀態信息聚類
主成分分析也叫作PCA,分析原理是通過降維方法,將公用變壓器的多個狀態指標轉換為少量狀態指標,簡化變壓器狀態分析過程。變壓器狀態指標主要包括相關系數矩陣、特征值和特征向量,得到公用變壓器的最大特征值。主成分分析法在簡化分析流程的同時要保證數據的精確性,主成分分析法將采集到的變壓器狀態指標合理地放入一個直角坐標系中,通過各個指標間的線性圖像,計算公用變壓器的指標權重值p[13-14]。
聚類分析的工作原理是運用數據建模進行數據分類,主要的工作是將不同的公用變壓器的各個狀態簇進行有理分類,有利于變壓器狀態出現故障時的維修。聚類分析算法首先對主成分分析得到的變壓器數據進行初始化,得到狀態簇k,然后根據k 均值聚類算法對狀態簇進行狀態指標分類,k 均值聚類算法的核心是以狀態簇為核心對狀態指標進行分類處理,最后將聚類結果進行分析,得到公用變壓器的狀態信息[15-16]。
該文實驗研究為檢驗整體聚類方法的有效性,對公用變壓器的健康狀態信息聚類結果及5G 通信狀態下變壓器訓練樣本的分類器分類性能進行對比分析,進而對比不同方法的聚類效果。
實驗研究的采樣地區電網系統共裝了100 臺220 kV的變壓器及150 臺110 kV的變壓器。利用5G通信方式將缺陷統計數據傳導至實驗空間中,并將統計數據作為聚類分析的實驗對象。選取簇半徑為8的聚類數據樣本,利用Canope 算法獲取計算的k值,選擇5G 通信的內部數據流通道將k 值信息由外聯網絡傳輸至k-means 算法處理中心。由此對樣本總體數據進行聚類調整,調整后的簇中心點與坐標軸原點間的距離關系如表2 所示。

表2 距離關系表
結合表2 信息,聯系變壓器狀態信息評價系統指標可得,當簇中心點與坐標軸原點間的距離越遠,則表示該聚類分析對象的健康狀態越差,反之,當簇中心點與坐標軸原點間的距離越近,則表示該聚類分析對象的健康狀態越好。為此,以簇中心點與坐標軸原點距離數據作為聚類結果的分析指標,對變壓器健康狀態信息進行等級劃分。共分為1~5共5個等級:從1 級至5 級,變壓器的健康狀態逐漸好轉。其中,1 級狀態變壓器樣本數量占總體狀態變壓器樣本數量的5%;2 級狀態變壓器樣本數量占總體狀態變壓器樣本數量的12%;3 級狀態變壓器樣本數量占總體狀態變壓器樣本數量的19%;4 級狀態變壓器樣本數量占總體狀態變壓器樣本數量的25%;5 級狀態變壓器樣本數量占總體狀態變壓器樣本數量的39%。
按照以上變壓器健康狀態等級的劃分,可將檢修效果較優的資源放置到健康等級較高的變壓器中,便于變壓器的調節與安全保護操作。同時可及時提醒處于較低健康狀態的變壓器調整負荷運作系統,避免因負荷過重而導致變壓器損壞現象的產生。為檢驗聚類方法的有效性,分別隨機抽取完成等級劃分后的一臺變壓器作為檢測對象,進行指標對照檢驗操作。實驗對比圖如圖2 所示。

圖2 實驗對比圖
根據圖2,當檢測的變壓器樣本健康狀態等級由1~5 級變化時,該文方法研究抽取的樣本指標取值呈現下降趨勢,表示變壓器的健康狀態良好,且優于其他兩種傳統方法,聚類分析的有效性得到較好的驗證,聚類效果最優。由于該文方法研究在變壓器狀態信息聚類分析的過程中匹配變壓器的健康狀態信息,對應不同的信息情況選取不同的算法,解決聚類分析中產生的異常數據,減輕聚類分析的負擔,劃分不同的聚類層次,排除了人為因素的干擾,突出關鍵指標的重要性,充分挖掘5G 通信中的變壓器狀態信息,可有效指導變壓器的檢測以及評估方向的問題。
采用DBSCAN 算法對變壓器的色譜狀態信息進行聚類處理,為獲取良好的聚類效果,該文降低ε數值,逐漸提升密度閾值,控制ε數值的變化區域為0.1~1 之間,變動幅度最佳數值為0.1。控制密度閾值的變化區域為5~10 之間,變動幅度最佳數值為1。所得聚類結果如表3 所示。

表3 聚類結果
從表中可以看出,數據樣本被劃分為兩個聚類2,簇號數值為0 和1,分別表示正常的樣本操作簇與故障的樣本操作簇。從兩種簇中挑選100 條變壓器狀態信息樣本數據,作為訓練樣本的分類器載體。將該文方法研究的分類器記為分類器1,將傳統基于時間序列分析的聚類方法研究的樣本數據分類器記為分類器2,將傳統基于歷史信息挖掘的聚類方法研究的樣本數據分類器記為分類器3。選取30 組變壓器測試樣本作為實驗研究的研究數據集,分別對經過樣本訓練的3 個分類器進行分類性能檢測,并構建實驗對比圖,如圖3 所示。

圖3 分類性能對比圖
由圖3 可知,基于5G 通信的公用變壓器狀態信息聚類方法研究的訓練樣本的分類器分類性能遠遠優于其他兩種傳統方法,表明該文研究的變壓器狀態信息聚類方法具有最佳的聚類效果。該文在進行平衡聚類訓練后,調整了各簇變壓器樣本信息,各簇變壓器樣本信息可緩解聚類分析在操作中產生的誤差分析問題,基本保障變壓器狀態信息分類樣本訓練過程中對于正常樣本與異常樣本的平衡性的需求,便利了聚類操作,提升了分類器的分類性能,進而獲取了較高的聚類效果。
根據上述研究可知,文中提出的基于5G 通信的公用變壓器狀態信息聚類方法,能夠實現公用變壓器運行狀態的快速采集和計算,通過聚類算法的公式原理和計算流程,分析得到公用變壓器的各個狀態提升了變壓器維修的便捷性。實驗結果表明,基于5G 通信的公用變壓器狀態信息聚類方法具有良好的聚類效果,可直接歸類未進行評估的部分變壓器數據,快速聚類大量變壓器狀態信息,提升對變壓器狀態檢測的指導性,具有較高的研究價值。