林奕夫 鄭書生
(1.國網福建省電力有限公司經濟技術研究院 福建省福州市 350000)(2.新能源電力系統國家重點實驗室(華北電力大學) 北京市 102206)
局部放電(Partial-Discharge, PD)在高壓電力設備經常出現,會降低設備的絕緣性能,長期發展可能帶來嚴重的事故[1-3]。變電站的設備多、運行的電場復雜,出現局放的概率相對更大,對局放源進行定位,從而采取檢修措施對設備的安全運行具有重要意義。特高頻法(Ultra-High- Frequency, UHF)作為局放檢測的有效手段,在變壓器、氣體絕緣變電站等設備的局放檢測中廣泛應用[4-6]。近幾年有學者提出利用UHF 法進行局放定位,成功應用在變電站內的局放查找[7]。
基于UHF 定位的常用方法主要有:基于到達時間差(time difference of arrival, TDOA) 和基于信號接收幅值強度(received signal strength indicator, RSSI)。TDOA 法是通過布置特高頻傳感器陣列,根據信號到達傳感器陣列的時間差,通過一定的方法解出局放源的坐標。TDOA 法定位精度高,相較于RSSI 法抗干擾能力更強,目前已出現可移動式定位裝置應用在變電站,但其需要高速同步采樣設備的支持,獲取納秒級別的到達時間差[8-10]。國內有學者在變壓器內布置特高頻傳感器陣列,根據到達時間差得到定位方程組,通過復數域牛頓迭代算法求解,定位繞組上的單源局放,精度達到0.34 m[11]。Philip J.Moore 于2003年總結了變電站各種常見類型局放的空間電磁波頻譜特性,提出了用天線陣列進行開放空間局放定位。利用極坐標系進行故障定位已成為變電站常用的放電故障定位主要方法[12-14]。
局部放電具有隨機性,信號波形復雜多樣,時間差計算方法的普適性不強,時間差數據的分散性很大。此外,檢測環境中存在偶發的干擾信號,產生與放電源不同的時間差。由于這兩方面原因,特高頻定位的時間差數據分散性大,無法確定有效區間的區間,時間差算術均值與理論時間差偏差較大,從而降低了定位精度??梢?,如何篩除無效數據,提高時間差均值計算精度,是局部放電特高頻時間差定位中的關鍵環節。為此,本文提出一種基于時間差正態分布特征分析的數據清洗方法。
特高頻法測局部放電的輸出結果為時間差、方位角或空間位置。各次試驗中,由于外界參數(如示波器采樣頻率等)不變,時間差取值可以視作一個獨立同分布的隨機變量。中心極限定理表明,獨立隨機變量個數增加時,它們的值趨近于正態分布。如果這些樣本是獨立同分布的,即他們的數學期望與方差是相同的,可以視作這些樣本是從總體中抽取的,抽取數量足夠大時,這些樣本的均值將服從的正態分布。簡單來說,就是樣本的均值與總體相等,無論總體呈何種分布趨勢,從總體中任意抽取樣本的均值總在總體均值周圍呈正態分布。
時間差這一隨機變量與許多因素有關,這些因素都存在隨機性且互相獨立,彼此之間的影響微小,可以說,時間差受他們的綜合影響,根據概率論知識知,時間差這一隨機變量的分布應該近似于正態分布。正態性可以用偏度、峰度進行檢驗,對第二章中的原始試驗數據進行偏度、峰度檢驗,大多均滿足正態性。因此,可以從正態分布入手,對數據進行有效區間的提取。
正態分布的概率密度函數如式(1)所示。

其中μ 代表樣本均值,也是正態分布概率密度函數的對稱軸;σ 代表樣本標準差,其圖像如圖1所示。

圖1:正態分布概率密度曲線圖
式(1)為一個超越函數,無法積分,但由圖1的正態分布圖可知:區間(μ,μ+σ)面積為0.341,區間(μ+σ,μ+2σ)面積為0.136,區間(μ+2σ,μ+3σ)面積為0.021。由此給出正態分布的3σ 原則,即:對于滿足正態分布的隨機變量,其數值分布在(μ-σ,μ+σ)中的概率為0.682;分布在(μ-2σ,μ+2σ)中的概率為0.954;分布在(μ-3σ,μ+3σ)中的概率為0.996。可以用3σ 原則來篩選數據。假設采集的時間差僅有隨機誤差,計算其標準差與均值,按照概率取一個區間,認為該區間外數據屬于粗大誤差,將其舍去。
正態分布中,數值分布在(μ-σ,μ+σ)區間的概率為0.682,這個區間,既包含了中位數附近的采集數據,又篩去了較多的兩端離群數據,可以說,是提出了正態曲線的“峰”所在的部分。根據工程經驗,有效時間差集中在正態曲線的峰附近,因此選擇(μ-σ,μ+σ)中的數據作為有效數據。
由于正態分布概率密度曲線關于直線x=μ 對稱,對稱軸的橫坐標可以描述為位于總體數據的50%處。Labview 中存在均值趨勢函數,該函數在工作在模式3 下可以輸入一個百分數x 表示數據在總體所占的位置,以求取自動排除區間(0,x)和(1-x,1)后關于對稱軸對稱的數據的均值,取該對稱區間的好處在于可以在原始平均值兩側各排除一個占總數據個數x%的區間,平均了原始均值兩側離群數據的干擾,因此需要求取μ-σ 所代表的的百分比,并將其連接到均值趨勢函數中,以求取有效時間差區間的均值。設該百分比為x,可由式(2)、(3)計算。

在上述地線的三個端子處,由于結構變化,傳輸阻抗將發生突變。脈沖電流到達端子處將會發生折返射。在一定頻率下,入射波與反射波疊加,脈沖電流幅值增大,形成駐波。在此駐波頻率下,地線向周圍空間輻射出較強烈的電磁波信號。將天線傳感器放置在設備外部地線附近時,就可以探測到射頻信號。
通常,檢驗總體分布一般采用x2擬合檢驗的方法,但是在檢驗正態性時,這種方法有較大概率會犯第II 類錯誤(原假設不正確但接受了原假設的錯誤),因此,對于正態分布的檢驗,需要采用專用的方法——偏度、峰度檢驗。

若X 滿足正態分布,則v1=0 且v2=3,假設樣本x1,x2,…,x3來自總體X,則v1與v2的矩估計量分別為G1與G2,代表樣本偏度與樣本峰度,(其中Bk為樣本的k 階中心矩,k=2~4),具體見式(6)。

如果總體X 是正態變量,且n 充分大時,有式(7)、(8)。

現有假設H0:X 為正態總體,記

當n 充分大時,若H0為真,近似有U1~N(0,1),U2~N(0,1),易知,G1與G2應該依概率收斂于v1與v2,因此|U1|的觀察值|u1|或|U2|的觀察值|u2|大于某一設定值時,就拒絕H0,即H0的拒絕域為:(其中α 為顯著性水平)。
如果假設的可靠性為95%,即考慮置信水平為95%時,有95%=1-α,可知顯著性水平α=0.05,因此可以求得1-(α/2)=0.975,將z 取值為1.96,當觀察值大于1.96 時就拒絕假設,反之,則證明樣本屬于正態分布,這就是偏度、峰度檢驗正態分布的原理。
從上面原理可知,偏度、峰度主要用于檢驗樣本是否服從正態分布。使用該原理可以校驗篩選后的有效時間差,即原始數據中的(μ-σ,μ+σ)部分,是否滿足正態分布。將該條件作為循環判斷條件,如果篩選后不服從正態分布,則不跳出篩選程序,繼續用3σ 原則循環篩選新的有效區間中的(μ-σ,μ+σ)部分,直至新的有效區間服從正態分布跳出篩選循環為止。當篩選后的數據服從正態分布,即視為有效區間提取完畢,利用均值趨勢函數計算該有效區間均值作為最終的有效時間差均值即可。
時間差數據清洗的流程如圖2所示。

圖2:時間差數據清洗流程圖
第一步,利用讀取電子表格函數從定位程序的輸出文件中讀取原始時間差、方位角數據,輸出提取后的時間差數組;
第二步,利用3σ原則篩選其中分布在(μ-σ,μ+σ)的時間差數據,并計算其均值;
第三步,利用偏度、峰度檢驗,判斷篩選后數據是否滿足正態分布,滿足則跳出循環,否則重復第2-3 步繼續篩選,直至循環次數達到4 次停止(防止死循環);
第四步,輸出跳出循環后的正態分布檢驗布爾值,若篩選后滿足正態分布,再篩選一次(μ-σ,μ+σ)的時間差數據,并計算其均值,輸出該值作為提取出的有效均值。
通過每一次篩選,剔除一部分離群數據,不斷循環剔除,使剩余時間差區間逐步逼近真正有效的區間,當剔除數據后滿足正態分布,即認為此時數據已經為有效數據,再剔除一次此種情況下的離群數據,將此時篩選剩下的數據均值輸出,即為時間差的有效均值,完成了清洗過程。
如圖3所示,在實驗室開展了特高頻法局部放電定位試驗,以測量原始時間差。本次試驗在三個位置分別布置局部放電源,利用兩個天線測量時間差。本文試驗將三個放電源設定在同一高度,忽略了Z 軸(高度)定位誤差的影響,盡力保證數據的準確性。本文選取的三個放電源分別在天線支架正前方,左前方與右前方,并用紅外測距儀測出各點具體位置。在試驗中,對每個位置的放電源連續采集數據100 次,形成100 個時間差數據。

圖3:時間差定位測量圖
對每組試驗測得的時間差數據,分別直接計算時間差均值、并利用正態分布數據清洗方法處理后計算時間差均值,結果表1所示。

表1:時間差數據清洗前后誤差分析
經上表對比分析可知,篩選后時間差均值相較于直接對所有實測數據進行算術平均的結果,誤差大多均有明顯減小,更接近理論值,且最大誤差由原來的超過0.4ns 減小為約0.1ns,因此,可以視為單源有效時間差均值提取成功,且在縮小誤差方面有一定效果。
本文針對局部放電時間差定位測量中存在的異常離散數據引起的誤差,提出了基于數據正態分布的數據清洗方法。闡明了提出異常數據的方法,同時給出了檢驗數據清理合理性的偏度與峰度檢驗方法。基于LabVIEW 開發了時間差數據清洗軟件。通過實測檢驗了清洗方法與軟件的可行性。測試結果表明,清洗后均值明顯更接近理論值,有效地將最大誤差從超過0.4ns 減小到了約為0.1ns。