黃緒勇,沈志,王昕
(1.云南電網有限責任公司電力科學研究院,昆明 650127;2.上海交通大學電工與電子技術中心,上海 200240)
中長期暴露在空氣中的絕緣子由于大氣中鹽霧、塵埃等污穢物在其表面逐漸積累,遇雨水受潮后往往會發生污閃事故,造成嚴重的后果,因此絕緣子發生污閃事故的概率與氣象環境的污穢程度直接相關。污區等級是衡量絕緣子所在地區污穢程度的重要指標,也是絕緣子安全性能的一個關鍵參數,尤其是隨著我國超高壓輸電線路的逐步發展,污區等級的評估已經成為絕緣子污閃事故預警過程中必不可少的環節。
目前,對污區等級的評估主要分為兩類方法,一類是人工測量法,包括等值附鹽密測量法[1-3]、泄漏電流測量法[4-6]等。這種方法能夠較為準確地測量出絕緣子表面附著的污穢物的定量值,從而推斷出絕緣子發生污閃事故的概率,但這種方法需要一定的實驗環境,測量成本較高,測量周期長。另一類評估方法為數據預測法,包括BP 神經網絡評估法[7,8]、粒子群(PSO)優化評估法[9,10]和支持向量機(SVM)評估法[11-13]等。這種方法可以有效地推測出絕緣子所在環境的污區等級,不需要專門的試驗器材和大量的評估時間,僅需要提取訓練樣本進行機器學習就能進行定性評估,應用廣泛。文獻[8]利用BP 神經網絡建立了以泄漏電流最大值、環境濕度、溫度等8 個變量作為輸入參數,等值附鹽密度(ESDD)作為輸出參數的智能預測模型。但是BP 神經網絡所需訓練樣本較大,同時其網絡結構及參數的選擇需要由經驗判斷[14],在數據缺乏的情況下得不到合適的參數;文獻[9] 利用粒子群優化算法,優化神經網絡的網絡結構以及設定參數,合理有效地選擇得到最終的優化學習結果。但其計算精確度較低、易發散,甚至可能錯過最優解導致算法不收斂。文獻[15]利用最小二乘支持向量機(LSSVM),以泄漏電流有效值、泄漏電流峰值、脈沖電流次數、環境濕度、溫度作為輸入參數,以ESDD 作為輸出參數,實現了絕緣子表面污穢程度的在線評估。LSSVM 具有較強的泛化能力和較快的收斂速度,但其性能極其依賴于核函數和參數的選擇[16],針對LSSVM 的核函數選擇和參數選擇是目前研究的熱點。
傳統SVM 算法雖然在結構參數復雜度以及算法收斂速度上有一定的優勢,但處理本文所采用的多維氣象數據的非線性關系時較為困難,往往得不到理想的預測效果。LSSVM 算法可將傳統SVM 算法中不等式約束轉換為等式約束,并利用最小二乘線性系統替代SVM 中的二次規劃方程,本文首先建立LSSVM 模型。

式中,φ(x) 為x的映射函數,可將訓練數據映射到高維空間。ω為權向量,b為偏置常數。LSSVM 的目標函數則為:

式中,γ稱為懲罰系數,用以控制樣本噪聲的影響程度。ξ為誤差變量。針對上述目標優化問題,引入拉格朗日函數:

式中,ai為拉格朗日乘子。由KKT 最優條件,有:
保留方程中b和a,消去方程組中其他項可得:


將核函數公式帶入到式(5)中聯立解得b和α,可寫出LSSVM 回歸函數:

式中,K為RBF 核函數。這樣還待求解的參數為RBF 中的核參數λ以及懲罰系數γ,本文采用CSO 算法對這兩個參數進行尋優求解。
CSO 算法是一種模擬雞群覓食行為的新型智能優化算法[17]。該算法通過適應度值確定雞群等級,整個雞群分為公雞、母雞和小雞3 類個體。公雞的覓食能力最強,小雞的覓食能力最弱。每個個體按照一定的運動規律覓食。其中,公雞位置更新公式為:

式中,Pi,j為第i 只公雞所處位置第j 維度的值;randn(0,σ2) 為正態分布隨機數,其期望為0,標準差為s;第i 只公雞的適應度值用fi來表示;fr為隨機選取的第r 只公雞的適應度值。母雞位置的更新公式為:

式中,R1和R2為隨機數,取值范圍為[0,1];r1為母雞i 的伴侶;r2為母雞i 所在群體中除自身以外的另一只公雞或者母雞;C1和C2代表影響因子。小雞位置更新公式為:

式中,Pm,j代表小雞母親所處位置第j 維度的值;母親覓食行為對小雞的影響程度用F來表示,其取值范圍通常為(0,2)。
本文提取了云南省2016 年31 個氣象監測站的全年日值氣象數據對氣象站所在地區的污區等級進行評估,根據污區劃分國標[18]中所述,絕緣子污穢物的形成主要與當地的相對濕度、氣溫、降水量和平均風速有關。根據云南地區的氣候濕度高、多雨雪的特點,本文主要提取了有關相對濕度、氣溫、降水量、風速四個主要氣象因素的共9 維數據,另外以海拔高度和風向作為輔助參考因素,對氣象數據進行主成分分析(PCA)預處理,選取其中4 維向量作為實驗數據。
根據云南省輸電網的分布,本文選取了31 個采樣點的數據作為本文算法和評估結果分析的依據,氣象采樣點選擇如圖所示,其中選擇23 個氣象站點的監測數據以及所在區域的污區等級作為訓練樣本,其余8 個作為預測樣本點,如圖1。

圖1 氣象采樣點分布圖
對所處樣本點2016 年全年日值氣象數據進行整理,提取出日相對濕度、日平均氣溫、日平均降水量、日平均風速等作為數據源,主要指標及數據以騰沖區站為例構建數據陣,如表1 所示。

表1 樣本點信息與數據陣
其中樣本采樣點所處的污區等級根據云南電力科學研究院2016 年污區劃分數據,分為A、B、C、D、E 五個等級,在對樣本點數據進行訓練前,需要進行離差歸一化處理。
CSO 作為一種全局搜索優化算法,需要預先設定搜索空間。本文采用大步長網格搜索 法 對LSSVM 參 數γ,σ進 行 最 優 搜 索,構建N×M的搜索空間,從中選取預測效果最好的組合作為最優參數。本文所設搜索空間為(0~102)×(0~102),并采用二進制編碼。設定雞群規模為100,公雞占20%,母雞占60%,小雞占20%,雞群關系更新代數為10。
綜上所述,采用CSO-LSSVM 算法對污區等級進行評估的具體步驟可分為6 步:
1)輸入訓練樣本并進行歸一化處理,設置CSO 算法參數;
2)計算每個個體所對應的參數的適應度(預測準確率);
3)根據適應度確定每個個體的最優位置,并做記錄;
4)判定最優位置是否在種群范圍內;
5)判斷是否滿足雞群關系更新條件,若滿足,則更新雞群等級秩序、伙伴關系和母子關系,并更新雞群位置;若不滿足,則直接更新雞群位置;
6)完成預設的迭代次數,并輸出最優參數帶入LSSVM 中進行評估。
由于污區等級的劃分是一種定性劃分,本文將污區的5 個等級數值化,對應“1、2、3、4、5”數值,數值越高,污區等級越高,最終預測結果由四舍五入取整并歸類等級。在經過訓練之后,將23 個訓練點數據和8 個預測點數據同時進行評估,并分析評估結果。

圖2 預測樣本原始值與評估值對比
圖2 可以看出,將污區等級數值進行四舍五入近似后作定性分析后,訓練樣本的評估具有極高的準確度,正確率高達95.6%(22/23),預測樣本的結果正確率也達75%。為進一步分析LVSSM 算法評估污區等級的性能,本文引入BP 神經網絡算法作為對照,其收斂誤差和學習速率等參數也由CSO 算法進行最優選擇,在同樣的數據模型下進行10 次試驗,評估結果如表2:

表2 不同算法的性能比較
由表2 可得,在同樣訓練數據和尋優方法的情況下,相較BP 神經網絡算法,LSSVM 在評估污區等級時正確率更高,參數尋優速度更快。
1)本文采用了基于CSO 優化的LSSVM 算法對污區等級進行預測評估,取得了較好的效果,證實了氣象數據與絕緣子表面污穢物的形成存在著內在聯系。
2)對于LSSVM 算法的參數選擇問題需要具體問題具體分析,本文將CSO 優化算法引入到對污區等級評估算法中,評估結果正確率較高,同時減少了CSO-LSSVM 的迭代次數,提高了算法效率。
3)本文在基于23 個氣象監測站數據訓練下,獲取了污區等級數值的預測模型,預測結果正確率達75%,相比較BP 神經網絡算法有較高的正確率,具有一定的實際應用意義。
4)本文所選取的數據僅考慮了基于氣象數據的四維狀態變量,在有其他數據如絕緣子材質、爬電距離等的支持下,可以考慮利用CSOLSSVM 算法進行多因數混合評估,評估正確率將得到進一步提升。