劉宣廷1, 李 鵬1, 苗愛敏2, 陳 勇1, 沈 鑫, 曹 敏
(1.云南大學 信息學院,云南 昆明 650500; 2.仲愷農業工程學院,廣東 廣州 510225;3.云南電網有限責任公司 電力科學研究院,云南 昆明 650217)
近年來由于全球氣候變暖,對我國自然災害風險分布和發生規律產生了全方位、多層次的影響。而由惡劣氣候誘導的冰凍、風災、雷害、大霧、洪澇、泥石流等自然災害已成為威脅電網安全的主要因素[1]。特別是在我國的云、貴、川、渝、湘等低緯度高海拔地區,由于地形地貌復雜,氣候環境多變,每年冬季在微地形和微氣候的共同影響下經常發生嚴重覆冰事故,對當地的經濟及人民的生活造成巨大的危害[2]。覆冰導線在氣溫升高、自然風力作用等情況下會產生脫冰現象,脫冰會引起輸電線路瞬時的張力變化,引起輸電線路閃絡,使脫冰檔絕緣子掛點處承受很大的縱向不平衡張力,對鐵塔產生很強的沖擊效應,危害線路的安全、穩定運行[3-5]。因此,如何根據氣象部門提供的氣象信息預測有可能對輸電線系統造成的覆冰災害影響已成為亟需解決的問題。
然而輸電線路覆冰過程是一個高維的非線性時間序列過程,具有動態性、不確定性、非線性、高維及突變等特性。不論是基于機理模型[6-7]還是統計學模型[8-9],其本質都是基于解析模型的覆冰預測方法。該類模型雖然可以利用微觀氣象信息對覆冰狀況進行監測和預報,但要求解析模型的精確化。而輸電線路覆冰過程解析模型不易建立,且模型中含有較多的待定參數和經驗參數,因此在實際的應用過程中無法滿足不同監測點的地理和氣候特性,其模型的魯棒性顯然存在問題。
另一方面,現有的輸電線路覆冰監測系統在運行過程中積累了大量的現場數據,例如溫度、濕度、風速、風向、雨量、氣壓、絕緣子拉力、絕緣子傾斜角及風偏角、實時覆冰負荷等數據信息,而這些數據信息即為現場監測點氣象因子與輸電線路覆冰過程模型I/O映射關系最真實的反映。因此不少學者基于數據驅動建模的思想,提出了以機器學習為主要方法的覆冰負荷定量預測的智能計算方法[10-14],此類方法均基于數據驅動對輸電線路覆冰進行了定量預測研究,很少關注微氣象因素內在聯系對輸電線路覆冰過程的影響。
由此提出了基于譜聚類算法的輸電線路覆冰過程微氣象特征提取模型,該模型通過提取輸電線路覆冰的各階段微觀氣象特征,對覆冰過程進行定性分析,對嚴重覆冰、覆冰脫落等過程進行較好的聚類。分析總結了輕微覆冰、嚴重覆冰及覆冰脫落過程的微氣象條件,為電網部門對由輸電線路覆冰引起的電網災害預警提供氣象條件參考。
譜聚類算法是近年來出現的一類性能優越的聚類算法,相較于其他聚類算法,譜聚類算法實現簡單,不易陷入局部最優解,且具有對非凸數據集聚類的能力[15],因其具有較強的數據適應能力、較小的計算量以及優秀的聚類效果而得到廣泛運用[16]。
譜聚類是基于圖論而發展起來的聚類算法,主要思想是將數據集(x1,x2,…,xi)中的每個點視為空間中的點,并建立任意兩點間的邊連接,邊權重wij表示xi與xj的連接關系,距離較近的兩點之間邊權重較大,距離較遠的兩點之間邊權重較小,且有wij=wji,進而使用無向圖G(X,W)的表示方法描述整個數集,X表示原始數據集,W表示鄰接矩陣[15]。然后設定切分標準并對無向圖進行多路劃分,使得同一簇的數據點間具有強連接關系,不同簇的數據點間的連接關系較弱[15]。
設數據集為X(x1,x2,…,xi),使用高斯核函數定義邊權重wij,此時鄰接矩陣W與相似矩陣S相等[16]:
(1)

再由下式求出拉普拉斯矩陣L:
(2)
之后求出拉普拉斯矩陣L最小的k個特征值λ(λ1,λ2,…,λk) 以及對應的特征向量V(v1,v2,…,vk),最后對特征向量V進行K-means聚類[16-18],得到簇分類C1,C2,...,Ck。
圖1為基于譜聚類的電網災變氣象條件特征提取過程,數據為云南電網提供的監測數據,每15 min采樣一次。將歷史的監測數據,包括氣象因子(溫度、濕度、風速等)、時效因子以及由氣象因子所決定的成災因子(導線覆冰負荷),作為譜聚類算法的輸入,使用譜聚類算法對輸入數據進行特征提取,輸出為一維數組,表示每組數據對應的聚類類別。

圖1 基于譜聚類的電網災變氣象條件特征提取過程
圖2為基于譜聚類算法的輸電線路覆冰過程特征提取流程圖。
具體實現步驟如下。
① 設置參數,根據工程需求設置聚類簇數k以及σ值。
② 輸入數據并進行預處理,將時效因子、覆冰質量以及與輸電線路覆冰增長相關的微氣象因子(包括溫度、濕度、風向的歷史監測數據)作為模型輸入,并進行濾波及歸一化等預處理。

圖2 輸電線路覆冰過程提取流程圖
③ 求拉普拉斯矩陣L的k個最小特征值以及對應的特征向量,根據式(1)求出鄰接矩陣W,有相似矩陣S=W,由式(2)可獲得拉普拉斯矩陣L,最后求出其k個最小的特征值以及對應的特征向量V(v1,v2,…,vk)。
④ 對V(v1,v2,…,vk)進行K-means聚類,模型輸出為一維數組,對應每組數據所在的類別序號。
⑤ 最后將聚類結果進行統計分析,獲得微氣象因子的均值、范圍、傾向率等統計量,并進行綜合分析。
所使用的數據為云南電網提供的相關數據,微氣象因素及覆冰質量數據如圖3所示。
在進行仿真實驗時,參數聚類簇數k設置為9,即將覆冰過程分為9類,σ=0.1,仿真結果如圖4所示。

圖3 微氣象因素及覆冰質量數據

圖4 聚類結果圖
由仿真結果可知,譜聚類算法將輸電線路覆冰過程聚為9簇, 較準確地分離了無覆冰、輕微覆冰、覆冰增長、嚴重覆冰、覆冰脫落等過程,對無覆冰(第1類)、輕微覆冰(第6類)、嚴重覆冰(第3類)以及覆冰脫落過程(第5類)進行統計分析,統計數據如表1和表2所示。
表1為類別1,3,5,6對應的氣象特征,包含溫度、濕度以及風向的范圍和均值,表2 為溫度、濕度、風向的傾向率,氣候傾向率是指氣候變化趨勢率,通過建立氣象數據(x1,x2,…,xi)與時間(t)的一元線性回歸方程(3)來確定傾向率[19]:
x=pt+q
(3)
式中,p為回歸系數;q為回歸常數;p和q通過最小二乘法進行估計。p的10倍即為氣象因素傾向率[17],單位為:/10a。
為較準確地描述覆冰過程的氣象特征,根據氣象數據的長度進行分段處理,約10個數據點為一個單位,計算其氣象傾向率,表2 即為連續的各段數據氣象傾向率。傾向率為正表示此段數據總趨勢為上升,傾向率為負表示此段數據呈下降趨勢,其大小表示數據的變化程度。
由于輸電線路是一個時序過程,僅通過表1統計的各氣象因素的范圍及均值不能客觀地反映輸電線路覆冰每個階段的氣象特征,需要結合表2 給出的傾向率統計量,根據表1與表2進行綜合分析可提取出類別1,3,5,6的氣象條件特征。
第1類:無覆冰,對應的數據序號為1~19,其最高溫達到4.8 ℃,濕度最低為57%,由溫度、濕度、風向的傾向率可知其變化程度較大,微氣象因子極不穩定,即在溫度較高、濕度偏低且氣象因子波動較大的微環境不易形成覆冰,具體統計量如表1、表2所示。

表1 氣象條件特征
第3類:嚴重覆冰,對應的數據序號為178~209,覆冰質量在601~952 kg之間,此類情況溫度范圍在-10.4~7.9 ℃之間,平均濕度達到95%,且由表2可知溫度、濕度、風向的變化較為平緩,即在低溫持續時間長、濕度大且各氣象因素變化平緩的氣候條件下,易形成嚴重的覆冰。
第5類:覆冰脫落,對應的數據序號為210~241,氣溫范圍在-8~-5.2 ℃,平均濕度為95.2%,但由表2可知,前兩段數據的溫度持續升高,濕度持續下降,且第一段數據的風向發生突變,即當輸電線路覆冰較嚴重時,在溫度持續上升、濕度持續下降以及風向發生較大程度突變的情況下,輸電線路覆冰易脫落。若前期出現嚴重覆冰,則在此類氣候條件下,需要特別注意輸電線路覆冰脫落的狀況發生,提前做好防御措施,保障電網安全運行。
第6類:輕微覆冰,對應的數據序號為242~260,溫度范圍為-8.4~-6.9 ℃,溫度較低,平均濕度為96.2%,溫度傾向率以及濕度傾向率為負,且數值較小,即溫度及濕度均持續緩慢下降,但風向變化較劇烈,此類氣象條件易形成輕微覆冰,具體的統計量如表1所示。
針對覆冰過程具有非線性,且受微氣候以及微地形的影響較大,很難建立精確的數學模型對該過程進行直接預測,提出了基于譜聚類算法的輸電線路覆冰過程微氣象提取模型,此模型可以對輸電線路脫冰過程微氣象特征進行較好的分類提取,并統計了共4類覆冰狀況的各氣象條件的范圍、均值以及傾向率,通過對這些統計量的分析整理,獲得不同覆冰狀況對應的微氣象條件,并利用云南電網提供的相關數據驗證了此模型的有效性。