余 銳,鄭 亮,熊 俊,陳 愚,陳柏汗,鐘 璐
(1.國家電網公司西南分部,四川 成都 610042;2.國電南瑞南京控制系統有限公司,江蘇 南京 211106)
隨著能源互聯網的發展,電力通信設備不斷增多,其運行狀態對電網安全穩定控制裝置的影響逐漸增大,通信設備缺陷分析已成為影響電網安全穩定運行的關鍵因素。電力通信規模不斷擴大,原有的通信設備檢修工作方式難以支撐通信設備的大規模投入使用帶來的壓力,設備多且復雜給檢修人員帶來了相當大的工作負擔,同時也給電網運行帶來了一定的風險,運維人員的通信檢修水平亟待提高[1-2]。當前通信設備的運維人員在日常工作中也會對所發現和處理的缺陷進行記錄,方便日后的查看、統計和分析[3]。但此類方法都是依靠經驗進行人為消缺,未對其原因作深入分析,導致檢修效率低且不能有效預防缺陷的產生。
數據挖掘技術在電力通信系統多個領域的應用已經日漸成熟。在用大數據進行設備缺陷分析方面,文獻[4-7]使用關聯規則對電力變壓器等二次設備進行了缺陷分析,尋找二次設備的薄弱環節并對誘發薄弱環節的原因進行了探究。文獻[8-9]引入了聚類分析理論和層次分析法,從數據挖掘的角度對光伏出力進行了建模,并將其用于含光伏發電的系統可靠性評估。上述研究重點針對電力系統二次設備,探究二次設備的缺陷和影響因素,尚未涉及對電力通信設備缺陷的分析,且研究方法對于通信設備應用的適應性不足。文獻[10-11]對電力通信設備的技術和業務進行了介紹,并提出如何優化通信網的相關策略,但對通信檢修中,如何快速找到電力通信設備缺陷的影響因素,提高檢修速率和減小用戶損失,并未作深入研究?,F有基于大數據的其他二次設備的研究集中在通信檢修和故障分析層面[12-15],但很少有研究對電力通信設備缺陷進行溯源以發掘缺陷規律并提供降低通信設備缺陷發生率的思路,且多數研究使用傳統Apriori算法,復雜度高且內存占用量大,不適用于電力通信設備缺陷數據,面對通信設備缺陷時依舊是效率低、損失大。
針對以上問題,本文以同步數字體系(SDH)傳輸設備的物理模型基礎為例,結合設備本身、人為因素、外界環境,并對Apriori算法進行改進,再導入電力通信設備缺陷數據,提出1種基于改進Apriori算法的電力通信設備缺陷關聯性分析方法。首先,對整體研究思路進行闡釋,然后基于SDH通信設備物理模型,分析通信設備缺陷產生的影響因素與通信設備的缺陷特征;接著,融合關聯規則和改進Apriori算法數據模型,提出電力通信設備缺陷關聯性分析,對通信設備缺陷進行多維度綜合診斷;最后,以當地實際通信設備缺陷數據,對基于改進Apriori算法的通信設備缺陷關聯性分析方法的有效性進行驗證。
以SDH通信傳輸設備為例,電力通信設備缺陷關聯性分析方法的總體實現框架,如圖1所示。首先,對具體通信設備進行建模,通過采集近1 000條當地實際通信設備缺陷數據,包括缺陷類型和影響因素,如E={信號丟失,尾纖中斷,過量誤碼,光功率過載,環境溫度變化},并對原始數據庫進行有效分析,形成通信設備缺陷多維度影響因素和通信設備缺陷分類圖;然后,對缺陷數據庫進行編碼整合,將缺陷類型以字母分類,影響因素以數字分類,形成由字母和數字構成的數據集800條;接著對Apriori算法進行改進,根據缺陷數據模型,使用關聯規則和改進Apriori算法對編碼整合的數據進行深入分析,計算出設備缺陷候選項集的支持度,以及影響因素和設備缺陷之間的置信度,找出支持度較高的缺陷頻繁項集,并將置信度高的影響因素與缺陷形成強關聯,可知信號丟失這類設備缺陷出現次數較多,且多由尾纖中斷和光功率過載所導致,因此,在設備狀態檢修時,重點針對此缺陷類型進行預防性故障排查,并在此類型故障發生后,首先,對尾纖中斷和光功率過載等影響因素進行故障檢修,從而實現基于改進Apriori算法的電力通信設備缺陷關聯性分析方法。
圖1 總體實現框架Fig.1 Overall implementation framework
SDH是1種將復接、線路傳輸及交換功能融為一體并由統一網管系統操作的綜合信息傳送網絡,SDH傳輸設備抽象成邏輯存在即是SDH網元,其傳送網可分為3層:電路層、通道層和傳輸媒質層。其中,電路層是面向業務的,可直接為用戶提供通信業務SDH的業務承載,通道層可進一步分為高階通道層和低階通道層。高階和低階通道層易產生過量誤碼和軌跡標識失配等缺陷。傳輸媒介層中的段層又分為復用段和再生段,其中復用段MST設備易產生過量誤碼等遠端缺陷,而再生段RST設備易產生信號丟失和幀丟失等缺陷。
SDH傳輸設備的缺陷與一些模塊有密切關系,其中包括光模塊和光纖收發器。光模塊的作用就是發送端把電信號轉換成光信號,通過光纖傳送后,接收端再把光信號轉換成電信號。而光纖收發器是1種將短距離的雙絞線電信號和長距離的光信號進行互換的以太網傳輸媒體轉換單元,光纖收發器一般應用在以太網電纜無法覆蓋、必須使用光纖來延長傳輸距離的實際網絡環境中,同時在幫助把光纖最后1 km線路連接到城域網和更外層的網絡上也發揮了非常大的作用。
電力通信設備告警、缺陷通常由多種因素引起。通過采集通信設備缺陷數據,分析誘發通信設備缺陷的關鍵因素,建立電力通信設備多維度影響因素體系。
根據SDH傳輸設備模型,分析其性能和運行參數,以及設備在不同通道層易產生的缺陷,發現電力通信設備多維度影響因素通??煞譃橥獠恳蛩睾蛢炔恳蛩?個方面。外部因素包括環境溫濕度變化、光纖線路質量、人為操作不當、防震防塵條件、極端自然災害等。其中人為操作不當多為光纖方向接錯和時鐘源參數設置錯誤。內部因素是指引發告警缺陷的設備源發性因素,包含了設備投運時長、光功率過載、網絡層報文出錯、設備廠家類型、設備負載程度等一系列因素。
電力通信設備有多種缺陷,這些缺陷可分為信號丟失、幀丟失、過量誤碼、軌跡標識失配、指針丟失、時鐘失效、信號劣化、鏈接失效等等,如果不進行及時的通信檢修,這些缺陷會引發嚴重的故障,給電網和用戶造成巨大的損失。
關聯規則(Association Rules)能夠反映事物之間的相互依存性和關聯性,如果2個或多個事物之間存在一定的關聯,通過數據挖掘出其相關性,并分析內在的原因,進而可以快速找出導致該結果最可能的原因或者從原因預測出結果。
如果對于1個數據集,項(Item)指分析數據中的1個對象,項集(Itemset)就是由若干項構成的集合,每1條缺陷數據記錄就是1個項集,記為I={I1,I2,…,In}。其中Ii表示缺陷數據中每1個缺陷元素或影響因素。關聯規則表示為A?B,其中A∈I,B∈I,且A∩B≠?。本文A對應于通信設備缺陷的影響因素,B則表示通信設備的缺陷。評價1條關聯規則的優劣有2個重要的指標,即支持度(Support)和置信度(Confidence)。支持度為某項集在數據集中出現的頻率,置信度則表示關聯規則的可靠程度。
對于1個項集I,影響因素A和設備缺陷B是其中的2個子項集,對于1條關聯規則A?B,關聯規則A?B的支持度如式(1)所示:
(1)
式中:count(A∪B)表示影響因素A項集元素和缺陷B項集元素同時出現的數量,count(dateset)表示所有缺陷記錄的數量。
關聯規則A?B的置信度如式(2)所示:
(2)
式中:count(A)表示影響因素A項集元素在數據庫中出現的數量。本文計算影響因素A和缺陷B形成的關聯規則的支持度和置信度,若都滿足所設定的最小閾值,這一對影響因素和缺陷即可形成強關聯。
Apriori算法的核心思想是自連接和剪枝。其算法過程依賴算法的2條性質,即:1)頻繁項集的所有非空子集也必是頻繁項集;2)非頻繁項集I的項集中添加事物A,則新的項集I∪A也一定不是頻繁項集。
然而算法過程存在不足之處,從候選項集到篩選頻繁項集,需要頻繁掃描數據庫,時間復雜度高,內存占用量大?,F對算法進行改進,從而更快分析電力通信設備缺陷數據。首先對缺陷數據進行分層處理,分為通道層和傳輸介質層,其中通道層再細分為低階和高階,而傳輸介質層中的段層再分為復用段和再生段。接著對設備缺陷數據庫進行預處理,映射成僅含有“0”、“1”元素的矩陣,即布爾矩陣。矩陣行表示1條缺陷數據,列表示缺陷分類和影響因素;若bi×j=1表示缺陷j出現在第i條數據中,若bi×j=0表示缺陷j未出現在第i條數據中,由此以“0”、“1”元素組成矩陣B,生成通信設備缺陷布爾矩陣。例如,現有5條設備缺陷記錄,對應5種設備缺陷,分別為信號丟失、幀丟失、軌跡標識失配、指針丟失、信號劣化,每條記錄存在對應缺陷即為1,否則為0,由此可形成5×5的布爾矩陣,如式(3)所示:
(3)
式中:A、B、C、D、E分別為5種設備缺陷對應的編號。
對Apriori算法進行改進,具體為,電力通信設備缺陷布爾矩陣B每列缺陷項并集產生候選頻繁C-1項集;統計布爾矩陣B每列“1”元素出現的次數,進行剪枝操作,即若j列“1”元素出現次數Sj≤n×a%,刪除布爾矩陣該列,即刪除該缺陷項,產生頻繁L-1項集;再對頻繁L-1項集進行連接操作,即布爾矩陣B缺陷項列進行邏輯“與”運算,產生候選頻繁C-2項集。例如針對上述矩陣,最小閾值設為20%,即Sj≤1時,刪除矩陣E列,即信號劣化缺陷,再對新矩陣進行邏輯“與”運算,得到如式(4)所示:
A B C D AB AC AD BC BD CD
(4)
式中:AB、AC、AD、BC、BD、CD為對新矩陣的對應列進行邏輯“與”運算得到的缺陷列。
再對候選頻繁C-2項集各子元素的“1”與設定的最小閾值進行比較,若不滿足則刪除,更新頻繁L-2項集。依次下去進行剪枝和連接操作,直到更新到L-k項集。改進算法實現過程如圖2所示。
圖2 改進Apriori算法流程圖Fig.2 Flowchart of improved Apriori algorithm
為了使通信設備的缺陷管理水平得到提高,就要對通信設備缺陷進行及時的分析和處理,當電網的通信設備出現異常時,需要工作人員發現其異常,并對缺陷信息及時記錄,電力生產系統對各種通信設備的缺陷信息進行管理。若只分析數據本身的含義,在實際運維過程中通信設備運行產生的數據量大,有些數據冗余且不具代表性,得不到太多有用的價值。因此,本文采用關聯規則對電力通信設備缺陷進行關聯性分析,將原始數據編碼整合后,導入改進后的Apriori算法,結合通信設備模型與改進后Apriori算法模型提出基于改進Apriori算法的通信設備缺陷關聯性分析方法。
分析缺陷規律需要獲取有效且具有代表性的特征數據構成項集。根據上述多維度影響因素、缺陷特征分類、通信設備模型分析可知,引起缺陷的影響因素和缺陷分類這2個數據量是分析設備失效、缺陷規律的必需元素。由此可構建缺陷關鍵因素集合,如式(5)所示:
DR={Dm,Fn,Mi}
(5)
式中:Dm為缺陷的分類;Fn為導致缺陷的多維度影響因素;Mi代表數據來源地。
基于得到的某地缺陷數據,篩選出缺陷關鍵因素集合DR,再利用改進Apriori算法獲取頻繁項集,從而得到所需要的關聯規則。為分析產生規律并提出關聯性分析方法,需要獲取以下強規則,如式(6)所示:
R:Fn?Dm
(6)
式中:R規則表示影響因素與缺陷的關聯關系,用于分析何種影響因素導致了何種缺陷,以產生缺陷規律。所提出的基于改進Apriori算法的電力通信設備缺陷關聯性分析模型如圖3所示。
圖3 基于改進Apriori算法的電力通信設備缺陷關聯性分析模型Fig.3 Correlation analysis model of power communication equipment defects based on improved Apriori algorithm
為驗證提出的基于改進Apriori算法的電力通信設備缺陷關聯性分析方法的有效性,收集某地區的電力通信設備缺陷數據進行實際算例的仿真,利用改進后的Apriori算法分析通信設備缺陷數據。
對收集的通信設備缺陷進行整理歸納,得到800條有效缺陷集合。歸納得出主要缺陷類型8類,包括:信號丟失、幀丟失、過量誤碼、軌跡標識失配、指針丟失、時鐘失效、信號劣化、鏈接失效;影響因素則主要包含9類,分別為尾纖中斷、光功率過載、網絡層報文出錯、環境溫度變化、設備運行時長、設備制造參數、環境濕度變化、極端自然災害、設備負載程度。對樣本數據進行編號,其中,尾纖中斷、光功率過載等9類影響因素用1~9進行編號,而信號丟失、幀丟失等8類缺陷用A~H進行編號,每1條數據如E1={A,1,C,D,3,6}。采取改進后Apriori算法的電力通信設備缺陷關聯性分析方法對收集的缺陷數據進行分析。將每條記錄中的設備缺陷和影響因素通過編碼映射成布爾矩陣,由于樣本集數據量較大,設定改進Apriori算法的最小支持度閾值和最小置信度閾值分別為10%和50%,經過頻繁項集的循環自連接與剪枝,可得到頻繁項集,并根據置信度指標挖掘強規則。
將上述類似E1的數據集導入改進后的Apriori算法,通過計算字母編號的支持度形成設備缺陷的頻繁項集,計算字母與數字編號之間的置信度得到設備缺陷與影響因素之間的關聯關系,如A與1+2之間的置信度較高,則可形成1+2?A的強關聯,及尾纖中斷+網絡報文出錯?信號丟失。根據頻繁項集挖掘的強規則共有23條,從中篩選出可供分析缺陷機理及提出關聯性分析方法的滿足最小閾值條件的有效強規則共有13條,得出結果見表1。
根據表1計算得出的支持度和置信度,可以分析得出何種缺陷類型多發且多由何種影響因素導致,可構建電力通信設備缺陷數據規則庫,如圖4所示,數字表示強規則的置信度。
圖4 通信設備缺陷數據規則庫Fig.4 Rule base of communication equipment defects data
根據規則庫,可針對當地電力通信設備狀態檢修及故障檢修,給設備運維人員提出參考意見及建議:
1)根據電力通信設備缺陷數據規則庫對發生的設備缺陷進行溯源分析,找到該缺陷對應的影響因素,由于置信度高代表該規則可靠性高,即此類影響因素更可能導致此類缺陷,應優先對此類影響因素進行診斷。例如在發生信號丟失或幀丟失時,應監測尾纖、光功率和網絡報文質量,運行光纖收發器及光模塊的自診斷功能;在狀態檢修時,可以針對無線信號質量與軟件運行狀態關鍵影響因素進行預防性故障排查,以減少信號丟失和幀丟失缺陷的產生。
2)在日后的運維過程中采取手段避免此種影響因素的發生,從而降低缺陷率。支持度高的缺陷和影響因素代表某種缺陷多發且具有規律性可循,可采取預防性措施提前找出對應缺陷的影響因素,在日后的運維過程中安排巡查檢修,避免此類缺陷的發生,從而降低缺陷率。例如過量誤碼及軌跡標識失配多因環境溫度變化和設備運行時長,應及時對周圍環境溫度進行檢測,若不在設備正常運行范圍內,必須及時做出調整措施,對設備運行狀態也應及時檢查,過度使用的設備應立即更換。應當針對該缺陷問題提高運維人員的專業能力及意識。
3)如果是單個缺陷產生,例如只有幀丟失或軌跡標識失配,應當對置信度極高的尾纖中斷、光功率過載或環境溫度變化、設備運行時長進行檢測,若還摻雜著其他缺陷,則應對同時導致這些缺陷的另加原因進行重點防范。
本文將800條數據記錄映射成布爾矩陣,通過設置最小支持度閾值,分別運用傳統Apriori算法和改進Apriori算法對樣本進行關聯性分析,改進Apriori算法有效減少了候選項集的遍歷次數,高效找出缺陷頻繁項集,大大降低了時間復雜度和內存空間,比較結果如表2所示。
表2 時間復雜度比較Table 2 Comparison of time complexity
1)本文所提方法可以分析電力通信設備缺陷產生規律,找到導致設備缺陷的重要影響因素并形成強關聯,在預防性狀態檢修及故障檢修時,可重點預防信號丟失、幀丟失等主要缺陷,并當缺陷發生后,優先排查尾纖中斷、光功率過載等影響因素。
2)改進后的Apriori算法大大提高程序運算效率,節約內存容量,自關聯性分析方法適合于大量電力通信設備缺陷,仿真實例驗證了本文方法的有效性,為優化通信檢修提供策略,確保電網安全穩定運行提供保障。