李品磊 胡日鵬 葛馨遠 陳劍 王照
摘要:隨著低壓配電網的應用和拓展,這使得配電網臺區識別服務平臺的壓力不斷提升,而傳統的配電網臺區識別服務平臺存在運算和匹配速度過慢的問題,因此提出基于多模式匹配的配電網臺區識別服務平臺研究。通過多模式匹配算法對數據進行預處理,經由配電網臺區數組識別匹配,建立識別服務平臺的搜索樹算法。通過實驗驗證,傳統的識別方法與此識別方法在運算速度上的差異。證明了多模式匹配算法,具有效率高的特點,滿足識別服務平臺的需求
關鍵詞:運算;識別;準確性;運算效率
中圖分類號;TM72文獻標識碼:A
0引言
低壓配電網是連接著大部分的普通用電戶的方法,而為了方便管理者進行管理,建立起了配電網臺區識別服務平臺[1]。目前的配電網服務平臺所采用的算法多為AC算法或者WM算法。不過目前用戶不斷增加,傳統的運算方法難以滿足用戶需求。多模式匹配一次匹配過程中就可以完成對于多種模式下的匹配,可以滿足配電網臺區識別服務平臺的要求。配電網臺區識別服務平臺可以幫助低壓配電網管理中促進主動搶修和推進故障,可以遠程對用戶的異常用電進行檢測,也避免了竊電現象的出現。
1多模式匹配識別服務平臺
1.1用戶數據預處理
多模式匹配技術是依靠樹狀的數據鏈,并將其構成一個搜索樹狀圖,在此平臺的運算過程中,樹的高度取決于模式串的數量,在擁有大量數據集的情況下,算法的效率會變得低下[2]。對此情況,對于數據集首先進行排列,并將其排序成字典性的模式串,使用Leaf-Attaching算法對模式串使用變量記錄進行壓縮,可以使得多余的內存空間得到釋放。重復該過程直到使全部的模式串完成識別和遍歷。在預處理運算中,會生成一個有限狀態自動機FSM,可以表示為:
1.2配電網臺區數組識別匹配
對于識別方法的改進,建立一個完全二叉搜索樹算法。用運算的數組搜索來實現搜索數組的目的[3]。使用完全二叉搜索樹算法,可以讓搜索運行中所占用的內存得到降低。因為有緩存數據,也可以讓運算變得更快。搜索過程中,使用哈策分組法預處理階段將一棵較大的完全二叉搜索樹按照模式串前k個字符的哈希值拆分成不同的組。在模式匹配階段,每次進行精確匹配時,先計算文本串中待匹配子串的前k個字符的哈希值,再根據哈希值遍歷對應分組中的完全二叉搜索樹實現模式串匹配過程[4]。使用完全二叉搜索樹算法讓平臺對于配電臺數組進行識別匹配。
1.3識別用戶詞頻及意見
在多模式匹配的場景下,將數組實現的完全二叉搜索樹算法運用于 ELSM 算法構造完全二叉搜索樹的過程中[5]。該算法在使用中需要考慮到在多模式匹配算法中由于的模式串信息在進行模式匹配的同時,對該存儲的地址容器就已經進行識別,在完全二叉搜索樹中,對于特定的數組實現其數組的完全二叉搜索樹,該情況是對于數組中存儲的不同模式串搜索容器中的不同數值以及其索引值,并且在該數組的下標范圍為
到
,這里的
表示著二叉樹中節點的數量。假設目前節點在數組中的下標為
,則當前節點的左孩子節點的下標為
,當前節點的右孩子節點下標為
。
此算法在使用遞歸的運算結構的同時又在構造上融合二叉搜索樹,并且該算法具有如下特性:在該算法進行運算時,對一個二叉搜索樹進行中序遍歷,則輸出的是一個有序序列,而且有序序列的第一個元素一定是二叉搜索樹最左孩子節點,當第一元素確認為最左孩子節點時,則第二個元素肯定是最左孩子節點的父節點,因此可以在對數組形式的樹進行中序遍歷的過程中將元素添加到數組中。同時為了方便使用者收集用戶的意見,系統將會提供相關的對于收集詞頻的方法,即(2)
2 實驗設計分析
2.1實驗準備
設計實驗,對比本文設計的識別方法和傳統常見的AC算法識別平臺以及WM算法的識別服務平臺的情況,測試在多模式匹配算法與傳統算法的性能關系。實驗的設備條件為,單核 Xeon 2.2Ghz 處理器,4GB 內存,Ubuntu 14.04 64 位操作系統環境下,使用C++編程語言實現。設計程序隨機生成模式集,使用這三種識別算法對模擬集進行識別,并且根據識別速度,來評估這三個識別系統的優劣性。
2.2實驗結果分析
實驗結果表1所示。
如圖1所示,AC算法在運算超過
的模擬集時,因為運算時占用的內存過高,使得實驗設備無法支撐,后續的實驗運算無法支撐。同時也說明了AC算法在運算中占用內存過高的情況,而本文算法的運算速度均優于AC和WM識別方法。并且本算法步驟清晰,較為簡潔,能夠很好的滿足高效性和準確性,能夠很好的完成服務發現與識別的功能需求。本算法為基礎實現的服務發現與識別模塊,能夠為配電網臺區識別服務平臺,提供穩定且準確的識別服務來源,可以為后續服務接入與用戶捜索提供支持。
3結束語
本文對基于多模式匹配的配電網臺區識別服務平臺的算法進行重新改良,針對多模式匹配算法預處理階段的模式串的壓縮進行改良,對于配電網臺區數組的識別匹配建立二叉搜索樹算法,改善識別服務平臺的搜索樹算法,設計實驗進行分析,實驗結果顯示,本文所改良的方法在運算速度上優于傳統方法。
參考文獻
[1]?伊力亞爾·達吾提.維吾爾文本處理中多模式匹配的應用[J].電腦知識與技術,2019,15(16):210-211.
[2]?曹為政,葛蒙蒙.多模式匹配算法研究和優化[J].智能計算機與應用,2018,8(02):129-133.
[3]?王守相,張衛濤,葛磊蛟.智能配電網統一模型云與應用服務技術系統[J].電力自動化設備,2015,35(02):49-54.?[4]?宣菊琴.配電網全過程網格化管理實踐研究[J].中國管理信息化,2019,22(24):73-75.
[5]?陳洪濤,王法玉,靳彩園,等.多模式匹配算法的應用與改進[J].中國科技信息,2019(23):78-80.
第一作者簡介:李品磊(Li PinLei),1989年6月5日,男,漢族,湖南邵陽,研究生,中級工程師,電力信息系統研究