趙春榮
摘要:常規輸變電設備現場狀態監測數據搜索引擎運行時間較長。本文采用綜合數據網構造扁平化搜索引擎體系結構,進行層次優化,采用IEC61850標準接口實現不同層次的數據通信。以MapReduce方式查詢執行,引擎內部設置映射階段,采用遠程訪問的方式獲取數據,建立哈希環存儲不同的數據,Hadoop采用樹狀結構分布實現網絡拓撲。
關鍵詞:輸變電設備;現場狀態監測;數據搜索;搜索引擎優化
0.引言
當前雖然有大量輸變電設備現場狀態監測數據搜索引擎的研究,但由于搜索到的信息類型復雜,選擇的信息模型基準不同,使得難以對匹配對象時會存在較大的差異,而且目前的搜索引擎都是在線搜索引擎,必須要利用輸變電設備內部的系統來分析軟件才能實現開發接口互相關聯。本文對現有輸變電設備現場狀態監測數據搜索引擎進行優化研究,通過綜合變壓器、覆冰狀態、雷電狀態和電能質量等信息分析,利用驅動開發方法對輸變電設備信息進行收集、轉換和發布,建立擴展模型,實現現行標準化,增強搜索引擎的擴展性和開放性。
1.搜索引擎架構優化
當前的輸變電狀態監測系統所采用的網絡結構大多是串行網絡,結構比較復雜。當通訊鏈路中的任何一個環節出現問題,都會導致整個監控網絡的失效,降低數據傳輸的可靠性。一些監測數據由于傳輸難度不同,需要多次轉發,通過多次轉發到主站,影響了實時傳輸。監測裝置與主站之間存在多個通信協議,各種私有的協議不斷出現,主站的接口也越來越復雜。監測供應商間的數據孤島,不能快速查找相關數據。為了解決搜索引擎結構復雜、實時性差、可靠性低、通信規則不一致等問題,本文在傳統搜索引擎的基礎上進行優化,構造了一個扁平化的搜索引擎。
文中設計的搜索引擎體系結構分層優化采用IEC61850標準接口來實現不同級別的數據通信。本論文所設計的搜索引擎采用的通訊方式是“一發雙收”。通訊信息可同時發送到省主站和網絡主站。各網絡終端集成處理單元可直接與主站通信。使網絡主站點的數據傳輸節點大大減少,節點之間可以直接進行數據通信,省去節點間的數據轉換,實現搜索引擎的在線搜索。
通過IEC61850協議,將變電站各監測設備的數據集中到處理單元,使系統中各監控設備的數據同時傳送給各主站的監控信息,使用戶能夠實現各變電站監控信息的實時傳輸。
使用扁平化搜索引擎,在搜索數據時有效降低傳輸級別,極大地提高了實時搜索性能。上載數據的所有通道成為彼此的備份通道。在數據傳輸期間某個信道發生問題時,還可以使用其他信道。用來確保可靠的數據傳輸。綜合處理單元在系統內收集監測數據。,網級主站和省級主站的描述具備一致性,數據融合效果好,分析能力高。
2.搜索引擎存儲優化
2.1數據分配最優化
當輸變電設備現場狀態監測數據的關聯數據搜索時,查詢方式為MapReduce,通過分析數據與數據之間的相關性,實現Hadoop布局方案。設置映射階段,在所有節點上對獲得的數據進行重新分組、排序,并通過遠程訪問的方式提取數據。為了防止大量與操作無關的數據在網絡傳輸中被復制甚至上傳,將所有數據按照數據屬性放置在同一個節點上,通過映射實現連接,減少了不必要的數據通信,提高了整體的執行效率。
在數據的第一份副本中確定采集設備的ID,并根據獲取的采集設備的ID進行HashMap;在第二個副本中可以得到采集時間,根據確定的采集時間實現HashMap。在第三個副本中獲得數據的定制關系,并實現HashMap。對上述三份的映射結構進行了綜合分析,以滿足不同的檢索需求和數據查詢需求。相關系數在監測數據中的應用是研究的重要內容。為更好地保證用戶的相關性,需要根據上層應用進行分配。
文中的優化算法是一種多拷貝一致性哈希數據存儲算法,它利用數據相關性將所有數據存儲在一起。對查詢數據進行分析時,將所有主要的搜索和查詢任務放在映射端,統一執行,從而降低映射到通信過程的網絡負載,確保引擎能夠在較短時間內進行查詢和分析。
輸變電設備不同類型的現場監測數據具有不同的數據類型和格式,但全部數據均具有時空特性。每一傳感器的采樣數據對應一個匹配的采樣時間和地點,利用上述的關鍵字實現采集。對Hadoop進行優化,存儲3份數據,從監測設備位置、數據采集時間、自定義相關性等方面對優化效果進行判斷。
在使用優化算法時,需要建立哈希環。
詳細流程說明如下:
(1)確定監測數據間的相關系數,使用冗余副本預先定義監測數據,設置冗余拷貝數為3;
(2)分析每個集群中的哈希值,得到的哈希點配置在不同的哈希環區間內;
(3)對監測數據的時空屬性和相關系數進行計算,獲得準確的散列值,分析副本1的數據來源,確定監測ID,計算得出哈希值1,以映射方法在哈希環上復制;分析副本2的時間屬性,計算得到哈希值2,將時間戳映射到哈希環上;分析副本3的相關系數,得到相應的哈希值3,映射方式為依次映射;
(4)通過數據散列值和數據節點散列值,決定數據存儲在哪里,并以順時針方式實現映射;
(5)如果存儲數據的節點發生了異常現象,則該節點跳過并保存到下一個節點。
2.2拓撲優化
數據讀取內容主要是名字節點,分析數據節點與客戶機之間的距離,確保從最近的節點讀入數據內容,提高讀取時間。在搜索引擎節點中,Hadoop以樹狀結構分布,每棵子樹的根節點連接計算機上的交換節點,兩個節點之間的距離就像一個節點到另一個節點所經歷的跳數。Hadoop所有的缺省配置節點都被統一到一個框架中,通過分析真實集群的配置效果,拓撲結構將節點網絡傳遞給Hadoop,確保數據以合理的方式進行讀取和寫入。
3.結束語
本文研究了一種輸變電設備現場狀態監測引擎,采用開放標準,優化了其結構和存儲方式,并利用平面結構優化了設備。利用 Hadoop數據,采用 IEC 61850標準進行數據分配,實現了數據共享,減少了監控設備的監控難度,使引擎內的所有數據都能轉發。
參考文獻
[1] 楊虹,張來福,姜敏,等.輸變電設備在線監測及診斷技術的研究[J].現代電子技術,2017,40(9):163-165.
[2] 廖瑞金,王有元,劉航,等.輸變電設備狀態評估方法的研究現狀[J].高電壓技術,2018,44(11):3454-3464.