999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于電網數(shù)據(jù)中臺數(shù)據(jù)質量校驗的探索與研究

2021-01-12 05:47:19趙小凡,杜舒明,梁雪青
科技尚品 2021年12期
關鍵詞:數(shù)據(jù)質量

趙小凡,杜舒明,梁雪青

摘 要:電網數(shù)據(jù)中臺建設和實踐探索的目的是夯實電網數(shù)據(jù)應用基礎,提升數(shù)據(jù)應用的質量以及服務水平,借助技術手段,采集、分析數(shù)據(jù),彌補數(shù)據(jù)系統(tǒng)存在的漏洞。文章圍繞電網數(shù)據(jù)中臺數(shù)據(jù)質量展開探索,提出數(shù)據(jù)質量校驗的實踐方案,為政府科學決策、電網建設與質量服務效能提升、資源共享與數(shù)據(jù)精準分析等方面提供參考。

關鍵詞:電網數(shù)據(jù);數(shù)據(jù)質量;數(shù)據(jù)校驗

中圖分類號:C39 文獻標識碼:A 文章編號:1674-1064(2021)12-0-03

DOI:10.12310/j.issn.1674-1064.2021.12.018

電網質量保障要確保電力調度系統(tǒng)中各類運行數(shù)據(jù)正常傳輸,依靠技術手段和平臺建設,解決數(shù)據(jù)采集、數(shù)據(jù)傳輸、外界因素的影響和網絡傳輸速度延遲等問題,保障數(shù)據(jù)運行中不會因為上述不正常因素造成傳輸中斷,造成源數(shù)據(jù)異常和錯誤,影響和干擾數(shù)據(jù)調度綜合數(shù)系統(tǒng)中數(shù)據(jù)運行的正確性與及時性。因此,需要可靠的數(shù)據(jù)質量校驗方法,保障各類數(shù)據(jù)質量以及系統(tǒng)運行穩(wěn)定。

1 電網企業(yè)數(shù)據(jù)平臺和系統(tǒng)功能優(yōu)化的背景

結合國家電網企業(yè)相關數(shù)據(jù)分析,接入智能電表等各類終端5.4億臺,采集數(shù)據(jù)日增量超過60 TB,車聯(lián)網接入充電樁超過28萬個,電商平臺注冊用戶2.25億,在線采集全國約4.71億用戶的用電信息,線上繳費率超過50%。電網企業(yè)信息化系統(tǒng)建設為業(yè)務進展和企業(yè)經營提供支持,保障電網運行穩(wěn)定和數(shù)據(jù)傳輸暢通無阻,為電力用戶提供優(yōu)質的服務,實現(xiàn)各級業(yè)務展開和部門及時溝通,并以信息化手段全方位監(jiān)測電力系統(tǒng)。

雖然借助技術手段處理電力系統(tǒng)數(shù)據(jù)以及業(yè)務開展有很大的優(yōu)勢,但是也存在一些不足之處:一是電力業(yè)務上仍是“部門級”,各業(yè)務系統(tǒng)圍繞各自部門的業(yè)務單獨運用,造成業(yè)務流程斷點,形成數(shù)據(jù)壁壘;二是技術上信息化資產和能力未能積累,電力系統(tǒng)中的業(yè)務服務能力和數(shù)據(jù)共享與處理能力都相對薄弱,建設成本投入較大;三是管理和服務理念上有待強化。

從現(xiàn)階段各部門系統(tǒng)數(shù)據(jù)的實際應用看,各部門仍未充分發(fā)揮數(shù)據(jù)在業(yè)務運行、工作效率等方面的作用和價值,要完整采集所有數(shù)據(jù)信息,實現(xiàn)數(shù)據(jù)信息的實時共享,挖掘數(shù)據(jù)信息的作用價值,確保數(shù)據(jù)信息在各部門業(yè)務運行中的價值最大化。針對這一現(xiàn)狀,首要任務是要采集與整合數(shù)據(jù)資源,加強數(shù)據(jù)資源的實時共享與對外合作程度,全面優(yōu)化改進中臺系統(tǒng)。數(shù)據(jù)中臺能夠將系統(tǒng)的前臺與后臺有效銜接,通過加強數(shù)據(jù)的建模、數(shù)據(jù)信息的聚合,創(chuàng)建多元化的系統(tǒng)平臺,更好地支撐前臺與后臺的運作。

數(shù)據(jù)中臺與企業(yè)部門業(yè)務活動聯(lián)系密切,在企業(yè)業(yè)務運作中發(fā)揮至關重要的優(yōu)勢作用。一方面,通過建立完整的數(shù)據(jù)模型實現(xiàn)了數(shù)據(jù)信息的準確出入,最大限度地避免了多個數(shù)據(jù)源數(shù)據(jù)信息重復歸集的現(xiàn)象產生,提升了系統(tǒng)處理和分析數(shù)據(jù)的運行質量和效率;另一方面,節(jié)省系統(tǒng)數(shù)據(jù)處理時間和成本,通過提高處理運行效率,減少數(shù)據(jù)信息重復濫用現(xiàn)象。

2 數(shù)據(jù)應用系統(tǒng)功能分析

2.1 數(shù)據(jù)校驗與修復

數(shù)據(jù)校驗功能要立足于長期業(yè)務工作,并對其各項業(yè)務數(shù)據(jù)經過系統(tǒng)分析總結而成。國家電網經過數(shù)據(jù)中臺建設可以在綜合數(shù)據(jù)調度平臺運行中及時發(fā)現(xiàn)和解決各種問題,根據(jù)企業(yè)業(yè)務的實際需求應用系統(tǒng)對數(shù)據(jù)分析,經過數(shù)據(jù)校驗與修復建立數(shù)據(jù)規(guī)則庫,利用數(shù)據(jù)規(guī)則庫確定問題解決的路徑,通過一系列規(guī)則建立推理過程[1]。

數(shù)據(jù)校驗與修復的具體操作方案可以通過同步與采集組件從外系統(tǒng)接入模型設備信息和各類運行數(shù)據(jù),然后校驗數(shù)據(jù)。如果校驗結果顯示數(shù)據(jù)問題,就會自動根據(jù)相應的規(guī)則進行修復,再將修復的結果錄入數(shù)據(jù)庫,反映至人機界面,便于用戶判斷及操作。

2.2 缺失數(shù)據(jù)處理

數(shù)據(jù)平臺采集數(shù)據(jù)會出現(xiàn)數(shù)據(jù)缺失的情況,對后續(xù)數(shù)據(jù)分析和處理造成很大的影響,要盡可能彌補統(tǒng)計領域和數(shù)據(jù)庫領域數(shù)據(jù)缺失造成的損失。

統(tǒng)計領域中處理缺失數(shù)據(jù)的方法主要有單一填補法和多重填補法。單一填補法是對缺失的數(shù)據(jù)構造單一替代數(shù)據(jù)進行填補,填補方式通常有平均值或中間數(shù)填補法、回歸填補法、最大期望填補法、hot deck填補法等。其中,hot deck填補法采用與缺失數(shù)值最相似的觀測變應量值作為填充值,但其無法準確反映原有數(shù)據(jù)的情況,因為相似性填補方式會造成數(shù)據(jù)集的不確定性,產生數(shù)據(jù)偏差[2]。多重填補法是通過應用多個數(shù)據(jù)值進行填補,其優(yōu)勢在于通過對缺失數(shù)據(jù)分布情況的模擬保持變量之間的關系,通過采集完整數(shù)據(jù)集,利用系統(tǒng)規(guī)則獲得相應的結果,填補方式通常有趨勢得分法等。

2.3 異常數(shù)據(jù)檢測

數(shù)據(jù)出現(xiàn)異常情況主要由兩種原因造成:一是數(shù)據(jù)的固有變異性;二是度量或執(zhí)行錯誤。

檢測與校驗數(shù)據(jù)異常問題的方法要通過數(shù)據(jù)審計,深入挖掘數(shù)據(jù)質量。第一,數(shù)據(jù)概化,采用數(shù)據(jù)統(tǒng)計方式概化描述數(shù)據(jù)分布,并自動獲取數(shù)據(jù)的分布特點以及相關情況。第二,圍繞個別數(shù)據(jù)質量問題以及異常情況進一步挖掘和分析,可以將數(shù)據(jù)按照距離細化為不同的數(shù)據(jù)層,按照每一數(shù)據(jù)層統(tǒng)計數(shù)據(jù)特征,結合定義的距離算出每個數(shù)據(jù)節(jié)點與中心的距離,以此作為判斷數(shù)據(jù)異常的依據(jù)。第三,采用數(shù)據(jù)統(tǒng)計發(fā)現(xiàn)數(shù)據(jù)異常情況,這種方法大體依靠數(shù)據(jù)挖掘算法,通過數(shù)據(jù)算法準確辨別數(shù)據(jù)異常情況,挖掘數(shù)據(jù)價值,在此基礎上采用決策樹算法進行數(shù)據(jù)模擬,通過數(shù)據(jù)算法發(fā)現(xiàn)數(shù)據(jù)偏差[3]。

2.4 邏輯錯誤檢測

數(shù)據(jù)編輯修正研究的核心內容在于運用自動化方法,尋找并解決與業(yè)務邏輯運行相違背的數(shù)據(jù)錯誤,對此,要充分考慮到電力調度范圍內各項數(shù)據(jù)的不同特點,針對不同數(shù)據(jù)的不同特征實現(xiàn)具體化、差異化應用,最大程度地反映數(shù)據(jù)邏輯錯誤。

對于這一方式的數(shù)據(jù)錯誤檢測思路,主要是以相關領域的知識原理為應用基礎,建立起相應的規(guī)則體系,借助自動化設備、技術,實現(xiàn)各項數(shù)據(jù)的自動化處理,這種自動化處理結果主要通過嚴謹?shù)臄?shù)學模型,體現(xiàn)各項數(shù)據(jù)的實際變量,同時依據(jù)相應的數(shù)據(jù)編輯修正規(guī)則有針對性地做出最小的改動,以達到規(guī)則要求的實際效果。

2.5 不一致數(shù)據(jù)處理

電力調度范圍內常會出現(xiàn)多個獨立數(shù)據(jù)源相互重疊。數(shù)據(jù)內容相互重復的現(xiàn)象,造成數(shù)據(jù)不一致、不統(tǒng)一的情況,而多幾個數(shù)據(jù)源數(shù)據(jù)內容的集成清晰成為當前最重要的內容,如何從數(shù)據(jù)不一致情況中提煉出最精確的數(shù)據(jù)結果是集成清晰工作面臨的一大難題。當前主要通過排序、融合和依據(jù)規(guī)則的方式,進行不一致數(shù)據(jù)處理,系統(tǒng)平臺將不一致數(shù)據(jù)自動識別為上下獨立性沖突和依賴性沖突。獨立性沖突受到外部環(huán)境隨意性因素的影響而導致出現(xiàn)數(shù)據(jù)不一致情況,因而常需要通過人為干預和固定的方式進行處理。依賴性沖突多受到系統(tǒng)內部不同數(shù)據(jù)源之間的差異、重疊等因素的影響,針對這種情況常通過轉換系統(tǒng)內部學習規(guī)則,運用相關知識原理加強系統(tǒng)學習的方式,解決數(shù)據(jù)不一致問題。

除此之外,要評估各項數(shù)據(jù)值依據(jù)不同的指標參數(shù),注重評估值的完整性,依據(jù)各項數(shù)據(jù)值的線性組合序列確定唯一可信的數(shù)據(jù)值。

3 質量校驗方法實踐分析

3.1 數(shù)據(jù)校驗索引的構建

基于關聯(lián)規(guī)則電網不安全大數(shù)據(jù)下獲取的不安全數(shù)據(jù),要針對這類不安全數(shù)據(jù)利用電網大數(shù)據(jù)技術進行質量校驗研究,對于計算出的誘發(fā)度,以增量式校驗方法全面校驗誘發(fā)因子,確定增量數(shù)據(jù)記錄結果。

隨著電網企業(yè)業(yè)務數(shù)據(jù)的增多,數(shù)據(jù)質量校驗涉及的數(shù)據(jù)為結構化數(shù)據(jù),所有數(shù)據(jù)都會如實記錄在HBase表中,要及時更新數(shù)據(jù),校驗數(shù)據(jù)庫中的歷史數(shù)據(jù)及增量數(shù)據(jù),結合數(shù)據(jù)規(guī)則完成相應處理。對增量式校驗要保障在電網大數(shù)據(jù)誘發(fā)計算結果全部錄入并儲存到基準表。電網每天會產生1萬左右的數(shù)據(jù)量,為提高數(shù)據(jù)質量,要對比電網大數(shù)據(jù),對照基準表每條數(shù)據(jù)記錄,經過數(shù)據(jù)索引,檢索兩張表中是否同時存在某一待比對字段值,其對應的記錄是否一致,完成對電網數(shù)據(jù)記錄和數(shù)據(jù)校驗。

此外,要結合數(shù)據(jù)校驗規(guī)則,設計快速數(shù)據(jù)索引表。要結合數(shù)據(jù)校驗的索引構建,建立快速索引和存儲機制,提高數(shù)據(jù)校驗的計算速度,提高數(shù)據(jù)質量校驗效果。

3.2 數(shù)據(jù)中臺設計的總體思路

建設數(shù)據(jù)中臺要圍繞需求導向,結合電力企業(yè)的業(yè)務及數(shù)據(jù)分析應用的需求,設立數(shù)據(jù)校驗統(tǒng)一標準,建設數(shù)據(jù)模型,實現(xiàn)數(shù)據(jù)接入轉換和整合貫通,突破數(shù)據(jù)壁壘,建立健全電網企業(yè)數(shù)據(jù)質量把控與服務管理體系,打造電網建設、電力產業(yè)以及金融經濟等各個模塊的數(shù)據(jù)互通共聯(lián),實現(xiàn)數(shù)據(jù)接入、傳輸及整合,提升數(shù)據(jù)應用的服務效能。

第一,打造電力企業(yè)數(shù)據(jù)共享的管理體系要融合人員、組織、客戶、供應商等各項數(shù)據(jù),建立多維度管理內容。

第二,圍繞企業(yè)大數(shù)據(jù)應用,要積極開發(fā)數(shù)據(jù)化產品,利用企業(yè)內外數(shù)據(jù)支撐數(shù)據(jù)管理體系和數(shù)據(jù)分析應用的構建,提高數(shù)據(jù)服務能力,推動企業(yè)數(shù)據(jù)運營和系統(tǒng)服務水平,利用各種數(shù)據(jù)分析和校驗方法挖掘其價值。

第三,要建立企業(yè)內外管理一體化,集政府決策、社會服務、領導決策等內容的精細化管理,實現(xiàn)內外互通,支撐企業(yè)內部決策與管理,并對外為社會提供服務,積淀具有高價值的數(shù)據(jù)服務空間。

第四,構建數(shù)據(jù)中臺,要充分借助現(xiàn)代信息技術和通信技術,讓電力系統(tǒng)各環(huán)節(jié)數(shù)據(jù)實現(xiàn)人機交互,提升數(shù)據(jù)采集、獲取信息、靈活應用等能力,建立統(tǒng)一化的數(shù)據(jù)中臺,打造一網通辦、實時數(shù)據(jù)更新的一套業(yè)務流程。

總體來說,為全面加強數(shù)據(jù)中臺系統(tǒng)信息化建設,要從以下幾個方面入手,注重數(shù)據(jù)信息外部價值與內部價值的有機結合。

首先,要充分明確中臺系統(tǒng)建設理念,從數(shù)據(jù)內外部環(huán)節(jié)結合的方向考慮并改進,打破內外部數(shù)據(jù)壁壘,實現(xiàn)數(shù)據(jù)信息內外部環(huán)境的交互作用;制定統(tǒng)一的數(shù)據(jù)標準版,實現(xiàn)數(shù)據(jù)信息出入口徑的統(tǒng)一,為后續(xù)數(shù)據(jù)信息的處理分析以及價值挖掘夯實基礎;重視數(shù)據(jù)信息的資產化功能,通過對數(shù)據(jù)進行收集整合并形成系統(tǒng)建模,促使數(shù)據(jù)信息形成可通用的信息資產。促進中臺數(shù)據(jù)信息與企業(yè)業(yè)務之間的聯(lián)系,通過為企業(yè)決策提供更精確的數(shù)據(jù)分析結果,全面體現(xiàn)數(shù)據(jù)信息的作用和價值;優(yōu)化數(shù)據(jù)的智能化程度,充分利用算法等技術提高數(shù)據(jù)信息的智能化服務水平,為系統(tǒng)前臺、后臺提供更全面的需求。

其次,注重數(shù)據(jù)信息功能作用的重點建設。一是指數(shù)據(jù)的接入,注重數(shù)據(jù)收集轉換、復制遷移等功能的提取,將不同獨立數(shù)據(jù)源有序接入中臺系統(tǒng)。二是指數(shù)據(jù)的管理與存儲、計算,依據(jù)相應的數(shù)據(jù)標準和要求,結合中臺系統(tǒng)提供的多個數(shù)據(jù)源,對各項數(shù)據(jù)實行差異化具體分析與存儲,運用AI算法進行數(shù)據(jù)的分析處理。三是數(shù)據(jù)建模要提取中臺系統(tǒng)內部數(shù)據(jù)集,借助建模工具建立相應的數(shù)據(jù)模型,包括證據(jù)整合模型、分析應用模型等。

最后,中臺系統(tǒng)數(shù)據(jù)信息的服務功能包括數(shù)據(jù)信息的自動化識別記錄以及數(shù)據(jù)智能化監(jiān)控功能,只有明確系統(tǒng)優(yōu)化改進的建設理念與建設功能,才能確保系統(tǒng)設計方案制定的完整性和可行性。

3.3 數(shù)據(jù)校驗與修復的架構

數(shù)據(jù)平臺建設主要用于完成對系統(tǒng)數(shù)據(jù)調度、對外網多元業(yè)務數(shù)據(jù)的采集與質量校對、對歷史數(shù)據(jù)與新的數(shù)據(jù)的整合融通,實現(xiàn)統(tǒng)一化、系統(tǒng)化的數(shù)據(jù)模型構建,完成調度整合數(shù)據(jù)的發(fā)布與共享,通過信息技術和通信技術展現(xiàn)不同階段業(yè)務信息,為調度信息化提供數(shù)據(jù)支持和參考依據(jù)。

對于綜合性數(shù)據(jù)平臺建設的邏輯結構可以劃分為基礎服務層、數(shù)據(jù)整合層、模型層等。基礎服務層主要包含統(tǒng)一任務調度服務、電網社會模型服務、通用數(shù)據(jù)訪問服務、權限管控服務。數(shù)據(jù)整合層主要包含數(shù)據(jù)整合、設備同步、加工處理、管理監(jiān)控、數(shù)據(jù)維護、數(shù)據(jù)校驗、遷移重載、共享發(fā)布。數(shù)據(jù)模型層主要包含電網設備對象模型和整合數(shù)據(jù)模型。通過在其綜合數(shù)據(jù)平臺的數(shù)據(jù)處理層進行數(shù)據(jù)校驗,平臺能夠以最快的速度識別、記錄、校驗和修復,及時發(fā)現(xiàn)數(shù)據(jù)異常問題。

4 結語

電網運行和每天涉及的業(yè)務量會產生大量數(shù)據(jù),要通過數(shù)據(jù)系統(tǒng)支持完成數(shù)據(jù)質量校驗事務,通過分析不同數(shù)據(jù)完成業(yè)務和工作調度。

在電網信息化建設和運行管理與服務中,涉及內容和影響因素較多,因此,要通過信息技術等手段和平臺建設完成對數(shù)據(jù)的精確測量和分析,通過綜合評價方法系統(tǒng)評估。同時,要圍繞需求導向,以數(shù)據(jù)質量為切入點,建立系統(tǒng)化管理體系。

參考文獻

[1] 谷泓杰,黃麗麗,王佳妮.電網綜合數(shù)據(jù)質量評價系統(tǒng)及其軟件實現(xiàn)[J].電工技術,2021(10):122-124,128.

[2] 冷俊.大力推進數(shù)字化轉型 打造高質量發(fā)展新引擎[N].國家電網報,2021-04-01(003).

[3] 梅傲琪,張銳,周立德.以數(shù)據(jù)質量為核心的電網調度數(shù)據(jù)治理應用研究[J].機電信息,2020(33):14-15.

猜你喜歡
數(shù)據(jù)質量
醫(yī)院衛(wèi)生統(tǒng)計數(shù)據(jù)質量的影響因素及處理對策
電子商務平臺數(shù)據(jù)質量控制系統(tǒng)及仿真模型分析
基于大數(shù)據(jù)背景下提高供電局數(shù)據(jù)質量對策分析
強化統(tǒng)計執(zhí)法提高數(shù)據(jù)質量
淺析統(tǒng)計數(shù)據(jù)質量
中國市場(2016年40期)2016-11-28 04:58:19
金融統(tǒng)計數(shù)據(jù)質量管理的國際借鑒與中國實踐
時代金融(2016年27期)2016-11-25 19:02:25
淺談統(tǒng)計數(shù)據(jù)質量控制
提高政府統(tǒng)計數(shù)據(jù)質量,增強政府公信力
企業(yè)統(tǒng)計工作之我見
統(tǒng)計學在質量管理中的應用研究
商(2016年13期)2016-05-20 09:28:35
主站蜘蛛池模板: 亚洲中文字幕精品| 97久久精品人人做人人爽| 国产第三区| 在线亚洲精品自拍| 亚洲精品午夜天堂网页| 99视频在线观看免费| 54pao国产成人免费视频| 久久大香香蕉国产免费网站| 91伊人国产| 狠狠亚洲五月天| 国产精品原创不卡在线| 人妻中文字幕无码久久一区| 国产精品大尺度尺度视频| 亚洲日韩高清在线亚洲专区| 精品人妻一区二区三区蜜桃AⅤ| 国产免费久久精品99re不卡| 国产中文在线亚洲精品官网| 国产97公开成人免费视频| 精品少妇人妻av无码久久| 欧美日韩国产综合视频在线观看 | 伊人久综合| 国产精品人莉莉成在线播放| 亚洲欧美日韩高清综合678| 日韩欧美国产三级| 久久精品娱乐亚洲领先| 成人亚洲国产| а∨天堂一区中文字幕| 青草视频久久| 欧美不卡视频一区发布| 国产网站一区二区三区| 亚洲黄色片免费看| 在线免费亚洲无码视频| 亚洲精品图区| 91在线国内在线播放老师| 亚洲乱码在线视频| 在线观看网站国产| 18禁高潮出水呻吟娇喘蜜芽| 狂欢视频在线观看不卡| 欧美亚洲欧美区| 视频二区中文无码| 国产中文一区a级毛片视频| 日本一本正道综合久久dvd| 久久鸭综合久久国产| 国产精品美乳| 国产精品一老牛影视频| 午夜久久影院| 日韩欧美中文字幕在线韩免费| 国产精品视频第一专区| 香蕉国产精品视频| 一区二区三区在线不卡免费| 亚洲精品手机在线| 国产精品久线在线观看| 久草热视频在线| 老司机久久精品视频| 国产十八禁在线观看免费| www成人国产在线观看网站| 亚洲人成在线精品| 99精品国产电影| 爆操波多野结衣| 全部无卡免费的毛片在线看| 美女黄网十八禁免费看| 亚洲视频免费在线看| 欧美日韩一区二区三区在线视频| 国产剧情伊人| 国产亚洲欧美在线专区| 在线免费看片a| 男女男精品视频| 又粗又大又爽又紧免费视频| 操美女免费网站| 玩两个丰满老熟女久久网| 国产欧美日韩va| 在线欧美日韩国产| 欧美亚洲国产一区| 一本大道视频精品人妻| 国产爽歪歪免费视频在线观看 | 精品人妻无码区在线视频| 日韩AV手机在线观看蜜芽| 国产美女91视频| 午夜免费小视频| 欧美午夜在线播放| 中文字幕欧美日韩| 欧美 亚洲 日韩 国产|