尹文婷
【摘要】 本文主要以大數據相關概述作為出發點,分析了電力信息大數據高速存儲方案和技術,以及檢索關鍵技術,以期為提高電力企業信息技術水平提供一些參考和意見。
【關鍵詞】 電力信息 大數據 高速存儲 檢索
隨著網絡信息技術的不斷發展,電力企業涉及的數據信息更加廣泛、數據形式更加多元化。這就需要電力企業根據數據信息的發展規模,加快智能電網的建設進程,提高數據檢索關鍵技術和數據存儲技術。
一、大數據相關概述
所謂大數據是指在一個數的幾何體對各項數據以及信息進行儲存、查詢、計算、整合等。大數據具有4V特征:其一,容量大(Volume)。數據規模從TB級別躍升到EB級別,新數據以每天2.5EB的量級高速增長。其二,類型眾多(Variety)。大數據的結構形式具有多樣化特點,不僅能涵蓋了文本形式,還涵蓋了圖片、音頻、視頻、網絡日記和地理位置等多種半結構化形式、數據結構形式和非結構化形式。就結構化數據而言,在數據結構體系中占據的比例為15%;就非結構化數據而言,非結構化數據在數據結構體系中占據85%。其三,速度更快(Velocity)。由于大數據具有規模大、容量信息較大等特點,這就要求數據處理的效率要高。一旦數據信息沒有得到及時有效的處理,就會失去數據原本的價值,還會導致大量有效數據信息淹沒在海量數據規模體系中。其四,價值密度低(Value)。由于大數據規模巨大,信息容量大,因此數據價值容易被隱藏。因此需要通過綜合的分析方法在海量數據中體驗具有價值的數據信息。
二、基于電力信息大數據高速存儲方案和技術
第一,“先進先出”緩存形式。這類緩存形式應用的核心設備是FIFO存儲器。資料由儲存器的開端輸入存儲器的末端,資料輸出的時間與資料送入儲存器的時間成正比。這套緩存方法主要包含兩套數據線,無論是數據資料還是其他信息都可以在存儲器中進行順序運用。因該類型數據緩存方法具有信息傳遞效率高、節約時間等優勢。此種技術的缺點在于過于死板。一旦出現容量較大的數據信息或者資料,就容易導致數據讀取時間過慢。第二,“雙口PAM”緩存形式。該技術擁有兩套相互獨立的地址、數據總線。因此在讀取容量較大的數據信息時,可以在控制器的兩端同時讀取數據、采集信息等。該技術具有信息傳遞速度快、可以同時讀取和采集信息等優勢。但是雙口PAM控制器價格較貴。第三,“高速SRAM”切換緩存形式。該技術只有一套數據總線,可以以三態緩沖門作為數據傳輸的控制器,并實現ADC轉換器與緩沖門之間的數據切換和數據自由傳遞。完成數據存儲、數據傳遞、數據讀取之后,就可以在ADC控制器中展開數據讀寫程序。該技術具有隨著隨地操作與讀取數據的優勢,其缺點在于數據集成化水平相對較低。且占用內存的面積大。
三、基于電力信息大數據高速檢索技術
1、對內容進行檢索。搜索引擎需要對用戶輸送的關鍵信息進行檢驗、細致分析與歸類。一般來說,對搜索內容進行檢測的形式主要包含以下三種:?字符串檢索與分析。借助字符串可以正向分析、逆向分析、切分分析用戶檢索的關鍵詞類別。?先理解、再匹配分析。搜索引擎模擬人們的思考模式,人們總是對檢索信息或者詞匯進行歸類之后再進行信息的還原與匹配。基本原理是一致的。即在分詞過程中把語言歧義部分進行分類整理,主要以語法、語義體系和總控制體系三部分構成。?先統計,再匹配分析。根據調查得知,鄰近字在搜索引擎中出現的頻率較高,對鄰近詞進行統計后再分詞、匹配。需要注意的是,在檢索期間,類似“的”、“嗎”等詞語在分詞時會被去除。
2、并行采樣技術。對于高速數據采集體系來講,是系統最核心的指標。要想實現高采樣頻率這一目的,可以借助單片高度數據轉化其芯片。該芯片具有分辨率低、價格高等特點。因此可以通過交叉時間采樣方法提高數據收集效率,達到采集效果。ADC是并行采用技術的一種主要轉換器,其主要形式有閃電式的ADC轉換器,以及逐次逼近形式的轉換器,這兩類轉換器的優缺點見表1。
3、搜索請求進行檢索與匹配。對用戶搜索請求進行細致分析與匹配是在搜索引擎接受到檢索內容之后展開的主要任務。分析完用戶輸入的檢索內容之后,對名稱進行匹配,并在系統中顯示匹配的內容。這就需要遵照匹配程度對其進行排序。如此一來,用戶就可以減少搜索等待的時間,從而達到提高信息檢索效率和工作質量的目的。結束語:隨著市場競爭的日趨激烈,電力企業要想在殘酷的市場競爭中站穩腳跟,就需要改進傳統管理方法和管理技術,不斷借鑒發達國家的智能化管理技術和管理方法,提高大數據的存儲和檢索效率,從而更好地為社會服務。
參 考 文 獻
[1]馬義松,武志剛.基于Neo4j的電力大數據建模及分析[J].電工電能新技術,2016,02:24-30.
[2]周文瓊.大數據環境下的電力客戶服務數據分析系統[J].計算機系統應用,2015,04:51-57.
[3]祝恩國,竇健.用電信息采集系統雙向互動功能設計及關鍵技術[J].電力系統自動化,2015,17:62-67.