江蘇瑞中數據股份有限公司 湯朝波
面對當前電力大數據在分布式云儲存方面存在的問題,本文致力于解決這一問題,構建了分布式云儲存的系統模型,并運用匹配濾波器的檢驗方法對電力大數據的特征進行預先處理,從而構建了數據聚集樹,有效的減少了云存儲的冗余狀況,實現了電力大數據分布式云存儲的性能優化。
云儲存是一種新興網絡存儲技術,是在云計算的基礎上延伸與發展出來的。大量數據的管理、存儲成為云計算系統的運算、處理核心時,云計算系統為實現其良好的性能,就需要配置很多存儲設備,這樣就產生了云存儲系統,即云存儲系統在本質上是一個以數據的存儲、管理為核心的云計算系統。云儲存可以通過應用軟件,使網絡中不同類型的、大量的存儲設備進行協同工作,并使這些不同類型的存儲設備共同向外提供業務訪問功能及數據存儲功能,云儲存之所以能實現這些作用,主要是通過分布式的文件系統、網絡技術和集群應用等功能。云儲存是一種將資源、信息放置到云上,供人隨時、隨地的通過任何一個連接網絡的裝置,進行瀏覽、獲取、儲存信息的一種新興服務。
當下,大數據在電力行業中還沒有得到一個統一的、明確的定義,大數據是擁有價值密度低、處理速度快、數據類型多、數據體量大這四大特點的數據集合,這一含義是目前行業中基本達成的共識。之后相關研究報告對這種數據集合做出了進一步的補充,即這種數據集合的內容不能在一定的時間里通過使用傳統的數據庫軟件進行抓取、處理和管理。
近十幾年以來,我國電力行業的信息化獲得了快速地發展,以云儲存與物聯網為代表的IT技術被廣泛運用于電力行業的方方面面,電力數據資源也得到了迅速地增長,并朝著多源、異構與PB級數據規模快速發展。電力大數據是在電力工業的能源變革與技術更新過程中的必然過程,但電力大數據并不僅僅局限于技術范疇之中,其涉及到電力系統在處于大數據時代背景下的技術路線、管理體制及發展理念等方面的變革,是在大數據時代背景下智能化的電力系統價值形態的提升。
本文通過進行仿真實驗,對構建的大數據調度分布式云儲存的系統模型的性能進行檢驗,展示了算法在電力大數據分布式云儲存方面的優越性能。
為了使電力大數據調度控制功能得到全面、整體的提高,需要對電力系統進行分布式云儲存設計,構建電力調度云儲存分布式模型。電力調度系統模型是用G=(V,E)即連通無向圖進行表示,系統模型中的所有節點都有一個一樣的輸送半徑,無線傳感器節點網絡的邊(u,v)屬于E。在電力調度系統模型中,設置A包含于V,B包含于V,A交B等于φ,每一個調度傳輸集Si(i是不包括0的自然數)應該滿足下面的條件,Si交Sj等于φ,ULI=1Si等于V減去{sink}的差。
傳統方法所使用的是混合建立域間鏈接的方法,解決角色映射沖突與權限隱蔽提升的問題。而本文中所采用的是聯合特征下的信息增益提取的方式,本文引入了云存儲管理β,β是(0,0.5)的子集。在這個限定的范圍之內,采集數據集合,形成電力大數據調度生成階段,實現信息融合。當R是A的子集、X是U的子集這一條件成立的情況之下,電力大數據調度信息狀態的函數表達公式是:h(t)=Σiai(t)ejθδ(t-i Ts)。在此公式之中,t是調度的響應時間,ai是電力大數據信息系統中調度的個數。然后,再按照電力通信理論的中頻分復用,可以得到電力大數據的行為與頻率的關系,用多普勒公式可以表現為:yb=yow/zcosφ。在此公式中,z表示傳輸功率,yo表示電力調度通信的載波頻率(基站發射端),yb表示發射頻率的變化量(通信接收端)。

圖1 決策樹算法C4.5云存儲系統數據特征建模
在構建上述系統模型的基礎之上,運用匹配濾波器的檢驗方法對電力大數據的特征進行預先處理,從而構建了數據聚集樹(如圖1)并運用決策樹算法C4.5構建了云存儲系統數據特征建模。
在本文的設置中,決策樹中的映射值{no,yes}代表的是云存儲系統冗余數據的跟蹤屬性值{0,1},在決策樹算法C4.5之下,冗余數據的主特征聚類特征參考值有164個種類,提取出來的有19個種類,利用算法對數據特征進行壓縮與降維,從而得到了調度時間減弱的函數公式:當1≤k<n時,f(k)等于f(k-1)-1/n;當k=n時,f(k)等于1。由這個函數公式可以得到云儲存主特征的有效行為概率公式是:DNI,J(tn+1)=[DNI,J(tn+1)+f(n)DNI,J()]÷2。在在此計算公式中,tn時刻與tn+1時刻的差距是一個更新的周期。在這種條件下,調度系統就成了一個非線性的、多層節點的映射器,可以將調度系統的重組規律公式是:u(t)等于e(t)加上TD[de(t)/dt]再加上(1/T1)ζ10e(t)dt的和再乘以Kp,在這個公式之中,e代表的是調度系數,Kp代表的是調度通信效率。
運用匹配濾波器的檢驗方法對電力大數據的特征進行預先處理,可以得出濾波器函數公式,Hb(Z)等于(sinθ2+1)/cosθ2與G(z)與cosθ1(k)cosθ2z-1/sinθ2z-2+(sinθ2+1)z-1sinθ1(k)+1的乘積。其中,G(z)等于(1-sinθ2)/2與(1-z-2)/sinθ2z-2+(sinθ2+1)z-1sinθ1(k)+1的乘積。在這個公式之中,y(k)代表的是匹配濾波器的輸出,x(k)代表的是觀測序列,觀測序列是由背景噪音與信號構成的。
在此基礎上,本文提出了以寬頻數據特征為基礎的大數據分布式云儲存的算法,并通過寬頻數據特征壓縮進行信息融合降維,從而實現資源調度,提高電力調度的效益。
本文在構建大數據調度分布式云儲存系統模型的基礎上,利用決策樹算法C4.5分析云存儲系統數據特征。實驗表明,通過對本文中的云存儲系統模型進行信息融合降維,可以有效地減少數據冗余問題,提高電力系統的調度效益。