馬 文,田 園
(云南電網有限責任公司信息中心,云南 昆明 650000)
隨著工業自動化控制技術的發展,大量的工業電氣設備得到使用,過程中需要結合工業電氣設備的運行工況特性進行自動化性能監測,提高工業電氣設備的運行可靠性[1]。而進行自動化性能監測時需要提取運行狀態下設備的運行參數大數據特征,為自動化性能監測提供有效信息,因此研究相關的特征提取方法在工業電氣設備大數據分析和智能化應用方面具有重要意義[2]。
侯莉莎[3]利用聚類集成算法,在大數據組造期間,通過抽樣方法抽取大數據的子集樣本,并進行數冗余特征排除,結合隨機子空間的miRNA識別算法,對排除冗余數據后的數據子集進行融合,最終實現大數據集合中冗余特征排除的聚類。王玥[4]提出一種基于均值密度中心估計的大數據網絡中用戶特征數據準確檢測的方法,通過用戶特征數據間的關聯度進行計算,獲取特征數據。根據特征數據閾值判斷并篩選有效數據,利用數據不同特征的支持度與置信度對數據進行聚類,最后以總用戶數據點為核心,實現用戶數據中心密度集合,完成數據檢測。丁春暉[5]為優化大數據分類識別效果,提出改進蛙跳的數據分類優化識別方法,同時,結合了流形半監督算法更新并篩選最新數據個體,最終實現大數據的分類及優化識別。但上述方法僅應用于網絡信息或圖像數據的檢測上,未應用至設備中,并未有效分析出電氣設備大數據的特征。
為了提升工業電氣設備大數據分析和識別能力,該文提出一種基于模糊信息熵特征提取的工業電氣設備大數據特征識別方法。內容包括:應用數據采集器采集并分析相關電氣設備參數大數據;經計算機處理,實現大數據可視化,并重組其特征;構建特征識別的簡化數學模型;實現大數據的多特征識別。最后進行仿真測試分析,得出有效性結論。
首先需采集電氣設備的參數大數據,利用采樣結果進行特征重組,整合獲取到的分散數據,以此提高數據識別效率。具體實現流程如圖1所示。

圖1 方法實現流程
1.1.1 采樣裝置及模塊分析
由于數據較多且復雜,因此對其數據采樣的要求較高,該文將通過34980A數據采集器獲取設備參數大數據。整個數據采集器是由三部分共同組成,分別為信號預處理部分、信號調理部分以及通信部分,如圖2所示。

圖2 數據采集器模塊
由圖2可知,信號預處理部分是實現待檢測數據切換的準備階段;信號調理部分是切換數據的周期、信號采集階段;通信部分是實現與PC傳輸采集信號數據的連接環節。
利用上述裝置,對工業電氣設備的參數進行采集。
1.1.2 計算機處理過程
為了實現對工業電氣設備大數據信息的優化提取和特征識別,需進行工業電氣設備大數據信息采樣。結合信息流融合調度方法,進行工業電氣設備大數據的統計信息模型構建,通過期望頻繁項(EFI)采樣方法,進行大數據的聚類。而通常情況下聚類算法可以分為兩步進行處理,一是目標識別,二是聚類處理。目標識別階段先要對目標區域進行網絡化,通過目標的輪廓或者是數據識別,獲取高密度的格網概率密度函數。可以使網格化的目地在于加快目標的識別速度,以便于更加快速的定位。進行聚類處理時,在目標標識中間結果的基礎上,通過DENCLUE得到概率密度函數局部值定義密度吸引子,以此確定最終的聚類結果。
此密度聚類的算法對于噪聲數據有很強的抗干擾能力,另外,與其他的計算方法進行對比,該算法能夠發現隨意聚類,更好地敘述空間分布模式,以此提取更多的工業電氣設備大數據信息聚類特征。同時對監控區域歷史視頻以及異常事件信息統計,對非正常與正常情況下的工業電氣設備大數據信息特征分類統計,建立一個相對應的統計分析模型。其中工業電氣設備大數據特征分布式調度集函數為:
D(j)=t(xj(t)+lj(t))
(1)
其中,xj(t)表示工業電氣設備大數據的模糊平均集D中的平均信息熵,描述了在第j個聚類中心的樣本子集,lj(t)表示模糊聚類中心中工業電氣設備大數據的統計特征量,t表示采集時長。
在滿足約束條件下得到工業電氣設備大數據的類信息熵滿足:
e(D)>xj(t)
(2)
采用模糊C均值聚類方法,進行工業電氣設備大數據的融合處理,使用一個四元組結構來描述工業電氣設備大數據的信息關聯特征:F=(Xij,Pij,e(D),Tk1),其中,Xij為工業電氣設備大數據特征信息流在Tk1時刻的信息素強度,Pij為輸出優化訓練的最優概率。利用譜聚類算法,得到密度的格網概率密度函數為:
(3)


(4)
采用多傳感器信息采樣方法進行工業電氣設備大數據信息采集[6-7],得到工業電氣設備參數大數據的統計分析模型為:
(5)
其中,pi為工業電氣設備大數據的譜特征對齊的概率密度函數,其大小取決區域K中的概率。根據上述分析,構建了大數據采集模型,為提高特征識別效率,需根據參數特征將采集到的參數大數據進行重組。而大數據特征的重組不僅為電氣設備特征識別提供可依數據,還為識別應用奠定可行的理論基礎。
采用多分布的傳感器陣列進行工業電氣設備大數據采樣,對采集的工業電氣設備大數據進行特征重組[8-10],得到工業電氣設備大數據信息流融合特征聚類的概率分布:
(6)
其中,δ為關聯方差。結合分簇聚類融合的方法,構建工業電氣設備大數據的分布式融合聚類模型,得到工業電氣設備大數據信息的個體差異度函數為:
G(x)=ax-bx2+P(ω)
(7)
其中,a、b為常數,s為變量。使用有限的頻譜資源融合聚類分析的方法進行工業電氣設備大數據離散化調度,得到工業電氣設備大數據的統計特征檢測模型為:
(8)
其中,αi、yi分別表示工業電氣設備大數據信息流融合的高頻向量和低頻向量,K(xi,x)表示相關資源的預測偏好值。結合標量序列分析方法得到工業電氣設備大數據信息流的梯度向量分布模型為:
(9)
其中,m,n分別是工業電氣設備大數據的嵌入式維數。建立工業電氣設備大數據的負荷波動模型,得到工業電氣設備大數據信息流非線性特征重組輸出為:
(10)

綜合上述,完成工業電氣設備大數據信息流非線性特征重組。在前文的基礎上,進行大數據特征識別。
對采集的工業電氣設備大數據進行特征重組,提取元數據結構特征,通過對穩態電壓平衡特征量進行統計,結合統計信息分析方法,得到模糊迭代狀態方程為:
A(x)=AJ(x)a(x)+B(1-b(x))
(11)
令A={a1,a2,…,an}為終端用戶分配的負載特征集,B={b1,b2,…,bm}為分布屬性類別集,a(x)為負載特征集修正系數,b(x)為分布屬性類別集修正系數,J(x)為檢測幅值。
根據上述分析,結合傅里葉變換分解結果,計算工業電氣設備大數據特征識別的簡化數學模型,其可以用下述公式進行描述:
Gn=b1a1+b2a2+…+bnan
(12)
其中,an和bn都具有較強的關聯性,分別表示工業電氣設備大數據的偏差限制和諧波振蕩值。根據上述分析,構建了工業電氣設備大數據的分布式特征提取模型。
對采集的工業電氣設備參數大數據進行特征重組,提取其元數據結構特征,采用多模狀態重組的方法進行特征匹配,得到特征識別的關聯規則量。其中特征識別的統計分析模型為:
(13)
其中,G表示工業電氣設備大數據中的主成分,hi表示信息流屬性值,βc表示原始訓練集中的信噪比。
結合元數據分析的方法,進行工業電氣設備大數據的信息熵檢測[11],得到結構重組信息分量為:
(14)
其中,ki為負荷容量,Ecomm為重組頻率,pdrop為能耗分布。任意選取一采樣周期進行大數據負荷調度,提取元數據結構特征,根據元數據的結構分布進行模糊信息聚類處理,實現工業電氣設備大數據的優化特征識別,輸出為:
(15)
其中,a*、b*分別表示不同負荷下的大數據傳輸功耗。根據以上方法,提取大數據特征,結合特征分類技術,實現工業電氣設備大數據特征識別。根據特征融合結果實現大數據的優化特征識別[12-14],構建工業電氣設備大數據特征識別的模糊聚類分布模型,其表達式為:
(16)
其中,w表示多維大數據流的采樣時間延遲;u(xj)表示大數據分布范圍;ξj表示聚類系數。模糊聚類分布模型的約束條件為:
(17)
根據工業電氣設備大數據的相互耦合關系,引入高維相空間重構,得到其核函數H(x),則工業電氣設備大數據監測的分辨函數為:
(18)
其約束條件為:
(19)

Φ:Dfb→MR2d+1
(20)
通過映射可獲取工業電氣設備大數據運行過程中的有效信息,利用信息。將獲取信息作為輸入值,進行工業電氣設備大數據的多特征識別輸出,得到最終識別結果為:
(21)
其中,ck表示工業電氣設備大數據的多元信息特征分布集,e表示特征識別強度。為檢驗該方法的有效性及可行性,需進行仿真實驗。
通過Matlab 7測試該方法在實現工業電氣設備大數據特征識別中的應用性能,給出工業電氣設備的大數據分布式采樣的電壓參數為100 kV,對工業電氣設備大數據搜索的維數為8,關聯信息熵為0.35,其他仿真參數設定見表1。

表1 參數設定
根據上述參數設定,進行工業電氣設備大數據特征識別,得到采集的工業電氣設備大數據時域分布如圖3所示。

圖3 工業電氣設備大數據采集時域分布
分析圖3可知,工業電氣設備大數據在單位時間內分布幅值大小較為穩定。利用上述過程獲取的數據,建立工業電氣設備大數據的多分布特征檢測和屬性聚類模型,采用模糊融合方法進行工業電氣設備大數據的多元信息重構,根據信息熵特分布進行大數據特征識別[15-17],得到的特征識別結果如圖4所示。

圖4 工業電氣設備大數據特征識別結果
分析圖4可知,采用文中方法能有效實現工業電氣設備大數據特征識別,工業電氣設備大數據的特征識別準確性較高[18-20]。測試工業電氣設備大數據特征識別的精度,得到的對比結果見表2。

表2 工業電氣設備大數據特征識別的精度對比
分析可知,文中方法進行工業電氣設備大數據采集的精度較高。這是由于文中方法在采集數據的過程中進行了數據預處理,排除了冗余數據的干擾,故而提高了特征識別的精準度[21-24]。
工業電氣設備大數據特征識別是實現工業設備的運行工況監測的關鍵技術。提出了一種基于模糊信息熵特征提取的工業電氣設備大數據特征識別方法。采用模糊C均值聚類方法,進行工業電氣設備大數據的融合處理,建立工業電氣設備大數據的負荷波動模型,采用多模狀態重組的方法,進行工業電氣設備大數據特征匹配,結合信息熵特分布進行大數據特征識別。分析可知,利用該方法進行工業電氣設備大數據特征識別的精度較高,在工業電氣設備的信息化管理和監測中具有很好的應用價值。