于楚凡,郭大亮,張秋霞,宋子濤
(1.國家電投集團中央研究院,北京 102209;2.國家電力投資集團有限公司,北京 100029)
電力作為一種可再生的清潔能源,在能源危機的背景下得到了廣泛的發展和應用。因為直接從環境中獲取能量,發電設備主要安裝在建筑物頂部或沙漠無人區[1]。受外部環境和使用壽命的影響,PV板經常出現開裂、老化等故障[2]。電池板故障將影響整個發電系統的效率,嚴重時會引起火災。當前發電系統故障檢測技術主要有紅外圖像法和基于深度Q 網絡法兩種檢測方法。使用基于紅外圖像的檢測方法,利用光學圖像作為電路板的背景圖像,并與紅外熱圖像進行配準,實現元件定位,在此基礎上,提取待測板構件紅外溫升序列的多個特征向量,并與標準庫中的數據進行對比,判定構件失效。采用該方法成本較高,且受外部環境影響較大;使用基于深度Q 網絡法來判斷部件故障,在基于網絡的入侵檢測系統中,入侵預警與安全響應相結合,但隨著技術的不斷發展,攻擊變得越來越普遍,檢測也越來越困難。所以提出了基于大數據挖掘的發電系統異常數據識別系統設計。在數據處理子系統中,關聯規則是通過數據采集子系統中的監測數據建立的,監測數據模塊在發電異常情況下,利用關聯規則生成實時監測數據的實時規則,比較了先驗原理和實時原理,實現了發電設備運行狀態的自動監測和診斷。
為了改善發電系統裝備老化問題而導致的設備發電異常情況,提出了基于大數據挖掘的發電系統異常數據識別系統,系統硬件結構如圖1 所示。

圖1 系統硬件結構
由圖1 可知,系統硬件結構是由數據采集子系統、數據處理子系統、數據存儲子系統、設備狀態顯示子系統組成的[3-4]。通過設備狀態顯示子系統,可將其他子系統識別結果顯示在界面上,供工作人員查看[5-7]。
該子系統主要實現對數據的實時采集,即自動從模擬和數字裝置(如傳感器等)進行數據采集的過程。A/D 轉換器是數據采集系統中的一個關鍵部件,它主要用于把采集到的直流電壓轉換成數字數據,測量出的電壓可以與特定發電量、光照強度、溫度、濕度對應[8-9]。A/D 轉換器主要有兩種類型:積分和非積分。積分法可以根據一定的時間間隔測量平均輸入值,因此可以抑制多種噪聲源,非積分法是在很短時間間隔采樣輸入瞬時值[10]。數據采集子系統結構如圖2 所示。

圖2 數據采集子系統結構
由圖2 可知,系統硬件結構主要依據模塊化設計思路,包含發電量、光照強度、溫度、濕度數據接口,LCD顯示器及按鍵,RTC實時時鐘[11-12]。采 用LM12H458 高度集成數據采集芯片,將采樣結果與A/D 轉換集成結果存儲在同一芯片內,大大減少了外圍線路的連接[13]。LM12H458 是一個多功能數據采集系統,內部含有28 個16 bit的寄存器,其配置是采集系統的控制中心,可用于控制系統采集的啟動和停止[14]。
數據處理子系統是利用計算機處理信號的系統,采用數據處理系統對數據信息進行處理、排序,計算各種分析指標,便于用戶接收、保存處理后的數據信息[15]。數據處理子系統的結構如圖3 所示。

圖3 數據處理子系統結構
由圖3 可知,該子系統負責對所收集的資料進行實時處理,它旨在將數據采集系統中的“原始數據”轉化為“成熟數據”,即將采集的數據轉化為滿足上位機系統需要的、便于使用的數據結構,并且將數據存儲到實時數據表和歷史數據庫中[16]。在此基礎上,將上位機發出的控制指令通過數據處理分系統發送到相應的控制器,完成對測控裝置的控制。SCADA 系統的數據核心是數據處理子系統,同時要求系統具有高可靠性、實時性、魯棒性和較強的數據處理能力。
存儲器通過計算來處理數據,其中主要包括CPU (輔助或三級存儲器)無法直接存取的存儲設備和介質,通常是比RAM 慢但非易失性的硬盤、光驅等設備。
使用半導體存儲芯片,如果字節長為4 Byte,則使用半導體存儲芯片一次性讀取4 Byte,按字節尋址,總共1 000 個單元,每個單元1 Byte;按字尋址,總共256 個單元,每個單元4 Byte;按半字尋址,總共512 個單元,每個單元2 Byte;按雙字尋址,總共128個單元,每個單元8 Byte。主存塊調入系統,與緩存塊建立對應關系,使用標記記錄與某緩存塊建立了對應關系的主存塊號,使用先訪問Cache 再訪問主存方式,無論命中還是不命中,耗時均較短。
發電機組發生故障時,LED 看板能自動接收和顯示外部控制器發送的數據信息。將參數讀取到計算機作為主站的外部設備,輸出到顯示設備。支持VGA 多達8 屏的分屏輸出,每屏可以單獨顯示不同數據,互不影響。能顯示信息,如動畫、圖形、圖表、文本值等。LED 看板數量不限。能獨立顯示不同字符、數字等信息,能對各種信息和數據進行處理和顯示。
在系統硬件結構支持下,設計系統軟件流程,如圖4 所示。在圖4 所示執行流程支持下,設計異常數據詳細識別流程。

圖4 系統軟件流程
step1:光強采集模塊和溫度采集模塊分別用于數據處理子系統的發電量W、太陽光強G、溫度T和濕度S采集模塊,用于發電設備的數據輸入;
step2:關聯規則提取模塊從step1 中提取數據作為先驗數據,利用先驗數據構造F1、F2、F3規則,再結合先驗的F1、F2、F3規則生成先驗的規則集F{F1,F2,F3},將其存儲在先驗規則存儲模塊中。先驗規則集是用apriori 算法構建的,具體步驟如下:
1)關聯規則提取模塊提取正常情況下的發電量W、光強G、溫度T和濕度S,設置項目集D={D1,D2,…,Dn-1,Dn](n>2)輸入到數據處理子系統中,并確定項集集合D最小支持閾值,其中Di={Gi,Ti,Si,Wi} (0
2)依據1)中得到的最大項集產生的候選項集,需從集合D中確定項集支持度,并與最小支持度進行對比分析,獲取最大項集;
3)循環處理上述內容,直到不會出現新的項集為止;
4)通過上述得到最大項集的先驗規則集F{F1,F2,F3}中,F1表示發電量W與光照強度G之間的關系、F2表示發電量W與溫度T之間的關系、F3表示發電量W與濕度S之間的關系。
step3:在發電系統中,一旦發現發電量異常,數據采集子系統將采集到的異常數據傳送到關聯規則提取庫中,通過step2 構建新的實時規則集K{K1,K2,K3}。
對發電量異常的判別方法如下:設置發電量閾值U,提取step1 中構造先驗規則中的發電量W1,將其與發電系統實際運行狀態時相同時間內的發電量W2進行對比分析。如果W1與W2之間差值小于閾值U,那么說明發電系統正常;反之,則說明發電系統異常運行。
在系統Linux 集群環境下,包含4 臺虛擬服務器,各個服務器節點資源配置如表1 所示。

表1 集群虛擬服務器節點資源配置
整個集群包含了一個主節點和3 個子節點,充分考慮節點分配負載,給節點設置較高的物理內存。
該系統適合于光伏發電監測,為測試系統的功能,采集真實光伏監測設備上載的感測數據,包括設備上載的靜態和動態數據、雷達探測的plot 數據、高清攝像機拍攝的目標照片等。這些數據中,雷達波紋13 萬像素、靜態波紋6 萬像素、AIS 動態波紋15 萬像素。
對于多個預定義的異常行為,在實際場景中觀測到的目標不能被全部觸發,即在實際的數據集上不能進行異常行為測試。然后,對實際傳感器數據進行修正,如改變模擬場的異常和篡改行為,消除目標軌跡中某些圖形的模擬沉默行為,構造實驗數據集等。
分析正常情況下發電系統異常數據更新頻率,如表2 所示。

表2 正常情況下發電系統異常數據更新頻率
在上述實際更新頻率情況下,分別使用基于紅外圖像的故障診斷方法、基于深度Q 網絡故障診斷方法和基于大數據挖掘異常數據識別系統識別異常數據,識別結果精準度對比分析如圖5 所示。
由圖5(a)可知,使用基于紅外圖像的故障診斷方法、基于深度Q 網絡故障診斷方法異常數據識別結果與實際數據相差較大,當實驗次數為7 次時,故障狀態下的識別結果依次為120 bit和160 bit。而停止狀態下的識別結果與實際數據也不一致。使用基于大數據挖掘異常數據識別系統故障狀態下的識別結果、停止狀態下的識別結果均與實際數據一致,誤差為0。
由圖5(b)可知,3 種方法非周期內異常數據識別結果一致,周期內異常數據識別結果不一致。使用基于紅外圖像的故障診斷方法、基于深度Q 網絡故障診斷方法異常數據識別結果與實際結果不一致,而使用基于大數據挖掘異常數據識別系統異常數據識別結果與實際結果一致,只有在實驗次數為1次時,出現10 bit誤差。

圖5 不同方法異常數據識別結果精準度對比分析
基于大數據挖掘的發電系統異常數據識別系統實現了發電設備運行狀態的自動監測與診斷,降低了人力、物力成本,具有較高的實用性。將數據挖掘技術應用于故障診斷與檢測中,能夠快速有效地檢測出故障源和故障原因,提高了電力系統故障診斷的效率。這種方法不僅可以對電池板電路故障進行診斷,而且可以對電池板老化狀態下的低發電量異常進行診斷,具有很強的實用性。