摘要:目前,鍋爐控制大多數已采用自動控制系統,但在鍋爐控制現場,其采集的數據往往受到不同程度干擾,難以保證控制系統的準確性和精確性,因此,需要對現場采集的數據進行預處理。本文針對鏈條爐數據復雜、干擾大的特點,結合河北理工大學智能儀器廠的鏈條爐自動控制系統,給出了實時數據預處理方法。運行結果表明,采用本方法處理的數據具有較強的適用性和穩定性。
關鍵詞:鏈條爐自動控制 數據預處理 實時采集
0 引言
近年來,計算機自動控制系統已成功地應用于鍋爐控制系統中,然而由于控制現場環境惡劣,使得分布在現場的測控元件所采集到的數據有噪聲,有些數據因轉換原理或元器件溫漂、老化等,還包含有系統誤差。雖然在計算機測控系統中,也使用了多種硬件抗干擾技術,力求計算機采集的數據準確,但是也不能完全保證數據的可靠性,加之硬件抗干擾的成本較高,所以通常采用硬件抗干擾和軟件處理方法結合,確保采集數據接近真實值。所以,控制系統中采集的數據在參與控制決策或輸出顯示等之前需要進行數據預處理。
1 數據預處理
傳統的鍋爐控制系統中不對原始數據做數據預處理或只是做一些簡單的平滑處理,通過對鏈條爐運行參數的分析,發現不做數據預處理或只經過簡單平滑處理的數據無法滿足控制系統的需要。因此,本系統的數據處理主要是接受并理解用戶的要求,確定任務,抽取與系統控制任務相關的數據源,根據領域知識中的約束規則對數據進行合法性檢查,通過清理和曲線擬合等操作,生成控制系統所需要的目標數據。
2 實時數據預處理方案
結合河北理工大學智能儀器廠的鏈條爐自動控制系統,本方法采集的數據主要包括:鏈條爐輸出功率、爐膛溫度、爐排變頻機頻率、鼓風變頻機頻率、引風變頻機頻率等。這些數據通過下位機PLC傳入上位機計算機進行數據預處理,將PLC的傳輸頻率設置成每6s傳輸一次,數據通過清洗后一分鐘做一次平均,再將做完平均處理后的數據進行曲線擬合,最后將曲線擬合處理后的數據送入數據庫,參與控制系統的運行。
對數據的預處理主要包括以下五部分:數據集成、數據清洗、數據平均、曲線擬合和數據轉換。
2.1 數據集成 鏈條爐控制系統中所需的各個數據是從不同的實際采集系統中獲得,它們具有不同的采集策略(例如:采集頻率不同),要將它們放在同一個數據庫中需要一個統一的標準。在此,通過分析將時間作為統一標準,即同一時刻(精確到6s)不同屬性相應的數據作為一條記錄。
2.2 數據清洗 這里數據清洗主要完成的工作包括噪聲數據的處理和缺值數據的處理。
在原始數據集中,由于受實際系統干擾等因素的影響,會出現一些噪聲數據。噪聲數據主要是指數據值超出正常范圍的數據,簡單地講就是太大或太小的數據值。如表1中第4行所示的鏈條爐輸出功率,根據實際40t鏈條爐正常運行爐況可知,輸出功率值小于0MW,大于29MW都屬于不正常值。這些不正常值不符合實際工藝要求或根本不能出現在生產過程中,一般來講,噪聲數據量不會太大,但有時極少量的這些數據會對系統帶來較大負面影響,所以應對其進行數據清理,將不在正常范圍內的數據刪除。
原始數據除了在數據清理過濾錯誤數據時會產生缺失,其本身也有缺失數據。但是我們要求將所有數據集成到同一數據庫時,需要每個時間點上都有數據并且數據個數是一致的,因此按照這個要求,如果某一時間點沒有對應的數據,將對其進行補齊。如在表1中第八、九行的輸出功率的時間點所示,在26s和38s之間就“丟失”了數據,那么要對這些“丟失”的數據進行補齊。如果缺失數據的前后時間間隔不大,采用線性插值的方法將其補上。例如:如果已知n時刻、n+i時刻的輸出功率值ωn、ωn+i,而缺少中間的數據,則中間時刻n+j的取值為:
ωn+j=ωn+ ×j, 0<j<i(1)
如果時間間隔較大,則線性插值的效果不理想,我們采用相鄰時刻的數據來代替。
2.3 數據平均
數據平均也就是對一定時間段內采集的原始數據求平均值。本系統中,每一分鐘對數據做一次平均。下位機PLC每6s鐘傳輸一次數據到計算機的臨時數據庫中,在經過數據集成和數據清理后,每傳送10個數據(一分鐘)后就對其求平均值,再將平均值送入數據庫進一步處理。
2.4 曲線擬合
曲線擬合(curve fitting)是指通過實驗獲得有限對觀測數據(xi,yi),選擇適當的曲線類型y=f(x)來擬合觀測數據,并用擬合的曲線方程分析兩變量間的關系。曲線擬合并不要求曲線y=f(x)通過所有離散點(xi,yi),只要求反映這些離散點的一般趨勢,不出現局部波動。
通過對鏈條爐運行參數的分析,4次多項式能夠較好地反應鏈條爐的運行特性,且具有較高的預測準確性。因此,本系統采用4次多項式曲線擬合的方式對經過平均處理后的數據進行再次處理。例如,系統內,每分鐘會傳入一個輸出功率的值,等到傳入30個數據(30min)時開始做曲線擬合,此后每分鐘會傳入一個新數據,總是保持用最新的30個數據做擬合,曲線擬合是實時進行的。
曲線擬合的4次多項式為:f(x)=a0+a1x+a2x2+a3x3+a4x4(2)
擬合后的數據作為鏈條爐顯示和參與下一步控制的數據使用。
圖1所示為現場實際采集的數據經過數據預處理后實際運行的曲線圖。
3 結束語
實時數據采集及數據預處理系統對于鏈條爐的上位機系統分析判斷鏈條爐運行狀況、處理突發情況以及制定相關控制策略具有非常重要的作用。本文所提到的數據預處理方法是針對鏈條爐自動控制系統,在實際應用中取得了較好的效果。
參考文獻:
[1]金旭.數據挖掘中數據預處理的研究與實現[J].計算機應用研究,2004(7):117-157.
[2]劉明吉,王秀峰.數據挖掘中的數據預處理[J].計算機科學,2000,27(4):54-57.
[3]行小帥,焦李成.數據挖掘的聚類方法[J].電路與系統學報,2003,8(1):59-66.