李育發(fā)+閆慶慶
摘 要:由于CEMS系統(tǒng)工作在惡劣的環(huán)境下,監(jiān)測(cè)到的煙塵煙氣數(shù)據(jù)會(huì)受到影響,由人工定位系統(tǒng)問(wèn)題的話(huà)會(huì)耗費(fèi)大量的時(shí)間和精力。為了方便系統(tǒng)問(wèn)題的定位,通過(guò)對(duì)燃煤電廠(chǎng)的大數(shù)據(jù)進(jìn)行挖掘,采用基于離群點(diǎn)的檢測(cè)算法,甄別出數(shù)據(jù)中的異常點(diǎn),發(fā)現(xiàn)可能存在的問(wèn)題。
關(guān)鍵詞:CEMS系統(tǒng);離群點(diǎn)檢測(cè);KNN;LOF;INFLO
中圖分類(lèi)號(hào):TM621.7 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2017)21-0153-03
隨著當(dāng)前的生態(tài)環(huán)境不斷惡化,尤其是PM2.5日益嚴(yán)重,我國(guó)對(duì)燃煤電廠(chǎng)的排放物有了更加嚴(yán)格的要求,燃煤電廠(chǎng)向大氣排放的氣態(tài)(煙氣)污染物(二氧化硫、氮氧化物、一氧化碳等)和固體污染物(煙塵)需要控制在一定的范圍內(nèi)。CEMS固定污染物源排放連續(xù)監(jiān)測(cè)系統(tǒng)(Continuous Emissions Monitoring System)用于長(zhǎng)期且連續(xù)監(jiān)測(cè)固定污染物源排放的煙氣和煙塵,反映煙塵在某一段時(shí)間內(nèi)的排放狀況。然而CEMS是一種工作在多塵、高濕、腐蝕性且流場(chǎng)不穩(wěn)定環(huán)境中的系統(tǒng),環(huán)境的惡劣、精密儀器的損壞都會(huì)造成系統(tǒng)采集污染物濃度數(shù)據(jù)的不準(zhǔn)確性。良好的數(shù)據(jù)源能夠?yàn)殡娋W(wǎng)對(duì)電廠(chǎng)污染物排放、脫硫脫硝設(shè)備運(yùn)行監(jiān)視提供數(shù)據(jù)指導(dǎo),為電網(wǎng)節(jié)能發(fā)電調(diào)度與脫硫脫硝電量考核提供決策支持。因而,需要使用離群點(diǎn)檢測(cè)的方法將異常數(shù)據(jù)點(diǎn)甄別出來(lái),發(fā)現(xiàn)CEMS系統(tǒng)中的問(wèn)題設(shè)備。
1 CEMS系統(tǒng)
1.1 系統(tǒng)簡(jiǎn)介
CEMS系統(tǒng)是一種大型的在線(xiàn)分析成套系統(tǒng),大型燃煤電廠(chǎng)的鍋爐基本都安裝了煙氣脫硫裝置,在鍋爐的出口煙道上(即脫硫裝置的進(jìn)口),CEMS通常監(jiān)測(cè)SO2、O2、煙塵、壓力、溫度五個(gè)參數(shù),而在脫硫裝置后的出口煙道上(即煙囪入口),CEMS通常監(jiān)測(cè)SO2、NOX、CO、O2、煙塵、流量、濕度、壓力、溫度九個(gè)參數(shù)。通過(guò)數(shù)據(jù)采集與控制系統(tǒng)匯總實(shí)時(shí)數(shù)據(jù),分析故障、自我校準(zhǔn)、超時(shí)報(bào)警,實(shí)現(xiàn)系統(tǒng)的自診斷。
CEMS是燃煤電廠(chǎng)煙氣脫硫系統(tǒng)中不可或缺的一部分,是煙氣脫硫系統(tǒng)良好工作的保障。
1.2 系統(tǒng)工作流程
由采樣探頭在煙道上連續(xù)抽取煙氣,初步過(guò)濾后經(jīng)加熱管線(xiàn)加熱至150℃保溫傳送。之后進(jìn)入煙氣預(yù)處理裝置進(jìn)行過(guò)濾、干燥和冷凝,將冷凝后煙氣中的腐蝕性廢液進(jìn)行收集排放,而干燥后的潔凈煙氣進(jìn)入CEMS氣體分析儀進(jìn)行各氣體濃度參數(shù)的測(cè)量。同時(shí),通過(guò)CEMS配置的PLC和工業(yè)控制計(jì)算機(jī),對(duì)煙氣采樣探頭每天定時(shí)用壓縮空氣進(jìn)行反吹掃,對(duì)煙氣的加熱、伴熱和冷凝裝置進(jìn)行溫度控制,對(duì)煙氣預(yù)處理系統(tǒng)電磁閥進(jìn)行邏輯控制,以及對(duì)煙氣成分分析儀的各個(gè)測(cè)量通道進(jìn)行準(zhǔn)確度標(biāo)定。
2 影響CEMS數(shù)據(jù)不準(zhǔn)確的可能因素
2.1 CEMS安裝位置過(guò)短
煙氣連續(xù)監(jiān)測(cè)技術(shù)規(guī)范指出,安裝CEMS系統(tǒng)需要預(yù)留充足的空間,在實(shí)際的部署過(guò)程中,大多數(shù)電廠(chǎng)的直管煙道偏短,使得煙塵、流量的探頭無(wú)法安裝在合適的地方,這樣也就影響了采集和計(jì)量煙氣的數(shù)據(jù)的準(zhǔn)確性。煙道太短,對(duì)氣態(tài)污染物無(wú)多大影響,即對(duì)二氧化硫、氮氧化合物的測(cè)量一般不會(huì)產(chǎn)生影響,但對(duì)在不同位置測(cè)量到的煙塵和流量數(shù)據(jù)會(huì)造成較大的影響,主要原因是煙道中的顆粒物分布不均勻,導(dǎo)致監(jiān)測(cè)點(diǎn)不具有代表性,獲得的數(shù)據(jù)不能反映真實(shí)的情況。
2.2 煙囪入口處煙塵監(jiān)測(cè)探頭被污染
將煙氣通過(guò)預(yù)處理裝置進(jìn)行洗滌后,雖然使用除霧器除去了霧滴,但入口處的煙氣依然含有一定量的水分,二氧化硫、硫酸鹽等物質(zhì)溶于水中,這樣的煙氣流經(jīng)CEMS探頭時(shí),煙氣中的水分可能形成液滴,對(duì)激光會(huì)產(chǎn)生折射和吸收,因此會(huì)影響測(cè)量結(jié)果。
目前,普遍存在燃煤發(fā)電廠(chǎng)中的CEMS監(jiān)測(cè)儀表探頭被污染的現(xiàn)象,污染源為煙氣中所含的水分,在低溫條件下,水分會(huì)凝結(jié)成水珠,水珠中含有少量的二氧化硫和硫酸鹽等物質(zhì),這些物質(zhì)在進(jìn)入煙囪,通過(guò)探頭時(shí),便會(huì)附著在探頭表面的過(guò)濾網(wǎng)上,物質(zhì)過(guò)多時(shí)還會(huì)完全堵住過(guò)濾網(wǎng),影響系統(tǒng)對(duì)煙氣中氣態(tài)污染物的監(jiān)測(cè)準(zhǔn)確性。
2.3 采樣管路泄漏或分析儀表維護(hù)不合理
在監(jiān)測(cè)檢測(cè)中,有很多異常情況會(huì)影響儀表準(zhǔn)確監(jiān)測(cè)數(shù)據(jù),比如管路泄露和后期維護(hù)的不合理。但是這些異常情況一般都可以從儀表的監(jiān)測(cè)數(shù)據(jù)中分析出來(lái),當(dāng)發(fā)現(xiàn)監(jiān)測(cè)地的儀表數(shù)據(jù)異常時(shí),比如氧氣的測(cè)量值過(guò)高,二氧化硫的測(cè)量值過(guò)低,就能夠說(shuō)明監(jiān)測(cè)的的管路泄露,需要及時(shí)進(jìn)行處理。
儀表在安裝完成后仍需要進(jìn)行定時(shí)檢修,對(duì)儀表進(jìn)行科學(xué)的維護(hù)可以有效保證儀表監(jiān)測(cè)數(shù)據(jù)的準(zhǔn)確性,定時(shí)檢修和監(jiān)測(cè)條件的選擇可以改變儀表在監(jiān)測(cè)數(shù)據(jù)是的精度。因此,為了確保監(jiān)測(cè)數(shù)據(jù)的精準(zhǔn),安裝監(jiān)測(cè)儀表前,要根據(jù)儀表的使用場(chǎng)景來(lái)規(guī)劃好維護(hù)方案,做到科學(xué)維護(hù)。
2.4 伴熱管線(xiàn)缺少報(bào)警
管道排除的煙氣含有大量水分,在遇到溫度較低環(huán)境時(shí)會(huì)放熱液化為水滴,當(dāng)水滴附著在儀表上時(shí),會(huì)使監(jiān)測(cè)結(jié)果產(chǎn)生誤差。為了解決這個(gè)問(wèn)題,用伴熱管來(lái)維持煙體溫度,這樣就會(huì)使煙體保持氣體形態(tài),直到煙氣經(jīng)過(guò)分析儀分析完成。如果在排送煙氣的環(huán)節(jié)中,伴熱管線(xiàn)存在故障,煙氣就會(huì)凝成水滴附著在儀表上,會(huì)腐蝕儀表。在沒(méi)有相關(guān)報(bào)警裝置時(shí),工作人員就無(wú)法及時(shí)發(fā)現(xiàn)異常,隨著時(shí)間的推移,儀表腐蝕家中,嚴(yán)重影響檢測(cè)儀表的準(zhǔn)確度。
要使伴熱管線(xiàn)在監(jiān)測(cè)時(shí)發(fā)揮效果,就需要對(duì)伴熱管線(xiàn)持續(xù)加溫,因此要合理調(diào)控伴熱管線(xiàn)的加熱溫度,如果設(shè)置不當(dāng),會(huì)導(dǎo)致伴熱管線(xiàn)溫度不合適,不足以防止煙氣凝結(jié)成水滴;還可能導(dǎo)致繼電器的損壞,因此因此,合理的溫度控制邏輯可以直接影響到CEMS儀表的精度。
3 使用離群點(diǎn)檢測(cè)的方法對(duì)異常點(diǎn)進(jìn)行甄別
所謂離群點(diǎn),就是那些與眾不同的遠(yuǎn)離常規(guī)數(shù)據(jù)對(duì)象的數(shù)據(jù)。由于離群點(diǎn)并不總是孤立出現(xiàn),很可能以小群體的形式出現(xiàn),即離群簇出現(xiàn)。在各類(lèi)型檢測(cè)算法中,基于聚類(lèi)的離群點(diǎn)檢測(cè)算法將不屬于任何聚類(lèi)的點(diǎn)定義為離群點(diǎn),對(duì)于離群檢測(cè)有較好的效果。endprint
3.1 使用KNN進(jìn)行甄別
3.1.1 KNN
KNN是通過(guò)測(cè)量不同特征值之間的距離進(jìn)行分類(lèi)。它的思路是:如果一個(gè)樣本在特征空間中的K個(gè)最相似(即特征空間最鄰近)的樣本中的大多數(shù)屬于某一個(gè)類(lèi)別,那么該樣本也屬于這個(gè)類(lèi)別。K通常是不大于20的整數(shù)。KNN算法中,所選擇的鄰居都是已經(jīng)正確分類(lèi)的對(duì)象。該方法在定類(lèi)決策上只依據(jù)最鄰近的一個(gè)或者幾個(gè)樣本的類(lèi)別來(lái)決定待分樣本所屬的類(lèi)別。
3.1.2 實(shí)驗(yàn)過(guò)程和結(jié)果
首先,將從燃煤電廠(chǎng)CEMS系統(tǒng)中獲取到的數(shù)據(jù)的前90%作為訓(xùn)練集,后10%作為測(cè)試集。通過(guò)集成在Rapid Miner數(shù)據(jù)挖掘工具中的Est Anomaly Detection插件,計(jì)算測(cè)試集中每條數(shù)據(jù)的outlier值,并從中獲取前1000個(gè)最大outlier值的數(shù)據(jù)。每次抽取前100、200……1000條數(shù)據(jù),判斷其中確實(shí)為異常值的個(gè)數(shù),并繪制出如下的樣本檢測(cè)率曲線(xiàn)。從圖1中可以看出,隨著抽取數(shù)據(jù)條數(shù)的增加,異常點(diǎn)的檢測(cè)率逐漸提高。使用KNN算法求得的異常點(diǎn)檢測(cè)率在一定程度上達(dá)到了預(yù)期的效果,可以將絕大多數(shù)的異常點(diǎn)甄別出來(lái),但也不排除誤報(bào)的情況。
3.2 使用LOF進(jìn)行甄別
3.2.1 LOF
LOF算法即局部離群因子算法,該算法首先會(huì)計(jì)算每個(gè)對(duì)象與其他對(duì)象之間的歐幾里得距離,對(duì)歐幾里得距離進(jìn)行排序后,計(jì)算每個(gè)對(duì)象的第k距離(距離該對(duì)象第k遠(yuǎn)的對(duì)象的距離)以及第k鄰域(該對(duì)象第k距離以?xún)?nèi)的點(diǎn)的集合)。而后計(jì)算每個(gè)對(duì)象的可達(dá)密度(該對(duì)象的第k鄰域內(nèi)的點(diǎn)到該對(duì)象的平均可達(dá)距離的倒數(shù))。最后計(jì)算局部離群因子(該對(duì)象的鄰域點(diǎn)的局部可達(dá)密度與該對(duì)象的局部可達(dá)密度比值的平均數(shù))。如果點(diǎn)p的局部離群因子趨近于1,說(shuō)明p的鄰域點(diǎn)密度差不多,p可能與鄰域同屬一簇。如果局部離群因子越小于1,說(shuō)明p的密度高于其鄰域點(diǎn)密度,p為密集點(diǎn);如果局部離群因子越大于1,說(shuō)明p的密度小于其鄰域點(diǎn)密度,p越可能是異常點(diǎn)。
3.2.2 實(shí)驗(yàn)過(guò)程和結(jié)果
采用與在KNN算法中相同的數(shù)據(jù)源,通過(guò)集成在Rapid Miner數(shù)據(jù)挖掘工具中的Est Anomaly Detection插件,選擇LOF分析,計(jì)算測(cè)試集中每條數(shù)據(jù)的outlier值,并從中獲取到前1000個(gè)最大的outlier值的數(shù)據(jù)。每次抽取前100、200……1000條數(shù)據(jù),判斷其中確實(shí)為異常值的個(gè)數(shù),并繪制出如下的樣本檢測(cè)率曲線(xiàn)。從圖2中可以看出,隨著抽取數(shù)據(jù)條數(shù)的增加,異常點(diǎn)的檢測(cè)率呈現(xiàn)上升的趨勢(shì),在選取不同k值的情況下,檢測(cè)率最多也只能達(dá)到75%。
3.3 使用INFLO進(jìn)行甄別
3.3.1 INFLO
在計(jì)算數(shù)據(jù)點(diǎn)的離群因子時(shí),INFLO會(huì)考察它的最近k鄰居,同時(shí)也會(huì)考察它的逆k鄰居。所謂逆k鄰居,即那些最近k鄰居包含該點(diǎn)的數(shù)據(jù)點(diǎn)。而數(shù)據(jù)點(diǎn)的鄰居和逆鄰居,構(gòu)成了該數(shù)據(jù)點(diǎn)的影響空間。INFLO值為對(duì)象的影響空間中的所有點(diǎn)的局部密度的均值/對(duì)象的局部密度。如果INFLO的值趨近于1。則說(shuō)明該數(shù)據(jù)點(diǎn)就可能是一個(gè)正常的點(diǎn),如果值比較高,那么該點(diǎn)是異常點(diǎn)的概率極大。
3.3.2 實(shí)驗(yàn)過(guò)程和結(jié)果
采用與在KNN算法中相同的數(shù)據(jù)源,通過(guò)集成在Rapid Miner數(shù)據(jù)挖掘工具中的Est Anomaly Detection插件,選擇INFLO分析,計(jì)算測(cè)試集中每條數(shù)據(jù)的outlier值。繪圖規(guī)則與3.2.2中規(guī)則相同。從圖3中可以看出,隨著抽取數(shù)據(jù)條數(shù)的增加,異常點(diǎn)的檢測(cè)率一直在提升,而且相比于等量樣本數(shù)的LOF算法的檢測(cè)率,INFLO的檢測(cè)率都比LOF的高。在多次嘗試不同k值,達(dá)到最優(yōu)效果的檢測(cè)率也優(yōu)于等量樣本數(shù)的KNN算法。
4 結(jié)語(yǔ)
通過(guò)分析影響CEMS系統(tǒng)中能夠產(chǎn)生數(shù)據(jù)異常的原因,并提供三種不同的離群檢測(cè)算法,對(duì)可能包含異常點(diǎn)的數(shù)據(jù)集進(jìn)行甄別,三種算法均可以達(dá)到基本檢測(cè)出異常點(diǎn)的目的。但從效果來(lái)看,INFLO算法的效果最優(yōu)。
參考文獻(xiàn)
[1]劉書(shū)志.基于密度的局部離群數(shù)據(jù)挖掘方法的研究和改進(jìn)[D].重慶大學(xué),2014.
[2]壽立新.臺(tái)州電廠(chǎng)煙氣脫硫CEMS異常分析與處理[J].浙江電力,2009,28(b07):58-59.
[3]張峻.CEMS測(cè)量準(zhǔn)確率偏低的原因分析及解決措施[C].2011年電力環(huán)保學(xué)術(shù)年會(huì)論文集,2011.
[4]閆偉,張浩,陸劍鋒,袁磊.聚類(lèi)分析理論研究及在流程企業(yè)中的應(yīng)用[J].計(jì)算機(jī)工程,2006,32(17):19-21+27.endprint