王洋,趙明,梁俊宇,邱亞林
(1.華北電力大學云南電網公司研究生工作站,昆明 650217; 2.云南電網公司電力研究院,昆明 650217)
煤質數據庫的建立方法
王洋1,趙明2,梁俊宇1,邱亞林2
(1.華北電力大學云南電網公司研究生工作站,昆明 650217; 2.云南電網公司電力研究院,昆明 650217)
介紹為了保障節能發電調度中煤耗實時在線監測系統的準確性,減少煤質的復雜性和人為離線輸入的不確定性對鍋爐效率在線計算造成的偏差,采用統計分析和聚類計算等方法,構建了針對特定區域電廠的煤質數據庫的方法。
煤質數據庫;鍋爐效率;在線監測;節能發電調度
以等利用小時數按計劃平均分配發電指標的傳統調度方式沒有考慮機組的性能和運行狀態,導致我國的電力生產處于高能耗、高污染、低效率的粗放式增長模式。節能發電調度按照節能、經濟的原則,優先調度可再生發電資源,按照機組能耗和污染物排放水平由低到高排序,依次調用化石類發電資源,最大限度地減少能源、資源消耗和污染物排放[1]。煤耗實時在線監測系統作為節能發電調度的重要保障手段,其準確性對于負荷分配的公平、公開、公正有著至關重要的作用。
鍋爐效率在線計算的準確性對煤耗在線計算結果有著重要的影響,而在鍋爐效率計算中,煤質是最主要的影響因素之一。隨著電煤價格矛盾的日益突出,電廠用煤的來源和成分都復雜多變,各種煤質互摻燃燒使得入爐煤質很難確定[2-3]。而且,目前煤質成分的實時測量技術尚不成熟,常采用的離線取樣分析方法存在結果滯后、誤差大等問題,煤質數據的實時性得不到滿足。
收集特定地區的歷史煤質數據,通過統計分析和聚類計算等方法建立該地區的煤質數據庫,以收到基低位發熱量為索引,選取數據庫中 “虛擬煤質”的元素成分進行鍋爐效率的在線計算,可以很好的避免由人為化驗、離線輸入帶來的各種問題,提高鍋爐效率在線計算的準確性,從而保障了煤耗在線監測系統的公平、公開與公正。
煤是植物殘骸在適宜的地質環境中,經過了漫長的物理、化學和生物的復雜作用而形成的有機生物巖石。成煤物質、成煤條件和成煤年代等因素的復雜多變導致了煤質種類的多樣性和煤質結構的復雜性[4]。
通過煤的元素分析可知,煤主要由 C、H、O、N、S以及水分和灰分構成:
C+H+O+N+S+M+A=100% (1)
式中:C、H、O、N、S、M、A分別為碳、氫、氧、氮、硫、水分、灰分的質量百分數,%。
根據用途的不同,煤的元素分析結果表示也不一樣,在煤質特性研究中使用干燥無灰基(daf)表示:
Cdaf+Hdaf+Odaf+Ndaf+Sdaf=100% (2)
式中,Cdaf、 Hdaf、 Odaf、 Ndaf、 Sdaf分別為碳、氫、氧、氮、硫的干燥無灰基質量百分數,%。
研究表明[5-7],隨著煤化程度的加深,煤中的碳含量不斷增加,同時,氫和氧的含量逐漸減少。Hdaf—Cdaf、Odaf—Cdaf之間有良好的線性關系,如下式所示:
Hdaf=a1Cdaf+b1(3)
Odaf=a2Cdaf+b2(4)
對于我國大多數煤來說,煤中的氮與氫含量存在如下關系:
Ndaf=cHdaf(5)
式中,a1、a2、b1、b2、c為干燥無灰基組成特性系數,通過線性回歸可以得到系數的經驗值。
煤中硫的含量與煤的變質程度關系不明顯,硫含量的高低主要取決于成煤時的沉積環境。
由此可知,煤質典型的多變性不在于它的干燥無灰基成分,而在于它所含的水分和灰分。對于同一類型的煤種,特別是同一或者臨近礦點的煤種,煤質的干燥無灰基成分相對穩定,變化不大。
所以,通過統計分析,獲取特定區域電廠燃煤較穩定的干燥無灰基成分,并與統計處理后的水分和灰分組合,可以得到該地區電廠燃煤煤質的工程數據庫。
3.1 總體思路和模型
以發熱量為索引去煤質數據庫中取用煤質時,是用鍋爐實際吸熱量近似等于收到基低位發熱量:
Qs=Qar,net(6)
式中,Qs為鍋爐實際吸熱量,kJ/kg;Qar,net為收到基低位發熱量,kJ/kg。
煤質數據庫中的發熱量通過計算得到,為了提高計算的準確度,選用元素分析結果進行計算。所以,統計電廠歷史煤質的收到基水分和灰分以及電力試驗研究院化驗得到的干燥無灰基元素成分,最終通過計算整理,構建出以收到基低位發熱量為索引的煤質元素分析結果,如表1所示:

表1 煤質數據庫的形式
3.2 數據分析整理
3.2.1 基于劃分方法的聚類算法
聚類算法根據最大化簇內相似性和最小化簇間相似性的原則對數據對象進行自動分類,主要有劃分方法、層次方法、基于密度和基于網格的方法,其中劃分方法最基本也最常用[8]。劃分方法主要有k-均值 (k-means)和k-中心點 (kmedoids)兩種。
k-均值是一種基于形心的聚類技術,使用分配給該簇對象的均值作為形心,用簇內變差來度量簇的質量,通過不斷改變簇內對象并不斷計算形心來達到局部的最優聚類。簇內變差定義為簇內所有對象和形心之間的誤差的平方和,誤差通常選用對象與形心之間的歐氏距離。k-中心點是一種基于代表對象的聚類技術,與k-均值不同的是,簇的形心不是簇內對象的均值,而是挑選實際的對象來代表簇。算法基于最小化所有對象與其對應的代表對象之間的相異度之和的原則來進行劃分。圍繞中心點劃分 (Partitioning Around Medoids,PAM)算法[9]是k-中心點聚類的一種流行的實現。k-中心點算法比k-均值算法的計算花銷大很多,但是其對噪聲和離群點的敏感性明顯降低。
3.2.2 水分和灰分的處理
統計電廠用煤收到基水分Mar和灰分Aar,通過散點圖獲取其大致的分布區間,如圖1所示:

圖1 Mar與Aar的分布范圍
從圖1可以看出收到基水分Mar的分布范圍是35%~55%,收到基灰分Aar的分布范圍是10%~17%。
將水分和灰分數據進行順序排列,剔除明顯存在統計錯誤的離群點,然后將數據導入MATLAB軟件,調用軟件自帶的kmeans函數,將水分和灰分數據分別聚類成7類,調用格式如下:
[IDX,C]=kmeans(X,7) (7)
其中,X是水分和灰分的原始數據,IDX返回各對象的類標號,聚類后各簇的形心在矩陣C中。簇內各點與形心的距離采用默認的歐幾里得距離。
矩陣C中的值是聚類得到的各個簇內的數據均值,可以作為該簇的代表。使用聚類獲取的7個均值可以較好的反應原始數據的分布特征。如圖2所示:

圖2 Mar與Aar的取樣分布
3.2.3 干燥無灰基成分的處理
統計電力試驗研究院試驗期間化驗的煤質數據,將其換算成干燥無灰基元素成分。采用PAM算法從統計得到154種試驗煤質中選取典型煤質作為分析對象。
每個數據對象含有6個屬性,分別為 Cdaf、Hdaf、 Odaf、 Ndaf、 Sdaf以及Qdaf,net, 其中 Qdaf,net為煤質的干燥無灰基低位發熱量,用以檢驗數據庫中發熱量的計算值的準確性。在MATLAB軟件中進行PAM算法代碼開發,算法的流程如下:
1)輸入:簇的數目k和包含n個對象的數據集合D;
2)從D中隨機選擇k個對象作為初始的代表對象或中心點;
3)Repeat
4)將每個剩余的對象分配到最近的代表對象所代表的簇;
5)隨機選擇一個非代表對象Orandom;
6)計算用 Orandom代替代表對象 Oj的總代價S;
7)If S<0,then Orandom替換 Oj,形成一個新的k個中心點的集合;
8)Until不發生變化;
9)輸出:k個簇的集合。
計算時導入煤質數據并輸入k=40,得到聚類后的40種典型煤質成分,以此作為煤質數據庫構建的干燥無灰基成分。部分典型煤質數據如表2所示。

表2 典型煤質的干燥無灰基成分
把構造的收到基水分、灰分與選取的干燥無灰基元素成分的樣本進行組合,就得到了7×7×40 =1 960種 “虛擬煤質”。
3.2.4 發熱量的計算
煤的收到基低位發熱量是鍋爐熱平衡、熱效率、出力計算以及運行參數調整的重要依據,同時也是動力煤計價的主要指標,有著重要的技術和經濟價值。利用元素分析結果計算煤的發熱量有許多經驗公式[10],如:
杜隆公式:
Qgr,daf=337.9Cdaf+1 441(Hdaf-0.125Odaf) + 104.5t,daf(8)
門捷列夫公式:
Qgr,daf=338.7Cdaf+1 254.5Hdaf-108.7Odaf+ 08.7St,daf(9)
適用于我國褐煤的回歸式:
Qgr,daf=334.5Cdaf+1 275.4Hdaf-108.7Odaf+ 92St,daf-25.1(Ad-10) (10)
式中:Qgr,daf為干燥無灰基高位發熱量,kJ/ kg;Ad為干燥基灰分,%。
各公式對不同的煤質成分有不同程度的適應性,本例中煤質為褐煤,經過計算和比較,最終選取發熱量的計算公式[11]為:
Qar,gr=4.19(87Car+300Har+26Sar-26Qar)
(11)
最后,將計算結果全部換算到收到基,將公式計算得到的高位發熱量換算成低位發熱量。高、低位發熱量換算采用公式[12]如下:
Qar,net=Qar,gr-206Har-26Mar(12)
4.1 發熱量校驗
采用上述方法建立的煤質數據庫是否在實用允許誤差范圍之內,主要看其發熱量是否和化驗值相符。使用計算發熱量與化驗獲取發熱量的差值ΔQar,net來進行檢驗。

式中: Qj為收到基低位發熱量計算值,
ar,netkJ/kg;Qsar,net為收到基低位發熱量化驗值,kJ/kg。
數據庫中所有煤種發熱量的計算誤差如圖3所示:

圖3 計算發熱量與試驗值的誤差
由圖3可知,大部分煤質發熱量計算值都比較準確,只有少數的一些點誤差較大。結合數據分析得到,總體誤差在0.37~2 011.12 kJ/kg之間,其中誤差在600 kJ/kg以內的煤種占92.4%,總體匹配度較好。
由于煤質數據庫中的煤種是根據實際煤質的干燥無灰基成分和人為給定的水分、灰分組合而來,是一種 “虛擬煤質”,其各元素成分的組成不一定能夠滿足基于大量實際煤質成分而得到的經驗公式,小部分煤質熱量的計算誤差較大是可能存在的。
按照發熱量大小對所有煤種進行排序,發現計算誤差較大的煤種發熱量并沒有集中在某一個熱量區域中,而是較均勻的分布于各個熱量區間。所以,實際應用中刪去這些煤種后不會影響總體的熱量分布。本例中刪去了誤差大于600 kJ/kg的149種煤質。
4.2 數據庫精簡
針對實際應用過程中,由于煤質數據量太大而導致計算程序運行緩慢的問題,對煤質數據庫的數據總量進行了精簡。
將發熱量升序排列后,計算出前后相鄰煤種間的熱量差值,以此作為相鄰煤種的熱量間距。當前后兩種煤質熱量相差很小時,可以刪除其中一種,以達到精簡數據庫的目的。
計算后發現相鄰煤種的熱量間距值分布如圖4所示:

圖4 相鄰煤種的熱量間距
由圖4可知,只有少數煤種的熱量間隔較大(有6種大于100 kJ/kg的煤種沒有在圖上顯示)大部分熱量間距都分布在10 kJ/kg以內。刪除熱量間距在5 kJ/kg以下的煤質數據,剩余580種煤質。這些煤質同時滿足計算誤差和熱量間距的要求,使得數據庫內煤質在保證準確性的同時,大大精簡了數據量,提高了在線計算的效率。
4.3 實際應用
將構建的煤質數據庫運用到煤耗在線監測系統的軟件計算包中,根據現場實時采集的參數計算鍋爐實際吸收熱量值并取用煤質數據庫中的“虛擬煤質”進行煤耗的實時在線計算。
一般來說,火電廠一天之內煤質化驗的平均值是有代表性的,能較好地反映當天燃用的平均煤質。為了評估煤質數據庫中選取的煤質與現場煤質的差異,驗證煤質庫的可靠性,將2012年12月10日至12月31日取用的 “虛擬煤質”與現場化驗煤質的收到基低位發熱量進行對比,結果如圖5所示。

圖5 數據庫煤質發熱量與電廠化驗值的對比
從圖5中可以看出,電廠化驗煤質的發熱量與煤質數據庫選取 (計算值)的發熱量在趨勢上保持了高度的一致性,兩者最大的差別約為700 kJ/kg左右。如果考慮電廠化驗發熱量的允許誤差為±500 kJ/kg,則煤質數據庫的選取結果完全可以滿足鍋爐效率在線計算的要求,適合于工程實際應用。另外,采用同樣的方法建立的煤質數據庫的應用有效的統一了特定地區各個火電廠的煤質數據來源,有效保障了煤耗在線監測系統的公平、公開與公正性。
1)煤質所含的水分和灰分是導致其多變性的主要原因,可以通過組合實際煤種相對穩定的干燥無灰基成分與人為給定的水分和灰分得到“虛擬煤質”。
2)基于劃分方法的聚類算法適用于獲取水分、灰分的代表值和煤質干燥無灰基成分的典型值,獲取的樣本點能夠很好的保留母體的分布特征。
3)利用構建煤質的元素分析結果計算得到的煤質發熱量與試驗測取的發熱量匹配度較好,計算誤差在600 kJ/kg以內的煤種占92.4%。
4)采用構建的虛擬煤質數據庫進行鍋爐效率的在線計算時,計算中取用的煤質發熱量與電廠當天化驗的煤質發熱量在趨勢上保持了高度的一致性,兩者最大的差別約為700 kJ/kg左右。因此,建立的煤質數據庫可以滿足工程實際應用,有效保障了煤耗在線監測系統的公平、公開與公正性。
[1] 王庭飛,孫斌,等.節能發電調度技術研究及實踐與效果分析 [J].南方電網技術.2009,(3):1.
[2] 蘇保光,田亮,等.一種在線煤質軟測量方法 [J].電力科學與工程.2011,27(7):32.
[3] 高小濤.電站鍋爐燃用混煤的煤質特性分析 [J].江蘇電機工程.2009,28(1):63.
[4] 周桂萍.電廠燃料 [M].北京:中國電力出版社,2007.
[5] 劉福國.電站鍋爐入爐煤元素分析和發熱量的軟測量實時監測技術 [J].中國電機工程學報.2005,25(6):140
[6] 劉福國,郝衛東,韓小崗,等.基于煙氣成分分析的電站鍋爐入爐煤質監測模型 [J].燃燒科學與技術,2002,8 (5):442-443.
[7] 謝克昌.煤的結構和反應性 [M].北京:科學出版社,2002.
[8] 韓家煒 (Han,J.),等.數據挖掘概念與技術 [M].北京:機械工業出版社,2012.
[9] 陳志強,劉釗,張建輝.聚類分析中PAM算法的分析與實現 [J].計算機與現代化.2003,9:1-2.
[10] 陳文敏.煤的發熱量和計算公式 [M].北京:煤炭工業出版社,1989.
[11] 范從振 .鍋爐原理 [M].北京:水利電力出版社,1986.
[12] 樊泉桂 .鍋爐原理 [M].北京:中國電力出版社,2004.
A Method for Building a Coal Quality Database
WANG Yang1,ZHAO Ming2,LIANG Junyu1,QIU Yalin2
(1.Postdoctoral and Graduate Workstation of North China Electric Power University and Yunnan Power Grid Corporation,Kunming 650217; 2.Yunnan Electric Power Research Institute,Kunming 650217)
In order to ensure the accuracy of the online monitoring system for coal consumption in the energy-conservation power generation dispatch,a coal quality database for the power plants in a certain area was built based on the method of statistical analysis and clustering caculation to reduce the errors caused by the complex coal quality and the off-line input during the online calculation of the boiler efficiency.The results show that the errors less than 600 kJ/kg between the caculated heat of“virtual coal”and the laboratory values can be up to 92.4%.And the heat obtained from the database matches well with the laboratory values in the power plants in practical application,with the maximum error less than 700 kJ/kg.It can enhance the fairness and impartiality of the online monitoring system for the power plants in a certain region using the virtual coal database during the online calculation of boiler efficiency.
coal quality database;boiler efficiency;online monitoring;energy-conservation power generation dispatch.
TK3
B
1006-7345(2014)01-0044-05
2013-06-25
王洋 (1988),男,碩士研究生,云南電網公司研究生工作站,從事煤耗在線監測方面的相關研究 (e-mail)angus081428 @163.com。