999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

電站歷史數(shù)據(jù)缺失值填補(bǔ)策略研究

2017-02-07 09:00:55李建強(qiáng)潘文凱陳星旭李世博
電力科學(xué)與工程 2017年1期
關(guān)鍵詞:優(yōu)化

李建強(qiáng),趙 凱,潘文凱,陳星旭,李世博

(華北電力大學(xué) 能源動(dòng)力與機(jī)械工程學(xué)院,河北保定071003)

電站歷史數(shù)據(jù)缺失值填補(bǔ)策略研究

李建強(qiáng),趙 凱,潘文凱,陳星旭,李世博

(華北電力大學(xué) 能源動(dòng)力與機(jī)械工程學(xué)院,河北保定071003)

針對(duì)電站數(shù)據(jù)庫存在數(shù)據(jù)缺失的問題,提出了改進(jìn)的模糊聚類缺失值填補(bǔ)算法,即支持向量回歸與遺傳算法優(yōu)化的模糊聚類填補(bǔ)算法(SVR-OCSFCM)。對(duì)某600MW燃煤機(jī)組運(yùn)行數(shù)據(jù)用支持向量機(jī)回歸算法(SVR)、模糊聚類優(yōu)化補(bǔ)全策略(OCS-FCM)與SVR-OCSFCM三種方法分別進(jìn)行單屬性和多屬性缺失值填補(bǔ)實(shí)驗(yàn),實(shí)驗(yàn)表明:同屬性缺失時(shí),算法性能隨缺失率增加而降低,相同缺失率時(shí)填補(bǔ)性能隨缺失屬性的增加而降低;SVR-OCSFCM由支持向量回歸和模糊聚類算法共同約束估計(jì)值,具有較好的準(zhǔn)確性和有效性,缺失值填補(bǔ)性能優(yōu)于SVR和OCS-FCM算法,且對(duì)多屬性缺失數(shù)據(jù)填補(bǔ)具有較好的填補(bǔ)效果。

缺失值;數(shù)據(jù)填補(bǔ);電站;模糊聚類

0 引言

隨著電力工業(yè)的發(fā)展,電站過程數(shù)據(jù)庫復(fù)雜程度與數(shù)據(jù)量越來越大,促進(jìn)了數(shù)據(jù)挖掘在電站優(yōu)化中的應(yīng)用[1-2],數(shù)據(jù)預(yù)處理作為其不可或缺的基礎(chǔ)性工作,越來越受到重視。針對(duì)各實(shí)際領(lǐng)域的不同特點(diǎn)涌現(xiàn)出了不同的數(shù)據(jù)預(yù)處理思想與工具。就目前階段來看,數(shù)據(jù)預(yù)處理技術(shù)中研究最多的是“臟數(shù)據(jù)”的清理問題,數(shù)據(jù)清理的主要方向集中在數(shù)據(jù)缺失值處理、噪聲數(shù)據(jù)的平滑處理以及異常數(shù)據(jù)的篩選處理等。數(shù)據(jù)缺失問題在基于傳感器采集數(shù)據(jù)的發(fā)電廠普遍存在,嚴(yán)重阻礙了數(shù)據(jù)分析及挖掘在電站優(yōu)化領(lǐng)域的發(fā)展[3-5]。

電站數(shù)據(jù)采集、存儲(chǔ)系統(tǒng)組成復(fù)雜,測點(diǎn)工作環(huán)境惡劣等多方原因能夠造成數(shù)據(jù)的缺失,主要分為:傳感器故障、數(shù)據(jù)傳輸故障、數(shù)據(jù)存儲(chǔ)故障、人的主觀因素等。數(shù)據(jù)的不完整性給數(shù)據(jù)挖掘過程、數(shù)據(jù)分析和研究帶來了重重困難,這些不完整的數(shù)據(jù)會(huì)導(dǎo)致分析結(jié)果發(fā)生偏置,建立錯(cuò)誤的數(shù)據(jù)挖掘模型,導(dǎo)致不準(zhǔn)確的挖掘結(jié)果,甚至?xí)`導(dǎo)用戶的決策,導(dǎo)致經(jīng)濟(jì)損失。

針對(duì)電站歷史數(shù)據(jù)的缺失值處理問題,很多研究者提出了面向不同方向的多種有效方法。文獻(xiàn)[6]基于線性插值原理對(duì)較短時(shí)間內(nèi)平穩(wěn)運(yùn)行過程的缺失數(shù)據(jù)進(jìn)行填補(bǔ),針對(duì)不穩(wěn)定工況采用遺傳自適應(yīng)加權(quán)類平均值填補(bǔ)算法。文獻(xiàn)[7]采用粗糙集方法處理電站故障診斷系統(tǒng)中信號(hào)缺失問題。文獻(xiàn)[8]運(yùn)用EM(PCA)算法處理燃燒系統(tǒng)中的缺失數(shù)據(jù),對(duì)不同缺失率的數(shù)據(jù)進(jìn)行了填補(bǔ),由于此算法的目的是減少缺失數(shù)據(jù)對(duì)數(shù)據(jù)空間重構(gòu)的影響,對(duì)缺失數(shù)據(jù)值本身的預(yù)測不是十分精確。

電站歷史數(shù)據(jù)屬性參數(shù)眾多,缺失數(shù)據(jù)分布廣泛,以上研究一般用于單屬性數(shù)據(jù)缺失的處理,針對(duì)多屬性缺失數(shù)據(jù)涉及很少或應(yīng)用于多屬性缺失數(shù)據(jù)時(shí)性能下降明顯的問題,本文提出了改進(jìn)的模糊聚類缺失值填補(bǔ)算法,算法利用模糊聚類優(yōu)化補(bǔ)全策略和支持向量回歸填補(bǔ)算法共同約束缺失數(shù)據(jù)的估計(jì)值,并利用遺傳算法尋找最優(yōu)模糊聚類數(shù)c、模糊因子m的值,最終得到填補(bǔ)效果較理想的完整數(shù)據(jù)集。對(duì)某600 MW燃煤機(jī)組運(yùn)行數(shù)據(jù)進(jìn)行單屬性與多屬性缺失值填補(bǔ)實(shí)驗(yàn),結(jié)果表明該算法可以實(shí)現(xiàn)多屬性缺失值的填補(bǔ),驗(yàn)證了該方法的準(zhǔn)確性與有效性。

1 改進(jìn)的模糊聚類缺失值填補(bǔ)算法

1.1 OCS-FCM算法

將模糊C均值聚類算法(FCM)應(yīng)用在缺失值填補(bǔ)中有4種策略[9],分別為:完整數(shù)據(jù)策略(Whole Data Strategy,WDS)、局部距離策略(Partial Distance Strategy,PDS)、優(yōu)化補(bǔ)全策略(Optimal Completion Strategy,OCS)以及最近模型策略(Nearest Prototype Strategy,NPS)。

(1)完整數(shù)據(jù)策略。對(duì)缺失數(shù)據(jù)的處理方式屬于刪除法,其基本原理是當(dāng)數(shù)據(jù)集中的缺失值數(shù)量較少時(shí)采取刪除樣本的方法進(jìn)行聚類。但這種方法會(huì)造成信息的丟失。

(2)局部距離策略。僅忽略缺失樣本中的缺失屬性,對(duì)缺失樣本中的完整屬性按比例進(jìn)行樣本與聚類中心的距離。該算法與經(jīng)典FCM算法收斂性一致。

(3)優(yōu)化補(bǔ)全策略。將缺失數(shù)據(jù)的填補(bǔ)看作優(yōu)化問題,在迭代過程中給出缺失數(shù)據(jù)的估計(jì)值,其收斂性與經(jīng)典FCM算法收斂性一致。

(4)最近模型策略。在每次迭代中將缺失數(shù)據(jù)用距離最臨近的數(shù)據(jù)代替。

經(jīng)過理論分析及數(shù)據(jù)實(shí)驗(yàn)確定了OCS-FCM算法對(duì)缺失數(shù)據(jù)填補(bǔ)效果最佳[9],首先介紹OCS-FCM算法的基本原理。

假設(shè)數(shù)據(jù)樣本集合為X={x1,x2,x3,…,xn},其中xk為X數(shù)據(jù)集中第k個(gè)s維的數(shù)據(jù)向量;xkj為xk向量中第j個(gè)值,1≤j≤s,1≤k≤n。數(shù)據(jù)集合X中包含缺失值,以NA表示,令:

(1)

XM為缺失值數(shù)據(jù)集;M為缺失值的個(gè)數(shù)。舉例說明,令s=2,n=4,數(shù)據(jù)集設(shè)為:

(2)

則Xm={x12,x41,x43}。

OCS-FCM算法可以總結(jié)為以下步驟:

初始化:確定模糊因子m,聚類數(shù)目c,最大迭代次數(shù)tmax或收斂閾值ε并且滿足:10,模糊因子m被證明在[1.5,2.5]區(qū)間時(shí)聚類算法表現(xiàn)最好[10],m一般取值為2。初始化缺失值XM,初始化聚類中心V0。

步驟一:計(jì)算(更新)隸屬度矩陣U,

(3)

隸屬度矩陣U滿足條件:

(4)

步驟二:更新聚類中心V,

(5)

步驟三:若‖v(r+1)-v(r)‖<ε成立或達(dá)到最大迭代次數(shù),則算法停止,否則轉(zhuǎn)到步驟四。

步驟四:計(jì)算缺失數(shù)據(jù)的填補(bǔ)值。

(6)

步驟五:令r=r+1,轉(zhuǎn)到步驟一。

可以看出,OCS-FCM算法運(yùn)行中會(huì)對(duì)缺失數(shù)據(jù)進(jìn)行估計(jì),得到補(bǔ)全的數(shù)據(jù)集。

1.2 改進(jìn)的OCS-FCM算法

在本文的模型中,模糊聚類算法用來區(qū)分缺失數(shù)據(jù)之間的差異并依據(jù)它們的特性對(duì)這些數(shù)據(jù)進(jìn)行分類,應(yīng)用OCS-FCM算法對(duì)缺失數(shù)據(jù)進(jìn)行估計(jì)并進(jìn)行模糊聚類,這使得補(bǔ)全后相似的數(shù)據(jù)聚成一簇。然后在每個(gè)類別中分別以未缺失數(shù)據(jù)為訓(xùn)練集對(duì)支持向量回歸算法進(jìn)行訓(xùn)練,在相似數(shù)據(jù)集中支持向量回歸算法有更優(yōu)的學(xué)習(xí)能力[11],訓(xùn)練后的支持向量回歸分別對(duì)各類中的缺失數(shù)據(jù)進(jìn)行估計(jì),遺傳算法優(yōu)化聚類參數(shù)c、m,最終得到最優(yōu)的缺失數(shù)據(jù)估計(jì)值。缺失數(shù)據(jù)填補(bǔ)模型設(shè)計(jì)如圖1所示。

支持向量回歸與遺傳算法優(yōu)化的模糊聚類填補(bǔ)算法運(yùn)行步驟為:

(1)設(shè)置c、m初始值,應(yīng)用OCS-FCM算法對(duì)數(shù)據(jù)集進(jìn)行缺失值填補(bǔ)。填補(bǔ)結(jié)果記為X。

(2)在所得的各聚類空間中分別應(yīng)用支持向量回歸估計(jì)缺失值。該過程中聚類空間內(nèi)的完整數(shù)據(jù)作為訓(xùn)練集訓(xùn)練支持向量回歸算法,缺失數(shù)據(jù)作為估計(jì)目標(biāo)進(jìn)行填補(bǔ),填補(bǔ)結(jié)果記為Y。

(3)對(duì)參數(shù)c、m應(yīng)用遺傳算法優(yōu)化并重復(fù)(1)、(2)兩步驟,計(jì)算誤差函數(shù)Eerror=(X-Y)2,誤差函數(shù)最小時(shí)對(duì)應(yīng)的c、m為最優(yōu)分類參數(shù)。取此時(shí)X與Y的平均值作為最優(yōu)填補(bǔ)值。

(4)應(yīng)用最優(yōu)填補(bǔ)值,獲得完整數(shù)據(jù)集。

圖1 SVR-OCSFCM算法填補(bǔ)缺失值過程

2 單屬性缺失值填補(bǔ)實(shí)驗(yàn)

實(shí)驗(yàn)對(duì)象為某600 MW燃煤發(fā)電機(jī)組,從SIS數(shù)據(jù)庫中選取負(fù)荷、省煤器出口氧量、凝汽器真空和供電煤耗為數(shù)據(jù)集,采樣時(shí)間間隔為1 min。在原始數(shù)據(jù)中通過刪除含缺失值的行構(gòu)造不含缺失值的完整數(shù)據(jù)集,最終確定數(shù)據(jù)集包含1 000組數(shù)據(jù)。數(shù)據(jù)集部分?jǐn)?shù)據(jù)如表1所示。

電站運(yùn)行數(shù)據(jù)測點(diǎn)眾多,各屬性數(shù)據(jù)數(shù)量級(jí)、量綱不同,因此需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理,將數(shù)值范圍變換為[0,1],以提高算法的泛化能力,提高收斂速度,避免對(duì)度量單位選擇的依賴性[12]。歸一化公式為:

(7)

本文采取均方根誤差(Root Mean Square Error,ERMSE)和填補(bǔ)準(zhǔn)確度(Accuracy,A)去評(píng)價(jià)提出的算法的優(yōu)越性,均方根誤差是缺失值填補(bǔ)研究中應(yīng)用最廣泛的評(píng)價(jià)標(biāo)準(zhǔn),其函數(shù)如下:

表1 數(shù)據(jù)集樣本

(8)

式中:xr為真實(shí)值;xi為算法的填補(bǔ)值;n為缺失值的數(shù)目;ERMSE值越小說明算法填補(bǔ)質(zhì)量越高[13]。

填補(bǔ)準(zhǔn)確度A評(píng)價(jià)函數(shù)能夠計(jì)算出填補(bǔ)值中符合容忍度要求的值所占的比例,其函數(shù)如下:

(9)

式中:n為缺失值數(shù)量;nt為正確估計(jì)值數(shù)量,指在容忍度范圍內(nèi)的填補(bǔ)值數(shù)量。本文將容忍度設(shè)置為10%,即填補(bǔ)值在真實(shí)值的±10%誤差范圍內(nèi)時(shí)此填補(bǔ)值被視為正確估計(jì)值。

首先根據(jù)情況選定缺失屬性,通過隨機(jī)刪除的方法構(gòu)造缺失率分別為1%、3%、5%、10%、15%、20%、25%和30%的缺失數(shù)據(jù)集。在不同缺失率下分別應(yīng)用OCS-FCM、SVR和SVR-OCSFCM三種算法進(jìn)行實(shí)驗(yàn),并對(duì)各算法得到的實(shí)驗(yàn)結(jié)果根據(jù)均方根誤差和填補(bǔ)準(zhǔn)確度進(jìn)行分析比較。

以省煤器出口氧量為填補(bǔ)目標(biāo),構(gòu)造各比率的缺失數(shù)據(jù)集,測試三種算法的性能。為充分表現(xiàn)各算法的性能,用隨機(jī)生成缺失值的方式為每個(gè)缺失率構(gòu)造10個(gè)缺失數(shù)據(jù)集,算法應(yīng)用于各個(gè)數(shù)據(jù)集所得結(jié)果取平均值作為最終的實(shí)驗(yàn)結(jié)果,綜合各實(shí)驗(yàn)結(jié)果進(jìn)行分析對(duì)比。

從圖2中可以看出SVR-OCSFCM算法在所有缺失率下均方根誤差均最小,填補(bǔ)效果最優(yōu),隨缺失率的增加,均方根誤差增大。從算法原理上看,SVR-OCSFCM由支持向量回歸和模糊聚類算法共同約束估計(jì)值,缺失值填補(bǔ)性能提高,均方根誤差降低。

圖2 各算法填補(bǔ)結(jié)果的均方根誤差

缺失值填補(bǔ)準(zhǔn)確度隨缺失率的增大而降低,如圖3所示,當(dāng)缺失率為1%時(shí),三種算法的填補(bǔ)準(zhǔn)確率都能達(dá)到60%以上,說明在缺失少量數(shù)據(jù)時(shí)各算法填補(bǔ)性能均較好。缺失率在3%~15%時(shí)SVR算法填補(bǔ)準(zhǔn)確率明顯優(yōu)于OCS-FCM算法,缺失率大于15%時(shí)SVR與OCS-FCM算法的填補(bǔ)準(zhǔn)確率相差不大。在所有缺失情況下,SVR-OCSFCM填補(bǔ)效果都明顯好于另兩種算法。

圖3 不同算法填補(bǔ)結(jié)果的準(zhǔn)確度

從以上均方根誤差與填補(bǔ)準(zhǔn)確率分析可知,SVR-OCSFCM填補(bǔ)效果優(yōu)于另兩種算法,為更加直觀展示該算法實(shí)際填補(bǔ)效果,構(gòu)造缺失率為10%,且包括多段連續(xù)缺失的數(shù)據(jù)集,應(yīng)用SVR-OCSFCM算法進(jìn)行填補(bǔ)。圖4為其中一段連續(xù)缺失27組數(shù)據(jù)的填補(bǔ)結(jié)果與真實(shí)值的對(duì)比結(jié)果,可看出填補(bǔ)值與真實(shí)值相關(guān)度較高,滿足數(shù)據(jù)填補(bǔ)要求。

圖4 SVR-OCSFCM算法填補(bǔ)結(jié)果與真實(shí)值對(duì)比

3 多屬性缺失值填補(bǔ)實(shí)驗(yàn)

由SVR-OCSFCM算法的原理分析可知,步驟(1)中OCS-FCM算法能夠在多屬性數(shù)據(jù)缺失的情況下對(duì)缺失值進(jìn)行估計(jì);步驟(2)中支持向量回歸算法依次以各缺失參數(shù)為目標(biāo)屬性進(jìn)行算法訓(xùn)練以及缺失值填補(bǔ),因此SVR-OCSFCM算法能夠應(yīng)用于多屬性缺失數(shù)據(jù)的同步填補(bǔ)。

原始數(shù)據(jù)集共有4個(gè)屬性參數(shù),多屬性缺失值填補(bǔ)實(shí)驗(yàn)中設(shè)定氧量、供電煤耗為兩屬性缺失,設(shè)定氧量、供電煤耗和凝汽器真空為三屬性缺失,以及四屬性缺失。按各缺失率構(gòu)造實(shí)驗(yàn)數(shù)據(jù),應(yīng)用SVR-OCSFCM算法進(jìn)行缺失值填補(bǔ)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖5所示。可以看出單屬性缺失情況下均方根誤差最小,隨缺失屬性的增加均方根誤差增大;但兩屬性缺失與三屬性缺失情況下均方根誤差增加不明顯,且低缺失率下與單屬性缺失相差不大;四屬性缺失情況下均方根誤差明顯大于其余三種情況;但在缺失率較低時(shí)(小于3%)四種缺失情況的均方根誤差都較低(0.05至0.15之間),且增大不明顯。

圖5 多屬性缺失值填補(bǔ)均方根誤差

如圖6所示,相同缺失率時(shí)填補(bǔ)準(zhǔn)確度隨缺失屬性的增加而降低。缺失率低時(shí)各屬性缺失填補(bǔ)準(zhǔn)確度較高:缺失率為1%,填補(bǔ)準(zhǔn)確度均高于58%;缺失率為3%,填補(bǔ)準(zhǔn)確度均高于47%。

圖6 多屬性缺失值填補(bǔ)準(zhǔn)確度

從算法機(jī)理上分析,缺失屬性的增多使得步驟(1)中OCS-FCM算法需要估計(jì)的屬性數(shù)據(jù)增加,輔助屬性減少,造成聚類結(jié)果準(zhǔn)確性降低,當(dāng)數(shù)據(jù)集中各屬性都存在缺失且缺失數(shù)據(jù)大時(shí),聚類結(jié)果更加偏離真實(shí)情況。缺失屬性的增加使得缺失值在數(shù)據(jù)集分布更廣泛,聚類結(jié)果中完整數(shù)據(jù)組減少,即支持向量回歸訓(xùn)練數(shù)據(jù)減少導(dǎo)致學(xué)習(xí)能力下降,對(duì)缺失數(shù)據(jù)估計(jì)準(zhǔn)確性降低。綜合來看,缺失屬性多且卻缺失率高時(shí)SVR-OCSFCM算法填補(bǔ)效果變差,但缺失屬性多缺失率較低時(shí)仍然可以較好的填補(bǔ)缺失值。

在實(shí)際應(yīng)用中多屬性缺失值填補(bǔ)方法具有很大的優(yōu)勢,面對(duì)龐大的含缺失數(shù)據(jù)的數(shù)據(jù)庫多屬性同步填補(bǔ)方法能夠節(jié)省用戶大量的人力、物力以及時(shí)間,能夠明顯提高數(shù)據(jù)預(yù)處理速度。

4 結(jié)論

本文闡述了數(shù)據(jù)缺失值相關(guān)的理論,包括缺失數(shù)據(jù)產(chǎn)生的原因及缺失數(shù)據(jù)處理的必要性,介紹了模糊聚類優(yōu)化補(bǔ)全策略,為提高缺失值填補(bǔ)效率,根據(jù)電站數(shù)據(jù)的缺失值分布特點(diǎn),提出了支持向量回歸與遺傳算法優(yōu)化的模糊聚類填補(bǔ)算法。模糊聚類算法用來區(qū)分缺失數(shù)據(jù)之間的差異并依據(jù)它們的特性對(duì)這些數(shù)據(jù)進(jìn)行分類,應(yīng)用OCS-FCM算法對(duì)缺失數(shù)據(jù)進(jìn)行估計(jì)并進(jìn)行模糊聚類,在每個(gè)類別中分別以未缺失數(shù)據(jù)為訓(xùn)練集對(duì)支持向量回歸算法進(jìn)行訓(xùn)練,訓(xùn)練后的支持向量回歸分別對(duì)各類中的缺失數(shù)據(jù)進(jìn)行估計(jì),最終得到最優(yōu)的缺失數(shù)據(jù)估計(jì)值。

對(duì)某600MW燃煤機(jī)組運(yùn)行數(shù)據(jù)用SVR、OCS-FCM與SVR-OCSFCM三種方法分別進(jìn)行單屬性與多屬性缺失值填補(bǔ)實(shí)驗(yàn),結(jié)果表明同屬性缺失時(shí),算法性能隨缺失率增加而降低,同缺失率時(shí)填補(bǔ)性能隨缺失屬性的增加而降低;相對(duì)于其他兩種算法,SVR-OCSFCM算法有更好的填補(bǔ)效果,驗(yàn)證了該算法的填補(bǔ)準(zhǔn)確性和有效性。

[1] 王禹朋,閻維平,祝云飛,等.支持向量機(jī)理論與遺傳算法相結(jié)合的300MW機(jī)組鍋爐多目標(biāo)燃燒優(yōu)化[J].熱力發(fā)電,2015,44(10):91-96.

[2] 余廷芳,李鵬輝.基于神經(jīng)網(wǎng)絡(luò)的NO_x燃煤鍋爐排放預(yù)測及優(yōu)化[J].熱力發(fā)電,2015,44(4):112-115.

[3] 郝勝宣,宋宏,周曉峰.一種基于雙聚類的缺失數(shù)據(jù)填補(bǔ)方法[J].計(jì)算機(jī)應(yīng)用研究,2015,32(3):674-678.

[4] 武森,馮小東,單志廣.基于不完備數(shù)據(jù)聚類的缺失數(shù)據(jù)填補(bǔ)方法[J].計(jì)算機(jī)學(xué)報(bào),2012,35(8):1726-1738.

[5] 韋鋼,王飛,張永健,等.負(fù)荷預(yù)測中歷史數(shù)據(jù)缺損處理[J].電力科學(xué)與工程,2004,20(1):16-19.

[6] 任志偉,黃景濤,羅威,等.電站鍋爐缺失數(shù)據(jù)的遺傳自適應(yīng)填補(bǔ)方法[J].蘭州理工大學(xué)學(xué)報(bào),2013,39(2):75-79.

[7] 于剛,徐治皋.電站故障診斷系統(tǒng)中信號(hào)缺失處理的粗糙集方法[J].華東電力,2004,32(6):1-4.

[8] 張清宇,嚴(yán)建華,倪明江,等.實(shí)時(shí)燃燒診斷系統(tǒng)中缺失數(shù)據(jù)的處理[J].動(dòng)力工程學(xué)報(bào),2004,24(2):222-226.

[9] HATHAWAY R J,BEZDEK J C.Fuzzy c-means clustering of incomplete data[J].IEEE Transactions on Systems Man & Cybernetics Part B Cyberneties.2001,31(5):735-744.

[10] BEZDEK J C.Pattern recognition with fuzzy objective function algorithms [M].Plenum Press,1981.

[11] NIU D,LIU D,WU D D.A soft computing system for day-ahead electricity price forecasting[J].Applied Soft Computing.2010,10(3):868-875.

[12] HAN J,KAMBER M,PEI J.Data mining:concepts and techniques[M].Elsevier,2011:23-26.

[13] 卜范玉,陳志奎,張清辰.基于聚類和自動(dòng)編碼機(jī)的缺失數(shù)據(jù)填充算法[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(18):13-17.

Research on the Strategy of Missing Data Impuataion in Power Plant

LI Jianqiang,ZHAO Kai,PAN Wenkai,CHEN Xingxu,LI Shibo

(School of Energy Power and Mechanical Engineering,North China Electric Power University,Baoding 071003,China)

An improved fuzzy clustering algorithm for the missing data imputation was presented for the problem of data missing in database of the power plant,which is the fuzzy clustering fill algorithm that optimized by the support vector regression and genetic algorithm (SVR-OCSFCM).The missing data imputation of a single attribute and multiple attributes for a 600 MW coal-fired unit was tested by using the support vector regression (SVR),optimal completion strategy of fuzzy clustering algorithm and SVR-OCSFCM.The results show that the performance of the algorithm of the same deleted attribute degrades with the increase of the deletion rate,and the performance of the algorithm at the same deletion rate degrades with the increase of the deleted attribute.SVR-OCSFCM constrains the estimation value by the support vector regression and fuzzy clustering algorithm,which makes the system safer and more efficient.The performance of SVR-OCSFCM is better than that of SVR and OCS-FCM,which has a good filling effect on the imputation of multiple attribute missing data.

missing data; data imputation; power station; fuzzy clustering algorithm

10.3969/j.ISSN.1672-0792.2017.01.008

2016-09-05。

中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)基金(916021007)。

TP274.2

1672-0792(2017)01-0043-06

李建強(qiáng)(1976-),男,副教授,博士,主要從事數(shù)據(jù)挖掘在電站優(yōu)化運(yùn)行方面的研究工作。

猜你喜歡
優(yōu)化
超限高層建筑結(jié)構(gòu)設(shè)計(jì)與優(yōu)化思考
PEMFC流道的多目標(biāo)優(yōu)化
能源工程(2022年1期)2022-03-29 01:06:28
民用建筑防煙排煙設(shè)計(jì)優(yōu)化探討
關(guān)于優(yōu)化消防安全告知承諾的一些思考
一道優(yōu)化題的幾何解法
由“形”啟“數(shù)”優(yōu)化運(yùn)算——以2021年解析幾何高考題為例
圍繞“地、業(yè)、人”優(yōu)化產(chǎn)業(yè)扶貧
事業(yè)單位中固定資產(chǎn)會(huì)計(jì)處理的優(yōu)化
4K HDR性能大幅度優(yōu)化 JVC DLA-X8 18 BC
幾種常見的負(fù)載均衡算法的優(yōu)化
電子制作(2017年20期)2017-04-26 06:57:45
主站蜘蛛池模板: 国产日韩精品一区在线不卡| 欧美日韩高清在线| 亚洲视频免费播放| 色综合久久88| 国产AV无码专区亚洲精品网站| 国产毛片基地| 国产91久久久久久| 国产成人欧美| 亚洲精品午夜天堂网页| 亚洲黄色高清| 国产精品永久免费嫩草研究院| 亚洲床戏一区| 草逼视频国产| 国产在线无码av完整版在线观看| 国产一在线观看| 成人免费午夜视频| 久无码久无码av无码| 丰满人妻一区二区三区视频| 嫩草国产在线| 国产va在线| 欧美国产日产一区二区| 国产成人一区二区| 国产精品亚洲va在线观看| 久久人人爽人人爽人人片aV东京热| 国产精品极品美女自在线网站| 免费观看无遮挡www的小视频| 国产尤物视频在线| 久久性视频| 国产精品分类视频分类一区| 日韩欧美中文在线| 久久久久久尹人网香蕉| 亚洲国产天堂久久综合| 日韩免费毛片视频| 国产鲁鲁视频在线观看| 五月婷婷综合网| 国产美女无遮挡免费视频| 中日韩欧亚无码视频| 成人国内精品久久久久影院| 国模在线视频一区二区三区| 欧洲一区二区三区无码| 福利片91| 国产成人综合日韩精品无码首页| 国产黄色片在线看| a在线亚洲男人的天堂试看| 毛片网站观看| 国产拍在线| 无码网站免费观看| 国产va在线观看免费| 3344在线观看无码| 亚洲精品在线观看91| 色国产视频| 国产乱人视频免费观看| 国产精品流白浆在线观看| 亚洲av无码成人专区| 91蝌蚪视频在线观看| 综合五月天网| 毛片视频网| 香蕉视频在线观看www| 九九香蕉视频| 美女高潮全身流白浆福利区| 亚洲日本中文综合在线| 91在线无码精品秘九色APP | 国产成人精品一区二区免费看京| 伊人网址在线| 免费va国产在线观看| 国产精品第| 日韩第九页| 亚洲美女一级毛片| 亚洲午夜天堂| 99er这里只有精品| 国产视频自拍一区| 看av免费毛片手机播放| 成人精品视频一区二区在线| 伊人色在线视频| 这里只有精品在线播放| 亚洲欧洲自拍拍偷午夜色| 久久a级片| 色偷偷一区二区三区| 夜夜操天天摸| 国产青榴视频| 国产亚洲精久久久久久久91| 91无码人妻精品一区|