杜勝東
(大唐西北電力試驗(yàn)研究院,陜西 西安 710018)
隨著科技進(jìn)步和產(chǎn)業(yè)發(fā)展,風(fēng)電、光伏成本逐漸降低。近年來,新能源發(fā)電裝機(jī)容量快速提升。根據(jù)國家能源局發(fā)布的2020年全國電力工業(yè)統(tǒng)計(jì)數(shù)據(jù),2020年全國新增裝機(jī)容量19 087萬千瓦。其中,太陽能發(fā)電4 820萬千瓦、風(fēng)電7 167萬千瓦、水電1 323萬千瓦,占新增裝機(jī)容量的69.7%。新能源消納壓力的增加進(jìn)一步要求火電機(jī)組提供調(diào)峰服務(wù),出讓發(fā)電空間[1]。因此,為了提高能源與資源的綜合利用率、方便污染集中處理,以超臨界、超超臨界機(jī)組為代表的大型汽輪機(jī)承擔(dān)著不可或缺的作用[2]。汽輪機(jī)閥門總關(guān)閉時(shí)間作為評(píng)價(jià)大小汽輪機(jī)組安全性的重要指標(biāo)之一,在機(jī)組調(diào)節(jié)系統(tǒng)的動(dòng)態(tài)性特征方面扮演著重要的角色[3]。
進(jìn)行閥門關(guān)閉時(shí)間試驗(yàn)時(shí),如果閥門關(guān)閉時(shí)間不合格,會(huì)受到多種因素的影響[4-5]。發(fā)電企業(yè)一般委托其他單位進(jìn)行測(cè)試。在出具測(cè)試報(bào)告的過程中,處理結(jié)果需要消耗大量的時(shí)間。面對(duì)可能造成閥門關(guān)閉時(shí)間不合格的多種原因,處理問題緩慢且棘手。為了保證機(jī)組啟動(dòng)計(jì)劃不受影響,需盡快評(píng)估閥門關(guān)閉時(shí)間不合格的原因并進(jìn)行處理。通過將某電科院的所有閥門關(guān)閉試驗(yàn)報(bào)告中閥門關(guān)閉時(shí)間不合格原因進(jìn)行整理后發(fā)現(xiàn),可以將分析過程歸結(jié)為對(duì)不合格原因的文本分類問題。
由于現(xiàn)場環(huán)境復(fù)雜,個(gè)人的評(píng)估具有局限性,判斷標(biāo)準(zhǔn)不太明確。大數(shù)據(jù)及貝葉斯分類器憑借其優(yōu)勢(shì),為閥門不合格原因評(píng)估提供了新的解決路徑。貝葉斯網(wǎng)絡(luò)在系統(tǒng)故障診斷[6]、疾病的判別與診斷、機(jī)器故障診斷[7-8]等方面的有效性已被證明。因此,本文基于貝葉斯網(wǎng)絡(luò)的一種模型——樸素貝葉斯模型,通過對(duì)歷史報(bào)告中的信息進(jìn)行語義分割,構(gòu)建一種汽輪機(jī)閥門關(guān)閉不合格原因評(píng)估模型,實(shí)現(xiàn)對(duì)不合格原因的快速判斷。
汽輪機(jī)跳閘保護(hù)系統(tǒng)(emergency trip system,ETS)跳閘回路如圖1所示。

圖1 汽輪機(jī)ETS跳閘回路示意圖
當(dāng)閥門關(guān)閉試驗(yàn)時(shí),運(yùn)行人員按下盤前打閘按鈕,電磁閥失電動(dòng)作,高壓安全油迅速泄除,卸荷閥打開,主汽門、調(diào)門在彈簧的作用下快速關(guān)閉。參照《汽輪機(jī)調(diào)節(jié)保安系統(tǒng)試驗(yàn)導(dǎo)則》(DL/T 711—2019)進(jìn)行測(cè)試。對(duì)于高中壓主汽門、調(diào)門以及抽汽逆止門,采用汽輪機(jī)數(shù)字電液(digital electro hydraulic,DEH)控制系統(tǒng)、分布式控制系統(tǒng)(distributed control system,DCS)機(jī)柜內(nèi)卡件上的位移反饋輸出電壓作為輸入量,并以運(yùn)行控制室緊急打閘按鈕動(dòng)作信號(hào)作為觸發(fā)信號(hào)。
測(cè)試原理如圖2所示。

圖2 測(cè)試原理示意圖
閥門總關(guān)閉時(shí)間包含控制回路延時(shí)、機(jī)械延時(shí)及閥門純關(guān)閉時(shí)間[9]。延遲時(shí)間為汽輪機(jī)閥門跳閘發(fā)出的時(shí)刻至閥門全開信號(hào)消失時(shí)刻。動(dòng)作時(shí)間為閥門全開信號(hào)消失至閥門全關(guān)信號(hào)出現(xiàn)的時(shí)刻。總關(guān)閉時(shí)間為動(dòng)作時(shí)間與延遲時(shí)間之和。按照規(guī)定,對(duì)于200~600 MW汽輪機(jī)組:從跳閘指令發(fā)出到主汽門全關(guān)的時(shí)間須小于300 ms;從跳閘指令發(fā)出到調(diào)節(jié)汽門全關(guān)的時(shí)間須小于400 ms;抽汽逆止門關(guān)閉時(shí)間(包括延遲)一般應(yīng)小于1 s。
樸素貝葉斯方法屬于古典數(shù)學(xué)理論的重要分支,是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)中的重要算法之一[10]。該算法具有分類效率穩(wěn)定、訓(xùn)練和查詢速度快、能處理多分類任務(wù)、算法簡單、數(shù)據(jù)不敏感、結(jié)果易理解等特征[11]。在實(shí)際應(yīng)用中,該算法引入“特征條件獨(dú)立性假設(shè)”,簡化了聯(lián)合類條件概率的計(jì)算[12]。其模型分類原理如下。
(1)數(shù)據(jù)樣本由n維特征向量X={x1,x2,…,xn}表示,描述了具有n個(gè)屬性A1,A2,…,An樣本的n維向量。
(2)已知有m個(gè)類C1,C2,…,Cm。基于樸素貝葉斯分類算法,對(duì)于一個(gè)特定的未知標(biāo)號(hào)的數(shù)據(jù)樣本,其會(huì)被該算法預(yù)測(cè)為給定X條件下后驗(yàn)概率最高的類別。該分類算法將X分配給類Ci的條件為:
P(Ci|X)>P(Cj|X),1≤j≤m,j≠i
(1)
式中:P為概率;X為特征向量;C為類向量;m為類的數(shù)量。
最大化P(Ci|X),與之對(duì)應(yīng)的類Ci即為最大后驗(yàn)假定。根據(jù)貝葉斯定理:
(2)

(4)當(dāng)數(shù)據(jù)集包含過多的屬性時(shí),則會(huì)提高計(jì)算P(X|Ci)的時(shí)間復(fù)雜度。此時(shí),假定不同屬性之間相互獨(dú)立,即屬性之間不存在依賴關(guān)系,可以有效地降低計(jì)算P(X|Ci)的時(shí)間復(fù)雜度。相應(yīng)地,P(X|Ci)可表示為:
(3)
概率P(X1|Ci),P(X2|Ci),…,P(Xn|Ci)可以由訓(xùn)練樣本計(jì)算得到。

②當(dāng)Ak為連續(xù)值屬性時(shí),假設(shè)Ak服從正態(tài)分布,可以得到:
(4)
式中:μCi為類Ci的均值;σCi為類Ci的標(biāo)準(zhǔn)差;g(Xk,μCi,σCi)為Ak的高斯密度函數(shù)。
(5)對(duì)未知樣本X分類,計(jì)算每個(gè)類的P(X|Ci)P(Ci)。樣本X被分到類Ci的條件如下:
P(X|Ci)P(Ci)>P(X|Ci)P(Cj)
(5)
式中:1≤j≤m,j≠i。
也就是說,X被劃分到P(X|Ci)P(Ci)值最大的類Ci。
為了保證電廠機(jī)組運(yùn)行的安全、穩(wěn)定,防止由于汽輪機(jī)超速而導(dǎo)致的重大安全生產(chǎn)事故,根據(jù)《并網(wǎng)運(yùn)行汽輪機(jī)調(diào)節(jié)系統(tǒng)技術(shù)監(jiān)督導(dǎo)則》(DL/T 338—2010)要求,有必要對(duì)汽輪發(fā)電機(jī)組閥門快關(guān)特性進(jìn)行定期測(cè)試。在進(jìn)行閥門關(guān)閉測(cè)試中,相關(guān)單位會(huì)產(chǎn)生大量的閥門關(guān)閉時(shí)間報(bào)告。本文從某電科院收集6年內(nèi)實(shí)際的閥門關(guān)閉報(bào)告,對(duì)報(bào)告中的閥門關(guān)閉不合格原因的描述及數(shù)據(jù)進(jìn)行整理并組成數(shù)據(jù)集。在整理了所有報(bào)告中177條不合格閥門關(guān)閉時(shí)間結(jié)果和對(duì)應(yīng)的原因后,通過分析將其分為8類:閥門卡澀、控制油油壓低、控制油油溫低、控制器掃描周期長、跨控制器網(wǎng)絡(luò)變量傳輸、線性可變差動(dòng)變壓器(linear variable differential transformer,LVDT)安裝位置過高或過低、LVDT反饋雜波和其他。根據(jù)數(shù)據(jù)樣本計(jì)算得到各類不合格原因的先驗(yàn)概率如表1所示。

表1 不合格的原因分類及其先驗(yàn)概率
通過使用自然語言的分詞處理工具對(duì)閥門關(guān)閉不合格現(xiàn)象的描述進(jìn)行碎片化處理,得到數(shù)據(jù)集的特征屬性。本文使用由北京大學(xué)語言計(jì)算與機(jī)器學(xué)習(xí)研究組研發(fā)的PkuSeg工具包進(jìn)行閥門關(guān)閉不合格現(xiàn)象的描述分詞處理。該工具包具有以下特點(diǎn)。
①高分詞準(zhǔn)確率。相比于通常使用的JieBa等分詞工具包,PkuSeg工具包在不同行業(yè)的分詞結(jié)果準(zhǔn)確度都有所提高。
②多領(lǐng)域分詞。技術(shù)人員訓(xùn)練了多種不同行業(yè)的分詞模型。用戶可以根據(jù)自己需要分詞的行業(yè)自由地選擇不同的模型。
③支持用戶自訓(xùn)練模型。在分詞訓(xùn)練中PkuSeg工具包支持用戶添加全新的標(biāo)注數(shù)據(jù)并進(jìn)行訓(xùn)練。
在閥門關(guān)閉不合格現(xiàn)象的描述中,每種不合格原因?qū)?yīng)的現(xiàn)象描述并不相同。研究發(fā)現(xiàn),某些描述對(duì)不合格原因的判定貢獻(xiàn)很大,而其他描述則沒有貢獻(xiàn)。使用PkuSeg工具選取特征詞匯分為以下2步。
①集中某類原因的描述,將其組成1個(gè)集合,盡可能包含對(duì)該不合格現(xiàn)象的描述。
②收集出現(xiàn)的特征詞匯,組成數(shù)據(jù)集(隨著特征詞數(shù)量的增加,分類的準(zhǔn)確性越容易提高;特征詞收集應(yīng)同時(shí)包含高頻詞匯和指向性強(qiáng)的低頻詞匯)。
建立特征屬性時(shí):首先,使用PkuSeg工具對(duì)分類后的數(shù)據(jù)進(jìn)行分詞;然后,對(duì)詞匯進(jìn)行篩選,主要包括剔除語氣詞、停用詞等;最后,分別找出每種不合格原因?qū)?yīng)的高頻詞匯和指向性詞匯,相應(yīng)地把各類不合格原因特征詞進(jìn)行匯總,從而得到總體特征序列。
特征詞匯詞頻統(tǒng)計(jì)如表2所示。

表2 特征詞匯詞頻統(tǒng)計(jì)
建立模型的過程為:首先,對(duì)不合格原因進(jìn)行分類,并建立特征序列;然后,根據(jù)樸素貝葉斯定理建立分類器。各類不合格原因的先驗(yàn)概率P(Ci)如表1所示。不同特征屬性的條件概率P(X|Ci)根據(jù)特征詞匯頻率計(jì)算而得。研究中使用Python程序?qū)崿F(xiàn)模型的各個(gè)部分。各類原因通過建立字典類型實(shí)現(xiàn)。字典類型包括特征序列及其數(shù)量結(jié)構(gòu),如{‘控制器掃描周期長’:‘DCS’:54,‘DEH’:42,‘卡件’:28,‘網(wǎng)絡(luò)’:0,‘硬接線’:0,‘測(cè)點(diǎn)’:0,‘儀器’:0,‘雜波’:0,‘LVDT’:0,‘油溫’:0,‘油壓’:0,‘閥門’:0}、{‘跨控制器網(wǎng)絡(luò)變量傳輸’:‘DCS’:41,‘DEH’:59,‘卡件’:31,‘網(wǎng)絡(luò)’:23,‘硬接線’:27,‘測(cè)點(diǎn)’:0,‘儀器’:0,‘雜波’:0,‘LVDT’:0,‘油溫’:0,‘油壓’:0,‘閥門’:0}等基于P(Ci)、P(X|Ci)和式(5)構(gòu)建分類器的模型,即基于樸素貝葉斯的汽輪機(jī)閥門關(guān)閉不合格原因評(píng)估模型。
閥門關(guān)閉不合格原因評(píng)估模型是1個(gè)文本分類過程,利用樸素貝葉斯算法進(jìn)行不合格原因的分類。模型工作流程為:首先,對(duì)不合格的現(xiàn)象描述進(jìn)行處理,提取待判斷不合格的特征序列;然后,用樸素貝葉斯分類器計(jì)算各類別的概率;最后,比較分類器已經(jīng)計(jì)算完成的概率。每個(gè)概率值對(duì)應(yīng)1種原因類別。概率中的最大值對(duì)應(yīng)的原因類別就是評(píng)估結(jié)果。
模型的準(zhǔn)確性驗(yàn)證分為模型訓(xùn)練數(shù)據(jù)集測(cè)試和新增不合格數(shù)據(jù)集測(cè)試。首先,對(duì)模型數(shù)據(jù)集進(jìn)行測(cè)試。測(cè)試結(jié)果顯示,控制器掃描周期長,跨控制器網(wǎng)絡(luò)變量傳輸2種不合格原因的準(zhǔn)確率極高,均高于90%;其余有4種高于80%,2種偏低,最低的1種不到75%。根據(jù)測(cè)試結(jié)果,對(duì)模型進(jìn)行調(diào)整:①基于出現(xiàn)概率偏低的不合格原因的現(xiàn)象描述,增加模型特征序列中的特征詞;②人為提高特征詞的出現(xiàn)頻率。
經(jīng)過增加特征詞匯改進(jìn)模型后,選取116項(xiàng)歷史和新增不合格原因及其描述進(jìn)行測(cè)試。測(cè)試結(jié)果統(tǒng)計(jì)如表3所示。從表3可以看出,測(cè)試的準(zhǔn)確率均得到了顯著提高,都達(dá)到了80%以上。

表3 測(cè)試結(jié)果統(tǒng)計(jì)
模型改進(jìn)前后結(jié)果對(duì)比如圖3所示。圖3中,橫軸為不合格原因的類型,分別為控制器掃描周期長(SMQZL)、跨控制器網(wǎng)絡(luò)變量傳輸(SMQBL)、閥門卡澀(FMKS)、控制油油壓低(KZYYL)、控制油油溫低(KZYWL)、LVDT安裝位置過高或過低(LVDTHOL)、LVDT反饋雜波(LVDTZB)以及其他(QT)。縱軸為各不合格原因的測(cè)試準(zhǔn)確率。

圖3 模型改進(jìn)前后結(jié)果對(duì)比
通過對(duì)比改進(jìn)前后的測(cè)試結(jié)果以及結(jié)合模型原理進(jìn)行分析,得到提高模型性能的主要方法為:在創(chuàng)建閥門關(guān)閉不合格原因評(píng)估模型之初,選擇數(shù)據(jù)集時(shí)需要滿足樣本容量大且全面的要求;在構(gòu)建特征序列組合時(shí),應(yīng)將盡可能多的詞匯包含在其中,使得特征序列能夠包含指向性高的特征詞。對(duì)于實(shí)際運(yùn)行中出現(xiàn)頻率較低的不合格原因,其對(duì)應(yīng)的特征序列可以人為指定,且可人為提高其特征詞出現(xiàn)的頻率,進(jìn)而提高樣本容量少的不合格原因分類的準(zhǔn)確性。
本文基于樸素貝葉斯的汽輪機(jī)閥門關(guān)閉不合格原因評(píng)估方法,對(duì)某電科院報(bào)告中的歷史不合格數(shù)據(jù)進(jìn)行挖掘,完成不合格原因的判斷。在對(duì)已建立模型的準(zhǔn)確性測(cè)試中,發(fā)現(xiàn)模型分類無法實(shí)現(xiàn)100%的準(zhǔn)確,準(zhǔn)確率有待進(jìn)一步提高,評(píng)估方法也有待改進(jìn)。在以后的工作中,除了可以結(jié)合決策樹、隨機(jī)森林、支持向量機(jī)等分類算法,也可以結(jié)合知識(shí)圖譜等智能算法,通過給現(xiàn)有模型增加自學(xué)習(xí)功能,不斷提高判斷的準(zhǔn)確性。研究人員還可以將此方法應(yīng)用于電廠就地設(shè)備和儀表故障的判斷,提高電廠檢修效率與管理水平。本文結(jié)合某電科院歷史試驗(yàn)數(shù)據(jù)及結(jié)論,給出了樸素貝葉斯分類器在閥門關(guān)閉不合格原因評(píng)估領(lǐng)域的實(shí)現(xiàn)流程和測(cè)試結(jié)果,為實(shí)際生產(chǎn)中汽輪機(jī)故障診斷應(yīng)用以及相關(guān)領(lǐng)域的學(xué)術(shù)研究提供了參考。