齊 奔,梁金剛,張立國(guó),童節(jié)娟
(清華大學(xué) 核能與新能源技術(shù)研究院,北京 100084)
核應(yīng)急是核安全縱深防御的最后1道防線[1]。福島核事故后,業(yè)界更加關(guān)注核應(yīng)急決策技術(shù)研究,核應(yīng)急的首要環(huán)節(jié)是對(duì)核事故快速準(zhǔn)確診斷[2]。人工智能(AI)技術(shù),誕生于1956年,經(jīng)歷知識(shí)驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)兩大階段,目前正向第3代邁進(jìn)[3]。自20世紀(jì)80年代,AI技術(shù)在核電廠事故診斷方面開始應(yīng)用[4],其后的發(fā)展與AI技術(shù)發(fā)展緊密相連。基于專家系統(tǒng)的核電廠事故診斷方法[5],是基于知識(shí)驅(qū)動(dòng)的第1代AI技術(shù)在核電廠上的應(yīng)用案例,該方法由故障診斷知識(shí)庫(kù)、綜合知識(shí)庫(kù)、故障診斷推理機(jī)等組成,通過(guò)將監(jiān)視的物理征兆導(dǎo)入故障診斷推理機(jī),并由故障診斷推理機(jī)與診斷知識(shí)庫(kù)交互,求解出能解釋物理征兆的事故類型,從而完成診斷步驟。這種方法的缺點(diǎn)在于完全依賴領(lǐng)域?qū)<医?jīng)驗(yàn)知識(shí),缺乏足夠的數(shù)學(xué)基礎(chǔ)。第2代AI技術(shù)采用數(shù)據(jù)驅(qū)動(dòng)方式,如神經(jīng)網(wǎng)絡(luò)[6]、支持向量機(jī)[7]等方法,由于具備堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ),允許使用者僅提供原始的特征數(shù)據(jù),無(wú)需領(lǐng)域知識(shí)的幫助。基于神經(jīng)網(wǎng)絡(luò)的核電廠事故診斷方法[8],利用樣本訓(xùn)練神經(jīng)網(wǎng)絡(luò)得到能識(shí)別事故網(wǎng)絡(luò)模型,是目前基于第2代AI技術(shù)的核電廠智能化診斷方法研究中最為活躍的方向之一。但目前這種方法面臨兩方面的挑戰(zhàn),第一,它采用數(shù)據(jù)驅(qū)動(dòng)方式,對(duì)數(shù)據(jù)的數(shù)量和質(zhì)量均有著較高的要求:數(shù)據(jù)量不足,將不能夠訓(xùn)練出合適的網(wǎng)絡(luò)結(jié)構(gòu);數(shù)據(jù)質(zhì)量過(guò)差,使得網(wǎng)絡(luò)的推廣能力嚴(yán)重下降。對(duì)核電廠事故診斷來(lái)說(shuō),缺乏大量真實(shí)事故數(shù)據(jù),高度依賴仿真機(jī)對(duì)真實(shí)事故數(shù)據(jù)的仿真能力[9],僅能使用仿真機(jī)作為數(shù)據(jù)源來(lái)訓(xùn)練樣本,并且事故發(fā)生后很大概率面臨著數(shù)據(jù)的缺失問(wèn)題。第二,神經(jīng)網(wǎng)絡(luò)的運(yùn)作原理目前不能充分的解釋,即“黑盒”性質(zhì),對(duì)監(jiān)管極嚴(yán)的核電廠來(lái)說(shuō),這種不可解釋性將被認(rèn)為可能隱藏巨大風(fēng)險(xiǎn),是難以被接受的。第3代AI技術(shù)期望將第1代AI技術(shù)的知識(shí)驅(qū)動(dòng)和第2代AI技術(shù)的數(shù)據(jù)驅(qū)動(dòng)結(jié)合,克服各自的局限性[10],而將第3代AI技術(shù)應(yīng)用在核電廠事故診斷上的目標(biāo)便是增強(qiáng)前兩代智能化核電廠事故診斷的方法的魯棒性和可解釋性。
本文提出將貝葉斯分類器技術(shù)引入到核電廠事故診斷中,利用貝葉斯分類器方法本身提高診斷方法的魯棒性,并以圖論方法表達(dá)各物理征兆間的邏輯關(guān)系,提高診斷方法的可解釋性。
貝葉斯分類器是一種概率模型,主要利用貝葉斯公式解決分類問(wèn)題,而核電廠事故診斷本質(zhì)上也是一個(gè)分類問(wèn)題。貝葉斯公式[11]如下:
(1)
式中:c為樣本類別的集合{c1,c2,…,cN},對(duì)應(yīng)于核電廠事故的類型;x為樣本,該樣本包含m個(gè)屬性{x1,x2,…,xm},對(duì)應(yīng)于核電廠事故相關(guān)的物理參數(shù);p(c)為先驗(yàn)概率;p(x|c)為樣本x相對(duì)于類標(biāo)記c的類條件概率,或稱為“似然”,對(duì)應(yīng)于核電廠發(fā)生某種事故下相關(guān)物理參數(shù)表現(xiàn)某種狀態(tài)的概率;p(x)為用于歸一化的證據(jù)因子。求解上式時(shí),p(x)和p(c)可直接確定,關(guān)鍵是計(jì)算類條件概率p(x|c),它是所有屬性的聯(lián)合概率。在機(jī)器學(xué)習(xí)領(lǐng)域,根據(jù)求解該聯(lián)合概率方法的不同,貝葉斯分類器主要分為以下3種。
考慮到基于有限訓(xùn)練樣本直接估計(jì)聯(lián)合概率時(shí)在計(jì)算上將會(huì)遭遇組合爆炸問(wèn)題,在數(shù)據(jù)上將會(huì)遭遇樣本稀疏問(wèn)題,屬性越多,問(wèn)題越嚴(yán)重。樸素貝葉斯分類器采用屬性條件獨(dú)立性假設(shè):對(duì)已知類別,假設(shè)所有屬性相互獨(dú)立。換言之,假設(shè)每個(gè)屬性獨(dú)立地對(duì)分類結(jié)果產(chǎn)生影響[12],如圖1所示。
基于屬性條件獨(dú)立性假設(shè),貝葉斯公式可重寫為:
(2)
對(duì)于特定樣本,上式中分母均一致,因此分類的判別準(zhǔn)則為:
(3)
對(duì)于樸素貝葉斯分類器,又可分為離散型樸素貝葉斯和高斯型樸素貝葉斯,其中離散型是指樣本屬性呈離散狀態(tài),可通過(guò)統(tǒng)計(jì)計(jì)數(shù)的方式計(jì)算條件概率,而高斯型樸素貝葉斯直接處理連續(xù)性數(shù)值的樣本屬性,將條件概率分布認(rèn)為是高斯分布,如式(4)所示,求解該條件概率僅需確定在訓(xùn)練樣本中不同類別下該屬性的均值和方差即可。

圖1 樸素貝葉斯結(jié)構(gòu)示意圖Fig.1 Naive Bayes structure diagram
(4)

考慮到樸素貝葉斯分類器基于屬性條件獨(dú)立性假設(shè),在現(xiàn)實(shí)中通常很難成立,適當(dāng)考慮一部分屬性間的相互依賴信息,從而既不需完全進(jìn)行聯(lián)合概率計(jì)算,又不至于徹底忽略了較強(qiáng)的屬性依賴關(guān)系。獨(dú)依賴估計(jì)是半樸素貝葉斯分類器最常用的一種策略[13]。計(jì)算方法如下:
(5)
該方法假設(shè)每個(gè)屬性在類別之外最多依賴于1個(gè)其他屬性,既然屬性條件獨(dú)立性假設(shè)可獲得泛化性能的提升,能否考慮增加屬性的個(gè)數(shù)進(jìn)一步提升泛化性能呢?不能,屬性的增加導(dǎo)致訓(xùn)練所需的樣本數(shù)量將以指數(shù)級(jí)增加,若數(shù)據(jù)充足,泛化性能可提升,但樣本有限的情況下,求解高階聯(lián)合概率將成問(wèn)題。
為解決半樸素貝葉斯分類器,在有限的樣本下求解高階聯(lián)合概率難題,引入貝葉斯網(wǎng)絡(luò)[14]。基本的貝葉斯網(wǎng)絡(luò)如圖2所示,其中字母代表節(jié)點(diǎn),箭頭代表因果關(guān)系,例如A與B節(jié)點(diǎn)及兩者之間的箭頭,表示A為B的父節(jié)點(diǎn),B為A的子節(jié)點(diǎn)。對(duì)于整個(gè)貝葉斯網(wǎng)絡(luò),A為根節(jié)點(diǎn),D、E為頂節(jié)點(diǎn)。領(lǐng)域知識(shí)在貝葉斯網(wǎng)絡(luò)的體現(xiàn)主要是網(wǎng)絡(luò)中節(jié)點(diǎn)與節(jié)點(diǎn)之間的因果邏輯關(guān)系和條件概率的確定。該網(wǎng)絡(luò)借助有向無(wú)環(huán)圖來(lái)刻畫屬性間的依賴關(guān)系,并使用條件概率表來(lái)描述屬性間的聯(lián)合概率分布。貝葉斯網(wǎng)絡(luò)的優(yōu)點(diǎn)在于在有限的訓(xùn)練樣本條件下,可引入領(lǐng)域知識(shí)和專家認(rèn)知構(gòu)建網(wǎng)絡(luò),以避免機(jī)器學(xué)習(xí)方式求解高階聯(lián)合概率的障礙。

圖2 貝葉斯網(wǎng)絡(luò)Fig.2 Bayesian network
綜合上述分析,依據(jù)屬性間依賴的程度,將貝葉斯分類器看成1個(gè)“譜”:樸素貝葉斯分類器不考慮屬性間依賴性,貝葉斯網(wǎng)能表示任意屬性間的依賴性,二者分別位于“譜”的兩端;介于兩者之間的則是一系列半樸素貝葉斯分類器,它們基于各種假設(shè)和約束來(lái)對(duì)屬性間的部分依賴性進(jìn)行建模。
將貝葉斯分類器應(yīng)用于核電廠事故中通常需要3步:1) 事故診斷前的數(shù)據(jù)準(zhǔn)備;2) 確定貝葉斯公式的“先驗(yàn)”概率;3) 應(yīng)用不同的貝葉斯分類器,進(jìn)行診斷結(jié)果分析。
本文數(shù)據(jù)來(lái)源為基于M310堆型設(shè)計(jì)的仿真機(jī),按照該仿真機(jī)的特點(diǎn),選取的核電廠3類不同破口尺寸事故(LOCA(大破口失水事故),MSLB(主蒸汽管道破裂),SGTR(蒸汽發(fā)生器傳熱管破裂))案例共300個(gè)。根據(jù)仿真機(jī)測(cè)試流程說(shuō)明書針對(duì)核電廠不同事故下的物理征兆選擇提取1 min時(shí)長(zhǎng)的12個(gè)物理參數(shù),如表1所列。

表1 監(jiān)視參數(shù)Table 1 Monitored parameter
與經(jīng)典統(tǒng)計(jì)學(xué)中認(rèn)為可用公理化定義的具有非負(fù)性、正則性和可加性的概率不同,在貝葉斯學(xué)派中認(rèn)為先驗(yàn)概率是一種主觀概率,而主觀概率是人們根據(jù)經(jīng)驗(yàn)對(duì)事件發(fā)生機(jī)會(huì)的個(gè)人信念的強(qiáng)弱。確定該主觀概率的方法有以下3種:1) 對(duì)事件進(jìn)行對(duì)比確定相對(duì)似然性;2) 利用專家意見;3) 利用歷史資料[15]。針對(duì)核電廠不同事故類型的先驗(yàn)概率,本文采用以下兩種方法確定先驗(yàn)概率分布。
1) 事故發(fā)生可能性對(duì)比確定相對(duì)似然性
根據(jù)自身的領(lǐng)域認(rèn)知認(rèn)為不同事故的發(fā)生概率一致,因此先驗(yàn)概率是均勻分布的;
2) 利用歷史資料
根據(jù)紅沿河核電廠PRA報(bào)告中對(duì)不同事故的發(fā)生頻率來(lái)估計(jì)事故類型的先驗(yàn)概率分布(簡(jiǎn)稱PRA估計(jì)分布)。
由于半樸素貝葉斯分類器中屬性最多考慮受兩個(gè)屬性的影響,而貝葉斯網(wǎng)絡(luò)相比于該方法更適合表達(dá)事故下多個(gè)屬性的相互影響,因此本文主要驗(yàn)證樸素貝葉斯分類器(包括高斯型和離散型)和貝葉斯網(wǎng)絡(luò)兩種貝葉斯分類器的效果。貝葉斯分類器模型構(gòu)建思想為:將300個(gè)各類型事故構(gòu)成的數(shù)據(jù)集,劃分為訓(xùn)練集和測(cè)試集,利用訓(xùn)練集構(gòu)建貝葉斯分類器,用測(cè)試集檢測(cè)訓(xùn)練所得貝葉斯分類器的性能即診斷準(zhǔn)確率,后續(xù)小節(jié)中對(duì)各貝葉斯分類器的診斷驗(yàn)證便是基于該思想進(jìn)行的。而應(yīng)用于實(shí)際核事故中,其診斷思路是:在事故發(fā)生后,得到事故相關(guān)各物理參數(shù)監(jiān)視值,欲確定核事故類型,利用事先訓(xùn)練好的貝葉斯分類器進(jìn)行診斷,以達(dá)到快速核電廠事故診斷目的,診斷結(jié)果為核應(yīng)急后續(xù)環(huán)節(jié)如源項(xiàng)估計(jì)、后果評(píng)價(jià)和防護(hù)行動(dòng)建議等提供技術(shù)基礎(chǔ)。
1) 樸素貝葉斯分類器診斷方法
首先采用離散型貝葉斯分類器驗(yàn)證兩種先驗(yàn)分布(均勻分布和PRA估計(jì)分布)的影響。提取事故發(fā)生后第6 s的數(shù)據(jù)作為數(shù)據(jù)集。選取數(shù)據(jù)集的80%作為訓(xùn)練集,其余20%作為測(cè)試集,并采用蒙特卡羅交叉驗(yàn)證方法,診斷結(jié)果顯示均勻分布診斷準(zhǔn)確率為98.82%,PRA估計(jì)分布診斷準(zhǔn)確率為95.30%,可看出,不同的事故先驗(yàn)分布對(duì)診斷準(zhǔn)確率的影響較小,這也進(jìn)一步驗(yàn)證了貝葉斯定理用于診斷時(shí),粗糙的先驗(yàn)分布經(jīng)過(guò)似然函數(shù)的修正可顯著減小對(duì)后驗(yàn)分布(診斷結(jié)果)的影響。同時(shí)對(duì)于核電廠事故這種實(shí)際發(fā)生概率在百萬(wàn)分之一以下的事件,在進(jìn)行后續(xù)診斷時(shí),由于缺乏足夠充足樣本,將其分布認(rèn)為均勻的,是符合貝葉斯定理應(yīng)用情景的。確立先驗(yàn)分布后,將離散型和高斯型貝葉斯分類器用于事故診斷。
(1) 離散型樸素貝葉斯分類器診斷方法
本研究通過(guò)觀察6 s時(shí)各樣本物理征兆的差異顯著度劃分如表2所列的破口范圍。

表2 劃分范圍Table 2 Dividing range
離散型樸素貝葉斯分類器診斷思路是:事故發(fā)生后,得到了1 min內(nèi)12個(gè)物理參數(shù)監(jiān)視值,并不確定核事故類型,基于PyCharm平臺(tái),編寫Python程序,對(duì)事故發(fā)生后1 min內(nèi)的數(shù)據(jù)進(jìn)行事故類型的持續(xù)診斷,診斷準(zhǔn)確率隨時(shí)刻的變化如圖3所示。
經(jīng)計(jì)算事故診斷結(jié)果的準(zhǔn)確率均值在97%以上,證明基于樸素貝葉斯核電廠事故診斷方法的有效性。在事故發(fā)生的前幾秒,由于小破口事故物理參數(shù)特征與正常工況的差異性并不明顯,導(dǎo)致診斷精度較低,同時(shí)之所以在事故6 s附近診斷精度均為100%,這是因?yàn)樵趧澐制瓶诔叽绶秶鷷r(shí),主要基于6 s時(shí)的各物理參數(shù)之間的差異性進(jìn)行劃分,導(dǎo)致6 s附近的診斷結(jié)果較為準(zhǔn)確。
為進(jìn)一步驗(yàn)證大、中、小尺寸破口范圍對(duì)診斷結(jié)果的影響,依據(jù)不同時(shí)刻,觀察物理征兆差異顯著度,劃分如表3所列的破口范圍。在事故發(fā)生后的1 min內(nèi)持續(xù)診斷準(zhǔn)確率如圖4所示。

圖3 離散型樸素貝葉斯診斷準(zhǔn)確率Fig.3 Diagnostic accuracy of discrete na?ve Bayes

表3 不同破口歸類范圍Table 3 Classification range of different breaches

圖4 不同劃分方式診斷準(zhǔn)確率Fig.4 Diagnosis accuracy rate of different classification methods
根據(jù)診斷結(jié)果可看出,無(wú)論是何種劃分范圍,其準(zhǔn)確率均在91%以上。根據(jù)圖4在不同的劃分依據(jù)時(shí)刻附近(圖中圓圈標(biāo)記所示)準(zhǔn)確率均為100%,可得診斷準(zhǔn)確率一定程度上受大、中、小破口劃分依據(jù)時(shí)刻的影響,這是因?yàn)樵摃r(shí)刻附近樣本差異性分布與依據(jù)該時(shí)刻進(jìn)行劃分的大、中、小破口范圍一致性較高,從而導(dǎo)致該結(jié)果。根據(jù)上述分析,可看出樸素貝葉斯診斷方法有一定的錯(cuò)誤診斷率,受劃分范圍依據(jù)時(shí)刻的影響,診斷準(zhǔn)確率表現(xiàn)為一定的敏感性,其根本原因是物理參數(shù)轉(zhuǎn)化為離散狀態(tài)時(shí),部分樣本數(shù)據(jù)離散結(jié)果彼此之間差異性較弱。
(2) 高斯型樸素貝葉斯分類器診斷方法
根據(jù)離散型樸素貝葉斯分類器的驗(yàn)證結(jié)果,將采用均勻分布的先驗(yàn)概率和4類劃分均值范圍作為破口尺寸劃分依據(jù),進(jìn)行診斷,如圖5所示,診斷準(zhǔn)確率均值在99.4%以上,高于離散型樸素貝葉斯診斷準(zhǔn)確率均值。

圖5 高斯型診斷準(zhǔn)確率Fig.5 Gaussian diagnostic accuracy
2) 貝葉斯網(wǎng)絡(luò)診斷方法

圖6 3類事故貝葉斯網(wǎng)絡(luò)Fig.6 Bayesian network of three types of accidents
該診斷方法的第1步是進(jìn)行貝葉斯網(wǎng)絡(luò)的建模,根據(jù)PRA報(bào)告中針對(duì)3類事故物理征兆的描述,如對(duì)于一回路冷段大破口失水事故,該事故發(fā)生后將引起穩(wěn)壓器壓力、穩(wěn)壓器水位、上充流量、安全殼壓力、安全殼溫度、安全殼放射性以及地坑水位這些物理參數(shù)變化,同時(shí)結(jié)合仿真機(jī)已有的測(cè)點(diǎn)信息,建立如圖6所示的貝葉斯網(wǎng)絡(luò)模型。建好模型后,還需添加條件概率表,主要根據(jù)領(lǐng)域?qū)<抑R(shí)添加節(jié)點(diǎn)與節(jié)點(diǎn)間的條件概率。
該方法采用樸素貝葉斯診斷方法相同的數(shù)據(jù)來(lái)源與數(shù)據(jù)離散過(guò)程,構(gòu)建好貝葉斯網(wǎng)絡(luò)模型后,編寫Python程序,利用Pgmpy庫(kù)完成模型和測(cè)試集的讀入,并基于變量消去法進(jìn)行精確推理,其診斷結(jié)果如圖7所示,診斷準(zhǔn)確率均值為62.5%。

圖7 貝葉斯網(wǎng)絡(luò)診斷準(zhǔn)確率Fig.7 Bayesian network diagnosis accuracy
2.3節(jié)中先后采用了離散型樸素貝葉斯、高斯型樸素貝葉斯和貝葉斯網(wǎng)絡(luò)3種分類器針對(duì)核電廠事故發(fā)生后1 min內(nèi)的數(shù)據(jù)進(jìn)行診斷,診斷準(zhǔn)確率對(duì)比如圖8所示。

圖8 不同分類器診斷結(jié)果對(duì)比Fig.8 Comparison of diagnosis results of different Bayesian classifiers
綜合上述診斷結(jié)果,對(duì)比分析以下幾個(gè)方面。
1) 準(zhǔn)確率對(duì)比
根據(jù)診斷結(jié)果可看出貝葉斯網(wǎng)絡(luò)診斷結(jié)果準(zhǔn)確率顯著低于樸素貝葉斯分類器,主要有以下兩點(diǎn)原因。(1) 貝葉斯網(wǎng)絡(luò)雖考慮屬性間的相互影響,但整個(gè)建模過(guò)程中,引入了較大的人為不確定性,數(shù)據(jù)挖掘程度較淺,診斷結(jié)果誤差較大。(2) 樸素貝葉斯分類器采用屬性條件獨(dú)立性假設(shè),在現(xiàn)實(shí)中很難成立,但卻能獲得較好的診斷結(jié)果。一種解釋是對(duì)分類任務(wù)來(lái)說(shuō),僅需各類別的條件概率排序準(zhǔn)確、無(wú)需精準(zhǔn)概率即可導(dǎo)致正確分類結(jié)果。另一種解釋是,若屬性間依賴對(duì)所有類別影響相同,或依賴的影響能相互抵消,則屬性條件獨(dú)立性假設(shè)在降低計(jì)算消耗的同時(shí)不會(huì)對(duì)性能產(chǎn)生負(fù)面影響。
2) 診斷效率對(duì)比
樸素貝葉斯分類器診斷步驟簡(jiǎn)單,不需要貝葉斯網(wǎng)絡(luò)的建模過(guò)程,效率較高。尤其是高斯型樸素貝葉斯分類器不需要數(shù)據(jù)離散化處理,可直接對(duì)仿真機(jī)原始數(shù)據(jù)進(jìn)行診斷。
3) 破口尺寸診斷精度
在確定事故破口程度時(shí),人工建立的貝葉斯網(wǎng)絡(luò)主要取決于自身對(duì)核電廠事故物理現(xiàn)象的定性認(rèn)知,細(xì)化到破口的具體尺寸診斷時(shí),由于相同類型的事故物理征兆較為類似,對(duì)破口具體尺寸的建模較難。而樸素貝葉斯主要基于數(shù)據(jù)驅(qū)動(dòng),可進(jìn)一步診斷出事故的破口尺寸。
4) 事故可擴(kuò)展性
樸素貝葉斯分類器診斷時(shí),主要由程序完成診斷任務(wù),理論上可無(wú)限制添加可能的事故類型進(jìn)行診斷。而依賴于人自身建立的貝葉斯網(wǎng)路,在事故類型進(jìn)一步擴(kuò)展時(shí),會(huì)引起網(wǎng)絡(luò)節(jié)點(diǎn)組合爆炸問(wèn)題,條件概率表的制定和推理算法的選擇均將成問(wèn)題。
5) 程序自主化診斷
樸素貝葉斯分類器完全可由1套編好的處理程序自動(dòng)完成事故的診斷。而貝葉斯網(wǎng)絡(luò)需要專家參與,建立貝葉斯網(wǎng)絡(luò)等,將降低診斷時(shí)效。
核應(yīng)急是核安全縱深防御的最后1道防線,以期減少對(duì)公眾、環(huán)境的危害和降低經(jīng)濟(jì)損失。核應(yīng)急一般包括機(jī)組狀態(tài)診斷、源項(xiàng)估計(jì)、事故后果評(píng)價(jià)和防護(hù)行動(dòng)建議等技術(shù)環(huán)節(jié),而事故診斷是機(jī)組狀態(tài)診斷的核心內(nèi)容之一,領(lǐng)域?qū)<移诖趪?yán)重事故發(fā)生后的第一時(shí)間確定事故類型,將其作為后續(xù)核應(yīng)急技術(shù)環(huán)節(jié)的基礎(chǔ)。本文將貝葉斯分類器技術(shù)引入到核電廠事故診斷中,充分利用貝葉斯分類器相比于神經(jīng)網(wǎng)絡(luò)等智能化診斷技術(shù)具備的可解釋性和魯棒性優(yōu)點(diǎn),并進(jìn)一步對(duì)比分析3種不同的貝葉斯分類器的性能,結(jié)果表明:
1) 高斯型樸素貝葉斯分類器診斷準(zhǔn)確率最高,1 min內(nèi)診斷均值在99.4%以上;
2) 樸素貝葉斯分類器在診斷效率、破口診斷精度、事故可擴(kuò)展性、程序自主化診斷等方面有顯著優(yōu)勢(shì);
3) 貝葉斯網(wǎng)絡(luò)為不確定學(xué)習(xí)和推斷提供了基本框架,具備更高的可解釋性和魯棒性,未來(lái)可將機(jī)器學(xué)習(xí)引入到貝葉斯網(wǎng)路的構(gòu)造中,進(jìn)一步提高其性能。
作為一種智能化核事故診斷方法,樸素貝葉斯分類器方法(離散型和高斯型)主要基于數(shù)據(jù)進(jìn)行構(gòu)建,這使得該方法高度依賴仿真機(jī)對(duì)真實(shí)事故數(shù)據(jù)的仿真能力。因此,仿真機(jī)性能會(huì)影響樸素貝葉斯分類器實(shí)際應(yīng)用診斷精度。而與高斯型相比,離散型樸素貝葉斯在原始事故數(shù)據(jù)基礎(chǔ)上加入了領(lǐng)域認(rèn)知,即將原本連續(xù)的事故數(shù)據(jù)離散成偏低、正常和偏高等狀態(tài)信息,降低了對(duì)仿真機(jī)模擬數(shù)據(jù)的仿真度要求,且最終診斷準(zhǔn)確率與高斯型相比變化較小。而貝葉斯網(wǎng)絡(luò)作為一種擺脫仿真機(jī)數(shù)據(jù)依賴的嘗試,在網(wǎng)絡(luò)的構(gòu)建階段完全依賴領(lǐng)域知識(shí),但最終的診斷性能相對(duì)于樸素貝葉斯分類器較差,這是由于貝葉斯網(wǎng)絡(luò)構(gòu)建過(guò)程中,節(jié)點(diǎn)間連接關(guān)系和條件概率具體數(shù)值的構(gòu)建具有較大的不確定性,對(duì)網(wǎng)絡(luò)構(gòu)建者的領(lǐng)域知識(shí)要求較高,該方法可隨領(lǐng)域?qū)<抑R(shí)的加強(qiáng),進(jìn)一步提高其性能,對(duì)于實(shí)際應(yīng)用更具意義。除上述兩種貝葉斯分類器外,對(duì)于假設(shè)屬性符合多維正態(tài)分布的貝葉斯分類器[16],在核事故診斷方面的性能有待驗(yàn)證。未來(lái),將該方法與神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法做性能對(duì)比。
感謝紅沿河核電廠在事故仿真數(shù)據(jù)方面的支持。