陳世軍,張 寬,陳麗輝,王秭春
(蘇州熱工研究院有限公司,江蘇 蘇州 215004)
核安全是核能可持續發展的生命線,也是核電發展的永恒主題。如何利用現有科學技術及時有效地進行實時評價以及管控運行核電站的風險,做到對核電站風險的全面“可知”“可控”,是核安全領域的重大關鍵技術問題。
基于實時風險監測的配置風險管理技術是解決該問題的有效方法。根據系統和部件的實際運行狀況量化評價核電站的實時風險,可實現對核電站實時風險的監測與管理,是風險指引型綜合決策的重要風險評價與管理方式。2005 年,大亞灣核電站聯合清華大學率先在國內對風險監測器(risk monitor,RM)系統進行初步的探索性應用研究,隨后多家單位相繼開展了核電站實時風險監測、評價的理論與方法研究。由于目前軟件功能及計算速度與電站需求存在差距及缺乏統一的配置風險管理技術體系等因素,導致我國核電站風險監測器的應用還有很大進步的空間。因此,通過研究支持多任務場景的最小割集(minimum cut set,MCS)高效算法和風險模型重構后最小割集算法數據庫的高效更新方式,突破基于最小割集的多任務場景風險高效計算技術,為高效計算引擎提供數據算法。
故障樹分析法(fault tree analysis,FTA)的數學基礎是集合論、布爾代數和概率論,從集合論的公理和定理出發推導出與FTA 相關的數學定理,采用布爾代數運算法則將故障樹的結構函數轉化為布爾表達式,以便對故障樹進行定性分析,同時基于概率論對故障樹進行定量分析。
故障樹定性分析最基本的兩個概念是割集和最小割集。割集是導致故障樹頂事件發生的若干底事件的集合,即割集中包含的底事件發生,則頂事件一定發生。最小割集是導致頂事件發生的數目不可再少的底事件集合。若割集中去掉任意一個底事件后,余下的底事件組成的集合不再成為割集,則此割集為最小割集。
故障樹的結構函數定義為Y=φ(X1,X2,…,Xn),表示故障樹頂事件狀態與各底事件狀態的映射關系,即當各底事件發生或者不發生時,頂事件是否發生。當已經得到全部最小割集后,故障樹的結構函數即可表示如下。
式中:M表示該故障樹的最小割集組合;r表示該故障樹有r個最小割集;n表示該故障樹包含n個基本事件。
故障樹定量分析的任務包括求解頂事件概率、不確定性分析、重要度和靈敏度分析等,其中最基礎的就是求解頂事件概率,精確求解公式如下。
式中:Q為頂事件概率,P為相應最小割集發生的概率,sk(k=1,2,…,r)為k個最小割集同時發生的概率和。
當割集的數量很多時,按精確解公式計算的計算量會非常大。通常在軟件算法中會采用最小割集上限法的近似公式來求解,其近似公式如下。
式中:Q為該故障樹發生的概率,P為最小割集發生的概率。
重解法采用布爾代數邏輯計算事件樹/故障樹得到最小割集庫,進而計算出相應的堆芯損傷頻率(core damage frequency,CDF)/早期大量釋放頻率(large early release frequency,LERF)和風險見解,其中CDF 為單位時間內堆芯損壞的預計次數,是反映核電廠系統嚴重事故安全性的重要指標;LERF 為單位時間內早期大量釋放的預計次數,為核電廠嚴重事故預防和緩解的重要指標。最小割集法基于零維修狀態下的割集庫,針對特定設備不可用對割集庫重新定量化(割集吸收與合并),得出相應的CDF/LERF 和風險見解。
FTA 重解法廣泛應用在小規模故障樹,但是隨著系統規模及復雜性的不斷提高,分析對象故障樹的規模不斷變大,運算量也呈指數級增長,故運算量面臨以下問題。
1) 概率安全評價(probabilistic safety assessment,PSA)模型規模及復雜度增大導致割集數量變多,進而導致單組態計算耗時長。
2) 計劃風險評價中多重組態計算耗時長。
3) PSA 模型重構后數據庫更新繁瑣、效率低。
4) 條件共因自動風險評估實現難。
因此,為了提升風險監測器計算速度,采用最小割集法對多重疊加組態進行風險計算。同時為了提高風險監測器計算準確度,增大最小割集數據庫體量,避免量級極低割集丟失。
通過對最小割集高效算法進行廣泛調研和深入研究,針對最小割集數據量大、計算性能要求高等特點,結合多項計算機技術,制定了針對性的實現方案。
1) 整個割集計算采用多線程消費者模式設計。
2) 割集數據獲取按事件樹劃分,多線程使用Kryo 反序列化得出割集數據。
3) 篩選受影響割集方式,判斷割集的基本事件是否包含運行設置/不可用設置/考慮共因后的基本事件。
4) 運行備用計算:如果割集的基本事件包含運行備用的基本事件,則該割集FCDF設為0,并累加FCDF。
5) 不可用計算:如果割集的基本事件設置為不可用,則該基本事件概率為1,并計算ΔFCDF割集=FCDF原/P不可用基本事件-FCDF原。
6) 優先計算運行備用,再計算不可用。
7) 不可用計算時,對涉及的幾個基本事件組合按窮舉方式得出哈希表。計算方式為:割集=(A,B,C,D)4 個基本事件割集之和;哈希表=A+(B,C,D)3 個基本事件的窮舉組合。
8) 內部吸收:計算后得出的受影響割集相互吸收(結合哈希表優化性能)。
9) 外部吸收:結合哈希表,用內部吸收后剩余的割集去吸收未受影響的割集,每棵樹取前2 500。
10) 重要度分析:優先恢復設備和加強防范設備。優先恢復設備是按當前設置的不可用設備,依次恢復計算結果,并得出恢復對風險的貢獻比;加強防范設備是計算每個設備的Fussel-Vesely 重要度,并按公式推導出設備退出對風險的貢獻比,計算公式如下。
式中:SRIF為設備退出對風險的貢獻比,m為對應基本事件個數,PFV為基本事件的發生概率對故障樹頂事件發生的重要度。
11) 事件樹序列分析。由于建立風險監測模型時已將割集與事件樹和序列掛鉤,計算完后,分析事件樹占比、序列等結果。
選擇某事故序列為例,針對不同的截斷值,分別使用最小割集算法與Risk Spectrum?PSA 進行對比分析,如表1 所示。使用文件比較工具分別對最小割集算法和Risk Spectrum?PSA 計算結果進行比較,兩者生成的最小割集及其排序完全一致;在計算性能方面,針對不同的截斷值,最小割集算法的計算速度是Risk Spectrum?PSA 的2 倍左右。

表1 事故序列定量分析結果與計算性能對比分析
在最小割集算法進行共因處理過程中,需要建立共因事件與基本事件對應關系。通過該對應關系,識別出共因事件,并進行共因計算,處理邏輯如下。
1) 對不可用設備進行查詢,得出對應的基本事件。
2) 通過共因事件與基本事件對應表,找出相關共因事件,并把共因事件和對應概率存入臨時的共因事件表,共因事件概率為P共因事件=(P原共因事件/P不可用事件+P原共因事件)。
3) 在計算隊列中,匯總記錄每個共因事件對應的基本事件ΔFCDF最小割集。
在整個隊列計算完后,遍歷匯總每個導致共因的基本事件概率,并取最大的結果加到最終的計算結果中。
在計算設備不可用后,受影響割集的基本事件將會減少,并存在與其他最小割集一致或相互包含的情況下。為保證最小割集的準確性,需要將基本事件一致或者相互包含的割集相互吸收。下面以兩條割集為例進行介紹。
1) 1.05×10-10A B C。
2) 1.05×10-10A B D。
當設置D 不可用時,即D 基本事件不可用,割集2 剩余的基本事件只有A 和B,被割集1 包含,故割集1 需要被吸收掉。
為提高算法吸收性能,引入哈希匹配算法,在完成割集2 不可用計算后,對剩余的基本事件組合進行窮舉,并存入哈希表。吸收時將割集的基本事件組合與哈希表匹配,如果能匹配到,則判斷被包含,并進行吸收處理。以下列處理方式存入哈希表。
以A、E、F、B 為例,處理窮舉時,先將基本事件A 拿出來,然后處理E、F、B 的窮舉組合,最后將A 和窮舉組合拼接存入哈希表;除了組合外,同時存入割集編碼和基本事件長度,判斷是否包含。
在最小割集算法中,為了提高計算結果的準確性,需要增大割集量,故RM 風險模型重構后,單個RM 模型割集數據量提升了幾十倍,從以往的10 萬割集量,提升到了500 萬甚至更多。隨著RM 風險模型的體量增大,導致以往的RM 模型維護方式無法滿足精度要求,需找到RM 模型更高效的維護和更新方式。
采用SQL Server 模型數據庫、Net Framework 4 開發RM 模型維護小工具來實現最小割集算法數據庫高效更新功能,包含以下3 個主要功能。
1) RM 模型導入。導入RM 模型,不導入基本事件和割集。
2) 序列割集導入。在RM 模型導入基礎上,單獨導入序列割集。
3) 割集補充。對某個設備補充割集,提升計算準確度。
除以上功能外,還有模型刪除、單個事件樹刪除等功能。
基于風險監測器應用情景及計算速度需求,對風險模型重構后的數據庫高效更新方式、最小割集高效算法以及支持多任務場景的最小割集高效算法進行了研究,并結合最新計算機技術,提升了風險監測器計算速度,可滿足多任務多場景風險高效計算技術要求,并為下一階段高效計算引擎開發提供數據算法。