彭超龍,陳媛秀,楊秀平
(深圳市燃氣集團股份有限公司,廣東 深圳 518049)
20世紀50年代,世界上第一臺過程控制計算機TRW-300在美國德克薩斯州的一個煉油廠正式投入運行,標志著過程控制技術的正式應用。歷經起步期、試驗期、推廣期、發展期、成熟期五個階段的發展,到20世紀80年代,工業過程控制技術已變得很成熟,并廣泛應用于石油、核電、化工、水利、電力、冶金等行業。隨著自動化水平的不斷提高,可編程邏輯控制系統、分散控制系統、總線控制系統等被廣泛使用,增加報警點的設置變得十分容易且廉價,只需在組態軟件中簡單設置即可[1]。然而正是由于報警點設置的便捷性、任意性以及人們對報警的認識不足,從20世紀70年代末開始,美洲幾個國家便陸續發生了幾起特別重大的安全事故[2-5]。這些事故發生的原因均是操作人員無法及時從海量的報警信息中找出關鍵報警信息而導致。
基于以上慘重事故的教訓,人們開始對報警有了新的認識。報警并不是設置的越多越好,過多的報警反而更容易增加操作人員的工作負擔甚至超出操作人員的處理能力和應對能力,報警信息得不到及時有效處理,將給企業的安全穩定生產埋下嚴重隱患。因此,系統、科學、有效地設置報警點對保障生產過程安全、可靠運行至關重要[6-7]。
報警管理是一個持續改進的過程,需要不斷地對報警系統定期評估和優化[8]。國際自動化協會(ISA)發布的ANSI/ISA-18.2定義了工業過程報警系統的管理由“操作—監測評估—維護—操作”“操作—監測評估—變更管理—報警識別—合理化審查—詳細設計—實施—操作”和“報警識別—合理化審查—詳細設計—實施—操作—維護—監測評估—變更管理—報警識別”3個閉環回路構成。第1個回路描述了通過發現現行系統局部的小問題來對報警進行維護,第2個回路描述了在原有系統的基礎上運用新的技術方法進行二次改良的過程,第3個回路則是描述了新建報警系統管理的全生命周期過程[9]。報警管理全生命周期流程如圖1所示。

圖1 報警管理全生命周期流程示意
報警識別提出要基于工程經驗、設計要求、失效模式與后果分析(FEMA)、危險與可操作分析(HAZOP)報告、PID圖、SIL表、事故因果圖等歷史資料判斷哪里需要設置報警點;合理化審查則提出要對報警系統進行全面檢查和設置報警點分類、級別合理化評估,從而建立主報警庫。由此可見,對已投運的生產監控系統而言,進行報警點再評審十分重要,識別出重復設置的報警點和無意義的報警點,保留必須設置的報警點。
以某門站報警設置點為研究對象,為了全面、準確地識別出門站重復設置的報警點,前期必需要對門站的設計要求和生產過程有充分的認識。經梳理可作為門站報警點再評審的依據有:
1)國家和地方頒發的有關城市燃氣建設的法律、法規、條例和文件規定等。
2)GB 50028—2006《城鎮燃氣設計規范》[10]。
3)石油化工、燃氣火災防范,安全聯鎖控制系統等設計技術規范等。
4)報警設計導則、報警目標、報警設計策略、報警管理策略、報警點表等。
5)報警系統功能要求(ASRS)、管道與儀表流程圖(P&ID)、報警設置文檔等。
6)危險源識別報告、HAZOP報告、故障樹分析報告等。
報警點再評審是一個系統性的工作,既需要多部門協同工作,又需要專門的工具和方法。因此,本文在相關理論綜述研究的基礎上,采用頭腦風暴、因果報警識別與專家評審技術相結合的方法,對該門站SCADA中重復設置的報警點進行了識別和再評估[11-12]。具體流程如下: 在研究相關文獻綜述的基礎上,構建報警點評審分析模型;采用頭腦風暴的方法,針對報警點評審分析模型,分別從報警產生的原因、可能造成的后果、報警響應的動作和時間進行分析;根據報警分析的初步結果并結合審查該門站的工藝流程圖,采用時延網絡技術進一步識別重復設置的因果報警,得到擬取消重復設置報警點清單;邀請專家對擬取消的重復設置報警點進行評審,得到目標報警點。
報警設置點再評估流程如圖2所示。

圖2 報警設置點再評估流程示意
該門站屬于易燃、易爆場所,SCADA中設置的報警點涉及多個部門的管理需求。為了全面、準確地將門站所有重復設置和無意義的報警點都識別出來,特別邀請場站運行部、生產調度部、運行調度部、計量管理部、系統運行部、安全技術部專家7人組成報警點再評估分析團隊。再評審團隊成員基本資料見表1所列。
項目團隊成員站在自己專業的角度和出于安全生產管理的需要,對報警點設置再評估分析提出了不同的見解,具體如下:
1)運行調度部認為報警點設置再評審分析應充分利用歷史生產數據曲線以及考慮報警發生的頻次、報警時間的長短、報警產生的規律等。
2)場站運行部認為報警點再評審分析應從報警點設置的依據、報警點設置的合理性、生產安全的需要、消防法規以及過程安全儀表設計文件的硬性要求等角度分析。
3)生產調度部認為報警點再評審分析應從報警點設置的合理性、必要性、處理的時效性和閉環管理的可能性等角度分析。
4)計量管理部認為報警點再評審分析應考慮貿易計量結算、氣質合同要求、供銷差和上游管理的便捷等。
5)系統運行部認為報警點再評審分析要考慮報警設置的必要性、報警設置的合理性以及約束條件,無意義和重復設置的報警點不要出現在報警點列表中。
6)安全服務部認為報警點的分析應考慮安全需要和生產需要的相結合,避免關鍵節點、重要報警的遺漏和疏忽。
7)在開展項目評審前,考慮到系統運行部對報警系統較為熟悉,因此推薦系統運行部的儀器儀表高級工程師擔任報警點再評審分析團隊的組長,從而引導其他成員參與分析和評審的過程。經與會成員充分討論,并經過反復溝通,最終形成比較統一的意見。大家一致認為報警點再評審分析可以從報警產生的原因、可能造成的后果、報警響應的動作與時間三個方面分析,從而發現每個報警點設置的依據、設置的必要性和合理性。
報警點再評審分析模型如圖3所示。
如圖3所示,報警點評審分析模型由三部分組成。生產監控系統設置的報警點出現報警的原因主要有報警參數設置不當、生產過程波動震蕩大、生產操作頻繁以及設備、儀器儀表自身的異常報警等。報警響應動作與時間主要由兩部分組成,一部分是實際操作現場工藝設備的耗時,另一部分是處理報警所需的準備工作耗時,如電話請示、對講呼叫以及檢修、檢查儀器的配置等。報警可能產生的后果主要有: 燃氣站停輸、安全設施保護破壞、爆炸火災、管道破裂、氣體污染、貿易計量糾紛等。
經梳理該門站需要再評估的報警點數量有164個,為了便于分類討論評估報警過程,本文采用樹狀分類方法將待評審的報警點分為工藝類、設備類、自控邏輯類和系統通信類四大報警。工藝類是指在模擬量上設定報警上下限,該類報警主要有管道壓力、溫度、熱水及復熱前后燃氣溫度、流量、熱值以及加臭量、燃氣累積量等,其中限值類報警又分為低限值報警和高限值報警兩種。設備類報警是指由于現場設備自身狀態發生的異常改變而觸發的報警,比如: 緊急切斷閥的切斷報警,閥門的關閉啟動報警、UPS狀態異常報警、流量計算機故障報警等。自控邏輯類報警是指邏輯指令的啟動或觸發而產生的報警,比如: 閥門ESD啟動報警、密碼錯誤報警、觸發及失敗報警等。系統通信類報警主要是指通信數據中斷的報警,比如: 上位與下位站點的通信中斷報警、串口通信失敗報警、網絡傳輸異常報警等。
1.4.1報警產生的原因分析
從報警點再評審分析模型可以看出,報警點產生報警的主要原因有工藝操作、設備故障、生產過程波動和報警閾值設置不當等,對于不同類別的報警點報警產生的原因則會有一定差別。經與會專家討論,報警點產生報警的主要原因分析見表2所列。

表2 報警點產生報警的主要原因分析
1.4.2報警可能造成的后果分析
從報警點再評審分析模型可以看出,報警點可能造成的后果主要有燃氣停輸、貿易結算糾紛、爆炸與火災事故、生產系統癱瘓等。因報警的類型不同、報警產生的原因不同,不同區域設置的報警點可能造成的后果也不盡相同。報警點可能造成的后果分析見表3所列。

表3 報警點可能造成的后果分析
1.4.3報警響應動作與時間分析
生產監控系統報警一經產生,如果報警產生后操作人員無處置措施或者未有足夠的時間來處理報警,那么這樣的報警可認為是無意義的報警點,系統中則不應設置該報警。從報警點再評審分析模型可以看出,現場調度操作人員針對報警采取的報警響應動作包括主要操作和輔助操作。主操時間是實際進行具體操作需要的時間,如開啟閥門操作所需的時間;輔助操作時間則是判斷報警、確認報警等所需的時間。報警響應動作與操作時間見表4所列。

表4 報警響應動作與操作時間
本文以生產裝置的進站壓力高報警為例,識別報警的因果鏈,旨在進行合理的報警分組時,減少因果報警點的設置數量。在報警評估工作表的基礎上,針對門站與工藝相關的生產過程模擬量報警和開關量報警,依據先驗知識和評審團隊成員的意見,采用時延Petri網分析了目標報警點間的因果關系,并編制了門站進站壓力報警關聯產生規則表,見表5所列。

表5 門站進站壓力報警關聯產生規則
鑒于生產系統因果報警的識別和合理的報警分組,可以在短暫時間內甄別出關鍵報警事件從而避免大規模報警蔓延的惡劣狀況發生。為了更好地描述該門站各庫所之間的因果關聯關系,依據關聯規則繪制了報警事件時延Petri網絡模型,如圖4所示。

圖4 報警事件時延Petri網絡模型示意
圖4中時延Petri網絡模型中的符號含義見表6所列。

表6 時延Petri網絡模型中的符號含義
從圖4可以看出,報警鏈有H11—H6—H7—H1—H5,H11—H6—H7—H1—H2—H3—H4,H8—H6—H7—H1—H2—H3—H4,H8—H6—H9,H8—H6—H10,H8—H6—H7—H1—H5,H11—H6—H10和H11—H6—H9共8條,報警分組明細見表7所列。當以H1為報警源時,若該報警不處理,時延若干時間后將會產生H1—H2—H3—H4和H1—H5兩條因果報警鏈,從而觸發一系列的因果聯鎖報警。另外,從圖4可以看出,觸發H1高報警的有H6,H7,H8和H11壓力高報警源。由于H4,H5,H9,H10均位于時延網絡的末端,其報警可以通過前面的報警給予反映或發出預警提示,因此,站在生產工藝的角度上來說,該報警在壓力高報警中可視為重復設置的壓力報警點,系統中不宜設置該類報警點。生產裝置壓力高報警分組見表7所列。

表7 生產裝置壓力高報警分組
從報警點再評審分析的過程可以看出,若報警管理系統內設置了多個重復的報警點,則它們報警產生的原因、可能造成的后果以及報警響應動作與時間應該是一樣的。基于此,本文利用報警點評審分析的結果、因果報警的分組與識別以及結合對該門站工藝流程圖的審查,總結出該門站SCADA重復設置報警點的類型見表8所列。

表8 重復設置報警點的類型
基于上述重復設置報警點分類的方法,報警點再評審人員對該門站164個報警點進行了再評審分析和因果報警識別,共識別出同一位置設置多個重復報警點3個,互聯互通管道重復設置報警點11個,無意義報警點在系統的堆疊28個,因果聯鎖反應報警12個,合計54個。
通過對該天然氣門站164個報警點進行再評審分析,累計取消了54個重復設置報警點,識別新增了16個報警點,最終保留啟用了126個目標報警點,報警設置點總量較評估前減少了23.17%,為改善燃氣SCADA報警泛濫提供了目標報警點。但在報警點評審中還應注意: 為了確保擬取消的報警點是合理和安全的,建議由公司安全生產監督管理機構牽頭召集燃氣工程、機械電子工程、儀器儀表工程、化工安全工程和電氣工程等專業的專家對擬取消的報警點進行二次評審;為了保證取消的重復設置報警點是被認可和可追溯的,建議由生產部門在公司OA等數字化管理平臺提出了擬取消報警點申請,在完成相關職能部門逐級進行審批后,最終由SCADA維護工程師在報警管理系統中取消相關報警點的設置。