999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)技術(shù)在油氣行業(yè)事故事件致因分析中的應(yīng)用

2021-12-04 02:44:36閻紅巧樊志強(qiáng)郝壯遠(yuǎn)
安全與環(huán)境工程 2021年6期
關(guān)鍵詞:語(yǔ)義文本因素

閻紅巧,樊志強(qiáng),郝壯遠(yuǎn)

(中國(guó)石油集團(tuán)安全環(huán)保技術(shù)研究院有限公司HSE信息中心,北京 102206)

油氣行業(yè)具有易燃易爆炸、有毒有害、高溫高壓等生產(chǎn)特點(diǎn),一旦發(fā)生事故,不僅會(huì)造成重大的經(jīng)濟(jì)損失,而且會(huì)帶來(lái)嚴(yán)重的社會(huì)影響,因此防范安全事故的發(fā)生是石油及天然氣企業(yè)安全管理的重要目標(biāo)和方向。然而,近年來(lái)油氣生產(chǎn)企業(yè)同類型安全事故重復(fù)發(fā)生,其重要原因是企業(yè)對(duì)歷史事故事件發(fā)生的原因認(rèn)識(shí)不足。隨著信息化技術(shù)的發(fā)展,企業(yè)積累了大量的事故事件報(bào)告數(shù)據(jù),但文本挖掘技術(shù)的不足限制了事故事件資源利用的程度。

目前,我國(guó)對(duì)事故事件資源的利用水平仍然處于落后階段,主要表現(xiàn)在以下兩個(gè)方面:一是在某起重特大事故發(fā)生后對(duì)事故原因進(jìn)行深刻剖析,以預(yù)防同類型事故再次發(fā)生;二是采用人工方式批量分析事故數(shù)據(jù),統(tǒng)計(jì)各類事故發(fā)生的規(guī)律,為事故預(yù)防提供依據(jù)。上述兩者都是針對(duì)油氣生產(chǎn)企業(yè)事故發(fā)生原因和發(fā)生規(guī)律展開的分析與研究,但均存在一定的局限性:前者主要是針對(duì)某一起事故開展事故原因的分析,其數(shù)據(jù)量小,因而難以發(fā)現(xiàn)事故發(fā)生的共性原因;后者利用人工方式對(duì)事故原因開展分析,雖然其分析結(jié)果有一定的價(jià)值,但效率低。相比之下,挖掘方法將事故調(diào)查報(bào)告作為數(shù)據(jù)源,可從事故調(diào)查報(bào)告中獲取事故發(fā)生時(shí)的特征信息,有利于解釋事故發(fā)生的規(guī)律。基于文本挖掘方法的思路,許多學(xué)者利用文本挖掘方法對(duì)事故原因進(jìn)行了分析,如薛楠楠等通過(guò)對(duì)334份建筑施工安全事故報(bào)告進(jìn)行分析,識(shí)別出8項(xiàng)建筑工人不安全行為和27項(xiàng)影響因素;李解等首次運(yùn)用 R語(yǔ)言和文本挖掘方法,從151份地鐵施工事故報(bào)告中提取了6項(xiàng)關(guān)鍵因素和23項(xiàng)一般因素。但這些研究大多只是關(guān)注施工安全事故的原因,對(duì)油氣行業(yè)事故影響因素的研究相對(duì)較少。為此,本文以油氣生產(chǎn)企業(yè)事故事件數(shù)據(jù)為基礎(chǔ),通過(guò)建立領(lǐng)域?qū)I(yè)詞庫(kù)和停用詞庫(kù)對(duì)事故事件數(shù)據(jù)進(jìn)行分詞,建立了詞向量并基于FastText算法形成了與油氣生產(chǎn)企業(yè)事故事件信息相匹配的HSE文本語(yǔ)義分析模型,并利用其自動(dòng)提取大量事故調(diào)查報(bào)告中失效屏障類型、屏障失效原因,進(jìn)而揭示導(dǎo)致事故屏障失效的管理因素,為尋找油氣生產(chǎn)企業(yè)安全管理缺陷與事故預(yù)控提供依據(jù)。

1 數(shù)據(jù)來(lái)源

本研究收集了某油氣生產(chǎn)企業(yè)2000—2018年事故數(shù)據(jù),數(shù)據(jù)類型為非結(jié)構(gòu)化文本數(shù)據(jù),包括事故經(jīng)過(guò)描述、事故原因描述等,并考察數(shù)據(jù)的完整性和可用性。原始事故數(shù)據(jù)示例如表1所示。

表1 原始事故數(shù)據(jù)示例Table 1 Example of raw accident data

2 研究方法

基于自然語(yǔ)言處理技術(shù),利用事故數(shù)據(jù)建立訓(xùn)練樣本,構(gòu)建了HSE文本語(yǔ)義分析模型,并利用該模型從1萬(wàn)余條事故數(shù)據(jù)中自動(dòng)提取失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,進(jìn)而進(jìn)行了統(tǒng)計(jì)分析,其流程主要包括數(shù)據(jù)預(yù)處理、建立機(jī)器學(xué)習(xí)樣本、建立HSE文本語(yǔ)義分析模型、模型應(yīng)用、結(jié)果可視化分析和建議與措施6個(gè)環(huán)節(jié),見圖1。

圖1 事故事件歸因分析流程Fig.1 Cause analysis process of accidents and incidents

2.1 數(shù)據(jù)預(yù)處理

本文數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)集成和數(shù)據(jù)缺失標(biāo)記三項(xiàng)任務(wù)。本文主要分析事故事件發(fā)生的原因,由于原始事故文本數(shù)據(jù)中一些不相關(guān)的信息并不會(huì)為分析模型的構(gòu)建提供重要信息,反而會(huì)在模型訓(xùn)練期間制造噪音,因此需要通過(guò)數(shù)據(jù)清洗將其從訓(xùn)練集中去除;此外,原始事故文本數(shù)據(jù)中還存在缺少“事故經(jīng)過(guò)描述”或者“事故原因描述”字段的事故,因此需要通過(guò)數(shù)據(jù)集成以完善事故事件報(bào)告信息;最后,針對(duì)數(shù)據(jù)集成之后依然缺失信息的事故事件數(shù)據(jù),則標(biāo)記為數(shù)據(jù)來(lái)源不明,后續(xù)不參與建模。

2.2 建立機(jī)器學(xué)習(xí)樣本

本文在屏障理論的基礎(chǔ)上建立了機(jī)器學(xué)習(xí)樣本。屏障是指在事故早期階段可以阻止危害因素進(jìn)一步向事故演變的措施,它可以限制危害因素產(chǎn)生的傷害和后果。每一個(gè)屏障,如果其完好,都應(yīng)該能夠完全阻止事件的進(jìn)一步發(fā)展。

2.2.1 數(shù)據(jù)標(biāo)注

在屏障理論的基礎(chǔ)上,通過(guò)注解、打標(biāo)簽的方式建立機(jī)器學(xué)習(xí)訓(xùn)練樣本。建立訓(xùn)練樣本是本文的關(guān)鍵,這項(xiàng)任務(wù)需要具備石油領(lǐng)域?qū)I(yè)知識(shí)和安全專業(yè)素養(yǎng)的人員完成,需逐一識(shí)別出事故中失效的屏障類型,并依次分析屏障失效原因和導(dǎo)致屏障失效的管理因素。值得說(shuō)明的是,失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素具有對(duì)應(yīng)關(guān)系。針對(duì)每一份事故調(diào)查報(bào)告,標(biāo)記其失效的屏障類型、每類屏障的失效原因和導(dǎo)致屏障失效的管理因素,形成機(jī)器學(xué)習(xí)訓(xùn)練樣本。訓(xùn)練樣本建立的流程見圖2,訓(xùn)練樣本示例見表2。

圖2 機(jī)器學(xué)習(xí)樣本建立流程Fig.2 Process of constructing training samples for machine learning

表2 機(jī)器學(xué)習(xí)訓(xùn)練樣本示例Table 2 Examples of training samples for machine learning

2.2.2 事故事件歸因

形成事故事件歸因分類列表是建立機(jī)器學(xué)習(xí)樣本的基礎(chǔ)。基于建立機(jī)器學(xué)習(xí)樣本的需要,事故事件歸因列表包括三部分,分別為屏障類型列表、屏障失效原因列表和導(dǎo)致屏障失效的管理因素列表。

(1) 屏障類型列表。本文參照國(guó)際油氣協(xié)會(huì)(International Association of Oil & Gas Producers,簡(jiǎn)稱IOGP)的做法,將屏障劃分為技術(shù)屏障和人員屏障。其中,從安全功能角度將技術(shù)屏障分為8類,見表3;基于人員在人機(jī)系統(tǒng)中的典型活動(dòng)將人員屏障分為5類,見表4。

表3 技術(shù)屏障類型Table 3 Technical barrier types

表4 人員屏障類型Table 4 Human barrier types

(2) 屏障失效原因列表。本文將屏障失效原因列表分為技術(shù)屏障失效原因列表和人員屏障失效原因列表。其中,技術(shù)屏障失效的原因分為7類,見表5;人員屏障失效的原因分為7類,見表6。

表5 技術(shù)屏障失效的原因Table 5 Reasons for technical barrier failure

表6 人員屏障失效的原因Table 6 Reasons for human barrier failure

(3) 導(dǎo)致屏障失效的管理因素列表。基于國(guó)際HSE管理體系和油氣行業(yè)特點(diǎn),將導(dǎo)致屏障失效的管理因素分為13類,見表7。

表7 導(dǎo)致屏障失效的管理因素Table 7 Management factors leading to barrier failure

2.3 建立HSE文本語(yǔ)義分析模型

HSE文本語(yǔ)義分析模型的構(gòu)建過(guò)程即為訓(xùn)練HSE文本分類器的過(guò)程。本文采用監(jiān)督式的FastText模型訓(xùn)練HSE文本分類器。FastText模型架構(gòu)如圖3所示,其包含輸入層、隱含層和輸出層。其中,隱含層是模型固有結(jié)構(gòu),在此不做具體說(shuō)明;輸出層為分類器;輸入層是文本向量,其處理方式?jīng)Q定了HSE文本語(yǔ)義分類模型的分類效果。

圖3 FastText模型架構(gòu)圖Fig.3 Architecture diagram of FastText Model

FastText模型架構(gòu)圖中

x

表示文本中第

i

個(gè)詞的特征向量,文本向量為詞向量的平均值,因此分詞效果對(duì)于文本向量的正確表達(dá)至關(guān)重要。本文通過(guò)爬蟲技術(shù)、行業(yè)標(biāo)準(zhǔn)和新詞發(fā)現(xiàn)等功能建立了包含19 999個(gè)領(lǐng)域的專業(yè)詞庫(kù),并將基于領(lǐng)域?qū)I(yè)詞庫(kù)形成的文本向量作為模型輸入層。在訓(xùn)練分類模型之前將數(shù)據(jù)分割為訓(xùn)練集和驗(yàn)證集,其比例分別為70%和30%,驗(yàn)證集用來(lái)評(píng)估分類器的性能。構(gòu)建HSE文本語(yǔ)義分析模型的步驟,見圖4。

圖4 HSE文本語(yǔ)義分析模型的構(gòu)建步驟Fig.4 Construction steps of HSE text semantic analysis model

值得說(shuō)明的是,由于本文訓(xùn)練數(shù)量有限,因此在建立機(jī)器學(xué)習(xí)樣本時(shí)采用的是關(guān)鍵詞標(biāo)注方式,這樣機(jī)器可以高效、精準(zhǔn)地學(xué)習(xí)事故事件歸因知識(shí),從而大大提高模型構(gòu)建的效率。通過(guò)兩次模型調(diào)優(yōu)和迭代,本文最終訓(xùn)練得到的分類器模型的準(zhǔn)確率為85%、召回率為82%,模型基本可以滿足事故事件歸因信息的提取需求。

2.4 結(jié)果可視化分析

本文利用構(gòu)建的HSE文本語(yǔ)義分析模型自動(dòng)提取海量事故事件報(bào)告中失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,并通過(guò)統(tǒng)計(jì)其分布規(guī)律,將結(jié)果以圖像的形式直觀地展示出來(lái),達(dá)到所見即所得的效果。

2.5 建議與措施

基于事故事件歸因分析結(jié)果,結(jié)合企業(yè)風(fēng)險(xiǎn)特點(diǎn)及其事故事件相關(guān)管理辦法,從防范事故事件發(fā)生的角度,提出了相應(yīng)的防控建議與措施。

3 實(shí)例應(yīng)用與分析

本文首先采用某油氣生產(chǎn)企業(yè)300個(gè)事故報(bào)告數(shù)據(jù)作為訓(xùn)練樣本,構(gòu)建了事故事件歸因分類器,并利用此分類器從1萬(wàn)余條事故事件數(shù)據(jù)中自動(dòng)提取失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,最后通過(guò)可視化的方式展示失效屏障類型的分布規(guī)律,并將其與屏障失效原因和導(dǎo)致屏障失效的管理因素進(jìn)行關(guān)聯(lián),尋找HSE管理的缺陷和短板,為持續(xù)改進(jìn)HSE管理提供建議。

3.1 失效屏障類型分析

幾乎每起事故事件都是技術(shù)屏障和人員屏障失效疊加所導(dǎo)致的,圖5和圖6分別展示了不同技術(shù)屏障類型和人員屏障類型對(duì)事故事件影響的比例。

由圖5和圖6可知:技術(shù)屏障類型中結(jié)構(gòu)完整性屏障失效導(dǎo)致的事故事件數(shù)量最多,其導(dǎo)致了22%的事故事件;人員屏障類型中人員操作屏障失效導(dǎo)致的事故事件數(shù)量最多,其導(dǎo)致了59%的事故事件。

圖5 不同技術(shù)屏障類型失效對(duì)事故事件的影響比例Fig.5 Influence ratio of different types of technical barrier failure on accidents and incidents

圖6 不同人員屏障類型失效對(duì)事故事件的影響比例Fig.6 Influence ratio of different types of human barriers failure on accidents and incidents

3.2 屏障失效原因分析

本文利用熱力圖展示了事故中13類失效屏障類型與屏障失效原因之間的關(guān)聯(lián)關(guān)系,見圖7。其中,橫軸為失效屏障類型,縱軸為屏障失效原因;顏色的深淺代表了占比大小,顏色越深表明兩者之間的關(guān)聯(lián)關(guān)系越密切。

由圖7可知:裝置/設(shè)備設(shè)計(jì)缺陷和裝置/設(shè)備運(yùn)行控制缺陷分別造成了40%和19%的結(jié)構(gòu)完整性屏障失效,它們是結(jié)構(gòu)完整性屏障失效的關(guān)鍵原因;安全意識(shí)缺乏/疏忽/失誤和安全知識(shí)/技能不足分別造成了60%和13%的人員操作屏障失效,它們是人員操作屏障失效的關(guān)鍵原因。

圖7 事故中失效屏障類型與屏障失效原因之間的關(guān)聯(lián)關(guān)系Fig.7 Correlation relationship between failure barrier types and barrier failure causes of accidents and incidents

3.3 導(dǎo)致屏障失效的管理因素分析

事故中失效屏障類型與導(dǎo)致屏障失效的管理因素之間的關(guān)聯(lián)關(guān)系,見圖8。

圖8 事故中失效屏障類型與導(dǎo)致屏障失效的管理因素之間的關(guān)聯(lián)關(guān)系Fig.8 Correlation relationship between failure barrier types of accidents and incidents and management factors causing barrier failure

由圖8可知:設(shè)備管理因素和風(fēng)險(xiǎn)防控與隱患排查治理因素分別造成了27%和11%的結(jié)構(gòu)完整性屏障失效,它們是結(jié)構(gòu)完整性屏障失效的關(guān)鍵管理因素;風(fēng)險(xiǎn)防控與隱患排查治理因素和教育培訓(xùn)因素分別造成了31%和14%的人員操作屏障失效,它們是人員操作屏障失效的關(guān)鍵因素。

4 結(jié)論與建議

本文采用國(guó)際石油及天然氣行業(yè)主流的事故致因理論——屏障理論分析了事故事件調(diào)查報(bào)告數(shù)據(jù),建立了適用于石油石化行業(yè)的HSE文本語(yǔ)義分析模型,并從1萬(wàn)余條事故事件數(shù)據(jù)中自動(dòng)提取與分析了事故事件中失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,得到如下結(jié)論與建議:

(1) 59%的事故事件與人員操作屏障失效有關(guān),22%的事故事件與結(jié)構(gòu)完整性屏障失效相關(guān);安全意識(shí)缺乏/疏忽/失誤和安全知識(shí)/技能不足是導(dǎo)致人員操作屏障失效的關(guān)鍵原因,裝置/設(shè)備設(shè)計(jì)缺陷和裝置/設(shè)備運(yùn)行控制缺陷是導(dǎo)致結(jié)構(gòu)完整性屏障失效的關(guān)鍵原因。

(2) 員工教育培訓(xùn)不到位和風(fēng)險(xiǎn)管控與隱患排查管理不到位分別是導(dǎo)致人員操作屏障失效和結(jié)構(gòu)完整性屏障失效的共性管理因素,建議從事故預(yù)防的角度,采用虛擬現(xiàn)實(shí)技術(shù)、借助模擬操作機(jī)來(lái)切實(shí)提高員工的安全技能水平,并設(shè)計(jì)科學(xué)的員工培訓(xùn)效果考核指標(biāo),減少員工違章、誤操作不安全行為,同時(shí)提高員工的風(fēng)險(xiǎn)辨識(shí)能力,加強(qiáng)風(fēng)險(xiǎn)隱患排查治理工作,切實(shí)減少事故的發(fā)生。

(3) 采用本文構(gòu)建的HSE文本語(yǔ)義分析模型,只需1 min即可實(shí)現(xiàn)對(duì)1萬(wàn)余條事故事件報(bào)告信息的提取,而人工提取每份事故事件報(bào)告信息至少需要30 min,分析效率提高了約30萬(wàn)倍,為事故事件資源價(jià)值的利用奠定了技術(shù)基礎(chǔ)。

(4) 語(yǔ)義分析模型領(lǐng)域?qū)I(yè)詞庫(kù)和事故事件樣本的全面性、均衡性、數(shù)量對(duì)模型性能指標(biāo)的影響較大,未來(lái)計(jì)劃完善領(lǐng)域?qū)I(yè)詞庫(kù)、補(bǔ)充事故事件樣本數(shù)據(jù)數(shù)量和質(zhì)量,持續(xù)迭代優(yōu)化模型,以提高HSE文本語(yǔ)義分析模型的準(zhǔn)確率和召回率。

猜你喜歡
語(yǔ)義文本因素
腹部脹氣的飲食因素
中老年保健(2022年5期)2022-08-24 02:36:04
群眾路線是百年大黨成功之內(nèi)核性制度因素的外在表達(dá)
語(yǔ)言與語(yǔ)義
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識(shí)別
電子制作(2018年18期)2018-11-14 01:48:06
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
短道速滑運(yùn)動(dòng)員非智力因素的培養(yǎng)
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
《流星花園》的流行性因素
認(rèn)知范疇模糊與語(yǔ)義模糊
主站蜘蛛池模板: 国产xxxxx免费视频| 国产精品开放后亚洲| 91在线日韩在线播放| 国产JIZzJIzz视频全部免费| 亚洲 日韩 激情 无码 中出| 欧美高清视频一区二区三区| 国产人成在线观看| 色爽网免费视频| 国产69囗曝护士吞精在线视频| 久久精品人人做人人爽| 国产成人免费高清AⅤ| 无码专区国产精品第一页| 欧美视频在线第一页| 亚洲人成人无码www| 嫩草国产在线| 久久激情影院| 成年人免费国产视频| 久久久久人妻一区精品色奶水| 粉嫩国产白浆在线观看| 国产精品无码一区二区桃花视频| 日韩视频免费| 天天操精品| 免费a在线观看播放| 秘书高跟黑色丝袜国产91在线| 亚洲中文字幕久久无码精品A| www.99精品视频在线播放| 2020亚洲精品无码| 久久精品国产999大香线焦| 国产全黄a一级毛片| 91青青在线视频| 91精品情国产情侣高潮对白蜜| 国产精品一区二区久久精品无码| 五月婷婷伊人网| 欧美有码在线| 欧美一区精品| 亚洲国产天堂久久综合| 亚洲 成人国产| 91色在线观看| 亚洲高清无码久久久| 亚洲欧美h| 成人精品免费视频| 免费在线播放毛片| 亚洲激情区| 亚洲无码视频一区二区三区| 亚洲二区视频| 人妻无码中文字幕第一区| 亚洲国产精品一区二区高清无码久久| 一级毛片在线免费视频| 欧美亚洲一区二区三区在线| 国产噜噜噜视频在线观看| 婷婷色丁香综合激情| 成人午夜在线播放| 麻豆精品在线| 国产主播在线一区| 日本在线亚洲| 欧美国产日产一区二区| 亚洲五月激情网| 久久免费精品琪琪| 中文字幕不卡免费高清视频| 久久精品人人做人人爽电影蜜月 | 国产精品久线在线观看| 国产美女在线观看| 欧美一区二区福利视频| 国产乱子伦无码精品小说| 中文字幕在线观看日本| 欧美性精品不卡在线观看| 青青草国产一区二区三区| 色综合天天综合中文网| 久操中文在线| 日韩天堂网| 国产精品va免费视频| 1024国产在线| 亚洲国模精品一区| 狠狠色噜噜狠狠狠狠色综合久| 日本午夜在线视频| 99尹人香蕉国产免费天天拍| 日本黄色a视频| 日韩精品成人网页视频在线| 国产成人夜色91| 国产三级成人| 精品成人免费自拍视频| 天天摸天天操免费播放小视频|