吳博
摘要:核電廠人機系統的復雜化和人因研究技術的多樣化,導致人因數據的多樣化和海量化,核能安全人因分析已進入大數據時代。應用結合人因分析技術的數據挖掘技術挖掘核能安全人因大數據,是目前核能人因研究的重點之一。文章圍繞人因大數據挖掘問題,探討了核能人因大數據挖掘的價值、技術體系及今后的發展趨勢。
關鍵詞:人因分析技術;核能安全;人因大數據;數據挖掘;技術體系 文獻標識碼:A
中圖分類號:TP393 文章編號:1009-2374(2016)18-0007-02 DOI:10.13535/j.cnki.11-4406/n.2016.18.004
1 人因數據與大數據
核電已成為我國能源戰略的重要發展戰略。核電廠是一個由技術設備、人和組織、環境等部分組成的大型復雜人-機系統。保障核能存在和發展的必要條件就是安全。核電廠的安全問題所造成的影響往往是超出想象的,會給社會帶來巨大的負面影響。
人因可靠性分析(Human Reliability Analysis,HRA)著重研究的是人對核電廠的安全風險影響的貢獻大小。核能安全人因分析經過多年的發展,人因數據呈現出明顯的“大數據”特征。(1)數據量大(Volume),大量的核電廠運營數據和事件報告不斷累積,已經達到了GB、PB甚至ZB的等級;(2)速度高(Velocity),隨著核電廠和機組不斷建設和數目增多,數據在快速增長;(3)數據多樣化(Variety),HRA方法不斷改進,現在常用的HRA方法已有15種,數據類型龐雜;(4)真偽難辨(Veracity),在巨量龐雜的人因數據中存在大量的數據冗余和不真實數據;(5)價值高(Value),核電廠出現的安全事故少,但事故的破壞力大,而事故中人因的影響所導致事故所占的比例較高,人因數據的開發利用對人類有重要意義。由于大數據時代人因分析對于數據的特殊要求,因此對人因大數據的數據挖掘的要求更加迫切,而如何結合人因分析技術的數據挖掘技術成為解決問題的關鍵。
核電廠對人因的重視不斷提高,人因數據獲取途徑不斷豐富,測量研究人的技術和工具不斷進步,如眼動議、腦電議等,然而與人因數據獲取能力形成鮮明對比的是人因信息處理能力十分低下。目前核能安全人因研究技術,主要針對某個具體人因事件的分析,沒有考慮對多數據來源人因數據處理分析,人因數據的分析能力和數據采集能力之間嚴重失衡,人因大數據處理仍然停留在小數據處理的階段,因而對人因大數據的利用率低,造成了大數據、小知識的窘境。同時海量人因數據長期占用有限的空間資源并無法有效利用,將導致數據災難和空間浪費。因此,有必要研究適應于人因大數據的數據挖掘方法。
2 人因大數據的價值
2.1 提高核電廠的運行安全
人因失誤在復雜人-機系統中導致事故的比率占到了80%以上,是引發事故的最主要原因之一,因此需對工業系統中人因失誤進行分析。人是復雜人-機系統中非常重要的組成部分,盡管核電廠系統和相關設備的安全可靠性得到了很大的提高,運行環境不斷改善,系統呈現高度的自動化,但是最終核電廠還是需要人來對系統設備進行設計、制造、組織、控制和維修,需要由人來對系統設備進行操作和控制。因此,人在系統中的作用不僅沒有減弱,還越來越顯得重要和突出。國外PSA報告研究顯示,人因失誤相關因素造成的反應堆事故公眾風險大約為50%。因而確保核電廠安全運行必須解決的關鍵問題之一就是預防與減少人因事故,核電廠人因可靠性研究的意義重大。人因大數據挖掘是人因安全研究的重要組成部分,是其重要工具和途徑。
2.2 HRA的基礎性資源
HRA的研究核心是對人因失誤進行分析、預測、減少和預防,定性和定量地分析和評價人的可靠性。HRA的數據都來源于大量的運行數據、實驗數據、歷史數據和研究科學數據等,都歸屬于人因數據。人因數據可以為HRA提供所有的定性分析和定量計算的所有數據,從而完成HRA研究。人因大數據是一種基礎性資源,可以為HRA研究帶來更多的資源。大數據的價值主要在于它的全面性,能夠全面反映隱藏在數據后的規律或知識。同理,人因大數據的價值主要在于能全面反映人因事件而不是它的海量,并且能夠從數據中挖掘出隱藏在人因大數據背后的各種知識,包括心理知識、生理知識、組織管理知識等。對人因大數據中隱藏知識的挖掘是人因大數據利用的終極目標。
3 人因大數據挖掘的技術支撐
數據挖掘是一門新興的學科,主要用于研究人工智能方面以及其在商業等領域的應用。從技術方面而言,數據挖掘是從含有復雜、異構、模糊等特性的大規模數據集中尋找隱含的、不易被人們發現的、具有潛在價值的信息的過程。從商業應用方面而言,數據挖掘就是把一些潛在規律和價值從龐大的數據庫中抽取出來,獲得關鍵信息以輔助商業決策。
基本的大數據技術有:(1)采集技術、傳感技術等數據產品的開發和發展是人因大數據采集的重要工具和技術;(2)儲存技術。人因大數據挖掘的基礎就是數據存儲,是人因大數據面臨的困難之一,它提供了性能穩定可靠且擴展性好的儲存管理方案可以承載不斷增加的人因大數據;(3)處理技術。把人因數據轉變為人因知識是其主要任務;(4)表達技術。表達就是把人因數據中包含的信息予以清楚、有效地描述出來,可以為尋找難以掌握的數據提供新的視角;(5)評估技術。由于數據量龐大、測量密度高所以人因大數據中易出現錯誤,最大程度地減少錯誤帶來的風險就是評估技術的任務。
4 人因大數據挖掘
目前大數據處理的主要工具和有效方法之一就是數據挖掘,因為它可以從核能安全人因大數據中發現人的行為模式和規律,并探索出降低核電廠的人因風險的方法。人因數據具有行業特點和領域性特點,具有其多樣性和復雜性,這決定了人因大數據挖掘手段既要具有人因數據屬性特點,又要具有大數據特點。
(1)人因大數據來源多樣且豐富、海量、數據結構類型眾多、數據呈現形式非常復雜多樣;(2)需要借助于水平較高的數據分析手段,并結合人因分析技術使用模型對復雜的人因數據予以組織分析處理。由于較之前小規模數據環境下的簡單數據整合、分析處理而言,人因數據挖掘技術的定位已經有了很大提升;(3)人因大數據所涉及的挖掘手段類別多樣,對于不同研究目的和數據類型要求有不同屬性表現。人因數據挖掘技術依據HRA模型而在數據挖掘的側重點上存在區別;(4)人因數據挖掘原則是從多尺度、多維度對數據進行并行分析。現代核能安全對人因數據信息分析需求逐漸趨于多元化和復雜化,但多HRA方法并行分析是其趨勢和方向,原因在于今后信息分析的歸一性。
下面將具體分析人因大數據挖掘過程和目標:
4.1 人因大數據挖掘過程
人因大數據挖掘的過程就是知識發現。如圖1,它由數據獲取與存儲、數據分析與處理、數據挖掘、數據可視化、數據融合等部分組成。大數據的特點貫穿于整個過程,其依賴于人因分析理論和大數據技術的支撐。人因大數據挖掘具體過程為數據采集和存儲,對多源的人因數據存儲并將其篩選整合成數據集,然后對數據集進行處理和分析;接著對處理后的數據利用決策樹、遺傳算法等技術進行數據挖掘,探索和發現數據關聯、模式及規律;最后將這些模式及規律可視化、直觀地展示。為方便分析和利用,將發現的信息規律與現有的知識進行融合。
4.2 人因大數據挖掘目標
核能安全人因大數據是核電廠安全人因數據的全面反映。一方面,它能與其他行業領域人因數據形成互補;另一方面,人因大數據應該包含所有的核電廠運行數據、實驗數據和各領域專家學者的研究數據和成果。人因大數據的綜合信息挖掘能揭示更多的人的行為和人為規律。通過一系列的關聯規則等數據挖掘方法,可以從人因大數據中提取出其隱含的有用信息,它是把人因數據發展到人因信息,再把人因信息發展到人因知識的過程。人因數據挖掘作用在于將人因數據進行挖掘,并應用人因分析技術分析挖掘結果。對核能安全人因數據做到處理,并為核電廠安全提供決策支持。人因知識具有普遍性、自學習性等特點,容易被人們認可和應用,可以為核電廠安全決策提供重要依據。將人因數據挖掘技術應用于核電廠領域,就會使人因分析工作變為更加精細和簡單易行的工作,從而提高人因大數據的利用率,減少存儲資源浪費,促進核電廠安全可靠性的提高。
5 結語
大數據的發展促使人類的活動范圍在擴大、需求在增長。把大數據技術帶入到核能安全領域能夠大大推動我國核能戰略的發展,不僅能改善核電廠運行環境、提高核電廠的運行效率,還為核電廠的實時監測、多分布式人因數據采集等方面提供更多的方式和可能,人因數據的內容更加豐富、全面。同時,這也將加重人因數據處理和挖掘的負擔,因為更加豐富的數據類型和結構以及更加大量的數據將加大人因大數據的范圍,使人因數據分析工作變得更加困難,還有可能會對人因分析提出更高的要求,如在線處理實時分析、自動分析等。可以看到,對人因大數據挖掘的重視和發展不僅具有重要的學術價值,還具有重要的現實意義。
參考文獻
[1] 張力.人因分析:需要,問題和發展趨勢[J].系統工程理論與實踐,2001,21(6).
[2] US Nuclear Regulatory Commission,Reactor Safety Study:An assessment of Accident Risks in US Commercial Nuclear Power Plants,WASH-1400,NUREG-75/014,Washington,DC,October,1975.
[3] Dougherty EM,Fragola JR.Human reliability analysis:a systems engineering approach with nuclear power plant applications[M].John Wiley & Sons,1998.
[4] ZIKOPOULOS P,EATON C,DEROOS D,et al.Understanding of Big Data[M].New York:Mc Graw Hill,2012.
[5] Levine,S.and Rasmussan,N.C.Nuclear plant PRA:how fast has it come[J].Risk Analysis,1984,4(4).
[6] 李德仁,童慶禧,李榮興,等.高分辨率對地觀測的若干前沿科學問題[J].中國科學:地球科學,2012,42(6).
(責任編輯:黃銀芳)