賀鵬程
(海軍裝備部駐重慶地區軍事代表局 重慶 400042)
隨著科技的發展,現代技術系統愈加復雜,自動化程度日益提高,人對設備、機器的直接控制與接觸有所減少,但越是如此,人員的每個操作,與機器、設備的每次接觸對系統產生的影響越大,整個系統的安全性、可靠性與人是密不可分的。
對于軍事活動,人的高可靠性具有更加重大的意義,軍事活動的失敗很可能造成不可估量的后果。實際上在軍事活動中人的可靠性所包含的內容是十分廣泛的,一方面是軍事活動需要人指揮決策,另一方面軍事裝備需要人操作維護,在軍事裝備的人—機交互中,由于戰場的特殊環境使人的身心狀況產生變化,相對于平時訓練操作人員發生誤操作的可能性更大。世界各個國家都發生了很多極其嚴重的與人錯誤或失誤有關的事故,例如:美國三哩島堆芯熔化事件(1984),蘇聯切爾諾貝利核電站核泄漏事件(1986),美國挑戰者號飛船爆炸事件(1989)等等[1],這些事故的發生均與人的誤操作或者失誤疏忽有著重大的關系,也就是說與人的可靠性有著密切的聯系。另有資料表明70%~80%事故的發生都直接或間接與人的錯誤操控、管理、決策有關[2]。可見提高人的可靠性,減少人的錯誤能夠有效減少和避免不安全事件的發生,特別是對于軍事活動來說,提高人的可靠性就是提高戰斗勝利概率,具有重大意義。
人的可靠性分析HRA(Human Reliability A-nalysis)的研究開始于20世紀50年代[3~5],是一門綜合性的邊緣學科,也是可靠性學科的重要分支學科。人的可靠性一般定義為:人在規定時間內、規定條件下,無差錯的完成規定任務的概率[2]。人的可靠性至少包括三個方面的含義:1)人的可靠性水平同樣受到環境等因素影響,并不是保持不變的;2)不同性質的任務對應的可靠性水平也是不同的;3)相對裝備的可靠性來說,所謂的規定條件具有更豐富的內涵。
HRA最早是由H.L.williams在1958年提出的,他認為在系統的可靠性預測中必須要考慮人的因素[6]。1973年,《美國電子電氣工程師協會可靠性學報》(IEEE Transactions on Reliability)把已經出現的各種人的可靠性分析方法加以整理,出版了《人的可靠性》專集[7],雖然其中介紹的方法現在大部分都已不再使用,但它對于人的可靠性研究的發展具有重要的意義。
20世紀60年代到80年代,產生了第一代HRA方法[8],這些方法著重研究人的行為理論和失誤分類,收集人的可靠性數據(現實數據和模擬數據),發展以人員經驗和專家判斷為基礎的人的失誤概率的統計分析和預測方法,下面簡單分析部分第一代HRA方法。
1)THERP[9](Technique for Human Error Rate Prediction人誤率預測技術)
它的核心思想是將人的所有行為事先分解為一系列的由系統功能或規程所規定的子動作或子步驟,即建立人因事件樹,并由專家分別給出這些子動作的人誤概率值(Human Error Probability,HEP),同時考慮到使用績效形成因子(PSF,Performance Shaping Factor)在不確定性范圍內進行修正。績效形成因子的概念是1967年由Swain提出的,主要用于描述那些影響人行為的因素。
2)ASEP[10](Accident Sequence Evaluation Programme事故序列評價程序法)
ASEP法是THERP的簡便算法,是對事故后THERP分析方法的簡化,這種簡化可以大大減少資源的耗費,符合工程應用。簡化主要包括三個方面[14]:不再考慮具體的診斷效應;處理一項異常事件的全部可用時間分為兩個獨立部分—診斷允許時間和診斷后允許時間;假設在處理任何具體的事故序列時只存在一種正確的動作序列,這種動作序列選自應急操作規程。
3)HCR[11](Human Cognitive Reliability人的認知可靠性預測法)
HCR方法有兩個基本的假設前提:1)將人的認知行為分為基于技能的、基于規則的和基于知識的三種類型;2)認為每種類別的人的失誤概率僅與允許時間和執行時間的比值有關,在規定的任務時間內操作人員沒有響應的概率服從三參數Weibull分布,其中的參數取決于認知行為的類型。
4)SLIM[12](Success Likelihood Index Method成功似然指數法)
SLIM法的特點是不需要進行操作分析,不需要對各個操作失誤概率進行確定,并且以權重分配方法確定行為因子的作用。因為人的操作失誤概率有關數據不容易得到,采用這種方法,可使人的可靠性量化計算較為簡便易行。
5)OAT[3,13](Operator Action Tree操作員動作樹模型)
將操作人員行為分為三個階段:觀察—分析—反應,認為最應該關注的是分析階段,這一階段的差錯最為重要。因此,該方法首先建立任務的事件樹,然后分析其中可能存在的分析差錯并估計其概率。
6)PC[15](Paired Comparisons成對比較法)
PC法是借用心理物理學領域的一項技術,它與SLIM有相似之處,以專家判斷來定量估計人誤概率,不要求專家們直接作任何頂定量的分析。如有兩項任務,則要求專家判斷哪項任務人員最易產生差錯。其缺點在于有效性主要依靠專家們的知識經驗,主觀性較大。
7)HEART[16](Human Error Assessment and Reduction Technique人誤評估及減少技術)
此方法著重研究對人因可靠性有負面影響的因素,即差錯誘發條件,并尋求能夠降低人為差錯幾率的措施。但是,目前只能處理獨立的任務,尚無處理連續性序列任務的模型。
8) AIPA[3,17](Accident Investigation and Progression Analysis事故引發與分析)
它通過平均響應時間與可用的響應時間來表征某個行為的執行情況,最終依靠專家打分來確定行為無法執行的概率,但是它沒有建立明確的人的行為模型。
9)APJ[18](Absolute Probability Judgment絕對概率判斷法)
由具有專業知識和經驗并熟悉可能發生的人為錯誤的專家直接估計人誤概率,概率的估計可以以組進行也可以單獨進行然后統計綜合(例如,可以取所估計概率的幾何平均數或算數平均數等)。
10)HRMS[19](Human Reliability Management System人的可靠性管理系統)
具有一系列基于操作的錯誤數據及一系列的效績形成因子問題來確定人誤概率。評估人員選擇與人誤概率評估特征最相似的錯誤描述符,然后系統運算法則根據評估人員對效績形成因子的回應對數據外推得到所需的人誤概率。
11)JHEDI[20](Justification of Human Error Data information人誤數據信息驗證法)
由一系列對基本錯誤的描述和基于操作的錯誤數據開始,利用一系列的效績形成因子問題(由專家或評估人員給出回答)來確定人誤概率。
第一代HRA模型大都只注重人行為的最終結果,而不注重人做出這種最終行為所經歷的心理歷程及認知過程,而且沒有考慮人的任務環境(包括自然環境、社會環境、管理訓練等)這種分析方法忽略了人的主觀能動性,忽略了人與系統及其他影響因素的交互作用,僅僅把人作為機器處理,因此其缺點是很明顯的,主要有:
1)絕大部分第一代HRA模型都認為人的可靠性和其它硬件可靠性沒有本質區別,也就是說忽略了人的主觀能動性和人的心理認知過程。對人的可靠性分析來說,這個缺點明顯是“致命”的。
2)大部分模型對人的最終行為都利用簡單的二值來說明,即把人的行為僅僅區分為“正確”和“錯誤”兩種。實際上在現實環境中人的反應與行為遠遠不能簡單的用“正確”和“錯誤”來說明。
3)缺少真實數據,過分依賴專家的判斷。真實數據的缺乏是個很嚴重的問題,由于缺乏真實數據,所以只能依靠專家判斷或其它彌補性質的模型。
4)幾乎所有方法研究對象都是單個人,沒有考慮人與人之間的影響及多人可靠性問題。
5)大部分模型的正確性和合理性難以驗證。
為了克服第一代HRA方法的種種不足,20世紀90年代后期在歐美興起第二代HRA模型的研究[8]。在第二代模型中,對人的可靠性分析不再單純的當作硬件可靠性的分析,人們逐漸認識到人—機系統的交互作用以及人的心理狀態、對事物的認知等主觀因素對人的失誤的影響,都認為任務所處的環境條件才是人為差錯的決定因素,因此這些模型大都建立了認知模型,著重考慮可能導致人為差錯的環境條件因素,并分析可能導致的差錯。
1)ATHEANA(A Technique for Human E-vent Analysis人誤分析技術)
ATHEANA法認為絕大部分的人為差錯事件都是由系統自身條件和績效形成因子相結合共同影響造成的,統稱為差錯誘發環境。差錯誘發環境可能導致非安全動作,非安全動作最終將導致人為差錯事件。因此,方法的重點在于辨識出那些差錯誘發環境及其可能誘發的非安全動作。為此,ATHEANA方法將認知過程分為由監測—環境感知—計劃—實現四個階段構成的回路,任一階段出現差錯,都可能導致非安全動作。
2)CREAM(Cognitive Reliability and Error Analysis Method即認知可靠性和人誤分析法)
此法對HRA定性分析作了深刻的變革,由失誤模型多樣化得到認知失誤處理的新方法,引進復合狀態信息處理模型改進了操作員動作模型。CREAM的核心思想是強調人的績效輸出不是孤立的隨機行為,而是依賴于人完成任務時所處的情景環境,它通過影響人的認知控制模式和其在不同認知活動中的效應,最終決定人的響應行為。CREAM方法將這些影響因素歸納成九大因素,統稱為共同績效條件(CPC),每個因素稱為一個CPC因子,每個CPC因子有幾個水平等級,會對人的績效產生三種不同水平的影響:改進、降低和不顯著。
相對第一代HRA方法,第二代HRA方法已經不是單純地將人的可靠性當做硬件可靠性來分析,它們更加注重人的行為動作過程中的主觀心理認知過程以及客觀影響因素,對人行為動作的結果更加細化,不再僅僅是成敗的二值判斷。這些都是第二代HRA方法的進步之處,但是除了這些問題,它們仍存在與第一代HRA方法相同的弊端,包括數據的缺乏、模型難以驗證等。
隨著可靠性技術的不斷發展,可以將一些新興的可靠性分析方法逐步試用于人的可靠性分析,鑒于軍事活動的重要性,提出下面兩種適用于軍事活動中的人的可靠性分析方法,并加以簡單分析,一種是基于粗糙集的人的可靠性評估方法,一種是基于貝葉斯網絡的人的可靠性評估方法。
粗糙集理論是用于處理不完整、不確定知識和數據的有效方法[24]。粗糙集理論的出發點是根據目前已有的對給定問題的知識將問題的論域劃分,然后對劃分后的每一個組成部分確定其對某一概念的支持程度[25]。基于粗糙集的人的可靠性評估方法實際上是一種對人的可靠性等級進行評估的方法,由于人的可靠性除了受環境等與裝備相同因素的影響,更多的還與心理因素、精神因素、日常學習訓練等難以量化的諸多因素有關,因此,評估人的可靠性時,過分注重對可靠度的精確計算是不甚合理和科學的。
在軍事活動中,影響人的可靠性的因素主要有:人自身因素、環境因素、管理制度因素及裝備因素等。每一類因素又可以具體細化,例如:人自身因素可以分為生理因素、心理因素、經驗知識水平、訓練因素等;環境因素可以分為溫度、核化、爆炸、煙霧等;管理制度因素可以分為紀律不嚴、計劃不周、上級決策不當等;裝備因素可以分為裝備故障、設計缺陷、功能缺陷等。
針對軍事活動中的人的可靠性,可以根據以上分析的幾個方面的因素,分析確立軍事活動中的人的可靠性評估指標體系,并研究建立評估模型。采用粗糙集理論中知識的核理論以及信息熵、屬性重要度的概念,通過各專家評估各因素的重要等級,并結合已建立的評估模型,最終的得到軍事活動中人的可靠性水平。
貝葉斯網絡(Bayesian networks,BN),又稱貝葉斯信度網絡(Bayesian belief networks,BBN)[27]是用來表示變量間連接概率的圖形模式,它提供了一種自然的表示因果信息的方法,是由節點、有向弧線和條件概率分布組成的有向非循環網絡,是貝葉斯概率方法和有向無環圖的有機結合。它用概率測度的權重描述數據間的相關性,從而解決了數據的不一致性,甚至互相獨立的問題;用圖形的方法描述數據間的相互關系,語義清晰,易于理解[29]。

圖1 某軍事活動中人的可靠性的貝葉斯網絡
基于貝葉斯網絡的人的可靠性評估方法同樣建立在分析人的可靠性影響因素的基礎上,例如評估某軍事活動中人的可靠性的貝葉斯網絡如圖1所示。此貝葉斯網絡是3層網絡,利用專家評估法對貝葉斯網絡中的根節點V4、V6、…、V10、V12做出估計值,根節點V11可以通過實際計算得到而非估值。假設理想條件下人的可靠度p(V1)為1,軍事活動中人的可靠度為R,根據貝葉斯網絡理論人的可靠度為:

將得到的估值及計算值代入上式即可得出人的可靠度。

圖2 基于人工神經網絡的人的可靠性分析模型
除上述兩種模型外,神經網絡、模糊綜合評判也不失為對人的可靠性評估的方法。這些方法實際也存在部分與第一、二代HRA模型共同的缺陷,若要進一步完善HRA模型,可以從不同模型的綜合融合方面研究,因為不同的分析方法可能會側重研究問題的不同方面,將不同模型融合可以更加充分地反映人的可靠性的特點。例如利用CREAM模型可以確定得到修正后的人的認知失效概率CFP(Cognitive Failure Probability),之后就可以結合利用貝葉斯網絡、神經網絡或者其它融合模型來分析人的可靠性,再如一種融合ATHEANA法、CREAM法、貝葉斯網絡、人工神經網絡的評估模型如圖2所示。這樣既可以在一定程度上考慮人的主客觀因素對可靠性的影響,又發揮了新興分析模型的優點。
人的可靠性分析作為一門復雜的頗具挑戰性的面向21世紀的新學科,已得到了充分發展。盡管在人的可靠性研究領域已經有了50多年的發展,但對比機械、電子設備的可靠性分析仍然困難得多,而且分析結果的可信度不高,也無法驗證。這些問題主要是由于人本身所具有的特性造成的,并且人的生理因素、心理因素會受到社會因素、環境因素等的影響,以及人與系統和周圍環境的相關性、與其他人的合作性等,這些關系既涉及主觀因素又涉及客觀因素,關系相當復雜,導致人的行為在某種程度上具有很大的不確定性,因此難以做到定量化描述,也使得人的行為過程、心理過程無法完全復現。對人的可靠性的研究,一方面不能單純的將人當做機器對待,用那些描述元件和系統的硬件可靠性模型進行分析,另一方面要避免過分局限于對人的心理過程及生理變化的研究,避免出現將工程管理問題做成心理研究。
[1]高佳,沈培祖,黃祥瑞.人的可靠性分析:歷史、需求和進展[J].中國安全科學學報,2003,13(12):44~47
[2]岳玉山,王曉文,孫獻秋,等.人的可靠性研究與進展[J].石油工業技術監督,2006,10:62~64
[3]謝紅衛,孫志強,李欣欣,等.典型人因可靠性分析方法評述[J].國防科技大學學報,2007,29(2):101~107
[4]Kim I S.Human Reliability Analysis in the Man-machine Interface Design Review[J].Annal of Nuclear Energy,2001,28(11):1069~1081
[5]Hollnagel E.Reliability Analysis and Operator Modeling[J].Reliability Engineering &System Safety,1996,52(3):327~337
[6]黃瑞祥.可靠性工程[M].北京:清華大學出版社,1990:167~170
[7]Meister D.A Critical Review of Human Performance Reliability Predictive Methods[J].IEEE Transactiona on Reliability,1973,22(3):116~123
[8]Reer B,Straeter O,Merters J.Evaluation of Human Reliability Analysis Methods Addressing Cognitive Error Modeling and Quantification[R].DFA Report of Germany,1996:15~20
[9]Swain A D,Guttmann H E.Handbook of Human Reliability Analysis with Emphasis on Nuclear Power Applications(NUREG/CR-1278)[M].Washington.DC:US Nuclear Regulator Commission,1983:56~59
[10]Swain A D.Accident Sequence Evaluation Procedure(ASEP)program(NUREG/CR-4772)[M].Wash ington,DC:US Nuclear Regulatory Commission,1987:189~194
[11]Hanaman G W,Spurgin A J,Lukic Y.Human Cognitive Reliability Model for PRA Analysis(NUS24531)[R].Draft EPRI Report,Electric PowerResearch Institute,1984:100~105
[12]Embrey D E.SLIM-MAUD:An Approach to Assessing Human Error Probabilities Using Structured Expert Judgment(NUREG/CR-3518)[R].Washington,DC:US Nuclear Regulatory Commission,1984:289~291
[13]Wreathall J.Operator Action Trees.An Approach to Quantifying Operator Error Probability during Accident Sequences[R].NUS-4159.SanDiego,CA:NUSCorporation,1982:342~346
[14]戴立操,黃曙東,張力.事故序列評估程序:核電廠事故后人的可靠性分析技術[J].人類工效學,2005,11(1):21~23
[15]Potash L M,et al.Experience in integrating the operator contributions in the PRA in actual operating plants[C]//Proceedings of the ANS/ENS Topical Meet ing on Probabilistics Risk Assessment,Portchester,LaGrange Park,IL:American Nuclear Society,1981,2:1054~1063
[16]Williams J C.A Data-based Method for Assessing and Reducing Human Error to Improve Operational Performance[C]//IEEE 4th HumanFactor and Power Plants,1988:436~453
[17]Fleming K N,Hannaman P H,Houghton G W,et al.HTGR Accident Investigation and Progression A-nalysis Status Report(Vol.Ⅱ):AIPA RiskAssessment Methodology[R].San Diego:General Atomic Co.,1975:238~246
[18]王武宏.人機系統可靠性分析的發展[J].系統工程學報,1998,13(1):29~45
[19]何旭洪,高佳,黃祥瑞.人的可靠性分析方法比較[J].核動力工程,2005,26(6):627~630
[20]曹現濤.無人作戰飛機系統人機功效分析及人的可靠性研究[D].西安:西北工業大學,2003:36~41
[21]Barriere M.Technical Basis and Implementation Guidelines for a Technique for Human Event Analysis(ATHEANA)(NUREG/1624)[R].Washington,DC:US Nuclear Regulatory Commission,2000:456~462
[22]Hollnagel E.Cognitive Reliability and Error Analysis Method(CREAM)[M].Elsevier Science Ltd,1998:67~72
[23]王遙,沈培祖.CREAM—第二代人因可靠性分析方法[J].工業工程與管理,2005(3):17~21
[24]王國胤.Rough集理論和知識獲取[M].西安:西安交通大學出版社,2001:89~93
[25]劉伯運,歐陽光耀,常漢寶.基于粗糙集理論的內燃機狀態評估指標體系構建[M].小型內燃機與摩托車,2007,36(2):11~13
[26]彭善國,王希武,王寅龍.基于貝葉斯網絡的裝備保障能力評估建模研究[J].計算機與數字工程,2011,39(6)
[27]周忠寶.基于貝葉斯網絡的概率安全評估方法及應用研究[D].國防科學技術大學,2006:78~81
[28]王學玲.貝葉斯網絡分類模型研究及其在信用評估中的應用[J].計算機與數字工程,2010,38(8)
[29]李海軍,馬登武,劉宵,等.貝葉斯網絡理論在裝備故障診斷中的應用[M].北京:國防工業出版社,2009:78~82