李 琰,楊 森
(西安科技大學 管理學院,陜西 西安 710054)
近十年來,煤礦百萬噸死亡率由0.749下降至0.162,下降78.4%,但是依然遠遠高于世界其他產煤國家?!笆濉币巹澲兄赋?,到2020年,煤礦死亡人數和煤礦百萬噸死亡率都要下降15%以上。同時,在所有高危行業死亡總人數中,煤礦事故致死人數占到了一半以上,煤礦安全事故的治理和改善依舊需要受到重視。從礦工行為改善與安全行為養成角度進行研究和實踐是解決煤礦安全問題的根本路徑之一。國外,Hofmann認為,時間、安全培訓和資源不足都可以導致不安全行為的產生[1];Misawa Ryo提出,工作壓力是不安全行為產生的重要誘因[2];Byungjoo Choi等研究了文化背景和組織結構對不安全行為產生的影響[3];Iraj Mohammadfam建立了貝葉斯網絡模型,得出抑制不安全行為的措施[4]。國內,李磊運用系統動力學(SD)研究了不同組合對不安全行為的抑制作用[5];程戀軍認為,不安全行為的產生源于DARF機制[6];李乃文建立了壓力、注意力與不安全行為的影響機理模型[7]。此外,許多學者都用經典的經濟學和管理學方法來對不安全行為的產生、抑制等各方面進行研究。付全通則將不安全行為與行為經濟學這一方向進行結合研究,其認為,從理論模式上,行為經濟學與礦工不安全行為更貼近[8],本文以這個方向為起點,建立礦工決策模型,利用netlogo軟件,對不安全行為的產生進行仿真分析,并進一步探討不同影響因素對不安全行為產生的影響程度。
行為經濟學將傳統的經濟學與心理學進行結合,主要研究在有限理性情況下的決策,這一理論認為人的決策能力受到自身的綜合素質的限制,當決策人處于信息匱乏的環境中,會同時受到環境的影響,而處在有限理性的決策狀態[9]。這與煤礦井下的工作環境是非常契合的,而且煤礦工人由于教育程度等原因,在個人認知和決策上有其限度,所以行為經濟學的假設可以用來研究不安全行為的決策。
行為經濟學的基礎理論是前景理論,由卡曼尼和特沃斯基提出,理論將人的決策過程分為2個階段,信息接收、處理階段和評估、決策階段,同時,上個時點的決策會影響這個時點的處理方式,因而處理方式的差別會得出不同的決策結果。
本文體現前景理論的方法是,得出的收益不是直接對比,而是首先通過前景理論價值函數來得出價值,然后用價值進行對比。前景理論價值函數如式(1)所示:

(1)
式中:α代表風險價值冪函數的收益區域凹凸程度;β代表風險價值冪函數的損失區域凹凸程度;其中α,β表示對待風險的態度,取值為(0,1),α和β越大,表示決策人愿意冒更大的風險,本文取α=β=0.88;λ表示前景價值理論中損失和收益部分的不同,當λ>1時,表示同樣數量的損失相比同樣數量的收益更能引起決策人的心理變化,意味著決策人對損失更為敏感,為了便于對礦工的決策進行研究,文本λ取值2.25[10]。
建模的理論依據是將成本收益決策與行為經濟學的有限理性結合,影響礦工決策的主要因素是各行為模式下的成本和收益水平,同時,礦工也受自身素質和環境的影響,從而最終影響決策,因此,從環境、管理者及礦工3個主體提出模型的屬性特征。
定義的環境屬性主要指在行為決策下,能對礦工不安全行為的產生造成影響的屬性,但是這些屬性并不來自于管理者和礦工本身。本文所用到的環境屬性包括:
1)礦工不安全行為導致事故發生概率X。
2)安全事故發生造成的損失L。不安全行為導致煤礦事故產生的概率,在一定程度上受企業安全投入水平,機械設備可靠程度等的影響。事故發生后,每個企業的損失也同樣受這些因素的影響。
3)正向激勵水平。企業中,為增強礦工安全意識,規范礦工的安全行為,都有不同程度的獎勵辦法。現行煤礦企業獎勵條件,有嚴格按照安全制度執行作業、發現事故征兆、提出有用建議和舉報“三違”現象等,嚴格按照安全制度執行作業是主要的獎勵條件。將行為經濟學相關理論結合企業條例,本文通過獎金水平來定義礦工安全行為收益R1。
管理者和礦工在日常作業中不斷進行交互作用,管理者的安全領導行為有效性從一定程度上影響了礦工對不安全行為的決策。
1)對不安全行為干預概率M。由于礦工學歷、相互熟識以及礦工之間不存在競爭關系等原因,實踐調查得知,依靠礦工之間的互相監督和舉報并不能很有效地影響不安全行為的發生,所以在井下作業中,主要依靠管理者來對不安全行為進行監督和干預。
2)反向激勵水平GP。反向激勵水平用罰款來反映,在管理者決定對礦工進行干預后,出于對工作關系和行為嚴重程度等考量,可能不會做出罰款的懲罰決定,管理者對安全懲罰制度實施的有效性和煤礦企業整體罰款水平共同決定了罰款的合理額度。
1)工作倦怠水平E:不同的工作強度、工作時間、個人經驗和心理狀態等會產生不同的倦態水平,數值上體現為工作壓力增長率[11]。礦工倦怠程度計算如下:
(2)
式中:n表示連續工作時間;im表示壓力增長率,取值(3%,5%);ε為初始值,在本文中因不同礦工對壓力承受力不同,在0~5內取隨機值。
在安全行為的選擇下,礦工需要承受這些倦怠度,心理壓力就是安全行為成本的主要來源,所以本文用倦怠水平來表示安全行為下的成本C1。在不安全行為下,礦工會釋放一部分心理壓力來緩解,所以用倦怠感減去隨機數來定義不安全行為下的收益R2。
2)礦工采取安全行為的概率N:礦工在對安全行為和不安全行為的期望收益進行決策后,由于礦工獲得的信息有限,同時礦工也擁有有限理性的特點,所以從眾效應對礦工的決策影響巨大,甚至能夠產生與成本收益決策相反的行為,這些都決定了行為產生的概率。本期的概率作為下期礦工決策后行為產生的概率,這一屬性也是前景理論在模型中的體現。

表1 模型屬性和代號

圖1 礦工行為決策模型Fig.1 The coal miner decision-making model
1)期望收益計算
模型要能夠體現出影響礦工對不安全行為決策的各種因素。首先需要進行對2種行為選擇下的期望收益和綜合期望收益的計算。
假設安全行為和不安全行為的期望收益分別為U1和U2,如式(3)和式(4)所示:
U1=M×(R1-C1)+(1-M)×(R1-
C1)=R1-C1
(3)
U2=M×(R2-X×L-Gp)+(1-M)×(R2-
X×L)=R2-X×L-M×Gp
(4)
(1-N)×(R2-X×L-M×Gp)
(5)
從式(3)可以看出,礦工安全行為的收益是以自身為考量的,主要考慮的是認真履行安全生產條例獲得的獎金與嚴格按照條例操作所帶來的心理倦怠感的成本之間的決策。式(4)表明,礦工選擇不安全行為的期望收益除了考慮自身利益外,還要考慮不安全行為可能造成的事故損失以及被管理者干預后可能面臨的罰款。
2)心理價值計算


礦工在t時決策安全行為時:
礦工在t時決策不安全行為時:
將礦工在t時點選擇的不同行為與前一時點的平均收益的差值代入前景價值函數,如式(1)所示,得出本時點的安全行為心理價值V1(t)和不安全行為的心理價值V2(t),經過模型計算后,得出的價值不僅包含礦工自身的成本和收益,也受企業安全投入水平、管理者執行力和礦工從眾性傳播等導致不安全行為產生的各種因素的影響,這些心理價值的對比產生了本期礦工行為決策結果。礦工行為決策模型如圖1所示。
影響礦工決策的屬性有很多,考慮到礦工從眾性、與行為經濟學相關和便于煤礦企業管理決策等因素,本文選取企業正向激勵、倦怠程度和反向激勵3個屬性來進行仿真分析。其中,用獎金來反映正向激勵水平;用工作時間來反映倦怠程度;用罰款來反映反向激勵水平。
根據煤礦調研結果,設置礦工分布占格密度70%,管理者分布占格密度8%。礦工不安全行為被管理者干預后,隨機取值4到10輪處于quiet狀態,不會再產生不安全行為。模型初始假設,不安全行為的期望收益要大于安全行為的期望收益。由于礦工在1個交接班之后,才能大范圍互相交流、收集信息,所以這里1步代表模型中1個時點,也就是1次交接班。初始參數設定如表2所示。

表2 初始參數設定

圖2 初始運行示意Fig.2 Initial operation diagram
為了便于觀察,調整參數并試運行40步。圖2(a)為world視窗,其中三角形代表管理者,圓形代表礦工,其中淺色圓形代表被管理者干預后強行限制為quiet狀態的礦工。圖2(b)為發生不安全行為的礦工數量圖,橫坐標為運行的時點數,縱坐標為發生不安全行為的礦工數,可以看出,開始階段選擇不安全行為的礦工由0突增至最大,這是因為礦工初始時并沒有可以選擇的參考點,因受教育程度和安全知識水平等原因,絕大部分礦工選擇不安全行為的情況。在管理者干預和有決策參考點之后,礦工回歸有限理性的狀態,不安全行為的數量處于上下波動但相對較平穩的狀態。
3.3.1正向激勵水平對不安全行為的影響。
煤礦企業對一定期間無不安全行為的礦工的獎金是影響礦工安全行為期望收益的主要因素,從式(3)可以看出。通過增加安全行為收益來增加安全行為期望收益,將收益降低至18,運行一次得到圖3(a)所示結果;然后將收益增加18,得到圖3(b)所示結果。

圖3 獎勵水平對礦工決策影響Fig.3 The influence of reward level to decision-making
從圖3可以看出,將收益增加18后,開始階段礦工不安全行為的最大值由964降至906,曲線穩定后平均發生不安全行為的礦工數由圖3(a)的194下降到圖3(b)的84,說明正面的激勵對礦工在盲目狀態下有一定影響,同時對于有限理性狀態下礦工不安全行為的決策有巨大的影響,煤礦企業為安全考慮可以適度增大安全生產的獎勵措施。
3.3.2倦怠程度對不安全行為的影響
井下工作噪音、光線等因素造成工作環境十分壓抑,通過式(2)可以看出,工作時間的累加會對工作倦怠度影響越來越大,本文中的工作時間是指實際在井下的工作時間。將工作壓力增長率取(3%,5%)之間的隨機值,將ε設置為5。首先將工作時間設定6 h,得到圖4(a)所示結果;然后將工作時間設定8 h,得到圖4(b)所示結果。

圖4 工作時間對礦工決策影響Fig.4 The influence of working time to decision-making
從圖4可以看出,工作時間增加2 h,不安全行為曲線的拐點和穩定值均有所升高,其中最大值穩定值從104升至128,最高值由916升值957。可以看出,工時的累加會影響工作倦怠,從而影響不安全行為決策。
3.3.3反向激勵水平對不安全行為的影響。
將管理者干預概率維持在默認的70%,然后將罰款在一定區間內取隨機值,用來模擬不同的管理者對安全管理條例實施的有效性。首先,將罰款在(5,10)之間取隨機值,運行得到圖5(a)所示結果;然后,將區間提升至(10,30),運行得到圖5(b)所示結果;最后,將區間提升至(30,50),得到圖5(c)所示結果。

圖5 罰款對礦工決策影響Fig.5 The influence of fine to decision-making
從圖5(a)到圖5(b),罰款的平均取值擴大了3倍,但是從結果來看,相對于正面激勵的獎金,對不安全行為的抑制作用并不明顯,從153降至127;而從圖5(a)到圖5(c),罰款的平均取值擴大了5~7倍,有限理性階段從153降到81,但是因為礦工工資是有限的,需要考慮到國家規定的最低工資標準和勞動者權益,而且需要考慮過重的罰款帶來的逆反心理。因此,實際執行過程中,將罰款提升3倍就已經到達極限了。此外,從圖5的分析結果來看,提升罰款數量能減少盲目階段不安全行為最大值。
1)基于行為經濟學的模型,借助前景理論函數,在Netlogo仿真平臺下可以得出不同的屬性對不安全行為決策的影響程度。
2)不同的主體屬性對礦工決策影響度存在一定差異。在中等企業安全投入水平、中等機械設備可靠度等條件下,安全生產獎勵對不安全行為影響最為明顯,持續超過正常的工作時間對不安全行為影響較大,罰款水平對礦工不安全行為的影響較弱。
3)在較合理的利潤水平下,可以適度提高獎勵水平,這有利于保證安全生產。企業需將罰款與企業工資水平等綜合考慮,應該提升管理者對安全懲罰制度實施的有效性;需加強礦工間的交流,使礦工不僅能盡快找到決策參考點,還能將更多礦工的前期收益納入參考點的取值范圍,有助于礦工在有限理性狀態下進行有效決策。
[1]HOFMANN D A, STETZER A. The Role of Safety Climate and Communication in Accident Interpretation: Implications for Learning from Negative Events[J]. Academy of Management Journal, 1998, 41(6):644-657.
[2]MISAWA R, INADOMI K, YAMAGUCHI H. Psychological factors contributing to unsafe behavior in train drivers[J]. Shinrigaku Kenkyu the Japanese Journal of Psychology, 2006, 77(2):132.
[3]CHOI B, LEE S H. Role of Social Norms and Social Identifications in Safety Behavior of Construction Workers. II: Group Analyses for the Effects of Cultural Backgrounds and Organizational Structures on Social Influence Process[J]. Journal of Construction Engineering & Management, 2016:04016125.
[4]MOHAMMADFAM I, GHASEMI F, KALATPOUR O, et al. Constructing a Bayesian network model for improving safety behavior of employees at workplaces[J]. Applied Ergonomics, 2017, 58:35-47.
[5]李磊, 田水承. 煤礦工人不安全行為組合干預仿真研究[J]. 中國安全科學學報, 2016, 26(7):23-28.
LI Lei,TIAN Shuicheng.Simulation research on combination intervention in coal miners' unsafe behaviors [J]. China Safety Science Journal,2016,26(7):23-28.
[6]程戀軍, 仲維清. 礦工不安全行為DARF形成機制實證研究[J]. 中國安全生產科學技術, 2017, 13(2):107-113.
CHENG Lianjun,ZHONG Weiqing.Study on DARF formation mechanism of miner’s unsafe behaviors [J]. Journal of Safety Science and Technology,2017,13(2):107-113.
[7]李乃文, 張麗, 牛莉霞. 工作壓力、安全注意力與不安全行為的影響機理模型[J]. 中國安全生產科學技術, 2017, 13(6):14-19.
LI Naiwen, ZHANG Li, NIU Lixia.Influencing mechanism model of work stress,safety attention and unsafe behavior [J]. Journal of Safety Science and Technology, 2017,13(6):14-19.
[8]付全通, 張紅桃. 行為經濟學視角下礦工不安全行為決策研究[J]. 現代礦業, 2014(11):1-3.
FU Quantong, ZHANG Hongtao.Decision-making research on the miner’s unsafe behavior from the perpective of behavioral economics[J].Moden mining, 2014(11):1-3.
[9]戶曉坤, 郭旭新. 理性與情緒:從行為經濟學視角看不確定條件下的個體選擇[J]. 新疆社會科學(漢文版), 2013(2):16-21.
HU Xiaokun, GUO Xuxin.Rationality and emotion: individual choice under uncertain conditions from the perspective of behavioral economics [J]. Social Sciences in Xinjiang, 2013(2):16-21.
[10]TVERSKY A, KAHNEMAN D. Advances in prospect theory: Cumulative representation of uncertainty[J]. Journal of Risk & Uncertainty, 1992, 5(4):297-323.
[11]牛莉霞, 劉謀興, 李乃文,等. 基于ABMS的礦工習慣性違章行為演化仿真[J]. 中國安全科學學報, 2015, 25(11):34-40.
NIU Lixia,LIU Mouxing,LI Naiwen,et al. Simulation of evolution of miners'habitual violation behavior based on ABMS [J]. China Safety Science Journal, 2015, 25(11):34-40.
[12]周凡. 行為經濟學理論發展簡述[J]. 現代經濟信息, 2017(1): 410-411,413.
ZHOU Fan. A brief introduction to the development of behavioral economics [J]. Modern economic information,2017(1):410-411,413.