礦工違章作業演化博弈分析
——計劃行為理論視角

2021-03-06 09:11:06冀巨海

礦業安全與環保 2021年1期

張穎，冀巨海

(太原理工大學，山西太原 030024)

近年來，全國煤炭生產百萬噸死亡率顯著下降，但是與發達國家相比，我國的煤炭生產百萬噸死亡率仍處于較高的水平[1-2]。因此，提升煤礦安全管理水平是十分重要的。據統計，煤礦事故中80%以上的事故是由于人的警覺性、注意力下降引起的違規、冒險等人為因素造成的，而人因事故中70%～80%是由礦工違章行為造成的[3-5]。因此，分析礦工違章違規作業原因，進一步抑制其違章行為的發生顯得尤為重要。

針對礦工違章操作發生的原因研究，肖慧紅[6]通過行為心理學、習慣心理學對員工違章行為進行大量研究后得出僥幸、從眾心理等是令礦工產生習慣性違章行為的根源；梁利[7]認為安全意識、安全觀念、安全文化素質、安全生產管理水平等是影響員工作業行為的重要因素；楊雪等[8]通過構建不同激勵機制與礦工違章行為博弈模型，并對兩者進行博弈分析，結果發現，完善監督與考核機制，加大對違章礦工懲罰力度可以有效控制礦工違章行為；殷文韜等[9]通過構建認知—行為理論模型，并對違章操作產生的認知過程進行分析，認為加強日常監督管理、隱患排查能夠對礦工違章行為進行及時的糾正。

分析違章操作產生的認知過程，規范礦工行為，減少違規違章操作是煤礦安全管理的難點之一[10-12]。從博弈論角度看，煤礦安全管理中的監督檢查與礦工違章作業策略的選擇和相互影響可被視為一種動態博弈過程，而整個博弈過程中，主體為安全檢查員(簡稱“安檢員”，下同)和一線實際操作的礦工。筆者基于計劃行為理論，強調礦工行為是經過深思熟慮產生的，構建煤礦安檢員與一線高危崗位礦工違章行為演化博弈模型，對高危崗位礦工違章行為與安檢員檢查工作之間的博弈關系進行分析。

1 安檢員與一線礦工之間的動態博弈

1.1 安檢員與一線礦工博弈關系分析

在煤礦實際生產中，導致一線礦工違規違章作業，致使事故頻發的因素有很多，其中駐礦安檢員的日常監督檢查工作無疑是重要的環節，當安檢員積極進行檢查時，會使礦工在將要產生不安全心理時，起到強烈刺激作用，使礦工自發地規避風險性較大的不安全行為；相反，若安檢員采取消極態度檢查，則可能會放縱礦工違章行為[13-14]。由于煤礦中安檢員與一線礦工各自利益期望不同，從而在雙方的工作交集之間，會形成一種動態博弈。

根據計劃行為理論，礦工的人格特征、年齡、性別、文化背景等因素會對其行為意向產生影響，如在安檢工作開展過程中，安檢員的工作積極性、被檢員工的態度都會影響檢查工作的開展質量。另外，礦工的行為意向受到其主觀規范、自身態度、知覺行為控制的影響，當自身態度表現積極，同時他人給予的支持或施加的刺激越大，知覺行為控制就會越強，某項行為意向也就越強[15-17]。通常表現在自我抑制違章行為過程中，在工作積極性恒定的情況下，安檢員加大檢查力度，能夠刺激員工主動抑制不安全心理，從而進一步強化抑制違章的行為意向[18]。

1.2 模型假設

1)界定博弈過程中的參與方為一線礦工和安檢員等有限理性的群體，群體中個體做出決策需要依據其感知到的收入或者損失，即表示策略選擇是基于對策略價值本身的感知，這種感知價值特征符合累積前景理論，構建的博弈模型中參與方的實際收入或者損失即為其感知到的收入或損失。將參與者對策略得失的感知稱為前景價值V，其計算公式如下：

(1)

式中：δi為i事件發生的客觀概率；Δηi為博弈主體的損益值；π(δi)和v(Δηi)分別為博弈雙方對概率δi和價值Δηi的感知;Δηi<0,v(Δηi)>0;Δηi>0,v(Δηi)<0；π(0)=0，π(1)=1。

2)假設一線礦工群體可選擇的策略只有違章和不違章兩種；安檢員可選擇的策略只存在積極檢查與消極檢查兩種。

3)假設礦工產生的安全風險會部分轉移給安檢員，傳導系數為h,h∈(0,+∞)，即若煤礦安全事故發生后一線礦工需要承擔的事故成本為R，則安檢員需要承擔的成本為hR。

4)博弈雙方的策略選擇具有互補效應。當安檢員采用策略為積極檢查時，一線礦工執行不違章策略，礦井發生事故的概率最低，所付出的安全風險成本為0；當其中只有一方采取消極策略應對時，事故發生的可能性會增大，煤礦安全程度降低；當雙方均采用消極策略應對時，危險事故發生概率最高，安全程度最低。

1.3 矩陣構建

根據上述假設，構建礦工違章作業監督檢查的安全收益感知矩陣，如表1所示。

表1 煤礦企業礦工違章作業監督檢查的安全收益感知矩陣

表1中：Cm為安檢員對一線礦工實行檢查所付出的成本(Cm>0)；Cb為一線礦工不違章操作后，標準化操作所付出的行為成本(Cb>0);Ra1為一線礦工違章作業所受罰款及上級通報批評等(Ra1>0)；Ra2為一線礦工對風險的感知價值(Ra2>0)；d1為參與雙方選擇(積極檢查，違章)策略時的風險成本折扣系數(0

分析表1可知：

1)參與雙方選擇(積極檢查，違章)策略時，安檢員需要支付的檢查成本為Cm，一線礦工違章被查后，查處次數及罰金額度會被作為安檢員的考核指標，即為Ra1，而一線礦工還需要支付安全事故發生的風險感知成本為d1Ra2，由假設3可知，安檢員需要支付安全事故發生的風險感知成本為hd1Ra2，而未被安檢員檢查到的違章行為，處罰成本為0。因此可得：

Ra1=π(P1)v(Ra1)+π(1-P1)v(0)

(2)

式中P1為礦工違章操作被檢查到受處罰的概率,取值[0,1]。

2)參與雙方選擇(積極檢查，不違章)策略時，安檢員需要支付的檢查成本為Cm，一線礦工需要支付的不違章操作后，標準化操作的行為成本Cb。因此得出：

Cm=π(P3)v(c)+π(1-P3)v(0)=v(c)

Cb=π(P2)v(z)+π(1-P2)v(0)=v(z)

(3)

式中：P2、P3分別為一線礦工不違章的概率和安檢員積極檢查的概率，取值[0,1]；z為一線礦工不違章標準化操作所付出的行為成本;c為安檢員對一線礦工執行檢查所付出的成本。

3)參與雙方選擇(消極檢查，違章)策略時，安檢員需要支付的安全風險感知成本為hRa2，一線礦工需要支付的安全風險感知成本為Ra2。因此得出：

Ra2=π(P4)v(Ra2)+π(1-P4)v(0)

(4)

式中P4為參與雙方選擇(消極檢查，違章)策略的概率，取值[0,1]。

4)參與雙方選擇(消極檢查，不違章)策略時，安檢員需要支付的安全風險感知成本為hd2Ra2，一線礦工需要支付的安全風險感知成本為d2Ra2，需要支付的不違章操作后，標準化操作的行為成本為Cb。

1.4 模型構建

V1=Ra1-hd1Ra2-Cm-Ra1y+hd1Ra2y

(5)

V2=(1-d2)hRa2y-hRa2

(6)

(7)

式中:x為一線礦工在煤礦企業全體人員中所占比例，x∈[0,1]；y為安檢員在煤礦企業全體安全監查人員中所占比例，y∈[0,1]。

V3=d2Ra2x-Cb-d2Ra2

(8)

V4=(1-d1)Ra2x-Ra1x-Ra2

(9)

(10)

根據上述期望收益和群體平均收益得到復制動態方程：

=x(1-x)[Ra1-Cm+(1-d1)hRa2-Ra1y+

(d1+d2-1)hRa2y]

(11)

=y(1-y)[Ra1x+(d1+d2-1)Ra2x+

Ra2-Cb-d2Ra2]

(12)

根據式(11)和(12)得到a、b、c、d、e等5個局部均衡點，并據有關文獻資料可知，e點為不穩定點。當滿足Cb≤Ra1+d1Ra2，Cb≤Ra2-d2Ra1，Cm≤Ra1+(1-d1)hRa2，Cm≤hd2Ra2等4個約束條件時，系統收斂于d(1，1)，結果如表2所示。

表2 均衡點局部穩定性分析

1.5 結果解釋

根據表2所示的演化穩定均衡解(ESS)及其實現條件，結合動態演化博弈相位圖(見圖1),對結果進行具體解釋。

通過以上模型分析得出，當滿足式(11)和式(12)中4個約束條件時，策略選擇在d點達到最優狀態。然而在實際生產過程中，由于環境等不穩定因素的存在，會阻礙系統穩定演化過程，從而導致演化難以達到最優狀態。例如：煤礦企業的管理人員認為被管理者可以按照規范規定進行作業，從而忽略了不安全行為發生的可能性；還有在安檢員可能本身對一些作業行為存在認知缺陷，使其在安全檢查過程中檢查不全面，從而出現一些不安全行為等人因事故隱患，最終導致事故發生的可能性增大[19-20]。

2 煤礦管理者獎勵對礦工行為影響分析

2.1 影響模型構建

模型假設：

1)一線礦工與安檢員的損益值均使用貨幣衡量;

2)一線礦工僅限于綜采、綜掘和通防等崗位。

礦工在收益區間趨向于風險規避，在損失區間趨向于風險傾向。因此，將一線礦工劃分為以下幾類：風險規避者、風險持中者、風險傾向者。設當一線礦工遵守規章制度作業時，管理者給予的獎勵金額為C1，當一線礦工不遵守規章制度作業時，所增加的收益為C2(此處的礦工收益為個人收入)，參照點的實際收入為C0，此時煤礦企業被監管機構處罰的概率為p，懲罰系數為r。根據計劃行為理論，構建煤礦管理者獎勵條件下的礦工違章行為影響模型：

maxV(C1)=π(p)v(C2-rC1-C0)+π(1-p)v(C1+C2-C0)，V(C1)≥0，C2≥0

(13)

式中maxV(C1)為最大期望收益。

由式(13)得出，一線礦工在進行工作時是否發生違章行為會直接影響總收益，從而進一步影響到其自身感知到的價值；煤礦企業在進行安全生產時所做的決策直接影響總體收益狀況，進而影響主觀心理感知的價值。

設一線礦工遵守規章制度作業時收入為煤礦企業安全投資符合標準時的收入U1=C1+C2-C0，一線礦工不遵守規章制度作業時收入U2=C2-rC1-C0，據此得出：

V4=(1-d1)Ra2x-Ra1x-Ra2

(14)

令U1-U2=(1+r)C1=m，并對結果進行化簡、求導，最后得到：

(15)

其中，π(p)、π(1-p)、v′(U1)及v′(U2)值均大于0，式(15)取值依賴z的大小。因此，隨著管理者對一線礦工的獎勵程度增大，其取值變化結果如下：當z=0 時，一線礦工的風險規避系數不變，說明一線礦工決策是否違章時處于風險中立型，即管理者對一線礦工的獎勵制度下，對一線礦工是否發生違章作業影響效果不顯著;當z>0 時，一線礦工的風險規避系數降低，說明一線礦工決策是否違章時處于風險傾向型，即管理者對一線礦工的獎勵增加可能會促使礦工違章操作的發生；當z<0時，一線礦工的風險規避系數增大，說明一線礦工決策是否違章時處于風險規避型，即管理者對一線礦工的獎勵增加會促使礦工減少違章操作的次數。

2.2 結果解釋

以上研究結果表明，當檢查力度和懲罰系數一定時，管理者獎勵力度增加，礦工可能會從風險中立型轉變為風險傾向型或風險規避型，即表示管理者還不確定通過何種方式配合施加獎勵，會使礦工規避違章作業，這還要取決于礦工的風險規避系數。因此，在此假設礦工采取最適合行為得到的收益為Ca，通過V(C1)對Ca求微分，得到：

(16)

(17)

根據式(17)，在相同的監督檢查力度和懲罰系數條件下，安檢員可以通過以下2種方式抑制礦工違章行為的發生：

1)在管理者對一線礦工違章操作的懲罰力度不變的情況下，安檢員加大對一線礦工的檢查頻率和力度，以刺激礦工提升自我控制意識，減少違章操作的行為；

2)在安檢員對礦工檢查力度不變情況下，可以由管理者加大對違章行為的懲罰力度，也可以抑制一線礦工不安全心理的產生，進而減少違章作業次數。

3 結論

1)在一線礦工遵守規章制度生產作業的情況下，安檢員的檢查成本小于通過管理人員進行處罰作用所得到的期望收益和積極檢查得到的收益。在安檢員積極檢查的情況下，一線礦工按照規章作業的成本小于冒險違章作業、違規處罰所得到的收益值之和，也小于一線礦工標準化操作達到操作標準后所得到的外部收益之和。

2)煤礦安全管理者施加單一的獎勵，并不能完全消除煤礦生產中一線礦工的違章行為；如果安全管理者所制訂的獎勵制度不合理，尤其是在礦工風險規避系數降低時，礦工風險傾向性較大，而獎勵力度過大，與個人安全績效不匹配，會使礦工盲目自信，助長其違章行為；相反，當礦工的風險規避系數提高時，對礦工給予獎勵，對礦工安全操作給予肯定，則會有效地規避其違章行為。

3)安檢員處在相同的監督檢查和懲罰力度情況下，可以通過加大對被檢查的一線礦工懲罰力度和加大監督檢查力度兩種方式抑制其違章行為的發生。

礦工違章作業演化博弈分析——計劃行為理論視角