陳 艷,呂云翔,柴 訪,王曉峰
(1.青島理工大學管理工程學院,山東 青島 266520;2.煙建集團有限公司第四分公司,山東 煙臺 264000)
建筑業是世界上最危險的行業之一[1]。據統計,2018年全國房屋市政工程生產安全事故734起、死亡840人,與前一年相比,事故起數增加42起、死亡人數增加33人,分別上升6.1%和4.1%[2]。已有研究表明,90%以上的建筑安全事故與建筑工人的不安全行為密切相關[3]。可見,控制建筑工人的不安全行為是降低建筑安全事故發生的重要手段。
建筑業不同于其他行業,有其獨特的結算方式、組織結構和作業條件,其顯著的特點是大部分建筑工人(如鋼筋工、木工、瓦工)的工資結算是以工程量為依據,這一特點促使建筑工人為完成更多的工程量,獲得更多的工資收益,從而違反施工安全制度,做出可能引發建筑安全事故的不安全行為。加之建筑工人具有受教育程度低、流動性強、安全意識薄弱等特點[4],導致工程項目管理者制定的安全制度和安全守則難以約束建筑工人的不安全行為。而激勵機制被廣泛認為是促進群體間合作行為演化的重要機制,因此工程項目管理者可以采取合理的激勵機制對建筑工人的不安全行為進行引導和矯正。
目前,關于建筑工人不安全行為的研究多集中于不安全行為的致因[5-6]、傳播機理[7]、預防措施[8-9]等方面,對于建筑工人群體安全行為的激勵機制的研究相對較少。如祁神軍等[10]通過調查數據分析了建筑工人不安全行為與激勵機制之間的關系,但該研究僅說明激勵機制對建筑工人不安全行為有一定的干預作用,并沒有闡述激勵機制促使建筑工人不安全行為轉變的原因。由于建筑工人群體和工程項目管理者存在不同的利益動機,建筑工人群體的不安全行為與工程項目管理者所采取的激勵機制其實是一種動態博弈過程,所以從行為的“成本-收益”角度出發[11],運用博弈方法可以直觀地分析建筑工人不安全行為的變化情況。如陳述等[12]基于博弈理論構建了水電工程施工安全管理激勵模型;但經典博弈理論雖然應用廣泛,但逐漸也暴露出其不足之處,即以完全理性假設為基礎,而該假設顯然與現實不符[13]。
演化博弈理論是以博弈者的有限理性假設為基礎,并延續了傳統博弈模型的競爭性、策略依存性等特點,強調博弈過程的動態演化[14],目前演化博弈論開始在安全行為研究中興起。如王斯佳[15]構建了建筑施工群體與監管群體的演化博弈模型,認為有效的激勵機制能夠減少安全事故發生的概率,但該研究只涉及單一激勵機制研究,而在實際工作中獎勵(正向激勵機制)與懲罰(負向激勵機制)常常共存[16]。因此,傳統的單一激勵機制不能滿足博弈雙方期望收益的最大化,而采取正向激勵機制與負向激勵機制相結合的動態激勵機制能更有效地控制建筑工人的不安全行為。為此,本文從建筑工人和工程項目管理者雙方的利益動機出發,構建了以建筑工人和工程項目管理者為主體的動態激勵機制下建筑工人不安全行為演化博弈模型,探究雙方關注的利益焦點、策略選擇條件和行為演變過程,并運用系統動力學(System Dynamics,SD)仿真工具對該博弈模型進行了仿真模擬,進一步分析關鍵參數變化對建筑工人不安全行為的影響,進而依據仿真結果,提出控制建筑工人不安全行為的對策與建議。
根據建筑工程項目實際的安全管理情況,本文對構建的動態激勵機制下的建筑工人不安全行為演化博弈模型做出如下假設:
假設1:將博弈主體分為建筑工人和工程項目管理者,且均表現為有限理性。
假設2:不安全行為指員工在生產過程中,違反安全生產制度、安全作業辦法、生產技術規定等具有風險的行為[17]。本文認為建筑工人不安全行為是指由建筑工人做出的違反安全制度和安全規范或可能引發建筑安全事故的行為。
假設3:建筑工人在實際工作中面臨兩種選擇:“安全行為、不安全行為”;而工程項目管理者作為對建筑工人的管理者,在實施激勵機制時面臨兩種選擇:“負向激勵機制、正向激勵機制”。
假設4:工程項目管理者采用負向激勵機制時,如果建筑工人沒有發生不安全行為,則獲得正常收益,若建筑工人發生了不安全行為,則給予一定懲罰(包括經濟懲罰、降薪、批評教育);工程項目管理者采用正向激勵機制時,如果建筑工人沒有發生不安全行為,則獲得正常收益、安全獎勵(包括經濟獎勵、加薪、通報表揚、稱號),若建筑工人發生了不安全行為,則不可獲得安全獎勵。
基于上述假設,模型的具體參數如下:R1表示建筑工人采取安全行為時的工資收益值;R2表示建筑工人采取安全行為時工程項目的收益值;R3表示建筑工人采取不安全行為時的工資收益值;R4表示建筑工人采取不安全行為時工程項目的收益值;h表示因建筑工人不安全行為造成工程項目的損失值;B1表示工程項目管理者采用負向激勵機制時對建筑工人不安全行為的懲罰金;B2表示工程項目管理者采用正向激勵機制時對建筑工人安全行為的安全獎勵;p為建筑工人做出安全行為的概率;1-p為建筑工人做出不安全行為的概率;q為工程項目管理者采取負向激勵機制的概率;1-q為工程項目管理者采取正向激勵機制的概率。結合建筑工人不同行為發生的概率,可以得到建筑工人和工程項目管理者相應的收益矩陣,見表1。

表1 建筑工人和工程項目管理者的收益矩陣
根據演化博弈的復制動態方程,按下面公式可求得建筑工人“安全行為”和“不安全行為”的期望收益SMN和SMO以及平均期望收益SM:
SMN=qR1+(1-q)(R1+B2)
SMO=q(R3-B1)+(1-q)(R3-B2)
(1)
SM=p×SMN+(1-p)×SMO
同理,按下面公式可求得工程項目管理者采取“負向激勵機制”和“正向激勵機制”的期望收益TWR和TWS以及平均價值感知TW:
TWR=pR2+(1-p)(R4+B1-h)
TWS=p(R2-B2)+(1-p)(R4+B2-h)
(2)
TW=q×TWR+(1-q)×TWS
在演化博弈進程中,某種策略的平均期望收益越高,建筑工人模仿和學習該策略的次數就越多。假設某一時刻建筑工人采取安全行為策略的概率為p,根據演化博弈理論,建筑工人下一時刻選擇安全行為策略的概率變化率與現在時刻的安全行為策略概率、安全行為策略的平均期望收益的差值成正比。根據公式(1),可得建筑工人采取安全行為策略的復制動態方程式為
(3)
同理,可得工程項目管理者采取負向激勵機制策略的復制動態方程式為
(4)
通過上述均衡點證明了建筑工人不安全行為發生的概率與建筑工人做出安全行為時的收益R1、不安全行為時的收益R3、不安全行為時的懲罰金B1、安全行為時的安全獎勵B2等有關。該博弈模型存在5個均衡點,但以現有的條件并不能確定均衡點的穩定性。因此,本文將利用系統動力學仿真工具,構建動態激勵機制下建筑工人不安全行為演化博弈SD模型,并從參數變化、時間推移等角度[18]分析博弈雙方行為的演變過程。
王永剛等[19]所構建的民航安全監管演化博弈SD模型相對于其他獎懲類演化博弈SD模型[20-21],其結構更為簡單,運用少量的中間變量即可演示出研究對象的變化情況,具有極強的可借鑒性。故本文以該演化博弈SD模型為基礎,構建了以建筑工人和工程項目管理者為主體的動態激勵機制建筑工人不安全行為演化博弈的SD模型。
由于應用場景不同,本文對王永剛等所構建的演化博弈SD模型進行了一定的修正。本文構建的動態激勵機制下建筑工人不安全行為演化博弈的SD模型由4個水平變量、2個速率變量和12個輔助變量構成。其中,建筑工人做出“安全行為”的概率和做出“不安全行為”的概率、工程項目管理者采取“負向激勵機制”的概率和“正向激勵機制”的概率分別用4個水平變量來表示;建筑工人不安全行為的概率變化率和工程項目管理者采用不同激勵機制的概率變化率分別用2個速率變量來表示。該模型的流圖見圖1。

圖1 動態激勵機制下建筑工人不安全行為演化 博弈的SD模型Fig.1 SD model of the evolution game of construction workers’ unsafe behaviors based on dynamic incentive mechanism
根據文獻數據并結合工程項目實際情況對模型變量賦值,建筑工人不安全行為的懲罰金和安全行為的安全獎勵分別為B1=7、B2=1,由于建筑工人不安全行為的工資收益值大于安全行為的工資收益值,設R1=1、R3=4,其余參數初始值的設置則是為了保證行為選擇概率能夠保持相對穩定所進行的隨機賦值,這將利于改變其中任何一個參數,能有效觀察行為選擇概率的變化,設置的初始參數如下:INITIAL TIME=0,FINAL TIME=200,TIME STEP=1,時間單位為周,R2=5,R4=6,h=2。其中,外部變量分別對應表1收益矩陣中的7個變量取值。
結合上述分析,采用軟件Vensim Ple對動態激勵機制下建筑工人不安全行為演化博弈的SD模型進行了仿真模擬。SD模型中流率公式及其涉及到的變量根據前面分析得到的變量之間的關系和公式(1)~(4)確定。其中,SD模型中的主要變量(以建筑工人模塊為例)有建筑工人做出不安全行為的概率(NSB)、建筑工人做出安全行為的概率(SB)、行為變化率(BV)、安全行為與不安全行為期望收益的差異值(MP)、不安全行為期望收益(NSBI)、安全行為期望收益(SBI)、工程項目管理者采用正向激勵機制的概率(PI)、工程項目管理者采用負向激勵機制的概率(NI)。SD模型中主要變量的方程如下:
NSB=INTEG(BV,initial)
SB=INTEG(-1×BV,initial)
BV=NSB×SB×MP
NSBI=PI×(R3-B2)+NI×(R3-B1)
SBI=PI×(R1+B2)+NI×R1
將博弈模型的納什均衡代入上述SD模型中,以純策略(1,0)和混合動態策略(0.5,0.5)為例進行仿真模擬。當采用純策略時,純策略(1,0)的演化博弈過程仿真模擬結果,見圖2。

圖2 純策略(1,0)的演化博弈過程仿真模擬Fig.2 Simulation of evolution game process of pure strategy(1,0)
由圖2可見,當工程項目管理者100%采用正向激勵機制,而建筑工人100%做出安全行為,雙方達到穩定狀態。
為了驗證純策略的穩定性,假定純策略中出現新的策略(0.99,0.01),分析其演化博弈過程,見圖3。

圖3 純策略(0.99,0.01)的演化博弈過程仿真模擬Fig.3 Simulation of evolution game process of pure strategy(0.99,0.01)
由圖3可見,當工程項目管理者采用正向激勵機制時,建筑工人做出不安全行為的概率開始只有1%,但隨著時間的推移,建筑工人做出不安全行為的概率越來越高,說明其通過實踐發現當工程項目管理者采用正向激勵機制時實施不安全行為帶來的收益更多,實踐和模仿該行為的次數逐漸增多,最終建筑工人都做出不安全行為。通過分析可知,上述純策略存在路徑依賴現象,表明純策略均衡點是不穩定的,不存在進化穩定策略。
當采用混合動態策略時,混合動態策略的演化博弈過程仿真模擬結果見圖4。

圖4 混合動態策略的演化博弈過程仿真模擬Fig.4 Simulation of evolution game process of mixed dynamic strategy
由圖4可見,其仿真曲線是以p=0.5為中心振蕩發展,表明工程項目管理者采用動態激勵機制與建筑工人不安全行為的博弈過程是不斷循環進化的。以初始情況為建筑工人做出安全行為、工程項目管理者采用正向激勵機制為例,工程項目管理者采用正向激勵機的目的在于以獎勵的方式來促使建筑工人做出安全行為,但當建筑工人做出安全行為時,隨著時間的推移,工程項目所需付出的成本也在增加,致使其利潤降低,故工程項目管理者會逐漸調整為負向激勵機制;由于建筑工人在負向激勵機制下沒有相應的安全獎勵,且當其不安全行為的收益大于安全行為的收益時,建筑工人開始做出不安全行為;當建筑工人做出不安全行為造成工程項目損失時,工程項目管理者會逐漸調整至正向激勵機制,以此鼓勵建筑工人做出安全行為;因做出不安全行為所扣除安全獎勵的緣故,建筑工人做出不安全行為的收益要明顯小于安全行為的收益,建筑工人會逐步做出安全行為;此時,雙方又回到原始出發點,如此循環前述過程。上述仿真模擬結果證明:混合動態策略的均衡點也是不穩定的,不存在進化穩定策略。
由上述分析可知,博弈過程不存在進化穩定策略,建筑工人的不安全行為和工程項目管理者采用的激勵機制呈現出循環狀態,這既不利于建筑工人不安全行為的控制,也不利于建筑企業進行安全管理。為了減少博弈過程的波動性或促使其達到某種穩定狀態,使建筑工人在實際工作中主動做出安全行為,可通過調節關鍵參數,分析建筑工人不安全行為的演變趨勢,進而提出控制建筑工人不安全行為的建議。
不安全行為帶來的“高工資收益”是建筑工人做出不安全行為的主要原因。而當靜態懲罰策略無法使演化博弈過程達到均衡狀態時,可采用動態懲罰策略使演化博弈趨勢逐漸達到收斂[22]。因此,將建筑工人不安全行為的懲罰金B1由靜態懲罰機制中的固定常數變為與不安全行為收益相關的懲罰函數:g(R3)=(R3-R1)K(其中K表示懲罰系數),此時將懲罰視為動態懲罰策略。本文對工程項目管理者采用動態懲罰機制下建筑工人做出安全行為的概率進行了仿真模擬,其結果見圖5。

圖5 與不安全行為收益相關的動態懲罰策略的演化 博弈過程仿真模擬Fig.5 Simulation of evolution game process of dynamic penalty strategy related to unsafe behavior income
由圖5可見,隨著時間的推移,工程項目管理者采用動態懲罰機制下建筑工人做出安全行為的概率曲線演化趨勢呈逐漸收斂狀態,最終穩定到均衡點,這說明當不安全行為收益增大時,工程項目管理者對于建筑工人實施的懲罰力度也加大,建筑工人在做出相應行為時會將不安全行為收益與懲罰后的期望收益進行對比,選擇期望收益較高的行為。因此,工程項目管理者可以采取動態懲罰策略,通過對K值的調節,調整與建筑工人不安全行為收益相匹配的懲罰力度,使動態激勵機制演化博弈過程達到均衡狀態。
目前國內外關于懲罰力度對于不安全行為概率的影響研究已有很多。如王永剛等[19]認為在短期內隨著懲罰力度的上升,博弈方違規概率會快速下降;張攀等[20]認為從長期來看,加大懲罰力度會使博弈過程提前達到新的平衡。為了驗證提高懲罰力度對建筑工人不安全行為的影響,本文將懲罰金B1的取值從3變為6,仿真模擬了工程項目管理者提高懲罰力度后建筑工人做出安全行為的概率曲線,見圖6。

圖6 懲罰力度變化的演化博弈過程仿真模擬Fig.6 Simulation of evolution game process of the variation of penalty intensity
由圖6可見,工程項目管理者提高對建筑工人不安全行為的懲罰力度后,建筑工人做出安全行為的概率得到了提升,但到達較高程度后逐漸趨于穩定,即動態激勵機制下演化博弈過程達到均衡狀態,這說明工程項目管理者實施較高懲罰力度降低了建筑工人不安全行為的收益,建筑工人考慮到做出不安全行為的收益要小于安全行為的收益,在實際工作中會傾向做出安全行為,從而降低了不安全行為發生的概率。
已有研究表明,提高安全獎勵額度也可以使演化博弈過程加快達到新的均衡狀態[20]。本文將安全獎勵額度B2的取值從2變為4,仿真模擬了在懲罰力度不變的情況下建筑工人做出安全行為的概率曲線,見圖7。

圖7 安全獎勵額度變化的演化博弈過程仿真模擬Fig.7 Simulation of evolution game process of the variation of security reward amount
實施安全施工作業是建筑工人的義務和責任,不對建筑工人進行安全獎勵(即采取正向激勵機制)是建設項目管理者的傳統做法。但由圖7可見,當安全獎勵額度增大時,建筑工人做出安全行為的概率逐漸增大,最終穩定到新的均衡,這說明工程項目管理者在制定激勵機制時,應充分考慮安全獎勵因素對建筑工人不安全行為的影響,綜合運用獎懲措施,提高對未發生不安全行為的建筑工人給予一定的安全獎勵額度。
通過對比圖5、圖6和圖7可見,上述三種措施均可降低建筑工人不安全行為的概率,但三者達到的均衡不同,而控制建筑工人不安全行為的有效措施依次為:加大對建筑工人不安全行為的懲罰力度、提高安全獎勵的額度、采取與不安全行為收益相關的動態懲罰策略。由此可以看出,建筑工人對于懲罰參數的變化更為敏感。
“心理賬戶理論”認為,人們會無意識地把財富劃歸于不同的心理賬戶進行管理,不同的心理賬戶有不同的“記賬方式”,因此會導致非理性決策行為的發生。建筑工人依照獲得感知或失去感知,將心理賬戶分為效價賬戶和成本賬戶,不同的心理賬戶有不同的感知參照點,即建筑工人在面對回報時,如果回報值大于回報參照點,其相對回報便是正值,即獲得相對收益感知;如果回報值小于回報參照點,其相對回報便是負值,即獲得相對損失感知。同理,成本賬戶也是如此。建筑工人往往希望通過低付出獲得高回報,所以易形成高效價參照點和低成本參照點。
一方面,基于效價賬戶視角,安全行為效價與不安全行為效價相差無幾,效價賬戶主要來源是工資而不是安全獎勵,當效價參照點較高時,建筑工人會對效價差異感知微弱,不會因為低額的安全獎勵改變自己的策略選擇,說明高效價參照點不利于建筑工人選擇安全行為策略。另一方面,基于成本賬戶視角,安全行為成本與不安全行為成本相差較大,當采取安全行為時的工資收益小于采取不安全行為時的工資收益,建筑工人通常將采取不安全行為時獲得的工資收益作為正常收益,而當建筑工人獲得安全行為的工資收益時,其會產生成本損失感知,一般情況下建筑工人傾向于選擇不安全行為策略,由于建筑工人對成本差異感知強烈,說明低成本參照點不利于建筑工人選擇安全行為策略。因此,可以考慮通過改變建筑工人收益結構,依托勞務合同條款設置,在總收益不變的情況下,提高安全獎勵占總收益的比例,若在施工過程中發生不安全行為,則扣除相應的安全獎勵,以此降低效價賬戶的參照點;同時,降低工資收益占總收益的比例,提高成本賬戶的參照點。由此將建筑工人的策略選擇控制在低效價參照點和高成本參照點區域,引導其選擇安全行為策略。
建筑工人的不安全行為與工程項目管理者所采用的激勵機制的博弈演化過程是動態變化的,而現實中多數工程項目管理者所采用的激勵機制卻是靜態的,這不但不能滿足博弈雙方期望收益的最大化原則,同時也難以實現激勵機制的預期效果。本文從博弈雙方利益動機出發,借助演化博弈理論以及系統動力學(SD)理論構建了動態激勵機制下建筑工人不安全行為演化博弈的SD模型,并利用Vensim Ple軟件對純策略、混合動態策略以及關鍵參數變化進行了仿真模擬,得出以下結論:
(1) 建筑工人不安全行為與工程項目管理者采用不同激勵機制的博弈過程是不斷循環、進化的,如果工程項目管理者對建筑工人實施一成不變的激勵機制,建筑工人可能通過學習找到政策漏洞,形成“上有政策、下有對策”的情形,使激勵機制難以達到預期的目的。因此,對于工程項目管理者來說,應針對建筑工人不同的行為策略,及時調整相應策略,尋找既能促使建筑工人采取安全行為,又能盡可能地減少管理成本支出的策略,以減少建筑工人不安全行為發生的概率,促進工程項目的安全生產。
(2) 當采用混合動態策略時,仿真曲線呈現圍繞中心振蕩的波動性,說明在該條件下建筑工人的行為選擇不會趨于某一種策略;提高安全獎勵的額度、加大對建筑工人不安全行為的懲罰力度、采用與不安全行為收益相關的動態懲罰策略均可有效地抑制仿真曲線的波動性,理論上可以降低建筑工人不安全行為的概率。
(3) 依據心理賬戶理論,加大對建筑工人不安全行為的懲罰力度能更有效地控制建筑工人的不安全行為;同時,通過改變建筑工人的收益結構,可將建筑工人的策略選擇控制在低效價參照點和高成本參照點區域,引導其選擇安全行為策略。