時至今日,采煤在我國仍屬高危行業,稍微麻痹或松懈就可能導致安全事故的發生。盡管我國中央和地方政府相繼出臺了一系列的相關法規和規定來加強煤礦安全生產,但是在具體的實施執行和監察監督中往往效果很不理想,常常是安全培訓和監察流于形式,安全標準和程序執行不嚴格。在這種情況下,如何提高和加強監察監督力度,有效執行相關安全法規和標準就成為一個值得研討的問題。
由于在安全監察部門和各級煤礦之間,在各級煤礦安全管理人員和生產操作人員之間存在著一種博弈關系,所以并不是簡單地加強對安全監察部門的賞罰或是加大對事故責任方的懲處,就能立竿見影地提高監察監督效果,防止礦難事故發生。在本文中“監督者”可以認為是各級煤礦安全監察機構及其相關領導,相對應的“被監督者”就是煤礦主要負責人、安全管理人員或生產操作人員。
假設只考慮博弈雙方在監督和被監督的過程中獲得的效用,而不考慮雙方的物質收益和損失。對于被監督者,如果被監督者犯錯而沒有被發現,則被監督者得益,產生正效用假定為V(V>0);如果被監督者犯錯被查處,產生負效用-P(P>0);如果被監督者不犯錯則效用為0。對于監督者,如果不采用監督手段且被監督一方沒有犯錯,則會產生正效用,假定為S(S>0);如果不采用監督手段而被監督者犯錯,則會產生負效用-D(D>0);如果實施有效監督,監督者則得益為0。得益矩陣如圖一:

一、圖一表明,這是一個非對稱的非零和博弈,是一個沒有可被雙方接受的納什均衡的混合策略問題,即博弈雙方在有限的可選策略中以概率分布隨機的選擇策略形成一個混合策略。在此,博弈雙方選擇犯錯或監督的策略時,是由雙方的期望收益所決定的,一方的期望收益將直接影響博弈對手策略的選擇,一旦期望發生變化,所選擇的策略也將發生變化。
二、我們分析被監督者“犯錯與不犯錯”以及監督者“監督與不監督”的最佳混合策略選擇。圖二是被監督者的混合策略圖,橫軸P表示被監督者選擇“犯錯”策略的概率,分布在0到1之間,“不犯錯”的概率則等于1-P??v軸則反映對應于被監督者選擇“犯錯”策略的各個不同概率相對應的監督者選擇“不監督”策略的期望得益;圖中從S到-D連線的縱坐標就是在橫坐標對應的被監督者“犯錯”概率下,監督者選擇“不監督”的期望得益為S(1-P)+(-D)P。

如圖二所示,顯然該線與橫軸的交點就是被監督者選擇“犯錯”概率的最佳水平。如果被監督者“犯錯”的概率大于P*時,此時監督者“不監督”的期望得益小于0,因此他肯定選擇“監督”,而被監督者將終止犯錯行為;相反,當被監督者選擇“犯錯”的概率小于P*時,監督者“不監督”的期望收益大于0。因此,監督者選擇“不監督”是合算的,即使被監督者犯錯頻率更高一些,只要不大于P*,監督者都會選擇“不監督”。因此,被監督者不會害怕被抓住,被監督者在保證不被抓住的前提下,“犯錯”的概率越大收獲就越大,因此他會使犯錯的概率趨向于p*。均衡點是被監督者以概率P*和1-P*分別選擇“犯錯”和“不犯錯”,此時監督者“監督”和“不監督”的期望得益都等于0。
同理,對被監督者的分析如圖三所示。被監督者的期望得益也決定了監督者的“不監督”的概率最佳水平為P*。當pt=P*,P=P*時,博弈雙方實現均衡。
三、激勵悖論和結論
按照常理,在這個博弈模型中,為了減少犯錯事件的發生往往出臺一些新的規定和約束,最常見的是加大對已發現的犯錯事件的處罰力度,即增大了P,在圖三中相當于-P向下移動到-P′,如果監督者的混合策略中的概率不變,此時被監督者“犯錯”的期望得益變為負值,因此,被監督者會停止犯錯。但是長期中,被監督者減少犯錯會使監督者更多地選擇“不監督”,最終監督者會將“不監督”的概率提高到P*·,達到新的均衡,而此時被監督者“犯錯”的期望得益又恢復到0,他會重新選擇混合策略。由于被監督者的混合策略概率分布是由圖三決定的,并不受P值影響,因此加重對犯錯的懲罰在長期中并不能抑制犯錯,最多只能抑制短期的犯錯發生率,它的作用是使得監督者可以更多的偷懶,對防范與抑制犯錯現象并沒有多大的幫助。
現在加重對失職監督者的處罰,意味著圖二中的-D增大到-D′。此時,如果被監督者犯錯的概率不變,那么監督者“不監督”的期望得益變為負值,因此,監督者肯定會選擇“監督”策略。但是長期中,監督者的“監督”會使被監督者更多地選擇“不犯錯”,最終被監督者會將“犯錯”的概率下降到Pt*·,達到新的均衡,而此時監督者“監督”的期望得益又恢復到0,他會重新選擇混合策略。這就是說,加重對失職監督者的處罰在短期中的效果是使監督者真正盡職,但在長期中并不能使監督者更盡職,監督者的勤勉程度不是由D決定的。加重處罰監督者失職在長期中的真正作用,恰恰是會降低被監督者選擇“犯錯”的概率。
通過監督者和被監督者的博弈分析,可以看出政策的制定和執行是一個政策主體與政策客體之間的博弈過程,政策的實施效果是政策主體與政策客體博弈的結果,一項政策最終能否達到預期目標取決于這個博弈過程各方力量的大小,因此出臺政策時應充分考慮到政策客體的實際情況,降低政策失真的頻率和幅度,提高政策的實施效果。針對我國目前礦難高發的態勢和安全監察問題,決策部門在評估是加重懲罰違法礦難企業還是加重懲罰失職監察部門或人員等政策手段時應有一個比較清晰而合理的選擇。本文認為應采取以下對策。
一、加大對安全監察失職的懲罰力度
我們應該強化安監部門對各級煤炭生產單位的安全培訓,安全考核,嚴把安全生產許可證的發放,對于不嚴格執行安監條例的安監單位和個人進行有力懲處;對于因失職而造成的礦難事故的責任單位和責任人,要嚴格執行行政責任認責制,情況嚴重的交予司法部門處理。首先,在安全監察管理部門中明確責任主體,管人與治事相結合。某一職級的領導干部,其工作直接對哪級負責,就應當由哪級管理,對每一個人的行為有明確負責的責任人。將安全監察監督的內容分解為若干具體工作,該干什么、怎么干、由誰負責并承擔什么樣的責任、當事人承擔什么責任,都應明確。出了問題對號入座進行處理,誰主管,誰負責,一級抓一級,層層抓落實,不搞“下不為例”、“集體負責”,增強領導的責任感和壓力感,從而使領導干部嚴肅地對待責任制,履行應盡職責,不但嚴格要求自己,而且嚴格要求身邊工作人員和管轄范圍內的領導。其次,是將責任追究制度與考核工作相結合,把考核結果作為追究的依據;與案件查處相結合,使違紀責任與領導責任在追究上一并到位;三是要與糾風、執法監察、廉潔自律等項工作的開展相結合,通過責任制來推動各方面工作的開展;四是要與平時的監督檢查相結合,通過責任追究加大平時監察監督的力度,使各項安全生產規定落到實處。
二、形成獎罰分明的環境氛圍
對那些發生礦難的煤礦企業加大處罰力度,譬如媒體曝光、大幅度提升礦難賠償數額、加倍罰款、強制停產整頓,勒令關閉等,這樣在短期能抑制違規違紀的礦難事故發生率,同時,對于那些安全防護和安全生產工作搞得好的企業應給予獎勵,譬如:媒體表揚、物質獎勵、政府提供各種低息貸款或提供技改資金等,通過正向激勵和反向激勵,形成獎懲分明的環境氛圍,促使各個煤炭生產單位加強安全生產工作,真正做到“安全第一”。
在目前安全監察制度存在許多不完善情況下,政府主管部門應不斷完善安全生產法律法規體系,加強安監人員和安全生產管理人員素質培養,在自身體制內形成一套科學合理的監督機制和激勵機制。
?。ㄗ髡邌挝唬何髂鲜痛髮W工商管理學院)