作者簡介:舒曉康(1987— ),男,漢族,四川渠縣人,經濟師。主要研究方向:企業管理。
摘 要:本文以博弈論為分析視角,通過構建“缺勤——點名”博弈模型,試圖分析企業內部培訓中的缺勤現象,借由求解模型進一步揭示“激勵的悖論”是參訓者缺勤的主要原因,并探討解決問題的可能方法。
關鍵詞:企業內訓;“缺勤——點名”博弈模型;激勵的悖論
在現代企業中,對員工的教育培訓不可或缺。企業內部自主開展的培訓,由于其有別于學校教育的特點,更為普遍地存在缺勤問題。缺勤不僅影響課堂效果,浪費大量資源,困擾著主辦方同時也影響員工心態。筆者從事企業管理工作,也有主講內訓課程經驗,發現參訓員工缺勤原因眾多,但從博弈論視角看,內訓評價機制存在“激勵的悖論”是員工“從容”甚至“瘋狂”缺勤的主要原因。所謂“激勵的悖論”,是指政策、制度的目標與其執行效果出現不一致的現象。鑒于此,單純強化簽到點名難以解決問題。
一、“缺勤——點名”模型建立
從實踐中看,主辦方或內訓師為保證培訓質量,考察出勤率的方法有:紙質簽到、手機簽到、隨堂拍照、隨機點名等;參訓者出于工學矛盾等原因缺勤,又想拿到學分完成任務避免懲罰,逃避考勤的花樣有:請人代簽、轉交手機、電召即回、替人應答等。
為方便研究,本文簡化情形,用典型行為代表博弈雙方策略,僅以“缺勤——點名”建立模型。模型由諾貝爾經濟學獎得主、博弈論專家塞爾頓原創,他1996年在上海演講時提出“警察——小偷”博弈模型。
在“缺勤——點名”博弈模型中,博弈方有兩個:內訓師和參訓者。內訓師針對參訓者缺勤的策略集是“點名,不點名”,后者相應形成“缺勤,不缺勤”的策略集。
假設內訓師點名,參訓者不缺勤。對內訓師而言,保證課堂出勤率并完成教學內容是其義務,參訓者來上課,若不考慮心理上的成就與滿足,內訓師無其他實際效用,因此得益記為0;對參訓者而言,若身在課堂心在外,也近似于沒有得益或損失,得益同樣記為0。
假設內訓師點名,參訓者缺勤。參訓者由此受到一定處罰,比如該門課程學分為零,定期內部通報批評,甚至影響部門績效,那么缺勤對參訓者而言具有負效用,記為得益-M;內訓師效用不變,得益記為0。
假設內訓師不點名,參訓者不缺勤。內訓師認真履行了自身職責獲取一定課酬,參訓者按要求完成培訓任務,不考慮精神收獲的前提下,兩者都無特別收益或損失。但值得加以注意的是,由于內訓課程時間緊湊,參訓者人數眾多,內訓師如果每節課都要點名時間成本過大,也勢必影響其教學計劃進度,擾亂其上課心情。因此如果內訓師不點名,參訓者不缺勤,對于內訓師來說省時省力,因此有一定正效用。所以在這種策略組合下,內訓師得益記為N;參訓者得益記為0。
假設內訓師不點名,參訓者缺勤。參訓者可以擠出時間做自己的事,比如完成本職工作避免加班,獲得一定正效用,得益記為Z;而因不點名參訓者沒來上課,則內訓師存在一定程度的“失職”行為,可能被理解成缺乏應有責任心,其教學效果和教學評價可能受到一定影響,存在一定負效用,得益記為-A。
據以上分析,得益矩陣如下表1:
通過劃線法、箭頭法消除嚴格下策,顯然無法得到“缺勤——點名”模型的納什均衡解。這是一個嚴格競爭博弈,內訓師與參訓者作為博弈雙方,只有競爭而沒有合作的可能:若內訓師的策略是點名,則參訓者的策略是不缺勤;若參訓者不缺勤,則內訓師不點名;若內訓師不點名,則參訓者的策略是缺勤;若參訓者缺勤,內訓師又會點名,循環往復……內訓師與參訓者永遠是貓和老鼠的關系。當然,在這一模型中,內訓師和參訓者事先不會通氣,即不能讓對方預先知道自己策略,必須隨機選擇。這便要引入混合策略分析法,在無法找到純策略納什均衡的情形下,至少可在此模型中找到一個混合策略納什均衡的解。
二、模型的幾何法(Geometic Method)求解
首先討論參訓者在缺勤或不缺勤兩種策略選擇的概率。
如圖1所示,橫軸表示參訓者缺勤概率Pt,它分布在0到1之間,參訓者不缺勤的概率則為1-Pt??v軸則反映對應于參訓者缺勤的不同概率,內訓師選擇不點名策略所獲得期望值。設內訓師得益為Ut,則Ut與Pt之間存在如下線性關系:
圖1中從N到-A的連線即是這種線性關系反映,表示在橫坐標對應的參訓者缺勤概率下,內訓師選擇不點名的期望得益。不難看出,該線與橫軸的交點Pt1就是參訓者缺勤的最佳水平,參訓者選擇不缺勤的最佳概率是1-Pt1。首先,從N到-A連線上每一點的縱坐標就是在參訓者選擇該點對應橫坐標表示的缺勤概率時,內訓師選擇不點名的期望得益N-(N+A)*Pt。假設參訓者缺勤的概率大于Pt1,此時,內訓師不點名的期望得益必定小于0,因此出于理性肯定選擇點名,而參訓者缺勤一次就要被“逮到”一次,完全沒有正效用可賺。因此對參訓者來說,選擇大于Pt1的概率缺勤不可取。反之,若參訓者缺勤概率小于Pt1,則內訓師期望得益大于0,內訓師每一次上課都不點名就是合理的,即使此時參訓者提高一些缺勤概率,只要不大于Pt1,內訓師就不會選擇點名,因此參訓者就不用擔心被“逮到”。因為參訓者在保證不被“逮到”前提下,缺勤概率越大收獲就越大,因此他們會使缺勤概率趨向于Pt1,均衡點就是參訓者分別以Pt1的概率選擇缺勤,以1-Pt1的概率不缺勤。此時內訓師點名與不點名期望得益都為0,選擇純策略點名與不點名或混合策略的期望得益都是相同的。不過事實上,為不讓參訓者有機可乘,內訓師也必須選擇自己特定概率分布的混合策略。
內訓師選擇點名與不點名混合策略概率分布,也可以用同樣方法來確定。得出的結論就是圖2中Pd1和1-Pd1是內訓師最佳概率策略選擇。
三、由模型得到的啟示
本文“缺勤——點名”模型之間的混合策略博弈,實質上揭示了“激勵的悖論”現象。