劉 杰,周子祺,胡澤民
(桂林電子科技大學 商學院,廣西 桂林 541004)
經濟管理研究
員工團隊合作激勵關鍵問題研究
——基于博弈方法
劉 杰,周子祺,胡澤民
(桂林電子科技大學 商學院,廣西 桂林 541004)
采用博弈論的方法,根據學習速度較慢的有限理性博弈方的動態策略調整及其穩定性,建立關于團隊成員和企業的得益矩陣,將二人博弈的過程進行了推演,并根據復制動態相位圖分析員工在團隊合作過程不同階段采取的對策,求得博弈的ESS(進化穩定策略)。在博弈各方都是有限理性條件下,團隊內部員工博弈的進化穩定策略是員工都采取努力工作策略,員工與企業博弈的進化穩定策略是員工采用偷懶工作策略,相應的企業采取不認可的策略。
進化穩定策略;激勵與約束機制;授權;博弈論
隨著市場競爭的日趨激烈,由于團隊具有靈活、適應性強、效率高等特點,企業越來越熱衷于組建團隊。在知識經濟時代,單打獨斗的方式已經成為過去,競爭已不再是單獨的個體之間的斗爭,而是團隊與團隊、組織與組織的競爭。團隊合作是一種為達到既定目標所顯現出來的自愿合作和協同努力的精神。通過組建團隊,可以建立人際互賴關系,得到專業人員的幫助,彌補自身的不足。雖然團隊模式帶給企業的優勢很多,但是團隊是把雙刃劍,團隊激勵約束機制不合理則會造成嚴重的問題[1]。繼“北京現代城銷售人員集體跳槽事件”“邯鄲7.18大跳槽事件”之后,新聞又曝出“廣東格力電器公司經理及10余名業務員集體出走,加盟匯豐空調器廠銷售公司,并從格力電器廠訂貨會拉走客戶近300人”,“北京服裝進出口股份有限公司一個科室全員離職,致使該公司損失2 000萬美元的出口量”等企業團隊集體流失的事件。這些事件引發了人們對當前團隊激勵約束機制問題的質疑與思考。
根據央視新聞披露,2015年11月26日晚間,奧馬電器公司高管層集體離職。這次辭職的有14位奧馬電器的董事、監事、高級管理人員。企業內部團隊的突然集體離職往往會讓其他員工人心惶惶,造成公司經營效率的下降。許多企業近幾年也都遇到過這樣的事情,如方正集團的助理總裁攜30位方正科技部門的技術骨干加盟海信;TCL手機事業部的中層集體跳槽到長虹,而且其總裁萬明堅也如大家預料的那樣,加盟了長虹旗下的國虹通訊。其中導致企業內部團隊集體跳槽的主要原因是員工對公司的人事任用和獎懲制度感到不公平,得不到公司的認可和重用。
公平合理的團隊激勵約束機制的建立可以增進員工與企業的互信,提高員工對企業的認同感和歸屬感,從而降低企業離職率[2]。但是企業即便有公平的員工管理制度,也難免會出現部分員工依靠“特殊關系”,“弄虛作假”等不正當渠道獲得不當的收益,因此,有效的激勵約束機制對于企業公平來說至關重要。另外,對員工團隊激勵約束問題的研究可以為企業建立合理的人力資源管理機制,促進組織公平,降低企業離職率提供理論基礎。
國內外許多學者在這方面進行了有益的探索,但是大部分文獻都是從完全理性的經濟人角度進行研究,鮮有文獻在有限理性條件下,通過復制動態下的團隊合作經濟組織的主體——員工自身的個體行為特征來進行分析。
學者曾晨、呂學靜(2003)根據雇主與雇員的委托代理關系,通過分析雇員與雇員、雇主和雇員之間的博弈,建立基本的三階段博弈末位淘汰模型。通過對不同階段的博弈分析,驗證了末位淘汰制各階段的納什均衡解,得到一個基于博弈論的負激勵方法;陳永宇(2009)通過對智豬博弈模型的改進,從外部激勵的角度考慮激勵策略,建立激勵與約束并存的機制,同時提出團隊成員可以通過建立契約的方式達到團隊成員之間的利益均衡,使非合作博弈變成合作博弈。張娓娓(2011)通過對博弈論的研究,根據納什均衡理論,結合P2P網絡中的實際情況,分析P2P網絡中的納什均衡,并通過納什均衡中的伯川德雙寡頭模型提出了RDEC算法,同時在仿真平臺的基礎上進行算法的仿真,檢驗算法的正確性和有效性,實現了激勵結點以及最大化系統效用的目標;浙江大學的孔志強、邢以群(2003)提出企業或核心員工的博弈過程就是對合適的最優契約內容及形式進行選擇的過程。在博弈過程中,企業和核心員工都是作出決策的主體,都有選擇的權利并對選擇結果的執行負責。雙方可以在現有的契約類型進行自由選擇,并在選擇之后,雙方達成協議,以此為目標導向對核心員工實施激勵或者進行自我激勵,這樣會達到有效激勵的效果;國外一些學者早在18世紀就開始對博弈論進行研究,并逐漸提出一些關于團隊合作激勵問題的觀點。著名學者阿爾欽和德莫塞茨認為團隊工作存在的搭便車問題可以通過委托人來解決;霍姆斯特姆證明,如果放棄預算平衡約束,帕累托最優可以通過納什均衡達到;加特曼認為采取以牙還牙策略可以產生合作的結果[3-7]。
筆者試圖用博弈論的方法,針對團隊成員在合作過程中幾種工作行為進行研究,找出工作團隊在有限理性條件下復制動態的進化穩定策略,期望指導建立激勵約束機制,并據此提出相關決策建議。
在團隊工作中,員工無非是采取不合作的偷懶行為和合作的努力行為兩種表現。每個員工都具有追求自身成本最小,得益最大的理性,但這種理性是有限的。因為人類雖然具有分析和學習能力,特別是具有預見能力,但是人類存在理性局限,比如人類面對比較復雜的選擇問題時常常是憑本能直覺行為而不是根據優化分析、博弈分析決策和行為。因此,每個員工都會與團隊其他員工反復博弈,為了便于進行分析,可以將員工之間的博弈假設為兩人團隊的二人動態博弈。團隊成員為了盡可能使自己獲得大的收益和付出較低的成本,會在不合作的偷懶行為與合作的努力工作行為兩種對策中進行選擇[8]。團隊內部員工與員工博弈的同時也在與企業發生博弈,兩個博弈過程是緊密聯系的。員工往往會屬于某個團隊,但團隊不能脫離企業獨自存在,由此觀之,員工在采取有利于自身得益的對策后,必然與追求利潤的企業發生博弈。
(一)團隊內部員工與員工的博弈
通過團隊內部溝通,團隊成員的行動和信息是一致的(即完全信息動態博弈模型),且員工均知道相互之間努力和偷懶兩種情況下的支付,但在自身采取行動時并不知道對方是否采取努力工作的行動。

本文根據兩名員工兩種對策、四種狀態下工作的情況進行研究,對團隊成員之間的博弈行為進行分析,則團隊成員合作的得益矩陣如下。

博弈方二努力偷懶博弈方一努力Sf+βY(aH),Sf+βY(aH)Sf+βY(aH)+Y(aL)2,Sf+βY(aH)+Y(aL)2偷懶Sf+βY(aH)+Y(aL)2,Sf+βY(aH)+Y(aL)2Sf,Sf
圖1 員工與員工博弈矩陣



通過上述得益得到復制動態方程為


根據上述復制動態方程有
(1)
(2)



圖2 復制動態相位圖
(二)員工與企業的博弈
員工總希望以最小的付出獲得最大的報酬,企業總想以最低的成本獲得最高的收益,因此就形成了員工與企業之間的博弈[12]。通過以上團隊內部員工之間的博弈分析,在正常激勵機制條件下,員工都會按照企業任務要求努力工作以獲得最大的得益。因為在正常條件下,努力工作可以吸引領導的注意,有更大機會獲得企業的認可。但是努力工作對于員工來說并不總是好的“競爭策略”,因為努力工作對于員工來說也有很大的成本付出。首先,努力工作的員工要花費很大的時間、體力、精力成本,對其日常生活造成影響;其次,員工努力工作并不一定會獲得企業的認可。因為工作技能差的員工努力工作也不一定能有高的產出。除此之外,一些團隊內部存在任人唯親的現象,沒有特殊關系的員工即使努力工作也不能獲得職位晉升和獎勵。因此,努力工作并不總是能獲得企業的認可。該博弈矩陣如圖3所示,v是員工被企業認可而獲得的收益,R為員工努力工作并得到企業的認可,而給企業帶來的收益。-C2為員工雖然努力工作,但并沒有得到企業的認可而給企業帶來的成本。員工可能因為沒有得到企業的認可而降低工作積極性,甚至離職。-C3為員工偷懶工作并得到企業的認可,而給企業帶來的收益損失。企業對偷懶工作的員工進行獎勵,可能導致該員工繼續采取偷懶策略,甚至引起其他員工的效仿,導致員工工作士氣下降,影響企業產出。

企業認可認可員工努力Sf+v-C(aH),RSf-C(aH),-C2偷懶Sf+v-C(aL),-C3Sf,0
圖3 員工與企業博弈矩陣
根據圖3博弈矩陣可知,這個博弈的兩個博弈方既不是同時選擇,且策略選擇和得益情況也不對稱,因此是一個非對稱的兩人博弈。采取偷懶對策的員工在績效考核中,往往利用與上級的“特殊關系”或者“弄虛作假”來應付審核,從而使得企業無法真正觀測其實際績效產出。企業無法直接觀測到員工是采取努力對策還是偷懶對策,只能通過員工產出的指標來作出判斷,由此觀之,員工與企業之間的信息是不對稱的。現在實際上有兩個不同的博弈方群體,一個是員工方群體,另一個是企業方群體,每次博弈實際上都是前一個群體的一個成員與后一個群體的一個成員進行的。
研究的分析框架是,反復在兩個群體中各隨機抽取一個成員配對進行上述博弈,博弈方的學習和策略模仿局限在他們所在群體內部,策略調整的機制仍然是與兩人對稱博弈中相似的復制動態[13]。

u1e=y(Sf+v-C(aH))+(1-y)(Sf-C(aH)),
u1n=y(Sf+v-C(aL))+(1-y)Sf,

通過上述得益得到復制動態方程為

(3)
所以有F′(0)=yC(aL)-C(aH)<0,F′(1)=-[yC(aL)-C(aH)]>0,因此x*=0和x*=1是兩個穩定狀態,其中x*=0是ESS,即員工博弈群體全部選擇偷懶工作是進化穩定策略。
圖4中的兩個相位圖分別給出了上述兩種情況下x的動態趨勢及穩定性。

u2s=xR-(1-x)C3,
u2n=-xC2,

根據上述得益得到復制動態方程為

(4)



圖4 復制動態相位圖
進一步將上述兩個群體類型比例變化復制動態關系,在以兩個比例為坐標的坐標平面圖上表示出來,如圖5所示。根據圖6中反映的復制動態和穩定性,可知本博弈的進化穩定策略為x*=0和y*=0。這意味著有限理性條件下的博弈方通過長期反復博弈,學習和調整策略的結果是,員工最終會采取不合作的偷懶工作的策略,而企業會對員工的行為不認可,并有可能采取懲罰性措施,如削減獎勵,減少職位晉升機會,取消帶薪休假等。在這種情況下,員工不會努力工作,企業只能采取消極的否定態度處理勞務關系。這是一種雙輸的局面,對員工和企業雙方都沒有益處,其根本原因在于企業采用集權干預和約束給員工個體帶來的得益損失[14]。另外,團隊合作激勵約束機制可能存在的不公平,使得部分員工可以通過非正式渠道取得不當收益,從而導致團隊內部其他員工不合作的偷懶行為。

圖5 非對稱博弈兩群體復制動態的關系和穩定性
綜合上述分析,團隊內部員工與員工的博弈,在復制動態下的ESS(進化穩定策略)是所有員工都選擇合作的努力工作對策;員工與企業的博弈,在復制動態下的ESS(進化穩定策略)是員工采取不合作的偷懶策略,企業采取不認可策略。
企業應該通過授權、分權的方式給予企業內部團隊適當的自主權,以實現團隊的自我管理。根據彼得.德魯克(Peter Drucker)目標管理的思想,將企業的任務目標下發到團隊,然后再由團隊負責人根據團隊目標制定出分目標,下發到每位員工。企業按照團隊目標的實現情況實施獎懲,而不直接干預團隊內部事務,從而實現更為人性化的管理[15]。另外,企業應該公平的對努力工作的員工進行獎勵,對在工作中偷懶的員工予以適當的懲罰,使有才能的人能夠充分發揮自己的才能,缺乏必要工作技能的員工有機會進行相關學習,并運用的日常工作中去。企業應該擁有公平的規章制度,能夠一視同仁的對待企業內所有員工,防止某些員工因為裙帶關系或者其他特殊關系而獲得額外收益。



圖6 復制動態相位圖
(一)結論
團隊成員選擇何種工作行為不是單一的某一方的行為,而是所涉所有主體共同博弈的結果。團隊工作經常是一種有限理性條件下的復制動態博弈過程,從而,通過設計合理激勵與約束機制,并尋求復制動態條件下的博弈的最優ESS(進化穩定策略)是解決“搭便車”問題的可行辦法。本文建立了一個二人復制動態博弈模型,對團隊合作過程中成員之間的博弈以及員工與企業的博弈行為進行了研究,通過對反復博弈過程策略的調整,使得團隊內部員工都采取努力工作成為可信。通對調整員工與企業的博弈對策,經分析證明,在企業正常經營的條件下,團隊成員都選擇偷懶工作是復制動態博弈的進化穩定策略。由此觀之,團隊的自主管理模式比企業傳統的集權和等級鏈式的管理更為有效率,因此,企業應本著“以人為本”的思想,通過分權、授權,以分配任務目標的方式,間接參與團隊內部事務管理,充分激發員工的士氣,調動工作積極性。
(二)政策建議
現代社會組織與組織之間的競爭往往以團隊作為競爭單元方式出現,團隊成員之間的有效合作關乎到組織戰略目標的實現,任務的執行,盈利水平,核心競爭力的強度等密切相關。組織的成功與否主要取決于組織內部的核心團隊因素,所以,團隊成員的有效合作與組織的發展是密不可分的。因此,要激發團隊成員工作熱情,提高團隊工作效率,具體可以從以下幾個方面考慮:
1. 授權和分權于團隊。經分析證明團隊的自我管理比企業對員工的直接管理更有效,因此,企業應充分利用好團隊的積極帶動作用,給予團隊自由的發展空間和必要的自主權。當今的人力資源管理越來越人性化,傳統的集權和等級鏈式的管理越來越不符合潮流的發展,企業應順應時代的要求,適當分權于員工,充分挖掘團隊能動性潛力。通過授權或分權的方式管理,可以使員工覺得企業以禮相待,增強企業與員工的互信,提高員工的工作積極性。
2. 報酬激勵設置在合理區間內。適當的激勵與約束機制對于團隊效率的提升起著關鍵作用。報酬激勵過低,則起不到有效的激勵效果,影響團隊成員的工作積極性;報酬激勵過高會降低組織的收益。只有將報酬激勵控制在合理的范圍內才能既起到激勵團隊成員的作用,又能降低組織的支付成本。
3. 嚴格執行組織的獎懲制度,抬高偷懶行為的支付成本。即使是完美的制度,如果不去有效執行,也難以取得好的結果。嚴格的執行獎懲制度可以營造獎罰分明的組織氛圍,警示團隊成員偷懶工作會受到處罰,而努力工作會得到獎勵,減少消極怠工發生的可能空間,激勵團隊成員積極努力工作。
4. 縮短溝通渠道,加強員工之間互相監督。構建“扁平化”組織,建立團隊內部成員的互相監督機制,團隊成員發現偷懶行為的可以向上級投訴,上級經過調查后則可以根據成員的不同努力程度公平分配團隊工作成果。由于企業所有者通常只關注團隊產出,難以測量具體成員的工作產出,給偷懶行為留下了活動空間,增加“搭便車”行為的發生可能,由此觀之,只有通過團隊成員之間的互相監督以及成員與上級之間有效的溝通機制才能減少偷懶行為,解決搭便車問題。
5. 營造努力工作的組織文化。團隊領導以身作則,努力成為員工努力工作的標桿,嚴格執行組織出勤制度,合理運用正向與負向的激勵手段,及時了解團隊產出的有效信息,提升員工“勞者多得”的工作意識,使努力工作的理念深入人心。
[1]楊紅炳.基于博弈論的合作社成員風險防范投資與激勵問題研究[J].統計與決策,2012,(2):48-51.
[2]唐浩坤,溫濤,鄒芳莉.博弈論視角下的感知信用評價體系研究[J].軟科學,2016,30(5):125-129.
[3]曾晨,呂學靜.末位淘汰制博弈模型的建立、分析和應用[J].數量經濟技術經濟研究,2003,(9):34-38.
[4]陳永宇.“智豬博弈”模型改進與團隊激勵策略研究[J].人才開發,2009,271(6):19-21.
[5]張娓娓,陳綏陽,余洋.基于博弈論的P2P激勵機制[J].計算機工程,2011,37(15):89-91.
[6]周鴻,毛文靜.試論員工變革意愿[J].財經理論研究,2015,(1):21-27.
[7]孔志強,邢以群.基于博弈論的核心員工激勵模型的探討[J].技術經濟與管理研究,2003,(6):98-99.
[8]劉期烈,劉茂松,李云.基于博弈論的機會網絡激勵機制的研究[J].計算機應用研究,2015,32(7):2128-2132.
[9]Arrow K J. Social Choice and Individual Values[M].New Haven:Yale University,1963.
[10]謝識予.經濟博弈論[M].上海:復旦大學出版社,2002.
[11]Hirshleifer J.What strategics can support the evolutionary emergence of cooperation?[J].The Journal of Conflict Resolution,1988,(2):367-398.
[12]齊秀輝,王維,武志勇.高管激勵調節下研發投入與企業績效關系研究[J].科技進步與對策,2016,33(15):76-82.
[13]威布爾.演化博弈論[M].王永欽.譯.上海:上海人民出版社,2006.
[14]Gupta MC.Environmental management and its impact on the operations function[J].International Journal of Operations&Production Management,1995,15(8):34-51.
[15]何偉軍,袁亮,羅麗萍,等.博弈論視角下的企業綠色生產的外部性問題[J].武漢理工大學學報(社會科學版),2013,26 (6):898-903.
[責任編輯:劉 煒]
10.3969/j.issn.1672-5956.2017.02.010
2016-10-02
劉杰,1990年生,男,山東濰坊人,桂林電子科技大學碩士生, 研究方向為人力資源管理,(電子信箱)lj15078383701@163.com。胡澤民,1964年生,男,江西九江人,桂林電子科技大學教授,博士,研究方向為人力資源管理、政府公共事業管理、教育管理。
F272.92;F224.32
A
1672-5956(2017)02-0066-08