蔡鑫樺,孫亞南,陸凌凡
(1.中共南通市紀委,江蘇 南通 226000;2.南通大學 商學院,江蘇 南通 226019)
博弈論對廉政教育的啟示
蔡鑫樺1,孫亞南2,陸凌凡1
(1.中共南通市紀委,江蘇 南通 226000;2.南通大學 商學院,江蘇 南通 226019)
博弈論是研究復雜條件下人類行為的一種工具,廉政教育過程中教育者與被教育者行為之間也存在著博弈現象。廉政教育者應重視運用博弈理論的方法與策略,尋求積極主動的方式,順勢而為、因勢利導,充分考慮受教育者“對策”選擇,作出相應的“政策”調整,讓教育者的“政策”與受教育者的“對策”在思想交流交融中趨同。運用博弈論分析廉政教育過程,為廉政教育研究提供了新的視角與路徑方法。
博弈論;廉政教育;理性人;均衡狀態
社會是由不同群體的人組成的,不同的群體形成了不同的結構,一個群體之間的相互作用的結構形成一個博弈。黨員干部就是由不同類型的人構成的一個集合體,這個群體之間的相互作用同樣會構成博弈。廉政教育的目標是通過教育者的教育活動,形成教育對象穩定的思想道德品質,促使廉政教育對象廉潔從政、從業,從而在社會生活中表現出良好的行為。本文運用博弈論的方式,力求從經濟學中理性人的視角,解析廉政教育過程中的博弈現象,分析廉政教育中存在的博弈困惑,以期提高廉政教育的針對性和實效性。
博弈論(Game Theory)研究的是各個理性決策個體在其行為發生直接相互作用時的決策及決策均衡問題。[1]1928年,馮·諾依曼證明了博弈論的基本原理。博弈論屬于應用數學的一個分支,博弈論主要研究人們如何運用已有的信息進行決策的問題,為實現自己的目的,尋找出最佳合理的解決方案,即所謂的均衡狀態。當然這些博弈論分析是有前提條件的,如:“博弈的目的是為謀取個人利益最大化;博弈雙方都具有充分的理性,并具有充分的選擇的自由;博弈的規則是平等的,因而可以保證合理的預期能夠實現。”[2]
博弈我們經常翻譯為“游戲”,但實際意義上是一種策略選擇。博弈論是指某個人或一個團隊組織,處于特定的外部環境和選擇條件下,遵循一定的規則,依靠自身已經擁有的信息,同時或先后,若干次從各自允許選擇的行為或策略進行選擇和并加以實施,并從中各自獲得相應的結果。博弈論通常包括四個基本要素:博弈者或稱為局中人;策略選擇;博弈雙方的利益;相關信息。人們常常討論的“囚徒困境”就是典型的例子。
博弈論的對象被認為是理性的,在目標選擇上,博弈雙方都應該追求自己的利益最大化。博弈論不僅在經濟學中被廣泛應用,而且被廣泛運用于管理學、社會學等人類行為分析的學科中。在零和博弈和多人的合作關系中,博弈的一個合理的結果是一個組合的策略,每個博弈都不能通過單方面改變自己的戰略利益,雙方都不愿意調整自己的策略,在對方給出的策略,每一場比賽的策略是其他游戲的選擇策略最好的響應。這就是所謂的納什均衡。考慮別人的策略,自己選擇最佳的策略。博弈論是研究復雜條件下人類行為的一種工具,博弈論研究人類行為時著力關注兩方面的問題:一類是信息問題,即博弈雙方掌握對方信息和規則的情況,在現實社會中,由于信息不對稱帶來的博弈問題隨時可見,如賣方向市場推出低質量商品;國有企業由于產權所有者實際缺位,往往帶來監督缺失、產權管理不清晰等問題。第二類是時序方面,即博弈雙方的行動策略先后給對方帶來的影響,換句話說是你的決策將影響對方,對方的決策也將影響你,這是一個相互帶來影響的問題。
廉政教育是構建“不敢腐、不能腐、不愿腐”機制中的一個重要環節,也是預防腐敗現象產生的第一道防線。加強對黨員領導干部的廉政教育,是營造風清氣正環境的重要途徑,也是減少和解決腐敗問題最高效最經濟的手段。習近平同志始終突出廉政教育的重要作用,在多個場合闡述了加強廉政教育的重要作用。他指出,一名領導干部的蛻化變質往往就是從生活作風不檢點、生活情趣不健康開始的,往往都是從吃喝玩樂這些看似小事的地方起步的。如果領導干部生活作風上不檢點、不正派,在道德情操上打開了缺口,出現了滑坡,那就很難做到清正廉潔,很難對社會風氣起到正面引導和促進作用。[3]肯·賓默爾認為,一個社會契約要想具有可行性,必須是一個生存博弈的均衡。然而,這種生存博弈的均衡可能是非唯一的,道德博弈則可能是附著在其中的某個均衡上的。因此,人們的道德博弈也就是在生存博弈中選擇出符合社會規范的均衡。[4]
當前,由于廉政教育面臨日益多變的形勢,挑戰日益增多,將博弈論引入廉政教育無疑具有現實意義。將博弈思想引入廉政教育,是因為廉政教育活動與博弈活動具有類似性,通常情況下。廉政教育是把廉政教育說服與制度約束規范結合起來,以促進廉潔從政為目的的多形式感化、教化活動。教育者與被教育者在廉政法律制度規定的要求下,通過相互影響,使受教育者樹立起廉潔誠實守正的信念,形成廉潔的感覺,培養一種廉潔的意志,提高誠信的意識,養成廉潔的習慣。教育不是一個自然而然的過程,而是通過一個有意識的過程來達到最好的效果;不是一個簡單對原則制度的詮釋,而是一個動態的過程,動態的調整;不是一個具體的目標,而是通過教育者與被教育者思想交鋒與互動,使一個受過教育的人從被動到主動的接受過程,是一個多重選擇的博弈。
一般來說,廉政教育的過程是讓人學會正確選擇,做到這一點關鍵在于按照教育者的要求去做,廉政教育過程中雙方采取的行為和策略都受到對方的影響,二者之間既有合作又有對抗。廉政教育者和受教育者的主、客體關系中雙方都是平等的,均可假設為理性人。現實生活中,廉政教育者往往遇到這樣的疑惑:一些黨員干部非常清楚違紀違法的后果,理應遵規守紀,以黨和國家的利益為重,但結果往往知行不一,最終走上違紀違法的道路。這種情況不能簡單地定義為教育失靈或教育無效,是各種因素影響的結果。教育過程常常表現為教育者與被教育者面對面的思想交融、交流、交鋒,如果運用博弈論的方式表達這種情形,就是教育者與被教育者的博弈,這種包圍與反包圍、滲透與反滲透構成了一種博弈關系。這里我們不妨借用博弈理論架構來進行分析:
1.廉政教育過程中的局中人。是指參與廉政教育過程的教育者和受教育者。這里的廉政教育者既包括廉政教育實施主體,也包括廉潔從政的環境。廉政教育的教育者和受教育者都是社會群體的一部分,主要是同志之間的關系,當然有時候也包含一部分管理與被管理的關系。既然雙方當事人總體上是平等的主體,可以在思想上互相交流交鋒,通常情況下這種博弈是非零和博弈。在紀檢監察機關踐行“四種形態”時,尤其是第一種形態的談話函詢過程,教育則表現為非此即彼的零和博弈。
2.廉政教育過程中的策略。是指廉政教育雙方即局中人在實際行動組合中選擇一種行動,所以行動表現為一種決策。對于局中人來說,還有一個行動順序問題,比如甲和乙同時行動,或甲行動后乙再行動。人們常說的上有政策、下有對策,說的就是這個道理,受教育者對于廉政施教者的思想是否定還是接受,是選擇性接受,還是全盤同意。對于教育者來說,不能回避博弈思路,應當順勢而為、因勢利導,讓教育者的“政策”與受教育者的“對策”在思想交流交融中趨同,所以,廉政施教者應當尋求積極主動的方式,吸收博弈策略思想,充分考慮受教育者“對策”選擇,作出相應的“政策”調整。
3.廉政教育過程中的信息。這里的信息是個集合體概念,既包括教育者和受教育者各自的“圍地”環境信息,諸如在日常工作、學習、生活中接受的廉政方面的咨詢信息,也包括對對方的知曉程度,如心理狀態、個性特征、氣質類型,以及對方是對抗、競爭還是合作的行動選擇等。一般來說,廉政教育過程中的信息是不對稱的,廉政教育過程實際上是一個信息傳輸的過程。
4.廉政教育過程中的行動策略。是指廉政教育雙方即參與人在一定信息條件下的決策內容,是博弈各方可以選擇的全部策略或策略選擇。對受教育者來說,是遵從廉政制度規定,還是采取對抗的舉措,或者是表面上的遵從,例如一邊貪腐一邊裝出兩面人。對教育者來說,是采取灌輸教育,還是采取激發內心的平等交流等諸如此類的舉措。
5.廉政教育過程中的均衡狀態。是指廉政教育雙方即局中人在博弈結束后取得的最佳策略的結合。在廉政教育的過程中,教育者通過感化引導,受教育者的思想產生變化直至內化的過程,是一直在不斷作出調整的過程,從而在最后一次實現了現狀的平衡。然而,這種平衡不一定等于雙方所期望的目標。這很好解釋了一些貪污腐敗分子邊收錢、邊上繳的兩面人的心理。這說明廉政教育發揮了一些作用,但是仍然采取不合作的態度,
6.廉政教育雙方的博弈結果。是指廉政教育者和被教育者經過博弈之后所達到的結局。這種結局既含有了一系列最佳戰略的組合,也包括了達成博弈結局的最佳目標組合等。它通常表現為廉政教育雙方的實際行動、目標戰略處于相對均衡的一種狀態,即教育者和被教育者的任何一方均沒有要改變現狀的意愿。
我們把上述基本分析概念置于一個統一的分析框架中,意味著我們在分析任何一次廉政教育過程時,都必須具體分析這六個基本方面的情況。上述的理論模型充分說明了廉政教育過程的多變性、多樣性和多面性,教育者竭盡所能,采取各種辦法開展廉政教育,但教育效果總是難以如愿,甚至有時還事與愿違,這是廉政教育最大的困境。引入博弈論可以對此進行有效的解釋,為增強廉政教育實效性提供新的路徑和方法。
運用博弈論研究廉政教育過程,更加注重從教育雙方互動的角度去建構邏輯一致的理論模型,它能夠為廉政教育指明新的研究路徑:
1.研究廉政教育雙方在教育過程中理性行為反應。社會上絕大多數人都以理性來規范自己的思想與行為。從某種意義上說,廉政教育效果與受教育者的偏好關聯,在廉政教育過程中,潛在的違紀違法者在違紀違法行為的“收益”高于“成本”的情況下,更有可能選擇實施違紀違法行為,在壓力小、機會多的情形下,受教育者可能對違紀違規問題進行自我合理化;否則,就更有可能選擇遵紀守法。與違紀違法者的斗爭,是一場非合作的不完全信息動態博弈。因此,要加強對受教育者理性判斷基礎的研究,在具體設計、制定和實施廉政教育時,要全面把握廉政教育中博弈各方的戰略目標、優劣勢、成本與收益等,最大限度地發揮廉政教育的優勢,最大限度地減少腐敗方的“收益”,使潛在違紀者在確立的政策、制度和規則范圍內作出理性的選擇。同時也要尊重被教育者理性選擇的事實,在利己與利他做出選擇時,給予適當的利己,即維護一定的自身利益,這符合價值觀固化條件下成年人廉政教育的規律和特點,從而實現個人理性與集體理性相統一。
2.研究廉政教育過程中存在的一些普通性問題。一些反腐敗教育的研究結果表明,反腐敗教育過程中存在著一些問題:(1)在教育過程中的沖突表現了理性人無處不在的困境。在思想教育的過程中,教育者和受教育者的一致行動會導致一個雙方都是最優的結果。然而,在實際過程中,它可能會采取相反的一致的行為,導致非最佳結果。(2)廉政教育過程中搭便車的行為。教育過程中,教育者不是真正做到入心、入腦式的施教,而是搞形式上的走過場;受教育者不是認真開展批評與自我批評,采取消極抵觸或者回避態度,以求蒙混欺騙教育者,這樣的廉政教育效果必然是大打折扣的。(3)廉政教育的主體形象、自身的威信和清廉度欠佳。教育者自身不夠廉潔,難以取得受教育者的信賴和認同,甚至可能導致產生排斥的心理。教育者與受教育者之間互相不合作,這樣的廉政教育根本難以進行下去,廉政教育的效果可能是負面的。(4)教育的方式方法問題。蘇聯教育家蘇霍姆林斯基說:“教育者的教育意圖越是隱蔽,就越是能被教育對象所接受,就越能轉化為教育對象自己的內心需求”[5]。要抓住博弈雙方理性一面,在利己與利他中尋找最佳的均衡點,尋求最佳的結果。尋找那個均衡點,就是要依靠恰當的教育方式,注重教育內容的選擇,挑選合適的教育者,配以有力的廉政制度設計和高明的教育藝術。
3.研究信息這個要素在廉政教育過程中的作用。博弈雙方的行動策略受到對外部環境信息的影響。一方面要提高博弈雙方對黨紀法規的知曉度,形成清晰的認知,改變一些黨員干部通過大眾媒體或微信、微博等網絡媒體獲得的資訊往往不夠正確真實、客觀全面的現象。另外一方面,注意受教育群體之間的信息交流,親友之間在“小圈子”中的信息傳遞,相互之間產生的影響。邊際效用遞減規律告訴我們,消費者在消費物品時,每一單位物品對消費者的效用是不同的,它們呈遞減的邊際效應。就廉政教育而言,黨員干部作為廉政教育的“消費者”,他們的需求也在逐漸遞減:從幼兒時期開始,就接受到思想道德方面的教育,到了成年人則已經達到了“需求”的最低值。因此,要努力通過教學方法的改進,進行“供給側”改革,激發受教育者的興趣。
4.研究廉政教育中的重復博弈的情形。在實踐中,廉政教育者都有過反復做某個被教育者思想工作的現象,是多次博弈的結果,亦稱之為重復博弈,最終達到均衡結果。長期的重復博弈經驗使每個博弈方對別人的行動積累了一定的經驗,熟悉對方策略選擇的慣有傾向。博弈方憑借這些經驗,修改自身的預期,制訂不同情況下的行動策略,這就要求我們從博弈論角度研究這種反復。這些重復博弈是如何發生的?教育者與被教育者是否存在合作的可能?博弈雙方策略選擇傾向的預期與其行動規則如何達成一致,使得博弈各方的策略選擇趨于穩定?對這些的研究將有助于深化廉政教育理論。
5.研究廉政教育過程中機制設計問題。教育者作為理性經濟人,面對有限的時間和精力,傾向于以最小的投入換取最大的收益。廉政教育工作通常是由一級組織委托某個代理人或組織來實施,該一級組織與教育者構成了典型的委托代理關系。由于信息不對稱,委托人無法從表面上看出教育者的努力水平,但工作的最終成果是可觀測的。應設計有利的激勵機制促使教育在實現個人效用最大化的同時,實現預期收益的最大化。
總之,運用博弈論方法,有利于幫助我們適應反腐敗新常態,開拓廉政教育工作的新領域,探索反腐敗教育工作新的模式,進一步提高廉政教育的創新性、實效性和針對性。當然,使用博弈理論來研究廉潔教育的過程,不能直接用經濟學分析中的博弈方法分析,需要借助于統計概率論和行為研究學以及心理研究等理論與方法,對博弈行動做定量和定性分析。只有這樣,才能找到真正科學管用的方法。
[1]胡希寧,賈小立.博弈論的理論精華及其現實意義[J].中共中央黨校學報,2002(2):48-53.
[2]張維迎.博弈論與信息經濟學[M].上海:上海人民出版社,2003.
[3]習近平.之江新語[M].杭州:浙江出版聯合集團,2013.
[4]肯·賓默爾.博弈論與社會契約:第1卷[M].王小衛,錢勇,譯.上海:上海財經大學出版社,2003.
[5]鄭付海,當代大學生思想政治教育策略的研究[J].棗莊學院學報,2009(4):94-96.
責任編校 王學青
Enlightenment of Game Theory to the Education of Honest and Clean Government
CAI Xinhua1,SUN Yanan2,LU Lingfan1
(1.Commission for Discipline Inspection,CPC Nantong Committee,Nantong 226000,Jiangsu,China;2.School of Business,Nantong University,Nantong 226019,Jiangsu,China)
Game theory is a tool applied in the studies of human behaviors under complicated circumstances.A similar phenomenon to that of a game can be found in interactions between the educator and the educated during the process of clean governance education.Application of the means and strategies in game theory should be paid enough attention to by educators in their exploration for some active means in accordance with the situation with due consideration of the“reactions”of the educated.Relevant adjustments in“policies”will channel the“policies”of the educators and the“reactions”of the educated into a same medium.When game theory is applied in analyzing the educating process of clean governance,a new perspective and means can be found for further exploration into the education of clean governance.
game theory;education of clean governance;rational individuals;state of balance
D630.9
A
1674-9170(2017)01-0075-05
2016-12-10
蔡鑫樺(1978-),男,江蘇啟東人,中共南通市紀委干部;孫亞南(1978-),男,江蘇南通人,南通大學商學院副教授;陸凌凡(1984-),女,江蘇啟東人,中共南通市紀委干部。
南通廉政研究中心資助項目(2014YB09)