[摘要]“囚徒困境”是博弈論中的一個經典案例,是解釋各種經濟現象、研究經濟效率問題的非常有效的范式。本文對這一博弈模型和群體“囚徒困境”現象作了分析,并就如何走出群體“囚徒困境”作了探討。
[關鍵詞]“囚徒困境”群體效率提高辦法
“囚徒困境”是博弈論中的一個經典案例,1950年由圖克(Tucker)提出。它雖然非常簡單,但卻很好地反映了博弈問題的根本特征,成為人們現實生活中解釋各種經濟現象、研究經濟效率問題的非常有效的范式。
一、“囚徒困境”博弈模型分析
囚徒困境博弈的基本模型是這樣的:警察抓住了兩個合伙犯罪的罪犯,但卻缺乏足夠的證據指證他們所犯的罪行。如果其中至少有一人供認犯罪,就能確認罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關押,以防止他們串供或結成攻守同盟,并給他們同樣的選擇機會。如果他們兩人都拒不認罪,則他們會被以較輕的妨礙公務罪各判1年徒刑;如果他們兩人中有一人坦白認罪,則坦白者從輕處理,立即釋放,而另一個人則將重判8年徒刑;如果兩人同時坦白認罪,則他們將被各判5年監禁。
因此,所謂“囚徒困境”,實際上是經濟學上的一種原理,說的是人際關系博弈的一種非常微妙的心理,既揭示了個體理性與群體理性之間的矛盾——博弈雙方均選擇對自己收益最大、風險最小的策略而導致的是對大家都不利的結局,也揭示了個體理性本身的內在矛盾——從個體利益出發的行為最終也不一定能真正實現個體的最大利益,甚至會得到相當差的結果。
二、群體中的“囚徒困境”
類似“囚徒困境”類型的博弈,在群體成員之間,在市場競爭的各個領域,在資源利用和環境保護,以及政治、軍事和法律等各個方面都存在。
1.汽車尾氣排放與空氣清潔的矛盾。在城市中,若要保持城市空氣清潔,就必須對汽車尾氣進行治理,比如用較貴的清潔無鉛汽油、安裝防污染的過漏裝置,而這一切的費用都須汽車主人負擔。如果車主群體一致同意自愿購買無鉛汽油和安裝防污染過漏裝置,就無須對此制定法律。但是,作為理性個人,又想享受清潔空氣(集體選擇的結果)又不愿為此承擔代價,背叛(不裝防污染裝置)對每個人最有利。因此,他所希望的就是別人都購買無鉛汽油和防污染裝置,而他不這樣做,因為,他個人所造成的污染不足以給整個大范圍清潔空氣造成明顯的影響,而個人為此承擔的成本,確是實實在在的。即就個人而言,空氣質量的邊際改進率不會大于安裝防污染裝置的費用。但是,由于每個人都是理性人,人人都會這么考慮,并做出同樣的選擇,那么最終的結果,就是空氣的進一步惡化。由此可見,個人理性行為無法導致集體理性的結果,如依靠公民個人自覺自愿行動來解決空氣污染問題是不可能的。
2.創新與變革的惰性。組織內部改革與創新的惰性已為很多專家的研究所證實,這種創新的惰性實際上是群體中“囚徒困境”的表現。因為,創新與變革者個人所負擔的風險和成本是巨大的,若他們創新成功,名利雙收;但萬一失敗,則損失也巨大。而不創新者卻可分享他人創新與變革的成果與好處,其最不好的結果也不過是維持現狀。這樣兩相比較后,不去進行創新與變革便成為了最有利、最穩妥的選擇。因此,雖然人人認為變革與創新有利于群體的進化和大家的利益,但卻都希望他人有此行為,而自己不去冒風險,以至于群體中的所有成員都寧可在不甚滿意的現狀下維持。
3.“搭便車”。就是在群體成員的行為選擇中,若人人都積極供給公共物品,包括金錢、時間、物質、腦力和體力的支出等,則可以使群體的工作成效大為提高,使大家都能更為受益。但群體成員往住是以“囚徒困境”的邏輯進行選擇的,即別人供給公共物品,我不供給,則我占便宜;別人不供給,我供給,則我吃虧。這樣,我若不供給公共物品,就會從他人的供給中受益而無需負擔成本,從而形成不承擔成本供給,卻要從群體活動中獲益的“搭便車”現象,這就如同不買票而享受公共汽車一樣。
4.“公用地”的濫用。講的是有一群牧民共用一片草地,若每個牧民都有節制的在草地上放羊,就會保護這片草地并可長期使用它;但每個牧民的理性卻認為,我若不放羊,那么他人就可能放羊到草地上來,這樣我就會吃虧,因此,我也盡可能的放羊到草地上來,以減少相對于他人的損失。結果每個牧民的個人理性導致了這片公用草地的無節制濫用(草地的毀滅),使整個牧民群體及每個牧民的長遠利益受到了損害。在現實生活中,群體成員間也有類似于牧民的“囚徒困境”的存在。如果我們把一個群體中所擁有的公共物品(如設備、經費、福利、房產等)稱為公用地,則群體中每個人都有享用公用地的權利。假使每個群體成員都適度使用公用地,則有利于整個群體的利益。但我們常常會看到相反的現象,這就是因為群體成員認為,他人濫用公用地,而我沒有,則我吃虧;而若我優先搶占公用地,則不管他人是否有同樣行為,我都不吃虧。這樣兩相比較后,每個群體成員就會搶占、濫用、爭奪公共物品,其結果是危害群體及個人利益。
5.“三個和尚沒水喝”。當個體為完成某一目標而結為群體時,集體計酬和責任共擔等常會導致推倭或消極怠工的“三個和尚沒水喝”的內耗現象,這也是一種多人“囚徒困境”的現象。因為群體成員的這種行為所依據的是這樣的邏輯:我若多干而他人少干,則我付出的成本就比他人多,但我多干的成果卻由大家分享,這樣我就會吃虧;而我若少干,則不管他人如何干,都會由于低成本的付出而不吃虧。結果就會導致群體中的每個人都認為應該好好工作,但卻無人真正全力以赴的多人“囚徒困境”?;趥€人理性做出的好像是不吃虧的決策,卻會影響整個群體的工作效率和群體中每個成員的個人利益。
由此可見,由群體中每個成員的最優選擇所形成的“納什均衡”(納什均衡是由經濟學家納什提出的。其意為,若有n個人參加博弈,那么在給定他人戰略的情況下,在每一參與人選擇的最優戰略所形成的戰略組合中,沒有任何一個參與人有積極性選擇其他戰略,也沒有任何人有積極性打破這種均衡),不是一個有利于群體目標及個體利益的最好均衡,這就是群體成員中多人決策的“囚徒困境”。
三、群體中“囚徒困境”的走出
群體中成員之間的“囚徒困境”對群體的效率和進化來說是不利的,因此必須從群體中的“囚徒困境”走出,以達到提高群體的工作績效,發揮群體成員的工作才干的目的。
1.利用強化的力量。群體中的“囚徒困境”一般不是一次性的,而是多次重復博弈的結果,當一次選擇的結果得到群體的正強化或負強化時,強化的性質往往決定成員個體的下次選擇,這就為誘導群體中每位成員的合理的個人選擇提供了機會和可能。因此,群體可以通過制度、政策、獎懲措施等強化手段約束成員的個人理性與行為,鼓勵和激發創新與奉獻,抑制和懲罰隨大流、“搭便車”、搶占“公用地”等自私行為,通過強化手段的誘發和約束,加大群體成員進行更具建設性選擇的酬賞與份量,引發成員在引入了新的強化因素后做出更具合理性的個人選擇,打破原有利益格局中的“納什均衡”,建立起更有利于群體進化和群體成員利益的新的“納什均衡”,克服多人“囚徒困境”所帶來的群體內耗。
2.塑造共贏的群體文化。從“囚徒困境”的情景設計及其推理判斷中可以明顯看到,“經濟人”之所以陷入困境,是因為每個“囚徒”都以自我利益最大化為行為準則,漠視合作者的利益,這既是“囚徒”陷入困境的根本原因,也是解決“囚徒困境”的突破口。換句話說,“囚徒”要走出“困境”惟一的出路就是對“經濟人”的以追求自我利益最大化為目標的自私理念進行道德的約束和限定,形成互利共贏的合作理念”:堅持“利益共享原則”、“利人在先原則”;“只有整體的、共同的利益得以維護,個人利益才能存在”;“只有讓所有合作伙伴成為贏家,自己才能成為最后的贏家”;“經濟人”向“道德人”的轉變,才是經濟人真正走出“囚徒困境”的可行之路。只有這佯才能符合邏輯的走出“囚徒困境。
3.集體理性與個人理性的協調。“囚徒困境”的利已主義的思維方式是:只要對我最有利,不管他人是否吃虧,群體是否受損。這一個人理性困境的根本癥結在于當事人自認為這是對自己最有利的選擇,但實際的情況卻恰恰相反,這種排斥和漠視他人和群體利益的選擇正好使自己、他人和群體都吃了虧。利人才能利已。日本學者松義郎在《人際關系方程式》中提出,個體活動的方向要與群體的方向相一致,這樣個人的才能才能得以充分發揮,群體才能有更好的整體功能,否則個體很難達到自身工作的最佳效果,群體工作也要受到損失。
4.合作精神的形成與培養?!扒敉嚼Ь场钡睦樱f明兩個囚徒只有共同合作才是他們最佳的選擇,這樣的選擇會使他們達到“帕累托最優”狀態,在這種狀態下,囚徒雙方的利益都會實現最大化,所以,合作才是他們擺脫困境的惟一出路。這也說明在追求集體利益時,合作是必要的,而且由此產生的結果可能是最優的,在追求個人利益最大化時,人們不應該忽視合作的重要性,否則就極易陷入困境。因為,在重復性囚徒困境下,理性博弈者會考慮,如果我拒絕合作,不斷背叛,他人為了減少損失也會背叛。通過重復,博弈者將按對方以往選擇而決定當前選擇。背叛有可能遭到懲罰,合作則有可能獲得收益。可見,博弈者除第一回合外,以后總以對方上一回合策略回應對方,即所謂的“以其人之道還治其人之身”。
綜上所述,群體中的“囚徒困境”并不是無法攻克的怪圈,只要措施得當,針對性強,就可以削弱群體中的這一困境,提高群體的工作績效,發揮群體成員的工作才干。
參考文獻:
[1] 謝識予.經濟博弈論第2版[M].上海:復旦大學出版社, 2001.6-11.
[2] 劉輝.人才群體中的“囚徒困境”及其克服[J].中國人才,1999,⑴:13-15.
[3] 李剛,黃正華.“經濟人”與“道德人”——從“囚徒困境”談起[J].內蒙古大學學報(社會科學版),2004,⑵91-93.
[4] 張瓊.全贏文化與走出“囚徒困境”[J].河南科技,2002,⑻10-11.
責任編輯 鐘海連