周 洋 韓雪峰
什么是囚徒困境
亞當(dāng)·斯密講了這樣一個(gè)故事:有兩個(gè)因巨額盜竊而正在服刑的囚犯A和B。區(qū)檢察官c正在調(diào)查一宗懸而未決的銀行搶劫案,并且他相信A和B就是罪犯。區(qū)檢察官c正在計(jì)劃競(jìng)選州長(zhǎng),所以希望A和B認(rèn)罪,因?yàn)檫@樣會(huì)在他的記錄中增加一項(xiàng)重要的定罪案件。他依靠監(jiān)獄警衛(wèi)的幫助,對(duì)A和B的牢房進(jìn)行了突擊搜查,發(fā)現(xiàn)了隱藏的武器和毒品。他知道可以利用這一信息控告他們犯有藏匿武器與毒品的小罪而使之被判刑,他將A和B隔離起來(lái)并分別對(duì)他們作出了如下承諾:如果無(wú)人坦白銀行搶劫,他將以藏匿武器與毒品罪起訴并使兩人各被再判2年監(jiān)禁:如果兩人都認(rèn)罪,則都因銀行搶劫罪而被再判5年監(jiān)禁;如果只有一人坦白并將對(duì)方揭發(fā)出來(lái),則對(duì)坦白者的搶劫銀行與藏匿武器與毒品行為不予起訴并釋放他,而沒(méi)有坦白的人則會(huì)因搶劫銀行與藏匿武器與毒品而被再判20年監(jiān)禁。那么,這兩個(gè)囚犯該怎么辦呢?從表面上看,他們應(yīng)該互相合作。如果選擇抵賴,他們倆都能得到最好的結(jié)果。但他們不得不仔細(xì)考慮對(duì)方可能采取什么選擇。
對(duì)囚徒困境的引申與分析
警惕公權(quán)力的濫用。在上邊的囚徒困境中,區(qū)檢察官構(gòu)造了一種情勢(shì),使得個(gè)人對(duì)自己利益的追求會(huì)導(dǎo)致對(duì)A和B都不利的結(jié)果,兩個(gè)囚徒都會(huì)坦白,從而每個(gè)人都達(dá)到一個(gè)雙方都認(rèn)為是差于雙方都不坦白的結(jié)果。事實(shí)上,檢察官所構(gòu)造的這個(gè)困境對(duì)A和B的激勵(lì)是如此的強(qiáng)烈,以至于很容易想象A和B被迫承認(rèn)搶劫銀行,甚至即使他們是清白的。我國(guó)“文革”中坦白從寬、抗拒從嚴(yán)的政策之所以能使一大批人承認(rèn)自己的“罪行”,其奧妙即在于此。
個(gè)人理性與集體理性的沖突。囚徒困境反映了一個(gè)很深刻的問(wèn)題,這就是個(gè)人理性和集體理性的沖突,即理性人的個(gè)人理性行為可能導(dǎo)致集體非理性。很顯然,A和B雙方都抵賴(各判2年)比雙方都坦白(各判5年)要好,但是,作為理性人的A和B都想占對(duì)方的便宜,結(jié)果誰(shuí)也沒(méi)占到。
在現(xiàn)實(shí)生活中,這種個(gè)人理性與集體理性(社會(huì)效率)相沖突的事例很多。
利他主義者的囚徒困境。有人認(rèn)為產(chǎn)生囚徒困境的原因在于:每個(gè)局中人只關(guān)心自己的利益而對(duì)他人的利益漠不關(guān)心,為了自利的目的他甚至不惜違背“協(xié)議”。因此,解決囚徒困境的答案在于:不要做一個(gè)利己主義者。
讓我們回憶一下歐·亨利的小說(shuō)《麥琪的禮物》。主人公是一對(duì)新婚小夫妻——吉姆和德拉。圣誕節(jié)快到了,雙方都惦記著給對(duì)方買禮物,吉姆想給德拉買套發(fā)卡,因?yàn)榈吕幸活^靚麗的秀發(fā):而德拉則希望給吉姆的祖?zhèn)鹘鸨碣I表鏈和表袋。但是,他們的生活比較拮據(jù)。于是,吉姆賣掉了心愛(ài)的金表,買了一套漂亮發(fā)卡:德拉賣掉了心愛(ài)的長(zhǎng)發(fā),為吉姆的金表買了表鏈和表袋。出于無(wú)私愛(ài)心的利他主義行為,結(jié)果卻使得雙方的利益同時(shí)受損。
可見(jiàn),囚徒困境無(wú)須受限于利己主義者的假設(shè),只要每個(gè)局中人對(duì)結(jié)果之偏好的全部要求存在著一定的順序,并且這些偏好是發(fā)散的,即使是利他主義者,同樣無(wú)法避免個(gè)體理性與集體理性的矛盾。
破解囚徒困境的解
陷入囚徒困境的人要想達(dá)到一個(gè)對(duì)大家都有效率的結(jié)果,就必須運(yùn)用某種社會(huì)的交互作用來(lái)抑制個(gè)人對(duì)自利的追求。本文試著從以下幾個(gè)方面尋求破解囚徒困境的解。
對(duì)囚徒困境的科層式解決辦法。所謂對(duì)囚徒困境的科層式解決辦法是指賦予某個(gè)人能夠迫使每個(gè)博弈方不去采取均衡中那種誘人選擇的權(quán)力,擁有這種權(quán)力的人也就擁有了一種強(qiáng)制性的權(quán)威,以促使別人去做本來(lái)覺(jué)得不符合自身利益的事情,從而使博弈雙方的處境都得到改善。
人類的團(tuán)隊(duì)生產(chǎn)也面臨著類似的囚徒困境,當(dāng)人們覺(jué)得他對(duì)群體的貢獻(xiàn)無(wú)法準(zhǔn)確衡量時(shí),他的產(chǎn)量就趨于下降,就像在以前的人民公社制度下和現(xiàn)在的部分國(guó)有企業(yè)里面,如果大家都好好干,產(chǎn)品生產(chǎn)的多,大家都可以生活的很好,但問(wèn)題在于:我好好干,你不好好干,我吃虧,你好好干,我不好好干,我占便宜,于是,納什均衡就是大家都不好好干,都餓肚子。團(tuán)隊(duì)生產(chǎn)囚徒困境的科層式解決辦法是賦予監(jiān)督者以不對(duì)稱于其他成員的權(quán)威,監(jiān)督者的任務(wù)是“分配報(bào)酬,觀察投入品的投入行為以測(cè)試或估計(jì)它們的邊際生產(chǎn)率,以及布置任務(wù)并就做什么和如何做給出指導(dǎo)”。這種監(jiān)督導(dǎo)致了激勵(lì)機(jī)制的變化,它使卸責(zé)的人被懲罰,努力生產(chǎn)的人得到獎(jiǎng)勵(lì)。在這里,科層(企業(yè))通過(guò)為下屬與上級(jí)創(chuàng)造激勵(lì)來(lái)重新協(xié)調(diào)了個(gè)人對(duì)自我利益的追求與群體效率之間的關(guān)系,從而有效地解決了團(tuán)隊(duì)生產(chǎn)囚徒困境的難題。
合作與重復(fù)博弈。本文上面所講的囚徒困境都是指“一次性博奕”條件下的困境。在這種條件下,局中人對(duì)合作都沒(méi)有興趣。可是,如果博奕不是一次性的,而是可以多次重復(fù)的博奕,人們就有了合作的可能性,囚徒困境就有可能破解,連續(xù)的合作有可能成為重復(fù)的囚徒困境的均衡解,這也是博弈論上著名的“大眾定理”(Folk Theorem)的含義。
但合作的可能性不是必然性。博弈論的研究表明,要想使合作成為多次博弈的均衡解,博弈的一方(最好是實(shí)力更強(qiáng)的一方)必須主動(dòng)通過(guò)可信的承諾,向另一方表示合作的善意,努力把這個(gè)善意表達(dá)清楚,并傳達(dá)出去。如果該困境同時(shí)涉及多個(gè)對(duì)手,則要在博弈對(duì)手中形成聲譽(yù),并用心地維護(hù)這個(gè)聲譽(yù)。所以合作是非常困難的。
當(dāng)事人的感情,信念與信仰。上面的“囚徒困境”只考慮了當(dāng)事人博弈策略中的利害計(jì)算,未考慮當(dāng)事人的感情、信念和信仰等非理性因素。如果在囚徒困境中加入這些因素,那么即使是一次博弈,博奕結(jié)果也會(huì)有很大的不同。設(shè)想一下,如果被隔離訊問(wèn)的是一對(duì)雌雄大盜,它們彼此深愛(ài)著對(duì)方,面對(duì)檢察官構(gòu)造的囚徒困境時(shí),它們想到的更多的是對(duì)方的命運(yùn),這種無(wú)條件的愛(ài)使每一方都寧愿選擇抵賴,即使是對(duì)方坦白也心甘情愿,當(dāng)雙方都這樣做的時(shí)候,他們已經(jīng)成功地?cái)[脫了囚徒困境。
信仰會(huì)使他們認(rèn)為誠(chéng)實(shí)信用會(huì)給他帶來(lái)(較之于不誠(chéng)實(shí)的產(chǎn)出而言)更大的預(yù)期產(chǎn)出,或者誠(chéng)實(shí)的價(jià)值是他所更看重的,因此,他們會(huì)率先采取合作的策略,這樣整個(gè)決策結(jié)構(gòu)就發(fā)生了變化,克服囚徒困境的合作解就有可能出現(xiàn)。
此外,諸如同情心、正義感、愧疚感等非理性因素,都可以在囚徒困境條件下誘導(dǎo)出合作行為。