1950年,美國數學家阿爾伯特·塔克在斯坦福大學給心理學家做報告時,講了一個故事。警察在盜竊現場附近抓到了兩名疑犯阿爾和鮑勃,把他們分開審訊,并分別向他們開了條件:如果兩人都不招供(疑犯彼此“合作”),警方沒有他們盜竊的證據,將以攜帶武器這一較輕的罪名各判處一年監禁。如果兩人都招供并牽連對方(疑犯彼此“背叛”),兩人都將各判處10年監禁。如果有一人招供并牽連對方,而對方不招供,此人將被免于起訴,而對方將被判處最高刑期20年。
阿爾會想:“鮑勃要么招供要么不招。如果鮑勃招了,而我不招,那么我將被判20年,我招了則被判10年。如果鮑勃不招,我也不招,那么我將被判1年,但是如果我招了,我將被免于起訴。所以不管鮑勃招不招,我招供都是最好的選擇?!滨U勃也這么想。最終兩人因為都“理性”地選擇招供而被判了10年。但是如果他們都“非理性”地選擇不招,則只會被判1年。
理性的選擇卻不能帶來最佳的結果,這個“囚徒困境”后來成了博弈論最著名的問題。博弈論還有一個類似的問題也是關于合作與背叛(或欺騙)的關系,但是條件有些不同。有兩個人駕車回家,遇到暴風雪,被雪堆分別堵在了街道的兩頭。司機要么出來鏟雪清除路障,要么待在車中。如果兩個司機分別從兩頭鏟雪(“合作”),就能都開回家并分擔勞動付出。如果只有一個司機鏟雪,另一個司機待在車中等對方鏟完雪,他也能回家,而且還避免了勞動付出(“欺騙”)。當然,如果兩人都待在車中,沒人鏟雪,那就誰也回不了家了。在這種情況下應該怎么選擇呢?最佳的策略是做出與對方相反的選擇:如果對方當“好人”鏟雪,我就當“騙子”坐等其成;如果對方不鏟雪,我就當“好人”自己來鏟雪,這樣雖然被人占了便宜,總比坐以待斃的好。
博弈論在第二次世界大戰結束后不久出現,本來是為了解決政治學和經濟學問題的。上個世紀70年代,它開始被用來解決自達爾文以來就困擾著生物學家的一個生物進化難題:本質上是自私的生物個體為什么會進化出合作行為?它是自然選擇作用下不假思索的本能行為,因此就連毫無思考能力的單細胞生物,也會面臨著合作還是欺詐的兩難,比如酵母菌。
酵母菌通常利用單糖(葡萄糖和果糖)做為營養。如果環境中沒有這些單糖,酵母菌也能利用其他糖,例如蔗糖(比單糖復雜的二糖)。但是酵母菌要先把蔗糖消化成單糖,為此需要分泌轉化酶來催化這個消化過程。這個消化過程發生在細胞外(更確切地說,發生在細胞膜和細胞壁之間),產生的單糖擴散開去,其他酵母菌也能利用。有的酵母菌的基因發生突變,生產轉化酶的基因失去了作用,自己不能分泌轉化酶,但是它們能竊取其他酵母菌制造的單糖,又可以節省進行消化的成本。它們成了“騙子”,而那些耗費能量把蔗糖變成單糖的酵母菌成了“好人”(合作者)。
對群體來說,大家當好人彼此合作,全都生產單糖并分享,這樣最有優勢。但是對個體來說,當騙子最有優勢。休斯頓大學的研究人員曾經做過一個實驗,結果表明,一個酵母菌群體中好人的密度越大,當騙子的優勢就越明顯。他們認為這像是“囚徒困境”。在這樣的群體中,好人和騙子分享全部的資源,而好人要承擔生產成本,因此好人總是競爭不過騙子,一旦出現騙子,它們的后代數量會越來越多,好人的數量會越來越少,等到騙子們統一了天下,末日也就快到了,好人遺留下來的單糖被耗盡后,群體就會滅絕。一個處于“囚徒困境”的群體是很不穩定的。
實際的情形可能比這復雜。麻省理工學院的研究人員最近發現,好人生產的單糖并不是100%拿出來共享的,而是自己會截留一小部分,雖然私藏的這部分很少(只占約1%),卻讓好人在利用單糖方面比騙子有了一點優勢,在一定條件下這點優勢超過了制造單糖的成本,就會讓當好人在總體上比當騙子更有優勢。好人也會有機會。
實驗的結果的確如此。在好人的數量比較少、單糖的量也比較少時,能否有效地利用單糖就顯得比較重要,好人對單糖的利用率高了1%,其優勢較為明顯,好人的數量會逐漸增多。等到好人的數量達到一定程度,好人制造單糖花費成本的劣勢體現出來了,騙子的優勢反而更為明顯,騙子的數量就開始逐漸增多了。最終,好人和騙子的比例會達到平衡。
實驗表明,不管一開始酵母菌群體中的好人和騙子的比例是多少,演變的結果,最后的比例都是一樣的。
因此,這更像是“雪堆博弈”,特立獨行是最佳策略:舉世皆好人時當騙子,舉世皆騙子時當好人,這樣最有可能獲得成功。
(選自《中國青年報》)
小提點
博弈論歸根到底說明的是理性和人性的局限,博弈論的諸多奇妙故事固然可以作為作文的極佳素材,但是懂了一點博弈論,不但沒有因此而變得謙卑,反倒有了自以為智慧的沾沾自喜,那就不可救藥了。