漂 流
2015年5月24日,著名數學家、諾貝爾經濟學獎得主約翰·納什和妻子在美國新澤西州因車禍遇難.當時,納什剛從挪威領取阿貝爾獎,在夫人的陪同下回到美國.除了諾貝爾經濟學獎之外,納什還在1994年獲得過阿貝爾獎.約翰·納什的去世引起了中國媒體的廣泛關注,粉絲們以各種方式緬懷這位數學天才.
1928年,約翰·納什出生于美國西弗吉尼亞州的一個中產階級家庭.他從小性格就很孤僻,寧愿自己讀書也不愿和別的孩子玩耍.小的時候,納什的數學成績并不突出,但到了中學,他的數學才能逐漸展露.他獲得美國普林斯頓大學的博士學位時,在其博士論文里提出了一個重要概念,即后來的“納什均衡”博弈理論,這同時為他獲得1994年諾貝爾經濟學獎奠定了基礎.
1958年,納什因在數學領域取得的杰出成就被美國《財富》雜志評為新一代天才數學家中最杰出的人物.但正當他的事業如日中天、家庭美滿幸福的時候,30歲的納什得了嚴重的精神分裂癥.直到20世紀80年代,納什才漸漸從精神分裂癥中走出來,并在1994年獲得了諾貝爾經濟學獎.
學校經濟學系經常會舉辦有關博弈論的論壇,納什有時候會參加,但是他幾乎從不發言,每次都是靜靜地來,靜靜地走.
“這人是個天才.”
這就是納什的碩士導師給他寫的推薦信,只有一句話的推薦信.
納什閃光的數學才能,還有他和妻子艾莉西亞二十年來與折磨他的精神疾病作抗爭的不凡經歷也曾感動好萊塢.2002年獲得奧斯卡最佳影片獎的電影《美麗心靈》就是根據這段傳奇改編而成的.國人知道納什大多是因為電影《美麗心靈》,但納什留給這個世界最重要的遺產卻是他的“納什均衡”理論.

《美麗心靈》劇照
當時博弈論仍然處于起步階段,馮·諾依曼是該領域的先行者,他對零和博弈作了非常深入的研究.所謂零和博弈,就是所有對局者收益的綜合為零,一方獲益必然意味著一方損失.可現實生活中的博弈沒有這么簡單,雙贏和兩敗俱傷的情況常有發生.
當納什在1950年發表對非合作博弈的研究成果時,博弈學界眼前為之一亮.所謂“納什均衡”,即“在不存在外部強制執行的情況下,每一個人是否有積極性去自覺遵守這個協議?如果每個人都有積極性遵守這個協議,這個協議就構成一個納什均衡”.
“囚徒困境”是理解納什均衡的重要案例,其重要的結論是,人們為了自己的利益,而不愿意合作,最后的結果注定是損人不利己.
囚徒困境的故事:兩個歹徒在一位富豪的臥室作案,被趕來的警察逮住.富豪死在旁邊,他倆卻不承認殺人的事實,辯解說,他們只是來偷點東西,他們進來時,富豪已經死了.警方把兩個歹徒分開關在兩個房間進行審訊,并給他們講清楚了政策:如果兩個人都坦白了殺人罪行,那么都將被判無期徒刑;如果其中的一個坦白了,另一個抵賴,那么坦白者將被無罪釋放,抵賴者將被判處死刑.如果兩個都抵賴,因為證據不足,只能按偷竊罪判處他們有期徒刑一年.
我們不妨站在其中一個歹徒的立場上,設想一下他會如何思考.他應該會想,我應該繼續抵賴嗎?如果我兄弟在那邊坦白了,我不就死定了嗎?那么,我應該坦白嗎?如果我兄弟也坦白了,那我們倆就都得被判無期了.但如果他還是抵賴,我就能無罪釋放了.
大家可以思考一下,如果換做是你,面對這樣的情境,你會選擇什么?我們為什么選擇坦白而不是抵賴?假如大家都選擇抵賴,只會被判處有期徒刑一年呢!
讓我們把兩個歹徒分別稱為張三和李四.為了更清楚直觀地看到兩個歹徒的選擇和獲刑之間的關系,我們來看這張表:

剛才的這個表格,叫作博弈矩陣.類似的表格,在中學數學的應用題中我們有時也會遇到.這個表中的張三和李四,在博弈論中,被稱為局中人.他們每一個人都有坦白和抵賴兩個選擇,這兩個選擇被稱為局中人的策略.兩個人各自的選擇組合在一起,造就了兩人各自的結局.例如,當李四選擇坦白,張三選擇抵賴的時候,李四會被無罪釋放,而張三會被判死刑.兩人的選擇所得到的結果被稱為局中人的收益.這樣,傳說中的博弈的三要素就構成了:局中人,局中人的策略以及局中人選擇策略所獲得的收益.
對張三來說,盡管他不知道李四作何選擇,但他發現無論李四選擇什么,他選擇“坦白”總是最好的.顯然,李四也會如此想,最終他們都被判無期徒刑.但是,倘若他們都選擇“抵賴”,每人只被判有期徒刑一年.可是,都選擇抵賴的結果往往在現實生活中不會出現.
囚徒困境的例子在現實生活中有很多.
商家的價格戰就是如此:假設我是一位經營家電的零售商.在我商鋪的周圍有很多的競爭對手.現在我面臨降價與不降價的選擇:如果對手不降價,那么我降價是有利可圖的.如果對手降價,那么我也必須降價,否則我就會面臨一件都賣不出去的局面.所以,降價就成為我的優勢選擇.這對于我的競爭對手來說也同樣如此.這樣拼到底的最終結果就是我和我的競爭對手都只有微薄的利潤.當然,結果也可能更慘,大家一起關門大吉.
讀懂“囚徒困境”,理解納什均衡,也是我們對大師最好的紀念.