

如果不是諾貝爾獎和一部《美麗心靈》的傳記電影,恐怕約翰·福布斯·納什(John Forbes Nash)的名字早就被忘卻。
“納什均衡”對亞當·斯密的“看不見的手”的原理提出了挑戰。按照斯密的理論,在市場經濟中,每一個人都從利己的目的出發,而最終全社會達到利他的效果。但是從“納什均衡”我們卻看到:從利己目的出發,結果是既不利己也不利他。兩個囚徒的命運就是這樣。在“囚徒困境”的故事中,兩個小偷都選擇坦白而被判八年的情況就被稱為“納什均衡”,也叫非合作均衡。但是,如果兩人都抵賴,各判一年,顯然這個結果對他們更好。
20多歲的納什已經是聞名世界的科學家。當時他被《財富》雜志評為新一代天才數學家中最杰出的人物。他的才華和魅力吸引了一位漂亮女生——麻省理工學院物理系的艾里西亞。1957年2月,他們結婚了。
這也許是納什一生中比獲得諾貝爾獎更重要的事。
半生瘋癲
1928年6月,納什出生在美國一個富裕家庭。從小他就很孤僻,每天寧愿鉆在書堆里。但那個時候,納什的數學成績并不好,老師不滿于他常常使用奇特的解題方法。
1948年,在卡耐基梅隆大學讀大三的納什同時被哈佛、普林斯頓、芝加哥和密執安大學錄取。納什選擇了大師如云的普林斯頓,愛因斯坦、馮·諾依曼、列夫謝茨等都在這里。數學家馮·諾依曼是現代計算機之父,也是合作博弈理論的創立者。
“博弈根據是否達成具有約束力的協議分為合作博弈和非合作博弈。合作博弈是指博弈雙方的利益都增加,或者至少沒有受損,因而整體利益也增加。非合作博弈則研究人們在利益相互影響的局勢中如何決策使自己的收益最大,即策略選擇問題。”美國范德比爾特大學的溫泉教授對《英才》記者解釋。
“非合作博弈打破了合作博弈的最基本假設,就是說并非最優解就是均衡解(即博弈雙方的選擇可能對雙方都不利),個體都是從自身利益出發的,我根本不考慮別人的想法,我就考慮把自己的利益最大化。”
注意到諾依曼的缺陷的納什,在1950-1951年,以非合作博弈為主題寫出兩篇論文。他證明了非合作博弈及其均衡解的存在性,即著名的“納什均衡”,從而開創了博弈論的又一分支。
1958年,納什開始出現各種稀奇古怪的行為:他認為《紐約時報》上每一個字母都隱含著來自宇宙的神秘力量,而只有他才能讀懂其中的寓意。終于,在孩子出生以前,納什被送進了精神病醫院。他被確診為嚴重的精神分裂癥,然后是接二連三的診治,短暫的恢復和新的復發。
1962年,當納什被認為是理所當然的菲爾茲獎獲得者時,他的精神狀況使他與這一“數學領域的諾貝爾獎”失之交臂。
妻子艾里西亞在幾年后終于不堪忍受,與納什離婚了。但是艾里西亞并沒有放棄納什,還是跟他住在一起,30年來精心照料他和他們同樣患精神分裂癥的兒子。
盡管納什辭去了麻省理工學院教授的職位,但同事和朋友們設法為他保全了保險。他們還設立了一個資助納什治療的基金,尋找各種途徑幫他治療。
正當納什處于夢境般的精神狀態時,他的名字開始出現在20世紀70、80年代的經濟學課本、進化生物學論文、政治學專著和數學期刊中。他的名字已經成為經濟學或數學術語,如“納什均衡”、“納什談判解”、“納什嵌入”、“納什破裂”等。多數引用者想當然地以為這個人已經去世了。
“發瘋過程中他對經濟學沒有什么貢獻,最后給他諾貝爾獎,是因為別人是按照他的框架推出來的后續成果。2005年的諾貝爾經濟學獎得主謝林的主要貢獻是美、蘇的核武戰略該怎么做,他就是用納什的框架往前推,得出的結論是保持報復力量。”北京大學國家發展研究院副院長巫和懋認為,納什的貢獻在于提供了嶄新的思維框架。
漸漸蘇醒
那么后人如何繼續推演零和的納什均衡?囚徒困境能否被打破呢?
巫和懋表示,其實在現實中早已有解。
一戰中,英軍和德軍遭遇,若雙方都臥倒開槍,結果是(-1,-1);如果一方開槍,一方沒臥倒,結果是(2,-2);如果雙方都走來走去但不開槍,是(1,1)。“偶然遭遇時,是(-1,-1),就是所謂納什均衡,對雙方都不利的囚徒困境;可是長期的話,均衡肯定會走到(1,1)。因為雙方用(-1,-1)互相懲罰,懲罰到太痛苦了,你自然就會走到(1,1)”。這就是一戰中的著名景觀——互不開槍的對峙戰。
溫泉也提醒,在現實中大概有40%多的博弈結果是沒有按照納什的理論預測的,這可能由于重復博弈、非完全信息等。“囚徒困境是一個富有啟發性的角度,但現實社會極其復雜,沒有解決經濟社會問題的靈丹妙藥。”
20世紀80年代末的一個清晨,當戴森教授像平常一樣向在校園里“游蕩”的納什道早安時,他第一次聽到納什說話:“我看見你的女兒今天又上了電視。”
納什漸漸從瘋癲中蘇醒。而他的蘇醒似乎是為了迎接他生命中的一件大事:榮獲諾貝爾經濟學獎。1994年,他和另兩位博弈論學者約翰·C·海薩尼和萊因哈德·澤爾騰共同獲得了諾貝爾經濟學獎。
“我們現在更多是通過他獲得諾貝爾獎以及《美麗心靈》這部傳記電影,或者經濟學術語‘納什均衡’等來了解他。現實中,我與納什先生見過幾次面,是在他的病情穩定以后。但這時他已經衰老了,出院后他就完全脫離科研了。他雖然是普林斯頓的老師,但他不是正常的老師,是名譽老師。像其他諾貝爾獎獲得者都是一直工作,到這個年紀就成大師了。當然在經濟學界大家還是很尊重他,他的影響還是很大的。”溫泉介紹說。
2001年,根據納什的傳奇經歷改編的電影《美麗心靈》上映。也是在這年,艾里西亞與納什復婚了。
改革博弈
談到博弈論的實際應用,巫和懋向《英才》記者講解,博弈論表面有點兒玄,其實就來自現實。小到日常生活,中到經濟社會,大到國際關系都是博弈。人們平時經常用博弈思考,只是不很自覺。如果很自覺,思考就會更深一層。
“很重要的是要真正考慮對手的立場、策略,然后再思考自己的立場和策略,這樣才能達致均衡。比如釣魚島問題,就是一個博弈。美國和中國以前是(2,-2),美國控制整個太平洋;現在中國崛起后就要尋找一個新的均衡。怎么辦?那我就要用(-1,-1)說話,逼他走到(1,1)。”
正處于轉型期的中國經濟社會中,博弈困境更是隨處可見。北京大學光華管理學院張維迎教授便長期從事相關研究。“現在坑蒙拐騙很多,為什么?因為相當一部分人都想玩一次性博弈,我賺一把是一把;煤炭事故為什么這么多?因為政府隨意干預、隨意關煤礦,你不知道拿到的開采權能延續多久,怎么辦?那就竭澤而漁,能撈一把是一把。”
對于走出這類囚徒困境的辦法,張維迎解釋:“人類產生了很多制度來解決合作中的囚徒困境,包括私有產權制度、法律和社會規范等。其中私有產權制度是最重要的,只有基于私有產權基礎上的市場機制,我們才能更好地合作。如果消滅產權,或者任意侵害產權,就破壞了人們的預期,就有更多的短期行為。”
巫和懋則認為,中國要解決未來的問題,就要讓各個團體都能參與到經濟成長的博弈中來。他舉到食品安全的例子。現在企業是2,消費者是-2;如果讓消費者組成消費者聯盟NGO,它就可以公布哪家企業的食品有問題,就會向(-1,-1)走,你使我受損,我也讓你受損;這樣長期的話,大家就被逼到(1,1)了。現在的瓶頸是從(2,-2)到(-1,-1)過不來,因為沒有給消費者相應的博弈權利。
中國可以找尋自己的道路,可是要讓所有公民都能夠公平參賽,不要擋住很多人參與的權力。“總之要讓這些社會力量出來,像環保、消費者保護類的組織,你都可以讓他做。所有人都能得到經濟成長的好處,整個國家就會往前走。”
但改革不是請客吃飯,當下國內也面臨著改革的囚徒困境:希望改革的群體不掌握改革杠桿,掌握鎖鑰的所謂既得利益群體又不愿意改革。
“國內最重要問題是體制問題,用博弈論看都是有解的。”巫和懋提出了他對未來樂觀的原因:
“近代之后,世界對中國影響是蠻大的,對你有一個規范。你的人民可以不滿意就走,你就要吸引高端人才留下;財富也是這樣,有錢人可以往外跑。所以你要把中國放在博弈論的角度來看,有很多國家在跟它競爭。”
“中國足夠大,可以同時容納政府和百姓都得到利益,實現雙贏。不要總想著讓別人輸,我才能贏。第一個,大家一定要看清楚、看遠,才能形成一個長期博弈;第二個,范圍要看大,格局要大,都往前看,共同往(1,1)走,就能實現雙贏。”