“博弈論是指具備不同利益的人的理性行為理論。”①[美]羅伯特·J.奧曼:《博弈論講義》,周華任等譯,北京:中國人民大學出版社,2017年,第1 頁。通常認為,馮·諾伊曼和摩根斯頓合作的《博弈論與經濟行動》一書的出版標志著博弈論的建立。經過70 多年的發展,博弈論不僅與主流經濟學融合創立了交叉學科——經濟博弈學,而且其應用范圍更是遍及政治、軍事、外交、生物等各個領域,以至于有人說,如果未來社會科學還有純理論的話,那就是博弈論。諾貝爾經濟學獎得主赫伯特·金迪斯也認為,博弈論是我們“研究世界的一種工具”。雖然博弈論理論建立于20世紀上半葉,但博弈思想早已有之。中國春秋時期的《孫子兵法》雖然未提及與“博弈”有關的只言片語,但被認為“是人類有記載以來第一次試圖連貫地、一般性的理解沖突和策略”②Emerson M.S. Niou and Peter C.Ordeshook. A Game—Theoretic Analysis of Sun Tzu’s The Art of War,Journal of Peace Research,31(2):161-174,May 1994.的博弈論啟蒙全書,通篇蘊含著理性決策、互動決策、混合博弈等豐富的博弈思想,處處閃爍著博弈智慧光芒。
馮·諾伊曼將博弈參與人假設為理性的人,用數字方法考察雙方理性決策的過程,從而建構起了博弈論的基本框架。可以說,“理性的行為人做出完全符合邏輯的選擇”③[美]羅伯特·道奇:《哈佛大學的博弈論課》,李莎等譯,北京:新華出版社,2013年,第35 頁。這一假設既是博弈論的理論基石,也是其所倡導的核心思想——理性決策。而這一思想在《孫子兵法》中雖未被明確提及,卻滲透于全篇之中。《孫子兵法》被譽為“第一本在中國提供以理性客觀分析作為知識基礎的書”④轉引自鈕先鐘:《孫子三論:從古兵法到新戰略》,桂林:廣西師范大學出版社,2003年,第17 頁。,其理性決策思維理念集中體現在基于理智決策、基于理性分析、基于利害決策三個方面。
(一)基于理智決策。1994年,約翰·豪爾紹尼在諾貝爾獲獎辭中講:“博弈論是關于策略相互作用的理論,就是說,它是關于社會形勢中理性行為的理論。其中,每個參與人對自己行動的選擇必須以對其他參與人將如何反應的判斷為基礎。”但是在實際博弈中,特別是在戰爭博弈領域,人們往往會做出非理智決策。那么,應如何才能理智決策呢?一是理智決策的前提是慎重決策。《孫子兵法》開篇就指出:“兵者,國之大事,死生之地,存亡之道,不可不察。”①《孫子兵法》,北京:知識出版社,2015年,第3 頁。戰爭事關生死、存亡,充分表明了孫子對戰爭極其慎重的態度。二是理智決策的基礎是對客觀事物的充分認識,而不是輕率的主觀判斷。《孫子兵法》提出:“先知者,不可取于鬼神,不可象于事,不可驗于度,必取于人,知敵之情者也。”②《孫子兵法》,第141 頁。也就是說,戰爭決策不能迷信于“鬼神”,不可簡單類比于“事”,不可僅僅依賴“度”,而要基于“知敵之情者”,表面指“間諜”,引申為要基于客觀情況,不能憑主觀想象。三是理智決策的保證是基于理性,勿憑情感。要做到“主不可以怒而興師,將不可以慍而致戰”③《孫子兵法》,第135 頁。,這是因為“怒可以復喜,慍可以復悅;亡國不可以復存,死者不可以復生。故明君慎之,良將警之,此安國全軍之道也”④《孫子兵法》,第135 頁。。時刻提醒人們,必須以理智的態度對待戰爭、對待作戰,切不可憑個人好惡、個人感情用事。
(二)基于理性分析。納什均衡是博弈論中最基本的博弈均衡概念,它指的是這樣一種由所有參與人的最優策略組成的策略組合。博弈分析的目的就是預測博弈的均衡結果。《孫子兵法》以“計”為開始之篇,“計”基本意義是計算,但也可以具有計劃、分析、評估等含義。孫柏林認為:“孫子在當時的歷史條件下,運用樸素的系統觀和運籌思想,講求效益的綜合分析和預測評價,都符合現代系統論和運籌學的基本原則。”⑤《孫子新論集粹》,北京:長征出版社,1992年,第251 ~260 頁。這充分說明,孫子在認真考慮戰爭問題不是簡單的定性分析,而是經過周密精密的計算、計劃、分析和評估,其對勝負的預測與博弈均衡的分析是一致的。一是在戰略層面,要“經之以五事,校之以計,而索其情”。將國力評估區分“道、天、地、將、法”五種因素“校之以計”,即進行量度計算;并從“主、將、天地、法令、兵眾、士卒、賞罰”七個方面“索其情”,即在計算基礎上進行判斷,實現客觀與主觀統一,這既是“廟算”的核心,也是一種理性分析的方法。在上述理性分析基礎上才能確定決策,有針對性地制定策略,并提醒人們這樣才能“以此知勝負矣”⑥《孫子兵法》,第3 頁。。二是在戰役戰術層面,要按照“一曰度,二曰量,三曰數,四曰稱,五曰勝。地生度,度生量,量生數,數生稱,稱生勝”⑦《孫子兵法》,第39 頁。五項連續思考步驟進行理性分析。“度”是對戰場環境分析判斷,“量”是依據戰場環境確定作戰力量支撐程度,“數”是根據支撐程度來決定作戰部署,“稱”是對雙方作戰能力進行精密比較。始于戰場環境,終于作戰能力,無一不是對客觀情況的理性分析,只有這樣才能真正形成“以鎰稱銖”的決定性優勢。
(三)基于利害抉擇。博弈思維,指思考出許多方案,并以極快的思維操作比較其優劣,從中挑選出最好、最理想的方案并付諸實施的思維方法。⑧參見趙新軍等編著:《創新思維與技法》,北京:中國科學技術出版社,2014年,第38 頁。博弈論中將成本、收益和風險作為選擇最優策略的基本標準。那么,在戰爭博弈中,如何比較優劣,挑選出最好最理想的方案呢?就是要知利害、析利害、權利害,在利害比較中作出判斷,在趨利避害中作出決斷。首先,要知利害。“故不盡知用之害者,則不能盡知用兵之利也。”⑨《孫子兵法》,第14 頁。這句話包含兩方面意思:一方面,無論是戰爭,還是具體某一次作戰中,沒有絕對完美的占優策略,任何策略都是有利亦有害,切不可只知其利而不知其害;另一方面,要“盡”知利害,知其一二不行,要盡可能全面、徹底、毫無遺漏的知,不可以有任何一廂情愿的想法。其次,要析利害。“是故,智者之慮,必雜于利害。雜于利,而務可信也;雜于害,而患可解也。”⑩《孫子兵法》,第82 頁。所謂“智者”,就是有理性的決策者。戰爭和作戰決策者在決定時都必須考慮正反兩個方面,既要爭利,又要避害,而利害關系又非常復雜,往往利中有害,害中有利,所以應全面客觀分析利害。第三,趨利避害。“非利不動,非得不用,非危不戰。……合于利而動,不合于利而止。”①《孫子兵法》,第135 頁。決定打還是不打、何時打、在哪里打、怎么打、打到什么程度?其最高準則是符不符合國家的根本利益,能不能堅持以利為動、以害為止的原則。這些都充分說明,“孫子是一位標準的理性主義者,他完全了解在戰略領域中唯一考慮即為利害,而絕無感情用事之余地,他的思想與現代戰略家幾乎完全一致,甚至于其謹慎程度尤有過之而無不及。”②鈕先鐘:《孫子三論:從古兵法到新戰略》,第118 頁。
羅伯特·奧曼指出,“互動決策理論”可能是通常被稱為“博弈論”的這一學科的更加準確的名稱。③[美]羅伯特·道奇:《哈佛大學的博弈論課程》,李莎等譯,第34 頁。博弈論就是對理性決策者的互動決策過程的研究。簡單地講,就是一方制定策略時,需要預測另一方可能采取的策略,并在此基礎上確定己方策略,依此循環往復。《孫子兵法》雖未像博弗爾一樣將戰爭比喻為兩個擊劍手的對抗,也未像克勞塞維茨將戰爭比喻成一場紙牌賭博,但全篇都可以感覺到其將戰爭看作棋手對弈,其互動決策思想貫穿全書。
(一)“知”是互動決策之基。所謂“博弈”,即兩個或兩個以上參與者互動活動,其結果取決于雙方或多方策略的選擇。“而在同時行動的博弈里,沒有一個參與者可以在自己行動之前得知另一個參與者的整個計劃。在這種情況下,互動推理不是通過觀察對方的策略進行,而是必須通過看穿對手的策略才能展開。”④[美]阿維納什·K.迪克西特、巴里·J.奈爾伯夫:《策略思維:商界、政界及日常生活中的策略競爭》,王爾山譯,北京:中國人民大學出版社,2013年,第51 頁。這充分說明,互動決策要看穿對手策略,看穿對手策略需要信息;誰擁有更多準確的信息,誰預測判斷對手策略就更準確,誰勝算的可能性就更大。如何獲取信息?要靠“知”。《孫子兵法》全篇共有79 個“知”字,共同構成了其特有的敵我信息交互理論。一是在戰略層次,要知“道、天、地、將、法”。戰爭既是軍事實力的對抗,更是綜合國力的較量,戰與不戰的策略的抉擇,戰略方針的確定都要建立在客觀知情之上。因此,《孫子兵法》提出:“故經之以五事,校之以計而索其情:一曰道,二曰天,三曰地,四曰將,五曰法。”并且提醒人們:“凡此五者,將莫不聞,知之者勝,不知者不勝。”⑤《孫子兵法》,第3 頁。二是在戰役和戰術層面,要知彼知己、知天知地。《孫子兵法》提出:“知彼知己,勝乃不殆;知天知地,勝乃可全。”⑥《孫子兵法》,第109 頁。一方面,作戰是敵我雙方的對抗,要了解敵我雙方作戰實力,特別是了解敵方可能采取的策略,才能有針對性制定己方策略。為此,《孫子兵法》提出:“知彼知己,百戰不殆;不知彼而知己,一勝一負;不知彼不知己,每戰必殆。”⑦《孫子兵法》,第31 頁。另外,自然環境是敵我雙方交戰的舞臺,除了解敵我雙方情況外,還要知“通、掛、支、隘、險、遠”六種地形之道,“散、輕、爭、交、衢、重、圮、圍、死”九種戰地之策,“發火有時,起火有日”等自然環境規律,才能真正看穿敵人策略,因敵、因地、因情制定己方策略,奪取作戰勝利。三是要破壞對方“知”。由于“知”與“不知”是一個相對概念,有兩個衡量尺度:一是多與少,客觀情況獲取多的一方為知,反之為不知;二是準確與否,判斷準確的一方為知,反之為不知。為此,《孫子兵法》除強調己方要“知”外,還強調“故能而示之不能,用而示之不用,近而示之遠,遠而示之近”⑧《孫子兵法》,第6 頁。,采取保密、欺騙、佯動等手段,造成敵方的“不知”。
(二)“致”是敵我互動之法。策略博弈的精髓在于參與者的決策相互依存。①[美]阿維納什·K.迪克西特、巴里·J.奈爾伯夫:《策略思維:商界、政界及日常生活中的策略競爭》,王爾山譯,第30 頁。有可能參與者輪流出招,也可能參與者同時出招。無論哪種方式,誰掌握主動權,誰就能牽著對方的鼻子走,反之亦然。《孫子兵法》提出:“先處戰地而待敵者佚,后處戰地而趨敵者勞。故善戰者,致人而不致于人。”②《孫子兵法》,第55 頁。認為善于作戰的人,總是設法調動敵人而不被敵人所調動,其核心就是奪取和掌握戰場主動權,盡可能壓縮敵方選擇策略的空間。如何才能“致人而不致于人”呢?一是要應形無窮,使敵無策可施。《孫子兵法》提出:“故戰勝不復,而應形于無窮。”③《孫子兵法》,第62 頁。“故形兵之極,至于無形。無形,則深間不能窺,智者不能謀。”④《孫子兵法》,第61 頁。使敵看不出形跡,窺察不到我方策略,則再聰明的敵人也想不出辦法。“應形于無窮”,包含兩方面的含義:一方面,作戰部署“無形”,即:“故形人而我無形,則我專而敵分。我專為一,敵分為十,是以十攻其一也。”⑤《孫子兵法》,第58 頁。另一方面,作戰企圖“無形”,即:“吾所與戰之地不可知,不可知,則敵所備者多;敵所備者多,則吾所與戰者寡矣。”⑥《孫子兵法》,第58 頁。二是要利誘害驅,使敵依我計而行。博弈過程中,如果敵人能夠按照我方既定策略行動,則利于我掌握主動權。如何調動敵人呢?孫子認為無非“利害”二字,即:“能使敵人自至者,利之也;能使敵人不得至也,害之也。故敵佚能勞之、飽能饑之、安能動之者,出其所必趨也。”⑦《孫子兵法》,第55 頁。以利誘之,敵就會不請自來;使其感到威脅,敵就不會采取某種行動或策略。這樣,我就可以居于主動而敵處于被動。三是要因敵施擾,使敵策降效失效。《孫子兵法》提出擾敵“八法”,即:“利而誘之,亂而取之,實而備之,強而避之,怒而撓之,卑而驕之,佚而勞之,親而離之。”⑧《孫子兵法》,第6 頁。通過“誘、取、備、避、撓、驕、勞、離”等方法,擾亂敵人,使其無法完全按照既定策略行動,從而降低其策略效能。
(三)“變”是敵我互動之魂。博弈過程中,不能僅“致”敵,有時這些策略和方法具有較大被動性、消極性和不確定性,更為重要地是要主動求“變”,這樣才能“先為不可勝,以待敵之可勝”。為此,《孫子兵法》提出:“水因地而制行,兵因敵而制勝。故兵無成勢,無恒形。能因敵變化而取勝者,謂之神。”⑨《孫子兵法》,第63 頁。就是要因敵而變,目的是給對手制造出更多的不確定性,使敵無法準確掌握我方策略,這也是博弈重復而制勝之策卻不重復的原理。如何“變”呢?一是要深諳攻守之變。“不可勝者,守也;可勝者,攻也。守則有余,攻則不足。善守者,藏于九地之下;善攻者,動于九天之上,故能自保而全勝也。”⑩《孫子兵法》,第37 頁。深諳攻守之變,則能根據戰場實際,靈活采取攻守之法,防御時能自保,攻擊敵時能全勝。二要通曉奇正之變。“凡戰者,以正合,以奇勝”,“戰勢不過奇正,奇正之變不可勝窮也。奇正相生,如環之無端,孰能窮之?”?《孫子兵法》,第46 頁。這是《孫子兵法》中的一條定律,核心是使敵無所適從,進而捕捉勝機。無論“奇正”,都是因敵而言,在敵意想不到的時間、意想不到的地點、意想不到的行動或策略,都可以稱為“奇”,反之就是“正”。三是要活用虛實之變。“兵之所加,如以碫投卵者,虛實是也。”?《孫子兵法》,第45 頁。何謂虛實?“虛”就是弱點,“實”就是強點。活用虛實之變,同樣包含敵我兩個方面:于己,要實則虛之、虛則實之,讓敵分不清我虛實;于敵,要善于發現虛實、使實變虛、待實變虛,最終形成以我之實擊敵之虛之勢。
以往人們認為,在戰爭領域只有零和博弈。隨著博弈理論自身的發展和認識的不斷深化,人們逐步發現戰爭領域既有零和博弈,也有非零和博弈。美國著名博弈論專家托馬斯·謝林稱之為“混合博弈”,即“混合博弈不是指博弈雙方選擇的混合性,而是形容雙方之間關系的復雜、難以琢磨—互存關系與沖突關系或伙伴關系與競爭關系的混合”①[美]托馬斯·謝林:《沖突的戰略》,趙華等譯,北京:華夏出版社,2011年,第78 頁。。謝林認為,只有大規模戰爭和毀滅性戰爭中,敵我雙方才是“零和博弈”,才存在完全沖突;而更多的情況,敵我雙方是“混合博弈”,存在以威懾避免戰爭,或以小戰而遏止大戰的可能性。這與《孫子兵法》提出的“是故百戰百勝,非善之善者也;不戰而屈人之兵,善之善者也”②《孫子兵法》,第25 頁。思想似乎不謀而合。
(一)“全爭”理念。謝林認為:“成功的雇員大罷工絕不是搞得雇主飽受經濟損失、資不抵債,否則根本就不存在所謂的成功罷工。戰爭也是同樣的道理。”③[美]托馬斯·謝林:《沖突的戰略》,趙華等譯,第7 頁。同樣,這也是孫子所不愿看到的結果,他認為:“屈人之兵而非戰也,拔人之城而非攻也,毀人之國而非久也。必以全爭于天下,故兵不頓而利可全,此謀攻之法也。”④《孫子兵法》,第27 頁。也就是說,孫子認為國家之間博弈最好的結果是,不靠武力使人屈服,不靠攻城奪取城池,不靠消耗消滅敵國,而應“全爭于天下”。如何“全爭”,就是要“非戰、非攻、非久”。鈕先鐘先生認為:“孫子所謂的‘戰’,其意義即為使用武力。”⑤鈕先鐘:《孫子三論:從古兵法到新戰略》,第47 頁。兩個以上國家集團之間的戰略博弈,對于武力的使用應包含以下四個層次:不使用武力、威脅使用武力、有限使用武力、絕對使用武力。“非戰、非攻、非久”主要是指前三者,而非后者。為什么呢?《孫子兵法》中已經給出了明確的答案:一是戰爭準備消耗巨大,需要“馳車千駟,革車千乘,帶甲十萬,千里潰糧,則內外之費,賓客之用,膠漆之材,車甲之奉,日費千金,然后十萬之師舉矣”⑥《孫子兵法》,第13 頁。。這些數據在今天雖已不具有實際意義了,但其科學分析、量化分析的態度和思想卻歷久彌新。二是戰后成本高昂,可能造成“國之貧于師者遠輸,遠輸則百姓貧。……丘牛大車,十去其六”⑦《孫子兵法》,第15 頁。。三是即使勝利,也可能存在較大風險,可能導致“其用戰也勝,久則鈍兵挫銳,攻城則力屈,久暴師則國用不足。夫鈍兵挫銳,屈力殫貨,則諸侯乘其弊而起,雖有智者不能善其后矣。故兵聞拙速,未睹巧之久也。夫兵久而國利者,未之有也”⑧《孫子兵法》,第14 頁。。
(二)求“全”避“破”。因為絕對使用武力的代價、成本和風險如此高昂,所以“大多數的沖突者存在討價還價的可能性”⑨[美]托馬斯·謝林:《沖突的戰略》,趙華等譯,第7 頁。,于是存在著避免大規模毀滅戰爭的可能性,也存在著通過威脅使用武力或部分使用武力達到戰略目的的可能性。這也是充分證明了《孫子兵法》提出的“凡用兵之法,全國為上,破國次之;全軍為上,破軍次之;全旅為上,破旅次之;全卒為上,破卒次之;全伍為上,破伍次之”⑩《孫子兵法》,第25 頁。。求“全”避“破”并不僅僅只是一個理想目標,而且是可以實現的一個務實理念。“全”與“破”是兩個相對目標概念,“全”的意義是完整而無任何損毀,絕對的“全”只存在于合作博弈中;“破”的意義即為造成無可避免造成損毀,絕對的“破”只存在于零和博弈中。而孫子秉承的理念是:擊敗對方而又能避免造成損毀,達成“不戰而屈人之兵”的目的。這一理念必須要放在“混合博弈”框架下進行理解,既要看到沖突雙方除存在利益分歧外,某種程度上也存在共同利益,而這個“共同利益”的存在使得不使用武力、威脅使用武力或有限使用武力,將雙方損毀都能減到最低限度,而達成戰略目的成為可能。
(三)先“伐謀、伐交”后“伐兵、攻城”。如何將“全爭”理念落到具體的計劃,實現求“全”避“破”呢?《孫子兵法》提出:“故上兵伐謀,其次伐交,其次伐兵,其下攻城。”①《孫子兵法》,第26 頁。“伐謀、伐交、伐兵、攻城”既可以看成四種策略的選擇,也可看作四種手段的運用。一方面,作為四種策略的選擇,則有先后、優劣之分。首先應實施“伐謀”,識破敵策略,并表明我已經做好充分準備,使敵認為按既定計劃實施無法獲取相關利益或達到其意圖,自然能達成不戰而屈人之兵的目的。如果伐謀不成,則分化瓦解敵同盟或內部勢力,削弱敵方實力,使其無法按原定計劃實施,也不失為次好的策略。如果“伐謀”“伐交”均無法迫使敵放棄,則要考慮“伐兵”以小戰、速戰迫使敵屈服;否則,就要選擇“攻城”這個下策了。為什么將攻城視為下策呢?這是因為“攻城之法,為不得已。修櫓辒,具器械,三月而后成;……而城不拔者,此攻之災也。”其付出的代價較大,從博弈成本和風險來講,是為下下策。另一方面,如果將其視為四種不同手段的運用,則應綜合考慮使用四種不同的手段,要做好“攻城”和“伐兵”準備,具備“攻城”和“伐兵”能力,再通過“伐謀”“伐交”使敵相信如果不放棄原計劃或企圖則“被伐兵”“被攻城”,招致滅頂之災,迫敵主動放棄從而達成戰略或作戰目的。
成書于兩千多年前的《孫子兵法》,總結了當時各諸侯國戰爭策略實踐經驗,全篇充滿了豐富的博弈智慧。本文僅是從三個方面進行了簡單的梳理,遠未窺其全貌和精髓。比如,“避其銳氣”“擊其惰歸”“以治待亂”“以靜待嘩”“散地則無戰”“爭地則無攻”等針對各種情況提出的具體對策,無不閃耀著樸素策略思維的光芒,需要加以深入研究和理解。同時也必須看到,《孫子兵法》中的博弈思想是樸素的,既沒有深入探討理性決策者思維路徑,也沒有研究理性決策者之間的沖突與合作中的數學模型,與現代意義的博弈論相比,其科學性和精密性還有著明顯差距。但這并不是說其博弈思想對于現代戰爭和作戰領域沒有任何意義,恰恰相反,系統梳理和深化研究《孫子兵法》中的博弈思想,能夠加深對現代戰爭和沖突的本質認識,深化對現代博弈論的理解把握,加速推進博弈論與作戰理論的交叉融合,開拓作戰博弈理論研究的新領域。