楊召富,郭佳宏
(北京師范大學 哲學學院,北京 100875)
博弈包括合作博弈和非合作博弈。歷史上,合作博弈先于非合作博弈產生,但前者的研究對象相對于后者而言有些煩瑣,相關研究發展相對不足。區分二者的關鍵在于,在博弈過程中是否存在博弈方使用具有約束力性質的協議。非合作博弈是研究博弈參與者如何在博弈中運用策略使自身利益最大化的博弈。但這通常會造成個體理性與集體理性之間的沖突,導致類似囚徒困境現象的產生,繼而達不成和諧的狀態和整體利益較好的局面[1]。而在現實生活中,諸多個體通常會合作,他們會聯合在一起組成小團體或集團,這種基于博弈方允許存在約束力的協議而形成的博弈稱為合作博弈。與其說合作博弈的收益分配或成本分擔的解是數學問題,不如說它是經濟或社會問題[2]。
從方法論的角度講,多人合作博弈又稱聯盟(coalition,也有譯成“聯合”的)博弈,是指博弈參與人之間建立具有約束力協議的聯盟性質的博弈。博弈參與人之間能夠形成聯盟的原因在于,聯盟給個人帶來的價值超過個人獨自完成某項任務時創造的價值,從而實現共贏[3]。同時,聯盟后的利益分配也要彰顯正義,保護弱勢群體的利益,這樣的社會資源分配才是合理的,且有利于聯盟的穩定。而這也與儒家學派思想家荀子的“義分則和”思想有著某種相似的旨趣。當然,聯盟的形成絕非易事,并且有的聯盟具有不穩定性,易被破壞或者瓦解,從而造成資源的浪費。所以,在聯盟博弈中,對聯盟如何形成、怎樣確保已有聯盟的穩定性等問題的充分研究是運用聯盟博弈恰當分析社會問題,幫助更多人群走出博弈困境、提升團體和社會的公平程度甚至構建和諧美好社會的關鍵。
為了準確地理解聯盟博弈的核心解這一概念,我們首先需要了解聯盟、協議、聯盟值等概念。
聯盟:現實社會中的博弈中參與人往往不止一個,而是由多個參與人組成的一個或多個集合體,這種集合體在博弈論中被稱作聯盟。
協議:協議是聯盟各個成員主體商議后的成文或不成文的各項規定,重點是聯盟的利益分配。聯盟中的每個利益相關者在一定條件下遵循他們之間約定的協議,從而展開競爭與合作。
聯盟的個數:假設有n(n為正整數)個博弈參與人,他們構成一個集合N={1,2,…,n}。博弈中的所有可能聯盟S的個數為集合N的子集的個數,即2n。S包含四類聯盟,分別是:空聯盟 ,即沒有任何博弈參與人的聯盟;大聯盟N={1,2,…,n};單人聯盟(不是嚴格意義上的聯盟){1},{2},{3},…;一般聯盟{1,2},{2,3},{1,2,3},{1,2,3,4},{2,3,4,5},…。
可行分配集:分配(也叫效用分配)概念在聯盟博弈中至關重要,它關系一個聯盟形成后能否持續和穩定,通常用向量x=(x1,…,xn)∈Rn(R表示實數集)來表示,其中xi表示博弈參與人i在聯盟中的期望收益。而聯盟博弈的可行分配須同時滿足個體理性和集體理性兩個要求。個體理性意味著,對于聯盟內部而言,博弈參與人i在某個聯盟中的得益大于等于不參加任何聯盟的得益,這對單個博弈參與人有激勵性。集體理性則是指,聯盟形成后,不僅每個博弈參與人的收益不會比聯盟前的少,所有的博弈參與人恰好將聯盟形成后的收益分配完畢,此時也稱這個分配是有效的。這是針對整個聯盟來說的,此時可實現帕累托最優[5]。同時滿足上述要求的分配集合被稱作聯盟博弈的可行分配集,也被稱作聯盟博弈的“解”。
特征函數(characteristic function):在具有合作性質的聯盟博弈中,用特征函數來表示博弈的局勢。特征函數是基于聯盟博弈中形成的聯盟而建立起來的,也是反映聯盟形成的條件和價值的重要概念。其定義如下:設聯盟博弈是由n(n為正整數)個博弈參與人組成的集合N={a1,a2,…,an},?S?N,其中S為博弈中的任意聯盟,即S∈P(N),不管聯盟外的博弈參與人如何行動,聯盟中的博弈參與人之間通過遵循具有約束力的協議可以得到的最大聯盟總收益,記作v(S)。在很多情況下,一個聯盟能獲得的收益依賴于其他人所采取的行動。v(S)有時被解釋為聯盟S獨立于聯盟N-S的行動可保證的最多收益[6]。而集合N中的所有可能聯盟收益v(S),構成P(N)→R(R表示實數集)的一個實值函數,這個函數被稱作此聯盟博弈的特征函數。其中,v是從N的冪集到R的映射,S在N的冪集里變化。我們用特征函數來表示聯盟值。


吉利斯在1959年提出了聯盟博弈的解——“核心”[7]這一概念。謝識予、熊義杰、潘天群等學者對“核心”這一概念做了深入的研究。
每個博弈參與人在締結某個聯盟時都會關注自己能夠在聯盟后分配到多少效用或收益。謝識予認為,聯盟博弈的解實質上是指在確定了何種類型的聯盟形成之后聯盟成員如何恰當地分配聯盟收益的一種理論[4]365。
為了更好地理解“核心”這一概念,我們引入熊義杰的“優超”這一概念。

例2:一項任務需要a1、a2、a3三人共同完成,但單獨行動或任意兩人的聯盟都不能順利完成該項任務。規定完成該項任務的總收益為110。那么此聯盟博弈的特征函數可以表示為:v({a1})=v({a2})=v({a3})=v({a1,a2})=v({a2,a3})=v({a1,a3})=0,v({a1,a2,a3})=110。可見,在上述聯盟博弈中,大聯盟能夠改進任意一個單獨聯盟或普通聯盟。
潘天群指出,在一個N人聯盟博弈中,某個效用配置xi在聯盟的核心中,當且僅當這個配置xi滿足:它對大聯盟S來說是可行的,同時不存在比N小的聯盟能對配置xi進行改進,即效用配置xi在“核心”中的充要條件為[9]:
從上述條件中可以看出,核心中的分配不僅滿足個體理性,而且滿足聯盟理性,即任何聯盟的收益都不小于其離開核心的分配而獨立出來所能獲得的收益[10]。所以,此時大聯盟中的某個博弈參與人不愿意否決這個方案而去加入其他的聯盟,因為此時的分配給他帶來的利益是最多的。
如果一個效用配置xi未在核心當中,那么一定存在某個聯盟S,使得聯盟S中的博弈參與人之間通過共同合作、分配v(S)而使他們獲得嚴格高于效用配置xi的支付或收益。
上述例2的核心為{a|a1+a2+a3=110,a1≥0,a2≥0,a3≥0}。顯然,如例2的核心所顯示的那樣,核心通常是一個解集,它往往不能給我們提供唯一的解。甚至,聯盟博弈的解有時可能是空集。比如,某個聯盟博弈的特征函數可以表示為:v({a1})=v({a2})=v({a3})=0,v({a1,a2})=v({a2,a3})=v({a1,a3})=0,v({a1,a2,a3})=100。它的解就是空集。
核心只是表明什么樣的分配是穩定的,不能解決對于解的多樣性和不存在性這兩類問題,這也是它作為聯盟博弈的解概念的缺陷之處[4]366。當然,這種缺陷并不能否定核心這一概念在幫助人們理解聯盟博弈時的用處。
核心是多人合作博弈出現的最早的解概念,這樣的解對于博弈參與人個體而言是相對公平的,對于所有博弈參與人組成的大聯盟而言也是最優的。
《塔木德》是一部用于規范古代猶太人生活行為準則的重要法典,記載了一個關于婚姻契約與財產糾紛的故事。契約規定,如果出現婚姻中止(離婚或者死亡)的情形,男方要給予女方一定的經濟賠償。一個猶太男子娶了3個妻子(分別為1、2、3),沒過多久不幸死亡。而契約上約定給妻子1、妻子2、妻子3的財產分別為100、200、300。但是,這個男子死后并沒有留下足夠遺產。三個妻子為了爭奪男子的遺產,就請猶太拉比們根據男子實際留下的遺產給予一個公平的分配方案。《塔木德》一書中記載了猶太拉比們最終裁決的關于三個妻子分配遺產的解決方案,見表1。

表1 三妻爭財產問題的塔木德解決方案
按照常理,這三個妻子得到遺產的比應該是1∶2∶3。但從上表中得知,僅當男子留下的財產達到300時,上述方案中的分配比例才會成立。上表中的數字具體是如何分配的困擾了很多人,這個分配方案的依據與合理性成了一個千古謎題。直到1985年,兩位博弈論專家奧曼和馬希勒成功地破解了這一難題[12],經過研究發現,解開這個謎團的鑰匙就在《塔木德》法典的開頭部分。《塔木德·損害部·中門卷》第一章第一節的“爭執大衣原則”為三妻分財產的分配方案提供了合理的解釋:
兩人抓著一件大衣,來找拉比裁決:如果兩人都認為自己擁有這件大衣的全部所有權,拉比會裁定二人平分這件大衣。如果一個人說大衣全是他的,另一個人說大衣的一半是自己的,那么拉比最終裁定第一個人可以得到大衣的3/4,第二個人得到大衣的1/4。
“爭執大衣原則”大致包含兩個方面的內容[13]:
(1)爭執兩方僅對有爭議的部分進行分配,不考慮無爭議部分的分配。因此,聲稱自己對大衣擁有一半所有權的一方不幸率先失去索要的那半件大衣,只能跟聲稱擁有全部大衣所有權的一方平分半件大衣,而剩余的半件大衣歸第一個人所有。
(2)爭執過程中,提出較多分配一方的最終所得應不少于提出較少分配的一方。
奧曼和馬希勒成功找到以上兩條原則之間的關系,在他們合著的論文中得出了重要結論:塔木德分配方案是唯一一個與爭執大衣原則相一致的解決方案[12]。
再回到三妻分遺產的例子。當遺產為100時,根據“爭執大衣原則”,三個妻子都有權獲得全部遺產,該結果沒有爭議,所以分配為(100/3,100/3,100/3),與塔木德分配方案的結果完全相同。當遺產為200時,其中100是沒有爭議的,所以妻子1沒有資格獲取這100遺產。這時我們需要將分配方法轉換成聯盟博弈。根據“爭執大衣原則”,妻子2和妻子3可以結成一個聯盟,獲得這100。隨后,這個聯盟再與妻子1分剩余的100。此時,妻子1分得50,妻子2與妻子3共分得150。對于這150,妻子2和妻子3是沒有爭議的,應均分,各得到75。(50,75,75)就是三個妻子的最終分配。
同理,當遺產為300的時候,運用“爭執大衣原則”,可以得到最終的分配為(50,100,150)。
將“爭執大衣原則”推廣后得到的分配方案即為塔木德分配方案,而《塔木德》法典里許多問題的解決都凸顯出恰當運用聯盟博弈的核心概念可以成功解決現實問題。經研究發現,《塔木德》法典給出的所有遺產分配方案中的每個解均在博弈的核心里,所以那些解都是合理的。比如,當猶太男子遺產很少,并且假定他的三個妻子又都依靠他的遺產過活,此時如果按照1∶2∶3的比例來分配財產,原本就處于劣勢的妻子1會分得的財產太少,或許沒過多久生活就會陷入窘境。而《塔木德》法典中的分配方案很好地改善了這一狀況。
上述遺產分配問題涉及聯盟博弈的核心問題。當財產為100時,假定每個妻子的分配是(100/3,100/3,100/3),那么該分配方案沒有爭議。但是,諸如(30,30,30)這樣的分配方案是不會被接受的。原因在于,這三個數字之和小于100。也就是說,這樣的分配是不穩定的,至少會被其他方案所改進。例如,方案(33,33,34)對于方案(30,30,30)來說,就是改進的。
當遺產總數是100時,該博弈的核心是{a|a1+a2+a3=100,a1≥0,a2≥0,a3≥0},而法典中記載的分配方案(100/3,100/3,100/3)包含在核心當中。
當遺產總數是200時,此時博弈的核心是{b|b1+b2+b3=200,b1≥0,b2≥0,b3≥0}。當遺產總數增加到200時,每個妻子分得的財產應該不少于遺產總數是100時分得的財產,即須滿足條件:b1≥a1,b2≥a2,b3≥a3。可以看到,被建議的分配方案(50,75,75)在核心中。
同理可以得出,當遺產總數為300時,被建議的分配方案(50,100,150)也在此時聯盟的核心當中。
由此可以看出,《塔木德》法典中所有的分配方案均在博弈的核心之中,符合聯盟博弈關于如何分配聯盟成員間利益的理論。
塔木德分配方案與當今社會中的重大經濟問題之一——破產問題的解決方案有著內在的一致性,它為破產爭執這類經濟問題提供了很好的借鑒方案[14]。在現實生活中,企業在發展過程中由于資不抵債而被迫依照法律程序宣告破產,由專門機構對企業的剩余資產進行清理和評估,然后將評估后的資產一定程度上分給企業的各個債主。當然,企業償還給債主的財產不一定能夠補償他們的債權。企業的剩余資產通過清理而最終被全部分割。在給企業的各個債主分割財產這一事情上,法院通常不會根據“比例”均分剩余資產,法院會根據各個債主提供的理由對其進行賠償。所以說,法院對宣告破產企業的財產完全進行分割后償還給企業的債主,這與《塔木德》中三個妻子全部分割丈夫的遺產的情形和邏輯思路完全一致。
從博弈論的視角看,《塔木德》分配方案實質上是多人合作博弈的一個核心解。它的獨特之處在于,此方案一以貫之地保護了弱勢群體的利益。如果爭執方接受這一準則,那么在分配爭執過程中,任何一方從任意角度出發均會發現這樣的分配方案都是公正的。實際上,塔木德案例所體現出來的分配原則更符合現代社會所提倡的和諧意識,更能反映現代社會所需要的均衡理念,因此顯得既公平又合理[11]。現今,多人合作博弈的核心解與古典塔木德分配方案的思想不謀而合,保護弱者利益,體現出分配的公平和正義,有深刻的哲學意蘊。
分配的正義問題,在中國的儒家思想和美國新自由主義學派的代表人物羅爾斯的《正義論》中均有所體現。荀子:“人何以能群?曰:分。分何以能行?曰:義。故義以分則和。”(《荀子·王制》)這是“義分則和”思想的直接來源。荀子所處的時代正處于社會的轉型期,社會中的各種力量沖突不斷,社會資源如何公正地得到分配,是荀子面臨的時代課題。荀子的“義分則和”思想表達的主要還是“和”的愿望和理想,具有很強的現實性。荀子的“分”含義廣泛,是包括人、行事和財富的一種大分配觀念。這里的“分”專指荀子對諸如財富等社會資源的分配。在荀子看來,“分”具有可行性。“分何以能行?曰義,故義分則和”(《荀子·王制》),即通過“義”來保證“分”的可操作性。具體來說,借助“禮義”,即“道德和制度”來進行分配。荀子在闡釋“禮”的淵源時說:“禮起于何也?曰:人生而有欲,欲而不得,則不能無求。求而無度量分界,則不能不爭;爭則亂,亂則窮。先王惡其亂也,故制禮義以分之,以養人之欲,給人之求。使欲必不窮于物,物必不屈于欲。兩者相持而長也。”(《荀子·禮論》)可見,在荀子的時代,他主張通過“禮”來安定社會的秩序,通過“禮”來對有限的社會資源進行合理的分配。而對于新時代而言,需要合理的頂層設計來保證資源分配的公平和正義。所以說,荀子的“義分則和”思想對于新時代的分配制度的設計以及和諧社會的構建具有啟發性。這里的“公正”需要從制度倫理的角度來看,即將道德的公正與制度的正義相結合。換句話說,和諧社會的建構需要合理的分配制度作為前提,在道德和制度兩個層面上有所建樹,從而對稀缺的社會資源進行合理的分配。羅爾斯在《正義論》的開篇中說過:“正義是社會制度的首要價值,正如真理是思想體系的首要價值一樣。”[15]分配正義是和諧社會的價值原則和基本目標,是社會主義和諧社會的題中之義[16]。改革開放40多年來,我國的分配制度與分配正義原則的精神相契合。富裕群體最大限度地享受了改革開放發展的紅利,實行分配正義原則之后,他們仍然會是受益者。這種原則受“帕累托改善”①的制約,富裕群體的社會福利水平不會因此而降低。由于各個社會群體在利益上存在鏈式效應,分配正義原則的實行在改善弱勢群體福利的同時,富裕群體的福利也會隨之提高。所以,“人們就正義原則達成一致,不是因為每個人都有理由接受它,而是因為任何人都沒有理由拒絕它”[17]。
多人合作博弈中的“核心”概念,使博弈參與者找到了相關博弈參與人的利益均衡點,也使人們在處理現實社會中的一系列經濟糾紛問題(如家庭的遺產繼承、企業的破產決算等)時更具有人文關懷[18]。一方面,在資源較少時,平均或接近平均分配,能有效保護弱勢群體的利益。對弱勢群體、邊緣人群的關懷及尊重體現出來的博愛精神,不僅適應現代社會乃至人類發展的道德要求,也是傳統人格平等觀念以及儒家孟子人性觀的四端之首——惻隱之心的必要引申[19]。“正義是對弱者生存權利的關注和對強者權利意志的約束。”[20]另一方面,當資源比較豐富時,將超出博弈參與人所需資源的剩余部分集中起來,為實現更大規模的再分配打下良好的基礎,這也體現出博弈規則對于每個博弈參與人權利保護的公正性和科學性。核心解體現出的分配思想與羅爾斯的分配正義思路基本上是一致的:“能平等分配的東西都應該平等分配,不能平等分配的東西應該實行差別原則②——應該有利于最不利者。……收入和財富做不到人人平等,那么根據差別原則,它們的不平等分配只有符合最不利者的利益,才能夠是正義的。”[21]這種分配的基礎是公平而不是平均,它能夠激勵強者,更能讓弱者感覺到公平的存在,能夠在最大限度上調動博弈參與人的積極性和實現重復合作的可能性。從更加宏觀的角度來看,聯盟博弈中的核心解體現了博弈思維的智慧性和人性化。所以,世界性、區域性組織的權力代表在制定分配機制設計方案時靈活運用博弈核心解的相關理論,能夠從全局和實際出發,充分認識到保護弱者利益的重要性,減少或消除潛在的社會矛盾,實現雙贏甚至多贏的局面,為社會的和諧乃至人的全面發展作出長遠打算。需要注意的是,本文只是用核心解這一概念解釋了一些社會經濟現象,但從概念的解釋、制度的制定再到制度的實施,還需要法律(立法、執法)來加以保障;同時,現實情形中的經濟分配問題情形較為復雜,使用核心解或許不能很好地解決諸如塔木德法典中的三妻爭財產問題(如出現解為空集或反例的情形),所以我們需要在理論上對聯盟博弈的核心解加以拓展,這是下一步的工作。
注釋:
①帕累托改善(Pareto improvement),也稱帕累托改進或帕累托優化,是基于意大利經濟學家帕累托(Vilfredo Pareto)的名字來命名的,是指將現狀分配方案A與將要施行的分配方案B進行比較,在施行B方案之后,在沒有使任何人的狀況變得糟糕的情形下,一些人的狀況得到了改善。參見姚大志:《分配正義:從弱勢群體的觀點看》,《哲學研究》2011年第3期。
②差別原則(difference principle),又稱最大化最小原則(maximin principle),是羅爾斯《正義論》(1971)中極具代表性的思想觀點。該原則認為,在公平平等的程序正義的基礎上,社會成員在經濟上的不平等須對社會中的最不利群體或成員有利。從本質上說,該原則彰顯一種人文關懷,欲借助于社會制度來最大限度上縮小貧富差距,通過制度將不平等限制在可接受的范圍之內,旨在建立一種互利互惠的維系社會合作的體系。參見賈中海:《社會價值的分配正義——羅爾斯自由主義政治哲學批判》,中國社會科學出版社2011年版,第29—43頁。