吳蔚 石玉鳳



摘 要:以辛亥革命時期南北議和過程中博弈局面的形成為基礎,分別就革命黨和清廷的博弈思維與行為給出博弈機理分析,從各個角度檢視可供雙方選擇的所有行為策略及其可能后果;接下來,構建社會變革沖突在非暴力狀態下的革命黨與清廷貝葉斯博弈模型,得到模型的均衡解。模型結果顯示,局中人的行為策略符合合作博弈思維的理性選擇。
關鍵詞:辛亥革命;南北議和;合作博弈
一、引言
辛亥革命的意義不止于政權、政體的變更與社會變革。第一場武裝革命后,孫中山與清廷之間努力化解前嫌,推動五族共和,促使各方力量從觀望逐漸走向合作。適當妥協中所蘊含的合作博弈思想體現了劃時代的意義。這種合作博弈思想對第一場武裝革命的和平處理,達成了“各利益相關方相對小的傷亡損失換取最大限度地國族共識”的目標,不僅結束了帝王時期“以弒君實現朝代政權更迭”的循環,在世界近現代史上也是一次“以議代斗、減少沖突”的嘗試;可看作是中國近代“以理性選擇達到國家歷史目標優化”的典范。
胡適認為武裝革命是特定條件下不得已的手段,而非目的,并希望建立一個戰亂相對少的共和體制。梁啟超對革命態度轉變后認可了辛亥革命帶來的政體改變,也主張“和袁”,化解原立憲派與袁世凱之間的矛盾。
鑒于此,本文就南北議和過程的利益沖突方博弈行為、思維、機理、進程與結果進行科學的規范研究,以為社會發展過程中(尤其社會變革時期)各方力量的相互制衡提供借鑒范例。
二、南北議和中的博弈機理分析
1.辛亥革命時期博弈局面的形成
武昌起義后的數月,多省相繼爆發革命黨對清政府的武裝軍事行動。雖然雙方在軍事戰斗中“各有勝負”,但革命黨勢頭迅猛,清廷在意識到革命難以迅速鎮壓之際,啟用袁世凱,“剿”“撫”并用。之后,袁世凱與革命黨聯絡,以利益相關方清廷和革命黨為主要局中人的博弈就此展開。促成當時各方力量冷靜下來,通過斡旋談判各自做出相應妥協、最終達成議和的結局,避免更多流血沖突。最終,南北議和以袁世凱迫使“清帝”遜位并當選“中華民國總統”為結局,暫時結束了暴力爭奪政權的局面。
考慮實際參與過程及社會力量的概括性和代表性,在此主要抽出革命黨與清廷這兩個明確且具代表性的勢力之間的博弈行為進行具體分析。關于其他勢力參與博弈的細節,本文不做擴展,將另作研究。
2.革命黨博弈思維與行為
革命黨的初衷是結束君主集權統治建立共和國,意在通過革命推翻朝廷獲得其所追求的“共和”利益;行為決策主要是對武裝革命成本與不必武裝革命到底而使清廷接受放棄皇權的補償之間進行權衡。即選擇付出血腥代價革命到底直至徹底推翻清廷,或者補償與安置清皇室以減少革命的阻力,達到有效避免損失與代價的目的。其行為決策取決于獲得革命成功與清廷對其鎮壓成功的風險。
首先,革命有望獲得“利益”。這體現于結束皇權統治而建立共和體制的革命成果,這是進行革命的基本保證。革命黨只有當革命獲得利益大于革命付出的成本時才會做出革命到底的決策,革命黨總是希望盡可能地獲得更多利益,因此可能表現為,傾向于抵付出來對清皇室放棄皇位的補償進行安置。
其次,革命黨的利益會受到來自清廷的不利決策的直接威脅。由于清廷可以選擇鎮壓革命,這種雙方決策上的相悖勢必導致社會變革不能順利進行,其結果將是革命成本的驟增甚至是革命的終止。從可支配軍力的對比變化,也可以證明,若繼續武力解決,誰都難有必勝把握。因此,革命黨需要也必會充分考慮清廷的決策。
無論是理論上還是實際中,都是革命行為發生在先,清廷的反饋隨后。以下分別以A和B作為革命黨和清廷的簡單表示,則概括以上分析,當時革命黨可選擇的策略,存在有以下可能情況:
A1:堅持徹底推翻清廷并從形式上鏟除皇室成員。
不管清帝是否愿意退位,革命者執意以徹底推翻清廷甚至弒君為目標,則結果是清廷與革命者之間只有其中一方勝出存留,另一方失敗出局,即有:
A11:經過一番戰爭沖突,武裝革命推翻清廷,革命成功;
A12:遭到鎮壓,革命失敗。
這兩種情況跟歷史上的歷次農民起義結果沒有本質區別。
A2:以結束君主集權、建立共和體系為目標。是有條件換取清廷妥協,或是無奈仍以暴力推翻清廷,會得到兩種不同的結局:
A21:清廷愿意在保障皇室成員生命安全及顏面的前提下妥協,清帝遜位;革命者建立共和政府,并支付清遜帝后半生體面的生活條件;
A22:清廷拒不妥協,主張大清天下,武力鎮壓革命,則革命者需要以武裝暴力推翻清廷,又循環回到前述A1結果。
3.清廷博弈思維與行為
清廷的最基本目標是維持其生存延續,此基礎上再盡力在最大程度上保留自身的權力。由于革命者不會事先通知朝廷預報革命,顯然革命行為具有主動性,清廷需要隨后做出反應。
故清廷可考慮和預備的策略,以及相應可能的結果如下:
B1:針對革命黨的A1目標及其行為,采取武力鎮壓革命的方式,以維持清廷統治地位。可能得到的結果為:
B11:鎮壓革命失敗,清廷被推翻,皇室人員被殺或被流放。完全對應于A11的革命成功;
B12:成功鎮壓革命,清廷統治得以延續。完全對應于A12的革命失敗。
顯然,這是“你死我活”式的“零和博弈”選擇。雙方均以徹底消滅對方為唯一目標,結果是其中一方勝出、另一方出局。但雙方在博弈過程中都會付出巨大的成本和慘重的代價。
B2:針對革命黨的A2目標及其行為,也可能得到兩種結局:
B21:采取放棄皇權退位,以保全自身。這樣又可以分為程度不同的兩種情況:其一,幸運一些,新的執政者保證清帝生活優越體面;其二,失去一切權力,但至少也能存活。此結局完全與前述A21相對應。
B22:不響應革命黨的非對抗信號。堅持武力鎮壓勢不妥協態度,將迫使革命者重新采取武裝暴力的方式,結局完全與前述A22相對應,最終又會回到A1的循環結果。
上述A21及與其相對應的B21顯示了革命黨與清廷皆選擇妥協策略的行為后果。此選項表明,妥協的雙方注定都不會“大贏”,也不會“大輸”,相對其他選項而言,可以認為是風險最小的,且能夠有效地避開雙方直接沖突所必須付出的巨大代價。
三、社會變革沖突中的革命黨與清廷博弈模型
為了模型的構建,可認為當時的博弈各方均為理性人,考慮自身的利益最大化。而且,參與各方遵循內部行為一致性原則。
1.暴力沖突狀態下革命黨與清廷的博弈
簡化博弈過程,革命黨大致可采取與清廷有限妥協和徹底革命兩種行為方案;而清廷也可選擇與革命黨有限妥協和與革命黨完全對抗兩種行為方案。由此得到雙方如下的初始基本策略集:
革命黨A的策略SA=(有限妥協,徹底革命);清廷B的策略SB=(有限妥協,完全鎮壓)。
(1)暴力沖突博弈的負值和屬性
暴力沖突博弈過程中,各局中人只考慮為獲得利益而采取爭奪方式,不惜付出更多代價,故整體效率低下,社會總收益當然更是受損嚴重,由此基本都會形成負定值和博弈。
社會總收益主要是社會制度的升級和人民生存生活狀態的改善,其本質是社會利益進行重新分配的過程。從初始狀態,廣大民眾處于弱勢群體,代表其進行博弈的革命黨具備先天性的正義感和道德制高點;但由于資源占有的匱乏,同時具備經濟力量不夠的先天性弱勢,故其為了在博弈中爭取資源分配權和獲得更多的資源占有量,必將拼盡全力乃至生命。因此,這將大大增加了雙方的博弈成本以及清廷后續的生存成本。故而,社會總收益會隨著雙方爭奪度的增大而消耗。
(2)在所難免的“囚徒困境”
由于當時有強大軍事力量的軍閥的存在,革命黨與清廷的博弈行為都會有所顧忌,從而可能會更加冷靜,擺脫暴力沖突思維傾向而采取合作博弈態度;但同時,如果軍閥不參與博弈,雙方都表現出急功近利的心態,陷入暴力沖突狀態下的“囚徒困境”也不無可能。這樣,會有四種情況,如表1所示。
事實上,暴力沖突情況排除了雙方“串謀”的可能,即雙方不會互相妥協,也就不會得到均衡解(1,1);那么,當一方選擇有限妥協,另一方選擇徹底革命或完全對抗時,得到非均衡解(-1,0)和(0,-1)。強勢的一方將搶占全部原有社會效益,可以認為是歷次農民起義的結果;當雙方采取徹底革命和完全對抗時,各方均產生巨大的成本消耗,更可能的情況是效益被全部抵消,得到均衡解(-1,-1)。此即革命黨與清廷的負值和“囚徒困境”博弈均衡結果。
2.非暴力狀態下的革命黨與清廷貝葉斯博弈
排除雙方不考慮風險后果而陷入暴力傾向、導致“囚徒困境”的可能性,革命黨與清廷之間的博弈可以運用不完全對稱信息的貝葉斯博弈模型進行模擬。為此,首先明確:
(1)由革命黨先行考慮:若清廷B可以妥協,則對其以“撫恤”作為補償。較低的撫恤以L(low)表示,較高的撫恤表示為H(high)。
(2)清廷根據革命黨發出的信號,選擇是否與革命黨達成有限妥協,無論結果如何,博弈均就此結束。其中,Y和N分別代表清廷是否愿意舍棄皇權,與革命黨達成有限妥協。
然后,就雙方合作博弈,設預期社會總收益為1,分配給博弈雙方收益為α、β, (α+β=1, 0<α<β<1),并給出具體的收益假定:
(1)樂觀情形。革命黨采取L策略時,清廷如果選擇響應Y,則雙方收益分別為β和α;革命黨采取H策略時,清廷如果仍選擇響應Y,則雙方收益分別為α和β;而無論革命黨采取L還是H策略時,清廷選擇不響應N,則雙方非合作,其收益均是分別為0和α,這可以理解為,清廷不作任何改變,茍延殘喘地享用延續的收益α,而革命黨也就得不到任何變革收益,即收益為0。
(2)悲觀情形。只要清廷選擇響應Y,則結果與樂觀情形相同;但清廷選擇不響應N,其當然是爭取比α更大的收益β,而革命黨得不到任何變革收益,即收益為0。
此處樂觀與悲觀皆是就清廷對“放棄皇權向革命者有限妥協”這一選擇的感知思維與利益評價而言。作為博弈接受方的清廷,樂觀情況是指,其相信舍棄皇權后生活質量不低于舍棄前的情況,故在(L,Y)處達成均衡。悲觀表現的清廷則顯然不容易妥協,但在(H,Y)尚可達成均衡。可以看到,如果清廷對自身的勢力估計過高,而對革命黨給以的撫恤過于悲觀,則更難以達成均衡。由于對革命黨支付的撫恤額度,清廷難以知曉相對于革命黨來講是高還是低,因此,很大程度上,樂觀與悲觀取決于其自己的感知思維與利益評價。
分析至此,可以給出雙方收益樂觀與悲觀情況的貝葉斯博弈表述如上表2、3。
從模型中容易看到,當革命黨發出有限妥協信號,不管是L還是H,只要清廷選擇有限妥協Y,無論結果如何,都已經達到均衡,博弈就此結束。在清廷樂觀情況下,博弈在(L,Y)達到均衡(β,α);而在清廷悲觀情況下,博弈可以在(H,Y)達成均衡(α,β)。顯然,在(L,Y)均衡下保有的社會總收益是最大的,是有共同利益的各沖突方博弈的最佳均衡狀態。
回到南北議和的現實,可以認為,議和后的一段時間內雙方達到了博弈的均衡,而且就當時情況,是對國族系統最為有利的(L,Y)均衡狀態。
四、結語
體現和運用合作博弈理性思維作為辛亥革命的一項重要成就,本應為當時及隨后的社會變革提供寶貴的經驗及借鑒依據。但這項成就未能引起足夠重視,以至于后續的社會碰撞多陷入非合作的負值和博弈,造成本可減免的損失。
博弈的理性就在于避免因一意孤行的感性爭奪而招致風險損失的行為策略選擇。用博弈論模型對歷史事件進行的檢驗可應用到涉及社會變革議題的史學研究中,也為后世人類社會面臨重大抉擇時各個群體各種勢力之間可能產生的沖突的解決提供具有實際意義的參考。
參考文獻:
[1]李在全.民元孫中山北京之行與遜清皇室的應對——以紹彝、紹英未刊函札為中心的考察.[J]《清華大學學報(哲學社會科學版)》,2020
[2]江智健.胡適與辛亥革命[J].長江叢刊,2019
[3]鮑 捷.從梁啟超的態度變化來看辛亥革命的意義[J].漢字文化,2019
[4]賀覺非,馮天瑜.《辛亥武昌首義史》[M].武漢湖北人民出版社,1985
[5]Gibbons,Robert. A Primer in Game Theory[M].LondonPearson?Education,1992
(作者單位:1.臺灣政治大學歷史系 2.中國礦業大學北京)
作者簡介:吳蔚(1987—),男,漢族,北京人,博士研究生,研究方向:中國近代思想史;石玉鳳(1963—),女,漢族,北京人,博士,副教授,研究方向:管理科學與工程。