[摘要]博弈論是研究決策行為發生直接相互作用時候的決策以及這種決策的均衡問題。一般認為,博弈論始于1944年馮諾依曼和摩根斯坦恩合作的《博弈論和經濟行為》。本文借助博弈論的相關理論,分析圍繞皇權交接時三種勢力集團的行動,當達到均衡時的各勢力集團的策略,解釋歷史存在相似的原因。
[關鍵詞]博弈;皇權;勢力
引言
博弈論,英文又為game theory,指當一個主體,好比說一個人或一個企業的選擇受到其他人、企業選擇的影響,而反過來影響到其他人與企業選擇時的決策問題和均衡問題。博弈論問世之前,我國古人在處理人際、戰爭、對弈游戲時不自覺地用博弈論的原則,創造了一些較基礎的歷史規則,即我們常說的“謀略”等。
一、相關理論研究
(一)中國古代官僚政治制度
本文要用博弈來研究皇權交迭,簡要闡述一下中國古代官僚政治制度,這是皇權政治賴以運行的基礎。
中國古代封建貴族政治基于宗法血緣,權力層層分散在各級貴族手中,一度貴族制度盛行,到后代王朝強調軍功淡化世襲身份,開始向官僚制轉化[1]。西漢至南北朝時皇權始終依托于當時最有勢力的集團或階層,依靠他們進行統治,世族擔任宰相和高官,皇帝總要和貴族豪強勢力聯姻,以加強和他們的聯系,皇后的廢立是國家大事,外戚干政也在這種背景下產生;及至唐高宗李治立武則天為后才把皇后廢立作為“家事”處理。隨著科舉制度的興起,一批寒窗苦讀的學生朝為田舍郎暮登天子堂,以及政府機構按職能分工不斷加以調整,讀書人寒門子弟出將拜相增多,他們接近甚至可以觸摸到皇權樞紐。當接觸到皇權的人參和進皇權交接,從而歸納出幾方勢力,并用博弈論解釋皇權更迭時各種勢力的選擇。
(二)博弈論的幾個概念
1.參與人:指一個決策主體,他的目的是通過選擇行動以最大化自己的支付水平,記作i=1,2,…,n;在博弈論中自然(nature)作為“虛擬參與人”來處理,記作N。
2.信息:特別是有關自然的選擇,其他參與人的特性和行動的知識。下面提出兩個相關概念:
①完全信息指自然首先行動或自然的初始行動被參與人準確觀察到的情況,沒有實現的不確定性;
②完美信息指一個參與人對其他的參與人,包括自然的行動有準確了解的情況,即每一個信息集只包含一個值,不完全信息意味著不完美信息,反之不成立。
3.戰略:是參與人在給定信息集的情況下的行動規則,它規定參與人在什么時候選擇什么行動,用Si表示第i個參與人的一個特定戰略。Si={si}代表第i個參與人可選擇的戰略集合。
4.支付:指參與人得到期望效用水平,用u表示。
5.均衡:指所有參與人的最優戰略組合。
6.動態博弈表示法:動態博弈各方的選擇行為又稱先后次序,每個參與人的選擇行為會形成聯系的時間階段,因此動態博弈中一個參與人的一次選擇常稱為一個階段[2]。動態博弈中也可能參與人同時選擇的情況,這時這些參與人同時選擇構成一個階段,一個動態博弈至少兩階段。例:一個完全且完美信息動態博弈,首先參與人1行動,參與人2先觀察到參與人1的行動,然后2行動。
7.逆推歸納法:指從動態博弈的最后一個階段開始分析,每一次確定出所分析博弈方的選擇和路徑,然后再確定前一個階段的博弈方的選擇和路徑。
二、皇權周圍兩勢力模型
(一)圍繞皇權的三種勢力集團
首先介紹皇權周圍三種勢力集團,前文中對我國古代官僚政治制度分析中已有涉及,歸納如下:
1.重臣:講求門閥時,皇帝多與豪門貴族聯姻,重臣有外戚一類。隋唐后規定應試者不受門第限制,幾乎所有人都能帶著證明自己身份清白的材料報考,庶族學子有望飛黃騰達,重臣中因此包含通過科舉走上仕途的人。
2.嬪妃及子嗣:嬪妃是靠近權力的內闈女子,皇權更迭她們的力量不可或缺。
3.宦官是特殊群體,有異于常人的生理特征,還具有不同普通官吏的特殊身份。明太祖評價宦官認為:他們朝夕在人君左右,出入起居之際。聲音笑貌……皆足以固結君心。茍一為所惑而不之省,將必假威服竊權威,以干政事。[3]可以看出宦官干政的情勢。
(二)模型的前提假設
1.經濟人假設。重臣、宦官、嬪妃目標一致,即利益最大化。重臣目的是借助皇權得到更多的好處,有詩可證:明朝戚繼光《馬上行》“南北驅馳報主情,江花邊月笑平生。”[4]重臣利益最大化是出將拜相;嬪妃目的是讓其子嗣繼承皇位,先排除武則天的特例;宦官目的是把持權力斂財,使其畸形欲望得到滿足;
2.完全且完美信息;
3.皇帝僅為自然(N)收益忽略;
4.模型僅兩位嬪妃甲乙和一名宦官或重臣,且甲乙沒有地位差別,兩人各有一名皇子;
5.甲乙二人都有極強的報復心理,對宦官或重臣具有威脅;
因甲乙均具有威脅,所以宦官或重臣必做非此即彼的選擇,無法選擇觀望。
以宦官為例:
①參與人:嬪妃甲,定義為1;宦官,定義為2;I=2;
②策略空間:S1={L,R},其中L:拉攏宦官、R:不拉攏宦官;S2={L1,L2},L1:接受拉攏且甲之子取得皇權、L2:不被拉攏且甲之子取得皇權;
③收益函數:u1(L,L1)=1,u1(L,L2)=1,u1(R,L2)=1
u2(L,L1)=1,u2(L,L2)=-2,u2(R,L2)=0
宦官觀察嬪妃甲的行為:若甲選擇策略L,宦官有收益-2的威脅,應該選擇策略L1;若甲選擇策略R,宦官應該選擇策略L2,即采取觀望態度。
現實中拉攏宦官的嬪妃不止甲一人,宦官一旦支持對了人就有1的收益,收益增加的誘惑很難抗拒。因此經濟人不會觀望中立,他還會竭力避免-2收益的風險,故宦官需更多信息判斷哪位皇子成功,綜上宦官必做出非此即彼的選擇,若把宦官換成重臣亦然。
(三)皇權周圍兩勢力模型
1.參與人:宦官,定義為1;嬪妃甲,定義為2;I=3,包括N(皇帝);
2.策略空間:S1={L,R},其中L:巴結嬪妃甲、R:巴結嬪妃乙;S2={L1,L2},其中L1:甲之子取得皇權、L2:乙之子取得皇權;
3.收益函數:u1(L,L1)=1,u1(L,L2)=-2,u1(R,L1)=-2,u1(R,L2)=1
u2(L,L1)=1,u2(L,L2)=-1,u2(R,L2)=1,u2(R,L2)=-1
逆推歸納法:嬪妃甲有收益最大策略L1,宦官觀察甲的策略選擇為L1,宦官收益最大化選擇L,納什均衡為(1,1),即宦官巴結嬪妃,甲盡力讓自己兒子取得皇位,這是雙贏組合。宦官要避免收益-2的風險,他定要得到更多信息,如甲家族政治實力、皇帝對甲的寵愛程度、皇太后的意見等,以確保自身收益。若參與人由宦官換成重臣,納什均衡同樣為(1,1)。
歷史上與本模型擬合事件眾多,僅舉兩個事例:一是(東漢末年)靈帝,何皇后生子辯,王美人生子協,董太后自養之。群臣請立太子,帝以辯輕佻無威儀欲立協,猶預未決。會疾篤,屬協于蹇碩。靈帝崩,碩時在內,欲先誅何進而立協,然事敗反被何進誅殺。蹇碩為宦官參與廢立大事,判斷形勢不足賠了性命。
另明憲宗朱見深專寵萬貴妃。萬氏有孕后,“帝后宮生子漸多,(梁)芳等懼太子將立,勸帝易儲”[5]以致皇帝一度萌生廢立想法。
歷朝歷代皇權更迭時,許多人行為會不自覺遵循博弈論。
三、皇權周圍三勢力模型
當把宦官和重臣同時考慮,這是兩種勢力模型的擴展,當加上重臣勢力集團,應考慮重臣在宦官和嬪妃勾結情況下的選擇。首先三種勢力中重臣和宦官這兩種勢力集團的選擇是相關關系,其次討論重臣要排除外戚這種情況。
(一)三種勢力模型的前提假設
1.經濟人假設。無論是重臣、宦官、嬪妃目標一致,即利益最大化;
2.完全且完美信息;
3.皇帝僅為自然(N)收益忽略;
4.模型僅甲乙兩位嬪妃、一名宦官和一名重臣,且甲乙沒有地位差別,兩人各有一名皇子;
5.甲乙二人都有極強的報復心理,對宦官及重臣都有威脅。
(二)皇權周圍三勢力模型
1.參與人:宦官,定義為1;重臣,定義為2;甲,定義為3;乙,定義為4;I=5,包括N(皇帝);
2.策略空間:S1={L,R},其中L:巴結嬪妃甲、R:巴結嬪妃乙;S2={L1,L2},其中L1:支持甲之子取得皇權、L2:支持乙之子取得皇權;S3={M,N}、S4={N,M},其中M:甲之子取得皇權、N:乙之子取得皇權;
3.收益函數:u1(L,L1,M)=1,u1(L,L1,N)=-2,u1(L,L2,M)=1,u1(L,L2,N)=-2,u1(R,L1,M)=-2,u1(R,L1,N)=-2,u1(R,L2,M)=1,u1(R,L2,N)=-2;
u2(L,L1,M)=1,u2(L,L1,N)=-2,u2(L,L2,M)=-2,u2(L,L2,N)=1,
u2(R,L1,M)=1,u2(R,L1,N)=-2,u2(R,L2,M)=-2,u2(R,L2,N)=1;
u3(L,L1,M)=1,u3(L,L1,N)=-1,u3(L,L2,M)=1,u3(L,L2,N)=-1,
u3(R,L1,M)=1,u3(R,L1,N)=-1,u3(R,L2,M)=1,u3(R,L2,N)=-1;
U4(L,L1,M)=-1,u4(L,L1,N)=1,u4(L,L2,M)=-1,u4(L,L2,N)=1,
u4(R,L1,M)=-1,u4(R,L1,N)=1,u4(R,L2,M)=-1,u4(R,L2,N)=1。
逆推歸納法:嬪妃甲選擇收益最大策略為M,重臣觀察甲的選擇,為收益最大必選擇L1,宦官也隨之選擇L;同樣嬪妃乙會選擇收益最大策略N,重臣觀察乙必選擇L2,宦官隨之選擇R。宦官選擇巴結哪位后宮嬪妃,他需要考慮多種因素,重臣能夠觀察到宦官的選擇和公共信息,也需要更詳實的信息確保不因選擇錯誤而付出慘痛代價。
由于臣子信息不如宦官直接,掌握信息結成“朋黨”是經濟人的天性。清雍正帝最痛恨“朋黨”,他認為“(歐陽)修之所謂道(朋黨)……亦小人之道耳。”[6]
其實三勢力模型仍不完整,尚未考慮外戚的情況。外戚作為帝王母親、妻子方面的親戚,與單純以科舉或其他方法進入官場的人不同,家族利益維系他們與嬪妃及皇子們的關系,外戚勢力強弱應是宦官考慮巴結誰的重要方面。
四、完全不完美信息動態博弈
歷史上實際更多不完美信息的動態博弈。完全信息即皇帝N的選擇,皇帝的選擇在某種意義上是公共信息。封建社會的皇權無孔不入滲透到社會每個角落,古代規則中皇帝一舉一動幾乎公開透明,而不完美信息的產生在重臣方面,士大夫等官吏臣僚經常被皇帝不信任。只有宦官屬于家奴,是皇帝可親近依賴的,嬪妃們如若與宦官勾結,不一定為重臣所知。
把三勢力模型假設2變為完全不完美信息,得出:
設宦官選擇S1={L}的概率為p,選擇S2={R}的概率為1-p;甲選擇S2={L1}的概率為q,選擇S2={L2}的概率為1-q。
1.參與人:宦官,定義為1;甲,定義為2;乙,定義為3;重臣,定義為4;I=5包括N;
2.策略空間:S1={L,R},其中L:巴結嬪妃甲、R:巴結嬪妃乙;S2={L1,L2},其中L1:甲之子取得皇權、L2:乙之子取得皇權;S3={M,N},其中M:支持甲之子取得皇權、N:支持乙之子取得皇權。
重臣選擇S3={M}的收益為:u3=pq*1+p*(1-q)*(-2)=3pq-2p
重臣選擇S3={N}的收益為:u3=pq*(-2)+1*p*(1-q)=p-3pq
令u3=u3化簡得:3pq-2p=p-3pq
∵p>0 ∴q=1/2
若q<1/2,則u3 若q>1/2,則u3>u3 由于甲選擇L1的概率必為q=1,那么第三階段重臣選擇M收益較高,而第二階段中甲必選擇L1,所以第一階段宦官知道從甲選擇的子博弈均衡必然為L,意味著選擇L策略可獲得1收益,因此L是他的均衡策略,找到一個均衡策略組合{L,L1,M},如把甲換為乙有同樣的結果。 動態模型說明宦官不能干政也不曾干政的王朝,依靠重臣,嬪妃的皇子們也能成功取得皇權。清康熙雍正皇位交接時,隆科多成為康雍兩朝交接的關鍵人物。雍正帝皇權鞏固與隆科多手握兵權提督九門的權力是分不開的,故乾隆帝稱其為其父雍正帝的忠臣。 五、放寬模型的假設 以上的分析全部基于五個假設: 1.經濟人假設。無論是重臣、宦官、嬪妃目標一致,即利益最大化; 2.假設完全且完美信息,后放寬為完全不完美信息; 3.皇帝僅為自然(N)收益忽略; 4.模型僅甲乙兩位嬪妃、一名宦官及一名重臣,且甲乙沒有地位差別,兩人各有一名皇子; 5.甲乙二人都有極強的報復心理,對宦官及重臣都具有威脅。 現其他假設不變,僅放寬假設1為:嬪妃的利益最大化包括她自己取得皇權,即武則天掌權這種情況,也能被模型的結論解釋。作為歷史上唯一女皇,后來者雖沒有武則天的天時地利人和,但她給女性稱帝做了楷模。 六、結語 本文試圖用博弈論方法解釋歷史皇權更迭勢力集團的選擇。假設中最關鍵是經濟人假設。需說明如何解釋海瑞等層出不窮寧愿忤逆皇帝的強項之臣。自古讀書人離不開儒家思想義利觀,歷朝歷代以“君子”著稱的臣子都不愿如“小人”般蠅營狗茍,不一定完全符合經濟人假設。 歷史也有不合模型的地方:明萬歷年間,皇帝本人成為批評的對象,進諫的官員們對其私生活是否適當提出疑問。雖然萬歷皇帝授予寵妃鄭氏貴妃封號,卻無力使其子成為太子。因為沒有朝臣或心腹幫他完成這件事情,反引起首輔申時行和王錫爵對他的懷疑。 參考文獻: [1]吳宗國.中國古代官僚政治制度研究[M].北京:北京大學出版社.2004-11 [2]謝識予.經濟博弈論(第四版)[M].上海:復旦大學出版社.2018-1 [4]王云瀚.閹宦[M].天津:百花文藝出版社.2005-1 [3]岳文強,張善明.官德古詩詞選析[M].北京:藍天出版社.2002-5 [5][英]崔瑞德.[美]牟復禮.劍橋中國明代史(1368-1644年下)[M].楊品泉,譯.北京:中國社會科學出版社.2006-12 [6]劉潞,萬依,王樹卿.清代宮廷史[M].天津:百花文藝出版社.2004-1 作者簡介:仲晶昕(1984.12-),女,漢族,江蘇南通人,碩士,中級會計師,研究方向:財務分析。