摘要:以“囚徒困境”為主要表現形式的非合作博弈是困擾國際氣候談判進展緩慢的關鍵障礙,其原因就在于各國(國家集團)在氣候變化問題上的個體利益訴求與國際社會的集體利益訴求之間存在沖突。如果在個體理性與集體理性的協調上失敗,極有可能導致集體理性的失控,最終導致人類賴以生存的氣候系統崩潰。因此,探討非合作博弈困境的內部機理并尋求其破解途徑,就成為解決國際氣候談判困境的關鍵。
關鍵詞:國際氣候合作;非合作性博弈:理性
中圖分類號:D815 文獻標識碼:A 文章編號:1004-0544(2011)09-0096-04
國際氣候合作在性質上是各國在保障自身利益前提下追求共同利益的博弈,其目的是建立制度以保證公平公正的環保責任承擔。氣候變化是一個極其復雜而長期的全球性問題,關系到各國的根本利益和長遠利益。國際氣候談判是各國在高度不確定性條件下的集體決策過程,在利益沖突之間尋求妥協和平衡的政治過程。在這個過程中,雖然參與合作的世界各國具有共同利益。但共同利益的存在并不能保證合作一定產生。國家的個體理性決定的利益偏好差異仍然是導致集體行動困境的根本原因,除非克服這種障礙。否則共同利益根本無法實現。
一、博弈與非合作性博弈
所謂博弈。是指某些個人或組織做出相互有影響的決策,它不僅包括撲克、橋牌等游戲,也包括現實生活中大量的合作和沖突現象。博弈論也稱對策論。研究的核心是決策主體的行為發生直接作用時的決策以及這種決策的均衡問題。博弈論首先是作為自然科學理論出現的,建立在抽象推理的基礎之上,是數學和邏輯的一種結合。在社會科學領域,博弈論運用數學方法分析行為體在博弈中的互動行為所產生的可能后果。在博弈過程中,每個行為體都有自己的策略、目標和偏好。博弈論也將人的行為具有理性作為假設前提,因為“如果假設人類所有的行為都是荒謬的、神經質的或者反常的話,我們就不會有博弈論或其他社會科學理論了”。博弈論研究的重點不在于博弈者采取的實際行動,而是博弈者采取什么樣的行為才能在博弈中獲勝(將收益最大化或損失最小化)。如果人們希望在特定的環境中獲勝(即希望實現那些會受到他人阻止的目標),博弈論就可以分析他們的思維過程。在思維過程中,博弈者要判斷和決定采取什么樣的行動對自己最有利。同時相信他們的對手同自己一樣也遵從理性而且同樣會為勝利而進行多次計算。
博弈包含一些基本要素:博弈參與者,每場博弈都有不少于兩個參與者或行為者;參與者可獲得的收益,因為不同的參與者的價值體系不同,所以他們期望獲得的收益也不同;博弈的基本規則,只有遵守規則才能使博弈正常進行;信息條件,它決定每個參與者獲得相關信息(周圍的環境和其他參與者的決策)的數量、質量以及便捷程度(獲得信息的速度);參與者為達目的而采取的策略;進行博弈的總體環境,不論參與者是否對此有充分認識;競爭行為的互動,在這種互動過程中,參與者的每次選擇都會促使其他參與者改變選擇。
從不同的角度可以對博弈進行不同的分類。從能否達成有約束力的角度劃分,博弈可以劃分為合作博弈(Cooperative Game)和非合作博弈(N0n-CooperativeGame)。如果博弈參與者能夠在行為時達成有約束力的協議,則屬于合作博弈。反之,如果不能強制他方遵守協議,各參與者只能選擇自己的最優戰略,則是非合作博弈。前者的特點是集體理性、效率、公平和公正,后者則強調個體理性、個體最優決策。如果根據參與者的出場順序進行劃分,博弈可以分為靜態博弈(Static Game)和動態博弈(DynamicGame)。靜態博弈是指博弈參與者同時選擇行動或在對前者行動一無所知的情況下沒有同時采取行動。動態博弈指參與者行動有先后順序,而且最后行動者能夠觀察到先行動者的選擇。如果考慮參與者對其他參與者的認知因素,博弈還可以分為完全信息博弈和不完全信息博弈,其區別在于每一參與者是否對其他參與者的特征、戰略和支付函數有確切的了解。
非合作性博弈反映的是個體理性與集體理性之間的悖論問題,理性個體對利益的追求不能滿足集體理性或社會福利最大化的要求,導致集體理性失控。集體行動之所以出現困境源于個體理性和集體理性的磨合出現了問題,體現在傅弈中就是非合作性博弈。囚徒困境博弈、智豬博弈、斗雞博弈和盟主博弈都屬于非合作性博弈,但它們表現出的集體行動困境的特點不盡相同:在囚徒困境博弈中,個體理性無法導出集體理性:智豬博弈在個體理性與集體理性的關系上形成的納什均衡是“多勞不多得。少勞不少得”;在斗雞博弈下,“一人干活,另一人不勞而獲”;盟主博弈則是另外一種情形,它是一種不對稱的博弈,既受到收益分配問題的困擾,也含有個體理性和集體理性的沖突。
二、國際氣候合作與非合作性博弈
全球氣候變化問題上的國際合作,本質上就是集體行動是否可行以及如何實現的問題。國際氣候合作要取得成功,首要問題就是實現個體理性與集體理性保持一致,避免出現集體理性失控現象。產權界定問題是全球公共物品共同面臨的難題,全球氣候變化問題也不例外。由于缺乏具體的產權界定,所有的國家為最大限度地獲得經濟利益,將濫用氣候資源,不受限制地排放溫室氣體,從而最終導致哈丁所謂的“公用地的悲劇”。因此,要實現共同利益,各國需要一致同意合作以減少化石能源消耗。但是,合作協議是不穩定的,因為任何一個國家如果搭便車將獲得更大利益。從這個角度來看,“囚徒困境”博弈最具有代表性。囚徒困境的創造本身就部分地奠定了非合作性博弈的理論基礎,并且它可以作為實際生活中的許多現象的一個抽象概括。口’美國學者羅伯特·基歐漢(Robert Keohane)在闡述新自由制度主義的相關理論時,也采用“囚徒困境”作為分析框架?;鶜W漢指出:“不是世界政治或者國際政治經濟中的所有形勢都可以采取囚徒困境的形式表現出來,但是大部分都是如此的,由囚徒困境所提出的問題對本書討論的合作與紛爭問題是關鍵性的”,而且“奧爾森(Mancur Olson)闡述的集體行動的邏輯,本質上與囚徒困境的邏輯是一樣的”。奧爾森不贊成用囚徒困境解釋集體行動的困境,認為它完全不適用小集團,但可以用來解釋大集團集體行動的困境。奧爾森的理由是:“就大集團而言,其獲得的任何集體物品的數量離最優水平越遠,它就越不可能采取行動去獲取哪怕是最小數量的這類物品。簡而言之,集團越大,就越不能去增進它的共同利益”。從奧爾森的申辯中可以看出,在解釋大集團的集體行動的困境時,囚徒困境可以用作代表性的分析模式。
囚徒困境博弈描述的是這樣一個情景:兩個囚徒共同犯下一起嚴重罪行。如果兩個囚徒都保持沉默,就難以取得他們犯罪的證據,在這種情況下,他們會被判較輕的刑罰,判入獄1年。如果他們其中一人坦白了,并提供另一個人犯罪的證據,那么坦白者就會被立即釋放,而另一囚徒就會面臨入獄30年的刑罰。如果兩個囚徒都坦白并互相提供對方犯罪的證據,那么兩個囚徒都會被判入獄15年,如圖所示:
納什均衡是:A181都坦白,帕累托無效率,體現了個體理性與集體理性的矛盾。
資料來源:崔大鵬著。《國際氣候合作的政治經濟學分析》,第36頁。
從博弈矩陣可以看出,作為理性人,每個囚徒都有坦白的愿望。A的收益順序是A2BI>A1BI>A282>A182,而B的收益順序是B2AI>B1AI>B2A2>B1A2。雖然如果A和B都保持沉默,可以達到帕累托最優解,但這個結果并不穩定,因為兩個囚徒都擔心對方背叛。所以,博弈雙方的最優理性戰略都是背叛,納什均衡結果是A282,這是一個帕累托無效的納什均衡解?;鶜W漢對囚徒困境的理解頗為深刻:“在需要集體行動的狀態中,合作對獲得一種為所有相關成員共同享用的物品是必要的,不管這些成員是否為這種物品的供應作出貢獻。當每一個成員為供應這種物品所承擔的成本,與總的成本相比非常小的時候,利己的個體可能會作出估算,認為他們如果不作貢獻的話會好一點,因為他們的貢獻對自己來說是有成本的,而其貢獻對這種物品最終被生產出來卻只會產生微不足道的影響。因此就像在囚徒困境中一樣,對一個利己主義者來說,占優勢的戰略是背叛而不是對這種物品的生產作出貢獻”。囚徒困境說明的是個體理性行為的總和導致集體非理性的反論問題。這是國際合作中存在的一個關鍵問題,即在以逐利原則為主導的個體行動組成的世界中,即使共同利益存在,個體往往也不會主動為這種共同利益去努力。從囚徒困境中我們可以得出一個很重要的結論:一種制度(體制)安排,要發生效力,必須是一種納什均衡。
在國際氣候合作中,囚徒困境現象表現得最為明顯和突出。在國際氣候合作中,特別是在溫室氣體減排問題上,博弈雙方的最優理性戰略也都是背叛。如果每個國家都不受限制地排放溫室氣體,而且都認為,當他國不受限制地排放二氧化碳的同時,即使自己單方面限制排放,對延緩全球氣候變化也不會產生根本性助益;或者每個國家都認為,在其他國家聯合限制二氧化碳排放量的時候,自己單方面擴大二氧化碳的排放量不會對全球氣候變化產生決定性影響時,最終必將重演全球的“公用地的悲劇”。在囚徒困境博弈情境下,博弈雙方出于個體理性的最優選擇都是不合作。所形成的納什均衡解是典型的集體理性失控。在國際氣候合作中出現這種局面則意味著應對氣候變化的努力徹底失敗,氣候系統將趨于崩潰。所以,在國際氣候合作中如何避免出現囚徒困境式博弈就成了合作成功與否的關鍵問題。美國對于京都機制就采取了囚徒困境博弈思維。強調如果發展中國家,特別是中國和印度等發展中大國不參與國際減排協議,即使美國采取減排行動也不會對全球溫室氣體減排產生根本性影響。同樣,對于廣大發展中國家來說,如果發達國家回避歷史責任,堅持以發展中國家承諾量化減排指標為達成減排協議的前提,發展中國家為了自身發展利益,也會在國際氣候談判中采取抵制態度,導致國際氣候合作陷入僵局。
三、超越“囚徒困境”博弈的幾種可能途徑
按照博弈論的解釋,要解決囚徒困境有三種可能的途徑:第一,博弈各方要建立相互信任關系。國家之間特別是發達國家與發展中國家之間應該建立良好的互信關系,保持信息溝通渠道暢通。發達國家應該遵循“共同但有區別的責任”原則,在溫室氣體減排方面率先采取行動,換取發展中國家的信任。發達國家應該切實履行自己的承諾,向發展中國家提供資金和技術援助,幫助其提高減緩和適應氣候變化的能力。發展中國家要認真履行在《聯合國氣候變化框架公約》和《京都議定書》中承擔的相應義務,表明參與國際氣候合作的誠意,并在力所能及的基礎上,按照自愿原則降低溫室氣體排放,待到能力達到一定程度后再考慮量化減排問題。發達國家之間也應該建立互信關系,尤其是歐美要放棄在氣候問題上的爭吵,在溫室氣體減排方面做出實際行動。第二,博弈各方簽訂有約束力的合約?;鶜W漢指出,國家為追求共同利益創立了國際機制。國家發現自己困在囚徒困境中,但由于國際機制為協議的達成提供了談判的規則、原則、規范和決策程序的框架,即使自我中心主義者之間也可以相互合作。機制可以向國家提供信息或降低交易成本從而促進合作。國際社會一直致力于簽訂一項有約束力的國際協議,以“硬法”的形式對各國在應對氣候變化行動中應承擔的相關義務做出具體安排,形成有效的國際氣候機制,以保證氣候變化行動順利進行?;鶜W漢指出:“總的來說,國際機制通過降低被欺騙的可能性,使合作成為更加明智的選擇?!缤瑥V義上定義的國際法一樣,它們的功能就是要使人類行動符合可預測的模式,從而使預計的行動能夠在手段和目的之間獲得一種理性的關系中前進”。第三,重復博弈在一定程度上能夠起到緩解困境的效用。囚徒困境之所以出現集體行動的悖論,在很大程度上因為博弈是一次完成的。選擇背叛的博弈者不用擔心在下一輪博弈中遭受報復。然而,國際氣候合作中的博弈卻并非一次博弈,而是多次重復博弈?!爸貜颓敉嚼Ь场痹试S雙方從合作中得到好處,同時也提供了一方占另一方便宜的或雙方都不合作的可能。在這種情況下。每一方采取合作或背叛戰略后都會在下一輪博弈中面臨被對方獎勵或懲罰,因此博弈方最佳選擇都是“一報還一報”(Tit for Tat)策略,即模仿對方上一步的選擇。先采取合作行動的一方相信自己的合作行為能換得對方的配合,否則將在下一輪博弈中懲罰對方?!耙粓筮€一報”的穩定成功的原因在于“它綜合了善良性、報復性、寬容性和清晰性。它的善良性防止它陷入不必要的麻煩,它的報復性使對方試著背叛一次后就不敢再背叛,它的寬容性有助于重新恢復合作,它的清晰性使它容易被對方理解,從而引出長期的合作”。溫室氣體減排方面就存在“重復囚徒困境”博弈,歐盟不斷提出新的減排目標并承諾如果其他發達國家減排,歐盟還將擴大減排力度。需要指出的是,這三種可能途徑必須建立在成本支出公平的基礎上,如果博弈方認為自己承擔的成本不公平,極有可能在個體理性逐利動機的強烈驅使下退出博弈。
應對氣候變化的責任承擔問題是國際氣候合作中各國制定氣候政策的前提和基礎,因此各國都把責任承擔是否公平視作國際氣候談判的核心問題。在國際氣候變化談判中,成員之間承擔的責任越公平,其對于合作的態度就越積極。責任承擔的公平性應該從國家的發展程度、國家具備的能力和個人發展權利三個方面給予保障。
1.從國家的發展程度看,要保證責任承擔的公平性,就必須確定“共同但有區別的責任”原則。全球氣候變化問題危及全人類的共同利益,每個國家在應對這一危機時都必須承擔共同的責任。然而,無論是從歷史排放還是從現實排放來看,發達國家都應對溫室氣體排放造成的全球氣候變化承擔主要責任。自工業革命以來。發達國家消耗的煤炭和石油產生的溫室氣體導致大氣中二氧化碳含量上升了60%。目前,發達國家人口僅占世界總人口的25%,卻已經并仍在消耗著世界80%的能源,發達國家的二氧化碳排放量依然占到世界排放總量的75%。以人均排放為例,發達國家的人均排放量為3.12噸,而發展中國家的這一數字尚不及其九分之一。如果要發達國家和發展中國家均等地承擔責任,勢必嚴重違反可持續發展原則所大力倡導的公平原則。因此,國際氣候合作必須遵循“共同但有區別的責任”原則?!堵摵蠂鴼夂蜃兓蚣芄s》中明確規定:“氣候變化的全球性要求所有國家根據其共同但有區別的責任和各自的能力及其社會和經濟條件,盡可能開展最廣泛的合作,并參與有效和適當的國際應對行動?!薄毒┒甲h定書》和“巴厘島路線圖”為保證在應對氣候變化問題上體現真正的公平,對“共同但有區別的責任”原則再次給予了強調。根據這一原則的要求,發達國家有義務承諾硬性減排的量化指標并率先采取減排行動。同時,為保證國際氣候合作的廣泛參與性,發達國家必須向發展中國家提供充足的資金和先進的技術以提高其減緩和適應氣候變化的能力。

2.從國家具備的能力來看,公平的責任承擔要求不同的國家在應對氣候變化的國際合作中應該作出不同的貢獻。發達國家對氣候變化的脆弱性相對發展中國家要低,而且在資金和技術上都擁有更高的應對氣候變化的能力。各國都肩負著恢復和維持氣候系統以實現其可持續發展的共同責任,能力高的國家理應作出更大的貢獻,這對能力較低的國家參與合作將產生示范和激勵的作用。發達國家應該履行已經在《聯合國氣候變化框架公約》和《京都議定書》中作出的承諾,向發展中國家提供資金和技術支持,幫助發展中國家提高減緩和適應氣候的能力。
3.從個人發展權利看,責任承擔的公平性強調對于人均平等的保障。按照可持續發展理念的要求,每個人都有平等享用大氣資源的權利,國際社會不能按照發展程度高低和貧富狀況差異作為分配大氣資源的基礎。在全球氣候變化問題上,發達國家主張溫室氣體減排必須全球參與,尤其是發展中大國如中國、印度等國家必須承擔強制性減排份額,以此作為發達國家承擔具體減排份額的前提條件。發展中國家強調,一國的排放權等于國家人口與世界人均排放權的乘積;國際氣候談判必須建立在人均能源消耗和人均溫室氣體排放的基礎之上。如果單純根據國家排放總量按比例減排。勢必對發展中國家的發展造成嚴重傷害,威脅到其維系生存問題的溫室氣體排放。這種形式上的公平違背了可持續發展的公平原則,造成了個人發展權利實際上的不平等。如果發展中國家面臨既無技術又無資金的雙重困境。那么它們在國際氣候合作的博弈中極易選擇消極的政策甚至退出國際合作,從而導致國際氣候合作失敗。
四、結語
應對全球氣候變化的國際合作是解決氣候危機的必然選擇。在這一進程中,各國(國家集團)的個體利益與全人類的共同利益必然會發生激烈的碰撞,“囚徒困境”始終是困擾國際氣候合作總體進展的障礙,其關鍵就在于如何在協調個體理性的基礎上實現集體理性。在國際氣候合作實踐中,各國都應該正確地認識到,全人類的共同利益高于個體利益,當長期利益與短期利益、全人類利益與個體利益發生沖突時,必須通過理性選擇,做出正確的決策。
責任編輯 文嶸