張垚婷,張成科,朱懷念
(1.廣東輕工職業技術學院,廣東 廣州 510300;2.廣東工業大學 經濟與貿易學院,廣東廣州 510520)
2017年10月,黨的十九大報告的第八部分再次用一個完整的大篇幅明確提出要“提高保障和改善民生水平,加強和創新社會治理”,并就如何“打造共建共治共享的社會治理格局”指明了戰略方向,即:加強社會治理體系建設,推動社會治理重心向基層下移,發揮社會組織作用,實現政府治理和社會調節、居民自治良性互動[1]。如何在中國共產黨領導下完善政府負責、社會協同、公眾參與、法治保障的社會治理體制?是一個具有重大現實意義的學術問題。本文將社會治理當中政府、社會組織和公眾這三大主體視為博弈參與人,通過建立隨機微分博弈模型,分析三方協同共建共治共享的社會治理機理。
事實上,如何創新社會治理一直是學術界廣泛討論和研究的問題。王浦劬基于中國共產黨治國理政理論和現實國情,分析解釋了國家治理、政府治理和社會治理的基本含義[2]。張振波認為多元協同社會治理正逐漸由理論構化變為一種現實可能,分析了多元協同社會治理的生成邏輯及構建路徑,強調需要通過制度規約與政府引導最大限度地發揮協同治理的社會治理效能[3]。鄧建高等對社會治理協同創新系統的內涵、框架和結構進行了系統研究,豐富了社會治理協同創新的基本理論[4]。張康之通過比較分析,認為在社會治理體系中,多元主體共同擔負著社會治理的職責,政府則為多元治理主體所構成的社會治理體系中的一部分[5]。胡萬進和童星指出社會治理過程中社會工作發展的方向是社會治理主體的分工協作,應強化政府的社會治理與公共服務職能,形成多元協作的良性社會治理運行模式[6]。史傳林分析了社會治理中政府與社會組織的合作績效問題,發現合作治理對政府、社會組織,乃至社會治理的績效改善均有積極影響[7]。Brookes和Grint認為政府績效的取得既決定于組織的科學管理,也取決于利益相關者的通力合作[8]。Reddel借鑒網絡治理的概念,提出了重構國家—社區關系和改善社區成果的框架,并就如何執行這個框架提出了可行的社會治理方法建議[9]。Folke等探討了社會生態系統的適應性治理問題,認為這種適應性社會生態系統是作為社會網絡自組織的一個有彈性的社會生態系統,可能會把危機當作一個機會轉化為一個更為理想的狀態[10]。張紅方等指出,我國正處于社會主義市場經濟和信息網絡化時代,個體、組織互相聯系,社會的交際網趨于復雜化,公共危機事件頻發。在這樣的背景下,單一的社會治理主體難以有效進行全面治理,而是需要社會多方主體共同參與,在長短效應機制的配合下達到標本兼治的效果[11]。周紅云結合中國社會治理理論與實踐,系統研究了社會治理理論、創新實踐與評估三大主題[12]。張乾友指出,社會治理主體的多元化發展需要政府主動作為,政府要促進社會組織參與到社會治理中去,要以服務的意識履行社會治理職能,要與其他社會治理主體謀求合作[13]。劉英基指出,在大數據時代背景下,要綜合運用復雜系統理論和協同學原理研究我國社會沖突治理問題,形成協同治理合力、構建“整體型政府”、實現多元治理主體等社會治理模式的新路徑[14]。
以上學者大多數通過傳統社會科學的研究方法對社會治理問題進行定性研究,定量研究還不多見,而通過數理化建模的定量研究已在社會科學領域廣泛使用。為此,范如國在復雜網絡結構范型下,綜合運用多學科理論和方法對中國社會治理的主要問題及其協同創新機制展開了詳盡分析。特別是,該研究通過構建一個確定型微分博弈模型,對政府、社會組織和公眾三方共同參與的社會治理協同創新問題進行了分析,發現多主體的協同合作對社會治理具有積極的影響[15]。但該博弈模型沒有考慮由于環境和社會事務的復雜性和不確定性帶來的隨機波動。而社會系統主要由具有目的性與主動性的適應性主體構成,這些適應性主體的決策過程會受到各種隨機干擾。這些干擾會導致博弈均衡結果的不確定性,因而考慮隨機干擾下的博弈問題可能更具有理論意義和現實價值。
此外,協同社會治理強調多元主體協同合作,改變政府主導的單一中心模式,謀求與其他社會主體的協同合作[5]。博弈論作為分析決策主體策略互動的有效工具,利用其分析社會治理中多主體間的互動合作,可以為減少政策失誤,優化政策參量,提供有說服力的依據[16]。
基于上述分析,本文在范如國[15]研究的基礎上,綜合運用隨機微分博弈理論研究多主體協同社會治理問題,探討現代社會治理中的三大主體——政府、社會組織和公眾在動態不確定環境下的行為決策,以期能豐富現代社會治理的基本理論,為創新社會治理方式提供理論參考。
社會的產生和演化由社會主體之間的博弈行為驅動,社會治理研究本質上是分析社會主體之間的博弈問題。在現代社會治理協同體系中,治理主體呈現出多元化的特征,政府職能部門、社會組織和公眾群體都可以是社會治理的主體,各主體在治理過程中的職能和作用也不盡相同。其中,政府作為主體,確保協同社會治理的高水平與高效率;社會組織是公益型主體,是社會自我管理的重要力量;公眾群體作為社會治理的最基本單位,是社會治理的參與型主體。下面,我們將結合博弈理論,分別從非合作博弈與合作博弈兩個視角,對政府、社會組織和公眾三方的社會治理協同作進一步分析。
本節給出博弈模型中各個變量和相應參數的具體含義,在不改變模型經濟意義的前提下,本文做出以下假設:
1.博弈開始的時間為t0,結束時間為T,在整個博弈持續期內[t0,T],政府、社會組織和公眾三方作為博弈的三類主體,為了提高其社會存在狀態水平,持續地進行資源投入。如政府可持續加大購買服務等方面的資金投入;社會組織吸納慈善資源、社會資源或是志愿性資源,可進行持續的慈善捐贈;公眾則可以將其參與社會治理的公共數據進行共享。
2.在博弈持續期內[t0,T],政府、社會組織和公眾三方的收益均可用貨幣來衡量,因而后文所討論的問題為支付可轉移的博弈問題。
3.在博弈持續期內[t0,T],政府、社會組織和公眾三方按無風險利率折現其收益。
假設主體i∈{1,2,3}在時間點s?[t0,T]投入資源u1(s)?R+,以提升其社會存在狀態水平xi(s)ìR+,因而xi(s)隨時間的動態變化可以表示為

其中zi(·)為標準的維納過程,為便于分析,假設對任意的i≠j,zi(·)和zj(·)相互獨立。αi[ui(s)xi(s)]1/2表示由于主體i投入資源ui(s)對xi(s)變化所產生的正面影響,
δi>0表示主體i的社會存在狀態水平的衰減程度,σixi(s)dzi(s)為噪聲項,表示主體i的社會存在狀態水平xi(s)在變化過程中所受的隨機干擾。
主體i∈{1,2,3}的控制變量是其資源投入ui(s),目標是最大化其期望收益。在整個博弈過程[t0,T]中,主體i的期望收益為

其中Et0為時間點t0時的期望值,Pi、ci和qi都是正常數,r為給定的無風險利率。Pi[xi(s)]1/2-ciui(s)表示主體i在時間點s?[t0,T]的瞬時收益,其中Pi[xi(s)]1/2表示凈收益,ciui(s)表示投資成本。qi[xi(T)]1/2表示終端收益,收益的大小取決于當時的社會存在狀態水平,常數qi表示主體i的資源投入結束時,其社會存在水平對于未來的潛在收益的邊際影響。
式(1)—(2)定義了以ui(·)∈R+為控制變量,xi(·)∈R+為狀態變量,Ji(·,·,·),i∈{1,2,3}為目標函數的三人隨機微分博弈。本模型中,我們希望博弈人的控制策略能夠根據系統狀態的變化進行調整,尤其當干擾出現時,控制策略能夠削弱干擾,因而本文研究模型的反饋控制策略,也稱閉環控制,該策略被越來越多地用來分析經濟模型[17]。下文中我們將研究非合作博弈與合作博弈兩種情形下的博弈均衡解,進行以上博弈分析的目的是為了比較三方在各自為政與協同合作兩種情形下的行為決策,從而為三方的理性決策提供參考。
本部分將在非合作框架下討論博弈的均衡解,參考Zhang等[18],博弈問題(1)—(2)的反饋Nash均衡解可以表述為:

對式(3)右邊最大化,解得

將式(4)代入式(3),化簡整理得

參照范如國[15]對解形式的假設,我們在隨機情形下求解式(5)可得如下結論。
命題1:若式(5)存在下述形式的解

其中

則博弈問題(1)-(2)的反饋Nash均衡為

根據式(8)可得如下性質:
1.主體i∈{1,2,3}的資源投入與Ai(t)的值呈正相關關系,隨著Ai(t)值的增加而資源投入增加,反之亦然。
2.主體i∈{1,2,3}的收益也受到Ai(t)的直接影響,二者呈正相關關系。
為了得到i∈{1,2,3}主體的最優狀態軌跡,將式(8)代入式(1),得主體i∈{1,2,3}的最優狀態可以表示為

令yi(t)=[xi(t)]1/2,i∈{1,2,3},使用It?引理可將式(9)重新表示為

式(10)是三個獨立的線性隨機微分方程,可以利用標準方法進行求解。將式(10)的解記為{(t),(t)},再令xi=yI2i,則得到最優的狀態軌跡為

由式(11)即可確定博弈系統的最優狀態軌跡隨時間的演化情況。
當政府、社會組織和公眾三方協同合作時,三方都為提升社會存在狀態水平投入資源,資源的共同投入產生了協同效應,因而主體i∈{1,2,3}的社會存在狀態水平xi(s)的動態變化可以表示為

三方協同合作將形成一個整體,以合作的整體收益最大化為目標共同確定的最優值,合作的整體收益可表示為

應用Fleming[19]中所述的隨機控制方法求解上述合作博弈問題(12)—(13),反饋策略集{ui**(t)=ψi(t,x1,x2,x3),i∈{1,2,3}}構成博弈問題(12)—(13)的反饋Nash均衡解,如果存在連續可微的函數W(t1,x2,x3):[t0,T]×R+×R+×R+→R,滿足下述偏微分方程

對式(14)右邊最大化,解得

將式(15)代入式(14),化簡整理得

求解式(16)可以得到下述結論。
命題2:若式(16)存在下述形式的解

其中

則博弈問題(12)—(13)的反饋Nash均衡為

將式(19)代入式(12),得主體i∈{1,2,3}的狀態軌跡的動態系統可以表示為

令yi(t)=[xi(t)]1/2,i∈{1,2,3},則可將式(20)表示為

式(21)是一個標準的線性隨機微分方程組,可以使用標準的求解方法進行求解。將式(21)的解記為{y*1(t),y*2(t),y*3(t)},再令xi=y2i,則得到最優的狀態軌跡為

在合作情況下,三類主體按照非合作模式下的收益比例,對整體收益進行分配。令Wi代表合作博弈中主體i∈{1,2,3}的收益,則有

前文已得到政府、社會組織和公眾三方在合作博弈與非合作博弈下最優解的解析表達式,囿于其復雜的形式,本節采用數值模擬的方法,分析政府、社會組織和公眾三方在合作博弈與非合作博弈兩種模式下最優解的特征。為簡化分析過程,模型中各參數賦值情況如下表1所示。

表1 數值模擬參數取值表
“影子價格”是指在其他條件不變的情況下,單位資源變化所引起的目標函數最優值的變化,因而本文中影子價格描述了社會存在狀態水平為博弈人帶來的邊際收益,具體取值可用博弈人的收益函數對“狀態變量”求一階偏導數表示。
由前面的分析可知,Ai(t)和A*i(t)分別代表t時刻主體i∈{1,2,3}在非合作博弈與合作博弈兩種情形下其社會存在狀態水平的影子價格。將表1中的參數代入式(7)和式(16),利用Matlab進行數值模擬,得到了兩種不同博弈模式下,Ai(t)和A*i(t),i∈{1,2,3}隨時間的取值變化,如下圖1所示。

圖1 不同博弈模式下和的比較

在博弈均衡狀態下,三類主體的資源投入和社會存在狀態水平隨時間的變化趨勢,如下圖2和圖3所示。

圖2 不同博弈模式下資源投入的比較

圖3 不同博弈模式下社會存在狀態水平的比較
從圖2和圖3的數值模擬結果可以看出,當三類主體協同合作時,每一類主體的資源投入和社會存在狀態水平均高于非合作時的情形。這是由于在三類主體協同合作時,政府、社會組織和公眾同時參與到社會治理中,三者相互協同合作,促使各類主體投入更多的資源,進而提高了社會存在狀態水平,三者都獲益。
管理啟示1:在面對紛繁復雜的社會信息環境下,各自為政追求自身利益最大化的社會治理主體的“理性”博弈人的“最優”選擇并非是最優的(源于其信息是不完全的,但卻錯誤地當作完全信息模式進行選擇),只有三者相互協同合作,加強各主體之間的信息共享,加速各主體之間資源的相互流動速度,才能實現共建共治共享的社會治理格局。
圖4為三類主體總收益示意圖,每個子圖中兩條曲線,上面的曲線代表合作博弈下主體的總收益,下面的曲線代表非合作博弈下主體的總收益。在合作博弈下,各類主體獲得的收益比非合作博弈下的收益都大,而且隨著時間的演進,兩者之間的差距會越來越大,說明三類主體都有協同合作的動機。

圖4 不同博弈模式下總收益的比較
管理啟示2:在面對紛繁復雜的社會信息環境下,社會治理當中的各個理性主體博弈人都有協同合作的利益驅動動機。
本文利用隨機微分博弈理論研究了多主體協同社會治理問題,建立了一個隨機微分博弈模型,運用動態規劃原理,分別在非合作博弈和合作博弈框架下,得到了社會治理主體最優博弈策略的顯式表達,并借助數值模擬仿真對兩種博弈模式下的均衡結果進行了比較。研究發現,在協同合作博弈下,三類治理主體對社會治理所投入的資源、獲得的收益及社會存在狀態水平均高于非合作博弈情形,且隨著時間的推移,兩者之間的差距會越來越大,這也進一步說明社會治理主體在參與社會治理的過程中采取協同合作的重要性。在非合作模式下,社會治理主體各自為政,“理性”的博弈人在各自的信息集內,選擇“最優”的策略,然而,由于社會信息的紛繁復雜,博弈人之間常常出現信息不對稱的情況,又或者博弈人所獲得的信息是不完整的,且錯誤地把不完整信息當作完整信息模式進行處理,此時,其選擇的策略往往偏離了“最優”。為了促進社會治理中多主體的協同,可通過采取一定的行政約束手段,加強各主體之間的信息共享,加速各主體之間資源的相互流動速度,并努力將各主體分散的利益訴求整合為一個群體的共同利益訴求,通過多元主體之間的利益博弈,實現各主體的利益均衡以提高社會治理的效率。