劉 驊,王 璨
(1.南京審計大學金融學院,江蘇南京 211815;2.中國工商銀行江蘇省分行,江蘇南京 210006)
區塊鏈起源于社會學,具有去中介化、信息透明等特點,由于其發展屬于顛覆性技術創新,因此其隱蔽性、時間戳、分布廣、匿名性和智能合約等特征給現有信息監管體系提出了前所未有的挑戰。我國目前區塊鏈領域的整體監管理念仍是被動型監管,信息安全維護措施呈現出碎片化態勢。為落實習近平總書記“加快區塊鏈應用”指示精神,政府部門出臺了多項區塊鏈技術的政策指導文件,并將其明確規劃為促進國家發展的戰略性技術。為進一步規范區塊鏈信息服務活動,促進區塊鏈信息服務健康有序發展,保護公民、法人和其他組織的合法權益,維護國家安全和公共利益,2018年10月國家互聯網信息辦公室發布《區塊鏈信息服務管理規定(征求意見稿)》,并于2019年1月審議通過,自2019年2月15日起開始執行。在區塊鏈風口階段,如何把控信息服務監管程度,尋找創新與監管間的平衡點,即在保證區塊鏈快速發展的同時不扼殺其革新的空間,是新時代背景下維護國家信息安全,實現經濟可持續發展的重要議題。
在區塊鏈研究領域,底層是基礎數學,中層是法律規制,上層是經濟行為。在底層基礎研究領域,Nakamoto[1]首次提出區塊鏈技術模型,研究問題主要集中于中心化、效率和隱私安全3個方面,且存在區塊鏈的“不可能三角”,即無法同時實現去中心化、高效低耗與隱私安全。在中心化方面,沈鑫等[2]指出,區塊鏈上任意獲得半數以上支持的提案都能通過,去中心化就會因算力集中而被打破;在效率方面,梅海濤等[3]認為在區塊鏈上節點增多、交易頻率增高的情況下,效率反而降低,成本也會提升;在隱私安全方面,尹冠喬[4]研究表明,區塊鏈技術即使能保證信息的可追溯,但是不能保證上鏈信息本身的真實性,同時無法確保用戶的身份信息不被盜用。
在區塊鏈中層法律規制研究領域,董慧等[5]研究發現,區塊鏈的匿名性規則及無政府主義造成了監管困難,在應用過程中很可能出現許多違規、違法的行為。趙岳[6]基于區塊鏈技術的優勢及面臨的挑戰,分析了其對金融法律的影響,并提出對區塊鏈發展的規制建設與監管建議。戚學祥[7]研究認為,亟需政府創新監管機制并健全制度體系,以面對區塊鏈技術給政府數據治理的管理權威、安全監管和法律秩序等方面帶來的挑戰。
在區塊鏈經濟與社會應用領域,國外學者較為重視區塊鏈在金融方面的應用,Ranjit等[8],Ghassan[9]研究了區塊鏈在比特幣加密、存儲內容演變與抵抗安全攻擊等方面的影響與限制。國內學者韓鋒[10]認為,將區塊鏈技術與大數據結合,可以使每個人掌握自己的數據產權,同時達到信息共享,降低獲取信用資源的成本,而且區塊鏈3.0模式將滲透到人類生活的各方面,實現基于信任機制的全世界范圍內的信息共享。此外,趙丹等[11]基于信息傳播和區塊鏈理論,提出區塊鏈環境下的網絡輿情信息傳播概念模型,并指出雖然區塊鏈輿情傳播效率有所降低,但虛假輿情傳播能夠得以遏制。
近年來,國內學者逐漸開始運用博弈理論分析金融科技的監管問題,例如,劉偉等[12]運用演化博弈理論研究了互聯網金融平臺行為及監管策略的博弈演化過程,系統考察了互聯網金融平臺行為及監管博弈過程的影響因素。而計算實驗方法依托于現代計算機科學技術,在特定制度與市場環境下,設置微觀主體具體的學習模式與行為機制,將微觀主體之間的交流互動作用包括其中,在此基礎上揭示經濟社會宏觀運行規律的一種模擬方法[13-14]。張維等[15]最早將該系統論方法引入國內,并將其基本概念、基礎理論和研究內容應用于我國的經濟社會實踐。
綜上所述,區塊鏈是近年來理論與實務界關注的焦點問題,國內外研究集中于基礎技術、法律規制與應用行為等方面,但各領域研究均處于起步探索階段,相關工作仍需進一步深入。此外,雖然部分學者已經根據我國國情對區塊鏈安全監管模型進行了設計與優化,但由于相關數據資料的缺乏,對區塊鏈信息服務監管的系統性量化分析仍然不充分。據此本文采用計算實驗方法,對區塊鏈信息服務監管進行演化博弈分析;基于計算實驗“情景——應對”思想,模擬仿真區塊鏈信息服務監管過程中,政府部門、信息服務提供者與使用者采用不同策略的初始概率,以及處罰力度、賠償額度與損失程度因素變化對演化博弈結果的影響。
區塊鏈信息監管存在“讀不懂、讀不出、看不懂、管不住”的問題,且參與主體間信息非對稱現象較為明顯。由于區塊鏈發展對實體經濟的沖擊以及不同業務帶來的風險隱患,必要的監管不可缺少。但如果監管過于嚴厲,不僅會降低區塊鏈發展速度,還會扼殺其革新的發展空間。因此基于區塊鏈信息服務監管主體構建適合的、動態的監管框架,并且制定彈性的、可調整的監管法規,是平衡其發展創新與信息風險隱患控制的保證。本文采取演化博弈理論,認定區塊鏈信息服務監管博弈主體為有限理性的“經濟人”,其每一個策略選擇都是在一定概率下完成,且具有相應的策略損益。在多重動態博弈過程中,博弈主體行為可模型化為具有學習能力且具備適應性的漸進演化過程,具體表現為每一次博弈中高收益策略均會取代低收益策略,并經過重復最終形成穩定的演化均衡策略。
《區塊鏈信息服務管理規定》中明確區塊鏈信息服務提供者是指,向社會公眾提供區塊鏈信息服務的主體或者節點,以及為區塊鏈信息服務的主體提供技術支持的機構或者組織;而區塊鏈信息服務使用者是指,使用區塊鏈信息服務的組織或者個人。因此,假設區塊鏈信息服務監管博弈三方參與主體為政府部門、信息服務提供者與使用者,且均為有限理性的“經濟人”。
其中,政府部門涉及的參數包括:政府部門嚴格監管成本Cg1,嚴格監管發現違規問題后的獎勵性收益Rg1;政府部門寬松監管成本Cg2,寬松監管未發現違規問題遭受的社會公共損失Rg2。信息服務提供者涉及的參數包括:信息服務提供者運營收益R2,合規運營成本Ci1,違規運營成本Ci2;當政府部門嚴格監管時,信息服務提供者合規運營將給予獎勵r2,違規運營將給予處罰T。信息服務使用者涉及的參數包括:信息服務使用者使用合規信息的收益R3,使用信息服務成本C3;當政府部門嚴格監管條件下,信息服務使用者使用了違規運營的信息服務,將遭受損失D,但可追償一定的信息服務損失費用W。
令政府部門嚴格監管的概率為x(0≤x≤1),信息服務提供者合規運營的概率為y(0≤y≤1),信息服務使用者選擇使用信息服務的概率為z(0≤z≤1)。此外,政府部門嚴格監管成本大于寬松監管成本,即Cg1>Cg2,寬松監管出現問題造成的社會公共損失大于嚴格監管發現問題的社會公共收益,即Rg2>Rg1;信息服務提供者合規運營成本大于違規運營成本,即Ci1>Ci2,運營收益大于其合規運營給予的獎勵,即R2>r2。
根據以上假設,構建政府部門、信息服務提供者與使用者的演化博弈支付矩陣,如表1~表4所示。

表1 信息服務使用者選擇使用行為(z)下信息服務提供者合規運營(y)的三方博弈支付矩陣

表2 信息服務使用者選擇使用行為(z)下信息服務提供者違規運營(1y)的三方博弈支付矩陣

表3 信息服務使用者選擇不使用行為(1z)下信息服務提供者合規運營(y)的三方博弈支付矩陣

表4 信息服務使用者選擇不使用行為(1z)下信息服務提供者違規運營(1y)的三方博弈支付矩陣
根據表1~表4,設政府部門“嚴格監管”的收益為u1,“寬松監管”的收益為u2,且政府部門平均收益為u,具體表達式如式(1),(2)和(3)所示。

由式(1)、(2)和(3)可得政府部門的復制動態方程為:

設信息服務提供者選擇“合規運營”策略時,其效用為v1,選擇“違規運營”策略時,其效用為v2,且信息服務提供者的平均效用為v,具體表達如式(5)、(6)和(7)所示。


由式(5)、(6)和(7)可得信息服務提供者的復制動態方程為:

設信息服務使用者選擇“使用”策略時,其效用為w1,選擇“不使用”策略時,其效用為w2,且信息服務使用者的平均效用為w,具體表達如式(9)、(10)和(11)所示。

由式(9)、(10)和(11)可得信息服務使用者的復制動態方程為:

聯立式(4)、(8)和(12),可得區塊鏈信息服務監管博弈系統的復制動態方程組,并令:

求解式(13)可得,在E={(x,y,z) 0≤x≤1,0≤y≤1,0≤z≤1}區域內存在8個純策略均衡點,E1(0,0,0),E2(0,0,1),E3(0,1,0),E4(0,1,1),E5(1,0,0),E6(1,0,1),E7(1,1,0),E8(1,1,1)。對式(13)依次求出x,y,z的偏導數,可得到與之相對應的雅克比矩陣(Jokobian),上述均衡點的穩定性可由相對應的雅克比矩陣J局部穩定性判別得到,且僅當det(J)>0,tr(J)<0時,均衡點會趨近局部漸進穩定狀態[16],結果如表5所示。

表5 區塊鏈信息服務監管演化博弈均衡點的局部穩定性
依據表5可知,由于8個純策略均衡點det(J)和tr(J)的值取決于各個參數值大小,并不能確定該類均衡點的穩定性。此外,還存在E*(x*,y*,z*)在上述解域內,且滿足式(14):

(14)


3.2.1 政府部門漸進穩定性分析





圖1 政府部門穩定性演化相位圖
分析結果表明,政府部門決策行為受多方因素的影響,而在決策選擇過程中,除了收益與成本因素外,在嚴格監管情景下對信息服務提供者違規運營給予的處罰是其重點衡量的因素。
3.2.2 信息服務提供者漸進穩定性分析






圖2 信息服務提供者穩定性演化相位圖
分析結果表明,信息服務提供者決策行為受多方因素的影響,除了相關的成本因素外,在政府部門嚴格監管情境下,其違規運營的處罰及為信息服務使用者提供的損失賠償,將直接影響信息服務提供者最終的決策意愿。
3.2.3 信息服務使用者漸進穩定性分析





圖3 信息服務使用者穩定性演化相位圖
分析結果表明,多方因素共同影響信息服務使用者的決策行為,除去各類收益與成本因素外,在政府部門嚴格監管條件下,其使用信息服務遭受的損失,及其可獲得的損失賠償將對信息服務使用者最后的決策行為造成直接影響。
綜上分析,區塊鏈信息服務監管演化博弈三方參與主體可以得到不同的均衡狀態,其穩定性的演化相位圖取決于各穩定狀態分界線的形態;同時,各方決策行為均受多方因素的影響,其中政府部門嚴格監管情景下,對信息服務提供者違規運營的處罰,信息服務使用者遭受的損失,及其可獲得的損失賠償是重要的共性影響因素。
通過區塊鏈信息服務監管演化博弈均衡分析可知,影響三方主體達到演化均衡的因素較多,但其實現均衡過程并不明確,也不能確定該均衡是否唯一和穩定,而且即使在某一種情境下達到均衡狀態,系統也可能會受到來自外界各種不確定因素的影響,從而打破均衡狀態。針對該問題本文采用數值模擬與仿真分析以刻畫區塊鏈信息服務監管三方演化博弈模型中各主體決策選擇的演化過程。
2018年,南京審計大學金融學院與中國工商銀行江蘇省分行合作開展金融科技項目研究,其中針對區塊鏈信息監管問題對江蘇省區塊鏈發展實際情況進行了調研,本文采用課題組調研后預設的原始數據為博弈模型的初始值進行設定:Cg1=1.5,Rg1=2,Cg2=0.5,Rg2=3,R2=8,Ci1=2,Ci2=1,r2=0.5,T=2,R3=3,C3=1,D=2,W=1。基于系統仿真平臺,根據演化博弈模型分析結果(假設INITIAL TIME=0,FINAL TIME=20 000,TIME STEP=1),對相關影響因素進行仿真計算。
當政府部門、信息服務提供者和使用者的決策初始值均為某種純策略時,他們的策略選擇有0和1兩種。考慮政府部門對區塊鏈技術風險治理的決心,以及對區塊鏈信息服務管理的政策要求,因此本文主要針對(1,0,0)策略組合,重點模擬仿真在政府部門嚴格監管情境下,信息服務提供者與使用者決策行為的演化趨勢。通過模擬計算發現,當博弈三方初始狀態均為純策略時,系統中沒有任何一方愿意改變當前狀態來突破均衡點,而一旦三者中的任何一方做出微小改變,均衡狀態就將被打破。為了把握三方博弈演化狀態,本文讓各方策略選擇做出微小變化,以策略(1,0,0)為例,令其模擬初始值調整為(0.99,0.01,0.01)。
在演化博弈仿真系統中引入政府部門對信息服務提供者的處罰力度系數a,通過調整該系數的取值,進而影響政府部門對信息服務提供者違規運營的處罰程度,即政府部門嚴格監管情景下,如果信息服務提供者違規運營,則對其進行處罰為aT。保持其他變量假設不變,設a1=0.2,a2=0.5,a3=0.8,模擬仿真三種處罰力度下,政府部門、信息服務提供者與使用者策略選擇概率的演化結果,如圖4(a)、(b)和(c)所示。

圖4 不同處罰力度下三方博弈行為演化軌跡
由圖5可以看到,在政府部門對信息服務提供者不同處罰力度下,即使稍微調整政府部門初始策略選擇概率,也不會妨礙其迅速向嚴格監管策略收斂的演化趨勢;在低處罰力度下,信息服務提供者的策略選擇將維持“違規運營”,而隨著處罰力度的增大,其采取“合規運營”策略的演化軌跡收斂于1的速度也在加快;當處罰力度維持在低水平時,信息服務使用者的決策選擇將穩定于“不使用”策略,而隨著政府部門加大處罰力度,則會改變其策略選擇向“使用”信息服務策略逼近。
在演化博弈仿真系統中引入信息服務提供者對使用者的賠償額度系數b,通過調整該系數的取值,進而影響信息服務提供者違規運營后對信息服務使用者的賠償額度,即政府部門嚴格監管情景下,如果信息服務提供者違規運營對信息服務使用者造成經濟損失時,需對其進行賠償為bW。保持其他變量假設不變,設b1=0.2,b2=0.5,b3=0.8,模擬仿真3種賠償額度下,政府部門、信息服務提供者與使用者策略選擇概率的演化結果,如圖5(a)、(b)和(c)所示。

圖5 不同賠償額度下三方博弈行為演化軌跡
由圖5可以看到,在政府部門嚴格監管,信息服務提供者對使用者不同賠償額度情景下,即使稍微調整政府部門初始策略選擇概率,也不會妨礙其迅速向嚴格監管策略收斂的演化趨勢;同時,隨著賠償額度的提升,信息服務使用者采取使用信息策略的演化軌跡收斂于1的速度也在加快;而賠償額度系數b的變化并未對信息服務提供者的策略選擇產生影響,其策略選擇概率均快速向1收斂。
在演化博弈仿真系統中引入信息服務使用者損失程度系數c,通過調整該系數的取值,進而影響由于信息服務提供者違規運營,造成信息服務使用者的損失程度,即政府部門嚴格監管情景下,如果信息服務提供者違規運營而給使用者造成的損失為cD。保持其他變量假設不變,設c1=0.2,c2=0.5,c3=0.8,模擬仿真三種損失程度下,政府部門、信息服務提供者與使用者策略選擇概率的演化結果,如圖6(a)和(b)所示。
由圖6可以看到,在信息服務使用者不同損失程度系數下,政府部門與信息服務提供者的行為演化軌跡并未受到影響,均快速向1收斂;而隨著損失程度系數c值的提升,信息服務使用者選擇使用服務策略的速度在放緩。

圖6 不同損失程度下三方博弈行為演化軌跡
綜上數值模擬與系統仿真分析可以發現,在政府部門采取嚴格監管策略的情景下,通過引入不同行為系數而改變信息服務提供者與使用者的博弈損益值,均會影響博弈參與主體行為軌跡的演化,但影響的效果與程度卻存在著一定的差異。一方面,如果政府部門采取“命令——控制”機制,通過處罰措施以規避信息服務違規風險,不僅對信息服務提供與使用者的作用存在時滯性,而且處罰力度的把控存在較大難度,力度較小不利于控制信息服務提供者的違規行為,力度過大又可能成為阻礙信息服務創新發展的桎梏。另一方面,為維護信息使用者合法權益,維持信息服務運營秩序,建立信息服務供求雙方“損失——賠償”動態調試性監管規制,能在保證信息服務提供者合規運營的前提下,提升信息服務的使用效率。
本文基于《區塊鏈信息服務管理規定》,結合以有限理性假設為前提的演化博弈模型,通過對政府部門、信息服務提供者和使用者博弈策略演化穩定性的分析,甄別影響博弈主體決策行為的關鍵因素,并置入計算實驗方法“情景——應對”思想進行數值模擬與仿真計算。從而通過計算機技術與計算實驗方法,檢驗不能在真實區塊鏈信息服務監管中實驗的相關措施的有效性,并展現策略更替導致區塊鏈信息服務監管中行為因素隨之演化,進而對其參與主體損失利得的影響,從而達成“‘實驗’不可實驗”,與“‘計算’不可計算”(收益與損失在現實區塊鏈信息服務監管過程中難以計量)的效果。依據數值模擬與系統仿真分析結論,從推動“沙箱監管”模式,建立動態監管機制兩個層面提出區塊鏈信息服務管理的政策組合。
第一,推動平衡技術創新與監管的“沙箱監管”模式。從政府部門對信息服務提供者處罰力度的模擬仿真結果可以看到,不同的監管處罰力度對信息服務提供者最終決策選擇具有直接的影響,但處罰力度的大小難以把控。因此,可采用“沙箱監管”模式測度監管處罰力度,在試驗區內對區塊鏈創新產品進行模擬測試,考察其實用性和安全性。通過“監管沙箱”營造出的“安全區域”為參與實驗的創新產品和服務提供一個相對寬松的虛擬環境,從而激發產品研發者與服務提供者的創新動力。同時還應參考借鑒國外“監管沙箱”的新理念和新工具,在做好消費者保護和維護市場穩定的前提下,研究建立能夠試錯、容錯、查錯、糾錯的包容性創新監管機制,從而給真正有價值的區塊鏈創新留有一定空間和合適的觀察期。
第二,建立以行為監管和消費者保護為核心的動態監管機制。從信息服務提供者對使用者的賠償額度,及信息服務使用者損失程度的模擬仿真結果可以看到,在提升區塊鏈信息服務使用效率過程中,信息服務供求雙方損失與賠償的動態監管機制發揮著重要作用,因此應采取主動型監管理念應對區塊鏈的發展變化。區塊鏈的發展增加了信息傳遞與獲取的復雜性、多變性以及不確定性,應理解并緊跟最新技術的發展脈絡,最大程度地減少信息服務存在的模糊邊界,將網絡安全、數據安全和隱私保護作為信息使用者權益保護的主要內容并且貫穿始終,提高信息服務基礎設施的效率和效能。同時,政府部門在監管過程中不能依賴僅憑牌照的簡單方式,還應增加管理透明度,建立政策協調統一的動態調適性監管機制。