杜維超
國際法治評估,是指國際上以國家為主要單位,基于定量的法治指標(indicators)對法治現象各維度進行量化,并將結果進一步聚合成法治指數(indices)的法學研究及法治實踐方法。就國際法治評估的內容而言,有研究根據法治功能層次,將其分為法律制度的運作、人的尊嚴和權利、社會秩序維護三種類型;〔1〕See Svend-Erik Skaaning, Measuring the Rule of law, Political Research Quarterly, Vol.63:2, p. 449-460(2010).也有的根據法治要素,將其分為目的(問責、受法律約束、公平、平等)、主體(政府官員、法官、檢察官)、實質內容(秩序、人權)、績效標準(公平獲取、認可度、透明度)或組織原則(獨立、分權、參與)等內容;〔2〕See Maurits Barendrecht, Rule of Law, Measuring and Accountability: Problems to be Solved Bottom up, Hague Journal on the Rule of Law, Vol.3:2, p. 281-304(2011).還有研究將財產權保護、營商法治環境也納入法治評估內容。〔3〕See J?rgen M?ller & Svend-Erik Skaaning, On the limited Interchangeability of Rule of Law Measures, European Political Science Review, Vol.3:3, p. 371-394(2011).就國際法治評估的指標形式而言,有些關注法治情況的專項評估,如聯合國法治指標項目(The United Nations Rule of Law Indicators),美國國際開發署主導的各種跨國評估等,而當前影響力最大的是世界正義工程(World Justice Project)開發的法治指數;但更常見的是作為二級指標納入其他跨國制度評估的附屬性評估,如全球治理指數(WGI)、世界自由指數(GCS)、全球競爭力報告(GCR)下的法治指標,國際國家風險指數(ICRG)、蓋洛普世界調查(GWP)下的法律與秩序(Law and Order)指標,國家轉型指數(NT)下的司法制度指標(Judicial Framework and Independence)等。有學者梳理出150 多種包含法治相關內容的跨國制度評估體系。〔4〕See Adeel Malik, State of the Art in Governance Indicators, Human Development Report Oきce Occasional Paper (2002).可見,不管從評估內容還是指標體系上看,國際法治評估與治理、人權、自由、民主、轉型等其他類型的跨國制度評估之邊界并不清晰。基于本文的研究立場及理論假設,以下討論將采取較廣義的概念對相關國際評估指標及體系給予全景式考察。
指標工具在近30 年來崛起為全球治理的新興技術,其背景包括:國際投資勃興引發的制度評估需求、冷戰結束后的制度轉型要求、各國改進政策效果的信息需求、新制度經濟學和社會科學定量研究提供的方法論支持。〔5〕See Christiane Arndt & Charles Oman, Uses and Abuses of Governance Indicators, OECD Publishing, p. 15-18(2006).指標方法被認為可以“有力地支撐數據驅動型決策發展,以及基于證據的穩健的政策評估文化”,從而極大地提升了全球治理的科學性和治理效果。〔6〕See Michaela Saisana & Andrea Saltelli, Rankings and Ratings: Instructions for Use, Hague Journal on the Rule of Law, Vol.3:2, p. 247-268(2011).法治評估作為一種重要的指標工具應用形式,在全球治理中的地位也日益凸顯,并被認為發揮著若干重要功能。
(1)法治指標作為制度改革動力。通過就特定法治領域制訂指標,引發各國政府對制度缺陷的重視,以設定制度改革議程優先級;通過指標評分凝聚社會共識,提供改革的“合法感”;為改革提供數據型論據,明確改革內容和方向。當前各國政府更頻繁的將法治評估結果作為發起改革的依據——正如經合組織和歐盟委員會聯合研究中心在一份報告中發現的:在政策分析的背景下,指標可用于判斷趨勢,并吸引對特定問題的關注。〔7〕See Juan Carlos Botero, Angela Maria Pinzon-Rondon & Christine S. Pratt, How, When and Why Do Governance, Justice and Rule of Law Indicators Fail Public Policy Decision Making in Practice? Hague Journal on the Rule of Law, Vol.8:1, p. 51-74 (2016).(2)法治指標作為流程和績效管理工具。在各種國際、國家機構推動的法律援助及法治發展項目中,主導方通過法治評估控制項目流程、評估項目實施進展,并根據評估結果進行資源配置,以實現組織激勵效果。如聯合國開發計劃署等下屬機構針對司法制度、反腐敗、青少年犯罪等各種國際援助和發展計劃,制定了多種評估指標,在全球范圍內開展評估,以決定下一步項目推進和資源配置方向。〔8〕See Jim Parsons & Monica Thornton, Data as a United Nations Rule of Law Programming Tool: Progress and Ongoing Challenges, in Juan Carlos Botero, et al., Innovations in Rule of Law: A Compilation of Concise Essays, HiiL and The World Justice Project, 2012.(3)法治指標作為政策研究依據。在法律與發展理論語境下,法治指標測評提供了各國法治領域的精確數據,關于法律制度與經濟社會發展之間因果關系的計量研究得以廣泛展開,國際組織和各國政策制定者得以檢驗法律制度建設與其他社會變量(如貧困、經濟增長和人類發展)之間的相關性關系,從而為政策制定提供定量依據,并形成了“數據驅動型”的決策模式。〔9〕See David Restrepo Amariles, Transnational legal indicators: The Missing Link in a New Era of Law and Development, in Pedro Fortes, et al., Law and Policy in Latin America, Palgrave Macmillan, 2017.(4)法治指標作為非正式法律淵源。法治指標的設計經常依據某種與法治有關的國際公約進行,指標實際上成為對公約法治內涵的評注和解釋。隨著這些法治評估體系影響力的擴張,其指標內容經常被各國法院采納為“國際法律契約”的一部分,適用于國內司法裁決,從而使得法治指標成為一種非正式法律淵源。例如,美洲人權委員會根據《美洲人權公約補充議定書》第19 條制訂了細致的法治指標,哥倫比亞憲法法院將其作為其司法裁判依據進行援引。〔10〕See René Urue?a, Indicators and the Law: A Case Study of the Rule of Law Index, in Sally E.Merry, Kevin E.Davis & Benedict Kingsbury, The Quiet Power of Indicators: Measuring Governance, Corruption and Rule of Law, Cambridge University Press, 2015.(5)法治指標作為塑造全球法治共同體的平臺。法治評估進程形成了法治領域學者、政府部門和社會群體就法治主題進行互動和辯論的公共空間。通過指數的制訂和評估,法治評估推動了各國之間、各法治主體之間關于法治知識的交流,凝聚了關于法治的國際共識,創造了一個超主權國家的法治知識共同體,并進一步將指標凝結的法治理念向全球擴散。法治指標實際上成為跨越制度和文化進行交流的通用語言。〔11〕See Willem F.M.De Vries, Meaningful Measures: Indicators on Progress, Progress on Indicators, International Statistical Review, Vol.69:2, p. 313-331(2001).
法治評估作為一種治理技術,有其特定的理論前提和話語模式。從知識譜系上看,它源自西方國家治理中的實證主義傳統,此傳統經由新公共管理運動的興起發展到指標化階段,并與法律與發展運動合流而進入國際法治實踐領域。使用數字信息來理解世界,被Mary Poovey 稱為“作為一種知識形式的現代性事實”(modern fact as a form of knowledge),此一事實是西方認識世界的基本方式,并塑造了過去四個世紀大部分的知識體系,〔12〕See Mary Poovey, A History of the Modern Fact: Problems of Knowledge in the Sciences of Wealth and Society, University of Chicago Press, p. xiii (1998).這種數學化的認知方式強調的是客觀性和普遍性。在此觀念背景下,統計數據作為治理模式的起源可以追溯到19 世紀早期現代民族國家在西方的形成,強大的中央集權政府開始突破封建制的藩籬,精確的統計下的人口、財產和土地,并據此施行統治,統計數據成為國家規訓社會的工具,從而形成了福柯所謂的“治理術”(governmentality);近代功利主義學者則要求將政治的重心從形而上的抽象觀念轉向社會效益的衡量,并據此認為統計和社會經濟指標才是治理的核心,數據統計方法可以將政治變成科學,將治理變成技術;最終,隨著現代福利國家的形成,國家的社會保障和再分配職責日益擴張,對社會精細控制所依賴的信息需求同步提升,統計數據由此作為一種知識工具和治理工具在國家內部蓬勃發展,并向全球傳播。
這種實證主義治理傳統,經由新公共管理運動而發展到指標化管理階段。“二戰”后,隨著消費主義的興起和對商品可靠性需求的提升,企業管理的重點逐漸從提高生產率轉向產品生產過程的標準化,因此普遍采用了目標化、指標化管理方法。隨著新公共管理運動的興起,這種指標管理技術從私人部門擴散到公共行政部門,各國政府和國際組織也開始廣泛采用指標方法對行政進行績效評價和管理。〔13〕See Benoit Frydman, From Accuracy to Accountability: Subjecting Global Indicators to the Rule of Law, International Journal of Law in Context, Vol.13:4, p. 450-464(2017).指標方法引發了“治理領域的度量革命”,日益挑戰基于傳聞證據、經驗、傳統和直覺的舊行政文化,并塑造了數據驅動的新治理文化。〔14〕See Michael Ignatieあ & Kate Desormeau, Measurement and Human Rights: Introduction, in Measurement and Human Rights: Tracking process, Assessing Impact, Carr Center for Human Rights Policy Project Report (2005).與此同時,“法律與發展運動”在美國興起。這一運動認為法律體系是國家發展和社會現代化的制度基礎,因此廣泛地進行跨國制度比較,并倡導向落后國家進行法律移植。〔15〕參見[美]戴維·杜魯貝克:《論當代美國的法律與發展運動》,王力威譯,載《比較法研究》1990 年第2 期,第46-53 頁。此運動吸納了制度經濟學的研究方法,強調研究材料的量化、規范的市場化和分析的數學化,以展開制度相關性定量研究;同時為了準確度量各國制度發展情況,以針對性地進行法律援助和制度移植,大量使用了新公共管理運動中興起的指標化方法,形成了一系列法治指標。〔16〕See Amanda Perry-Kessaris, Prepare your Indicators: Economics Imperialism on the Shores of Law and Development, International Journal of law in Context, Vol.7:4, p. 401-421 (2011).
在上述知識脈絡的敘事中,法律的指標化代表了法學的數學轉向(mathematical turn),即依靠數學和統計技術來描述法律現象和法律理論,數學論點成為對法律現象的可接受的解釋。此觀點認為,傳統法學知識體系依賴語言、論證、歷史和質性社會學的解釋方法,無法擺脫主觀性和價值信仰,而數學可以拓展法律研究和法律推理的方法和技術,以期為法律人提供關于法律的更科學、更一般的見解。〔17〕See Adam Aft, Alex B.Mitchell & Craig D.Rust, An Introduction to the Journal of Legal Metrics, Journal of Law, Vol.2:1, p.15-17(2012).很多學者據此認為,法治指標作為法學數學轉向的成果,其核心優勢之一是其技術中立性:因為數字是對社會事實的簡單描述符號,因此指標作為一種數學形式,是一種去政治化的中立技術行為,從而可以抵抗各種理論和政治偏見。國際法治評估體系的主導者同樣廣泛宣揚這一觀點,認為跨國法治指標是不具有強制性的純粹知識工具,僅以中立的方式向決策者提供客觀信息,因此它具有更廣泛的技術性、自愿性和共識性;〔18〕See David Restrepo Amariles, Legal Indicators, Global Law and Legal Pluralism: An Introduction, The Journal of Legal Pluralism and Unoきcial Law, Vol. 47:1, p. 9-21(2015).例如,世界銀行前總法律顧問Ibrahim Shihata 就強調,“治理”與“干預政治事務”截然不同,法治評估作為治理技術是政治中立的。〔19〕See Alvin YH Cheung, Measuring the Measures: Rule of Law Indices and Abusive Legalism, LawArXiv Papers (2019).跨國組織、非政府組織、國際智庫和各國政府普遍采信了這一觀點,接受國際法治評估的去政治化和技術中立性假設,并在此基礎上進行研究和決策。
由于法治概念的本質屬性和國際法治評估的技術路線,僅就方法論層面而言,也無法以完全技術中立的立場還原社會事實,更無法完全排除主觀判斷和政治立場的滲入。法治評估的主要步驟包括法治的概念化、操作化、測量及解釋,其含義依次為確定要測量的實質對象、確定測量對象對應的可觀察社會事實以制訂指標、測量社會事實并根據指標打分、對測量結果進行理論解釋。以下將逐項予以考察。
法治評估的第一個步驟是對法治的“概念化”,即在抽象層面上界定測量對象的內涵,以與其他相鄰概念形成明確區隔,唯此才能展開下一步的測量,〔20〕See John Gerring, Social Science Methodology: A Criterial Framework, Cambridge University Press, p. 40 (2001).其實質就是:法治評估要評估什么內容?法治評估的技術中立假設,實際上隱藏著一種法治概念的客觀論觀點,即認為法治概念是超然于價值判斷之外的客觀實在體,由此指標可以牢固地錨定于既存概念而保證中立性。但是,近年來法治理論界已經普遍同意,法治是個“本質可爭議的概念”(essentially contested concept),法治是體現了政治共同體觀念的社會構建性概念,由于對法律社會功能的不同立場,概念化過程中必然隱含著若干實質價值判斷,“想找到語義明確和意識形態中立的法治定義是不可能的”,〔21〕Jeremy Waldron, Is the Rule of Law an Essentially Contested Concept (in Florida)?, Law and Philosophy, Vol.21:2, p. 137-164(2002).對法治實質內涵的討論,終將訴諸各種互相競爭的韋伯式“理想類型”。法治評估的技術中立假設忽視了概念化過程中滲入的政治立場。
當前對法治評估概念化的研究普遍援引了Brian Tamanaha 關于“厚”及“薄”法治的概念二分法,其中大致認為薄法治強調嚴格遵守法律制度,厚法治則納入了某些實質性政治價值。據Wolfgang Merkel 的總結,當前國際上不同評估體系在由薄到厚的法治概念連續光譜中的定位隱含著三種政治立場——法制、自由民主法治、社會民主法治(具體內容見下表1),其政治價值內涵依次增加。法治的極簡概念(minimalist)形式化程度最高,也最大化地排除了實質政治立場。然而,多數國際評估體系對法治的概念化并不局限于其極簡范疇,Merkel 坦言,“極簡概念無法區分大多數民主國家與半專制政權之間的差異”,因此當前評估體系概念化主要在中層概念(midrange)內取舍組合,并納入部分最大化(maximalist)概念,形成各自的評估范圍。顯然,法治的中層概念采納了西方自由民主主義政治立場,其中政治性基本人權、權力分立、民主性等要素,實質上遵循的都是作為西方意識形態核心的政治觀念和制度設計。概念化路線的此種選擇,使得評估的前提下已經滲入了政治立場。

表1 法治概念化的政治立場
評估的結果驗證了這些政治立場的存在。Merkel 發現,將中東和北非的法治評估得分與拉丁美洲、南亞等區域相比,其在世界銀行法治指數(WGI)中的得分顯著高于在自由之家自由世界指數(FW)和貝塔斯曼轉型指數(BTI)中的得分。其原因是WGI 更關注法律的社會效果和有效治理,對“犯罪和暴力事件發生率”情況給予較高打分權重,因此犯罪率較低的中東和北非得分較高;而后兩種指數更重視西方式的選舉民主制及政治性基本權利,這導致雖然拉丁美洲面臨著廣泛的治理失效和社會潰敗問題,但其在“言論自由和政治問責(民主)”項目得分卻明顯高出全球平均水平。〔22〕See Wolfgang Merkel, Measuring the Quality of Rule of Law, in Michael Zurn, Andre Nollkaemper & Randy Peerenboom, Rule of Law Dynamics: In an Era of International and Transnational Governance, Cambridge University Press, 2012.實際上,各種評估指標廣泛存在著所謂“經合組織偏見”,即指標設計基于西方發達國家的政治理論傳統和制度偏好,而忽略不同國家社會發展階段和結構差異下的核心制度需求和治理效能,導致對不符合西方民主法治定義國家更不利的評價結果,例如,在各種國際法治指數對前蘇東國家和中國長期以來的低評分。〔23〕同前注〔1〕,Svend-Erik Skaaning 文。實際上已有學者指出,由于其概念化過程中的立場差異,許多影響廣泛的法治指標是沒有可互換性(interchangeability)的,即因為其不同的概念邊界,其衡量的實質上是不同的社會事實,導致概念互相缺乏關聯,指標也沒有可比性——“學者們各自分析了非常不同的事情,卻都堅稱他們研究的是法治”。〔24〕同前注〔3〕,J?rgen M?ller、Svend-Erik Skaaning 文。正因為法治概念化面臨著此種困難,評估指標的所指和能指實際處于游離狀態,法治話語體系的表層融貫經常隱藏著法治概念內核的沖突,不同政治立場下的法治評估體系,自然會產生驚人的不同結果,中立性也就存疑了。
法治評估的第二個步驟是操作化,即將概念轉化為可觀察的社會事實,并據此開發具體指標。〔25〕See Juan Carlos Botero, Robert L.Nelson & Christine Pratt, Indices and Indicators of Justice, Governance, and the Rule of Law: An Overview, Hague Journal on the Rule of Law, Vol.3:2, p. 153-169 (2011).指標化使得復雜的社會信息易于理解并可供比較,這也是指標化方法產生的原因。法治評估的技術中立假設因此也隱含了一種還原論觀點,即要求評估能完整地還原指標對應的可觀察社會事實,從而避免主觀判斷的干擾。但由于法治要素是由高層次抽象概念型構的,其向作為具體社會事實的低層次社會系統映射時經常出現概念上的滑坡,導致法治指標經常不可避免地過度概況法治社會現象,進而使得評估丟失社會信息細節,與社會事實產生鴻溝。
一是正式規則和實際社會效果的鴻溝。以國際民主法治指數評估為例,民主是一個高水平的概念,對權力關系公開性、監督問責機制、社會參與賦能有著較為復雜的要求,但由于其對應的社會事實過于煩雜而難以全部指標化,很多評估體系將其滑坡為定期舉行的競爭性選舉。〔26〕See Tom Ginsburg, Pitfalls of Measuring the Rule of Law, Hague Journal on the Rule of Law, Vol.3:2, p. 269-280(2011).一位赴印度的志愿者律師發現,雖然該國在選舉制度方面有著漂亮的“書本上的法”,導致在各種民主法治指數中評分較高,但其權力分享格局并未成熟,監督問責機制也不完善,人民社會參與程度比較落后。〔27〕See Linda D McGill, Measuring the Rule of Law in India: A Volunteer Lawyer’s Experience, Maine Law Review, Vol.60:2, p.537-545(2008).同樣來自印度的一個反例是,世界銀行對印度各邦的行政許可簡化、反腐敗法規情況進行了評估,但對公司的調查卻發現,對那些許可程序、反腐敗法規指標在世行項目中評分更低的州,受調查公司對其投資環境反而打分更高,顯然世行的指標更關注形式化規則的完整,卻未能準確地衡量實際制度運行情況和政府實現制度設計的能力。〔28〕See Amanda Perry-Kessaris, Recycle, Reduce, and Reflect: Information Overload and Knowledge Deficit in the Field of Foreign Investment and the Law, Journal of Law and Society, Vol.35:1, p. 67-75(2008).高水平法治概念的滑坡導致指標所衡量的規則無法真實的體現本來要測量的實際法治社會效果。二是指標普遍性與本土具體情境的鴻溝。指標化的普遍性和可比性要求經常導致其無法顧及復雜的本土社會情境。例如,自由之家建立了關于人權水平的綜合指數GCS,但被學者認為僅衡量了西方發達國家重視的幾種政治性權利,卻遺漏了《經濟、社會及文化權利國際公約》中所載的大量實質社會經濟文化權利,而發展中國家在此類實質權利提升方面的巨大努力和進步被忽視了,而由于經濟社會發展階段的局限所導致政治性權利不同于西方的安排形式則被聚焦批判;反之,發達國家雖然在歷史上長期的政治斗爭中形成了較為成熟的政治權利制度,但也由于其社會結構固化和深層次變革的困難,貌似完善的規則體系下反而在種族、性別、勞工等領域長期存在隱性的結構性歧視,對于西方在此類經濟社會文化權利上的種種人權缺陷,GCS 指數卻并無體現。Jed Rubenfeld 對此尖銳的批評道,此類指數實際上體現了美國保守主義意識形態的霸權,暴露了國際治理的“反民主本質”。〔29〕See Philip Alston, Promoting the Accountability of Members of the new UN Human Rights Council, Journal of Transnational Law & Policy, Vol.15:1, p. 49-96(2005).
上述情形還導致了所謂“表演政治學”的登場。該概念意為:由于指標統計的政治壓力導致了組織的特殊回應形式,即組織忽略制度的實質效果,而更關注符合指標要求的書面制度建設,以應付指標壓力,獲得政治資本。〔30〕參見左鳳榮等:《統計與政治》,載《開放時代》2014 年第1 期,第11-77 頁。例如,拉丁美洲一些國家為了應付司法制度評估,積極地推進司法改革,比照指標要求建立了公共辯護、聽證會等制度,辯護數量、結案量等指標也有提升,但學者經過實地觀察發現,雖然制度機構的建設符合指標要求而導致評分提升,但制度的運行效果并不好,司法服務質量幾乎沒有實質性改進。〔31〕See Linn Hammergren, Indices, Indicators and Statistics: A View From the Project Side as to Their Utility and Pitfalls, Hague Journal on the Rule of Law, Vol.3:2, p. 305-316(2011).由于指標丟失社會細節,使得法治建設中的技術性目標被政治資本化成為可能,法治建設是需要政治責任感的工作,而指標化的過度抽象可能導致負面政治激勵和政治表演的產生。
法治評估中測量環節的任務是針對各指標搜集評估對象相關數據,并將數據轉化為具體的分值。當前國際法治評估項目主要采取三種測量方式:文本審查、民眾調查、專家調查。其中文本審查對象包括文件、報告、統計數據、法律文本;民眾調查對象包括個人和私營企業成員;專家調查對象包括法學專家、律師、政府部門官員、國際組織成員、非政府組織成員和專業商業評估機構成員等。〔32〕See Jim Parsons, et al., Developing Indicators to Measure the Rule of Law: A Global Approach, Vera Institute of Justice (2008).后兩者主要通過對調查對象發放調查問卷進行。文本審查方式似乎更能保障客觀性,但實踐中存在如下問題:(1)正式法律文本很可能只能捕捉“書本上的法”,卻無法體現法律制度運行的實質社會效果;(2)除了統計數據外,其他文本無法直接轉化為分值,仍然需要依賴專家編碼和人工打分;(3)由于法律社會關系的復雜性,客觀數據經常很難與特定評價相聯系,例如,某地區刑事案件數量低,并不一定意味著該地治安水平高,也有可能體現了該地警務部門的效能低下;(4)如Daniel Kaufmann 所說,法治事項多數是“天然固有不可觀察性”的社會現象,無法體現為客觀數據,例如,實際腐敗情況、政府服務企業能力等事項都無法采用客觀數據來體現。這導致當前國際法治評估更重視對法治效果的調查,主要采取專家調查和民眾調查的測量方式,此類數據依賴于專家和民眾的主觀感知,即所謂“感知性數據”(perceptual data)。〔33〕See Daniel Kaufmann, Aart Kraay & Massimo Mastruzzi, Governance matters VIII: Aggregate and Individual Governance Indicators 1996-2008, The World Bank (2009).(可參見世界銀行專家對幾種主要法治評估項目數據類型的統計,見下表2。〔34〕See Daniel Kaufmann & Aart Kraay, Governance Indicators: Where Are We, Where Should We Be Going? The World Bank (2007).)

表2 全球主要法治評估項目數據類型
很多學者指出,因為評估者的主觀判斷和個人偏見無法避免,對感知性數據的依賴引起了信度問題。〔35〕See Gerardo L.Munck & Jay Verkuilen, Conceptualizing and Measuring Democracy: Evaluating Alternative Indices, Comparative Political Studies, Vol.35:1, p. 5-34(2002).在西方理論和話語體系在全球擴散的背景下,各國專家成為實質上的知識共同體,其知識、信息來源和理論立場更加接近,而且專家們經常分享觀點和閱讀相同的文獻,從而更容易形成類似的偏見。〔36〕See Gene A.Brewer, Yujin Choi & Richard M.Walker, Accountability, Corruption and Government Eあectiveness in Asia: An Exploration of World Bank Governance Indicators, International Public Management Review, Vol.8:2, p. 204-225(2007).例如,一項實證研究發現,由于專家普遍相信民主能減少腐敗的理論假設,經過與公開報告的對比,專家們在各種反腐敗評估中普遍顯著低估了有選舉制度國家的腐敗程度;〔37〕See Daniel Treisman, What Have We Learned About the Causes of Corruption From Ten Years of Cross-national Empirical Research? Annual Review of Political Science, Vol.10, p. 211-244 (2007).另一個常見偏見是對富國的光環效應,即高估富國的指標得分。一項檢驗性研究發現,由于相信良好治理與經濟發展的正向關系,專家們在法治評估中普遍對經濟發達的富國給予更高的法治評分。〔38〕See Tor Krever, Quantifying Law: Legal Indicator Projects and the Reproduction of Neoliberal Common Sense, Third World Quarterly, Vol.34:1, p. 131-150(2013).個人對法律制度的評價還可能會受到與法律無關的事項或偶然事件的影響,一個反例是,21 世紀初阿根廷發生經濟危機后,一年之內該國的WGI 專家評級大幅度下降,但該國的法律制度在該年度內實際上并無根本性變革。〔39〕同前注〔31〕,Linn Hammergren 文。有學者因此提出,專家們可能根本無法系統深入地研究不同國家的各單項指標,而是基于對一個國家狀況的一般性感受來進行評估,而這種感受經常源自某些國家的國際聲譽和形象。〔40〕See Tom Ginsburg & Mila Versteeg, Measuring the Rule of Law: Pushing Forward, LSI Forum, Vol.2, p. 10-12(2016).當前西方占據全球輿論和話語權優勢,并對其政治競爭對手國長期進行輿論抹黑和攻擊,例如,當前西方媒體對中國防疫措施不公正的報道廣泛地影響了西方民眾乃至部分專家,在此情況下感知性數據顯然無法避免各種主觀判斷和政治偏見。
法治評估作為國際治理技術的應用最終需歸結到對評估結果的解釋和挖掘。對評估結果的解釋有三種路徑:一是就特定指標在各國間進行橫向比較,以確定評估對象某法律制度的發展程度及在全球的位置;二是就特定指標在某國內部進行時間段上的縱向比較,以確定某法治領域的改革效果和法治建設進程;三是將特定法治指標作為自變量,將其他社會現象作為應變量,用定量方法驗證其相關性,以解釋法治的社會效果,為決策提供支撐。但上述解釋路徑均有極大的不確定性,使得評估難以排除主觀判斷。
就橫向比較而言,僅由于指標化和測量方法的固有缺陷,已經使得數據偏差難以控制;除此之外,學者又用計量方法對幾種指標差異的顯著性進行了檢驗,發現在合理的置信水平下,很多國家間的評分差異并沒有統計意義上的顯著性;WGI 的評估專家就明確提示,用戶要避免對國家間的細微評分差異進行過分解釋,這些差別在統計意義上或社會現實意義上都缺乏解釋價值,例如,秘魯在反腐敗工作上的評分領先于牙買加,但兩國數據的置信區間存在很大的重疊,使得這一結果在統計學意義上無法推導出任何有意義的結論。〔41〕See Aart Kraay, Daniel Kaufmann & Massimo Mastruzzi, The Worldwide Governance Indicators: Methodology and Analytical Issues, The World Bank (2010).而各國發展背景和社會情景的差異,進一步干擾了數據可比性,例如,西方某些人權評估體系在反歧視指標下特別重視種族歧視的相關制度規定,但在中國這種種族比較單一、歷史上也不存在種族歧視問題的多民族國家,自然也不會有太多反種族歧視制度設計。在不同的社會背景下,即使統計意義上顯著的評分差異有時也很難進行結果推論。就縱向比較而言,由于跨國評估需要高資源投入,當前絕大部分評估項目都不是每年開展的,還有很多臨時性和短期性評估項目;另外由于理論發展和政策目標變化,一些評估體系的指標設置頻繁變動,例如,WJP 法治指數的指標經過多次調整,一級指標由13 項最終調整到9 項,這都導致很多指標評估結果為橫斷面數據,無法納入時間序列,也就無法解釋前后因果關系,在此種情況下,對某法治事項即使完成評分,也不能根據該評分判斷此法治事項的改革進展;即使是縱向可比的指標,由于對社會性事實無法設置對照組,面對社會關系中因果關聯的復雜性也就無法控制混雜變量,此時即使某單項指標增長或降低了,也無法確切證明這一變化是源自實質法治改革計劃的進展還是其他社會因素的干擾。〔42〕See Elin Cohen, et al., Truth and Consequences in Rule of Law: Inferences, Attribution and Evaluation, Hague Journal on the Rule of Law, Vol.3:1, p. 106-129 (2011).
對法治社會效果的定量考察尤其困難。首先從統計學技術上看,由于法治概念邊界的模糊性,法治指標并不是一個良好的自變量,例如,學者采用探索性因子分析法對WGI 指數的6 個一級指標進行了分析,發現這些指標概念有大量重疊,它們均與一個更大的籠統概念有著強相關性,〔43〕See Laura Langbein & Stephen Knack, The Worldwide Governance Indicators: Six, One, or None? The Journal of Development Studies, Vol.46:2, p. 350-370 (2010).這使得僅以法治指標為因變量作出的因果解釋都是不穩健的。另外,由于社會治理領域的復雜性,任何社會變化都難以歸結為單一要素,遺漏解釋變量幾乎是不可避免的,例如,肯尼亞的行政許可改革完成的當年,其GDP 就暴跌了29%,顯然法制改革與GDP 變化之間的相關性無法建立,而實際情況是當年該國發生了嚴重的暴力事件。〔44〕同前注〔42〕,Elin Cohen, et al.文。可以說,由于法治的特殊屬性,社會科學定量研究方法中本就存在的問題在法治定量研究中更加嚴重了,例如,由于干擾變量過多,統計上的相關性難以推導出因果性,而法治領域存在著更為嚴重的自相關、共線性、內生性問題,法治相關的數學模型也更加不穩健而缺乏預測力……此類種種情形使得依賴法治指標進行的相關性解釋幾乎都難以避免各種主觀判斷。
正因為法治評估的技術中立性在理論層面的不可能,使得技術政治得以嵌入國際法治評估。福柯的技術政治理論揭示,政治權力本是一種通過法律、禁忌和審查機制進行控制的壓制性力量,而近代以來,技術成為新型政治權力機制,形成了規訓日常生活的“權力—知識之網”(the web of power/knowledge),統計指標就是此種技術類型之一。此種技術政治的實質是用觀念上的建構壓制乃至取代情景化、地方化和本土化知識。〔45〕參見李三虎:《技術,空間和權力——米歇爾·福柯的技術政治哲學》,載《公共管理學報》2006 年第3 期,第34-43 頁。本文認為,國際法治評估正是這種新型權力機制在全球擴散的后果,表面中立的評估技術實質上嵌入了隱性政治權力結構,其形式包括軟性權力支配、單向的政治意識形態輸出和實質不對等的權力關系,從而使得國際法治評估有可能蛻變為一種技術政治(technopolis),成為西方國家打破民族國家邊界、壓制各國地方性法治話語的政治規訓工具。
技術政治的特征,是技術取代傳統制度成為新型權力支配和控制手段。國際法治評估的技術中立性假設強調其非強制性,但實際上評估過程嵌入了各種軟性權力控制手段,通過控制資源分配、影響國家信用和聲譽、制造政治壓力等方法,使得被評估國家不得不遵從指標的規訓,從而使指標成為實質上的全球法,異化為一種政治支配權力。
第一種支配手段是控制資源分配,尤其表現為各種國際援助與評估結果的掛鉤。法治評估在法律與發展運動中誕生的重要原因,就是美國國際開發署可以借此衡量受援助國按照美國方案進行法治改革的進展,并以此決定給予經濟援助的力度和方向。20 世紀末以來,世界銀行等國際組織的援助也越來越多地與治理評估結果掛鉤。例如,世界銀行國際開發協會(IDA)向貧困國家提供的無息信貸和經濟援助,是根據其開發的“國家政策和制度評估(CPIA)”治理指標的評估結果分配的,該機構針對各國“制度和機構框架治理”設置了20 條指標,其中直接納入了其他幾種法治評估項目的數據。之后這種模式受到各種國際機構和援助國的歡迎,例如,亞洲開發銀行、非洲開發銀行等機構普遍使用WGI、DB 等國際法治評估結果作為援助分配的依據。美國專門負責對外援助的政府組織千年挑戰集團(MCA)更是明確指出要“獎勵那些根除腐敗、尊重人權并遵守法制的國家”,并針對“公正執政”“投資于人民”和“鼓勵經濟自由”三方面內容制定了17 種政策指標,根據評估結果分配對外援助。〔46〕同前注〔38〕,Tor Krever 文。附加政治條件的經濟援助使得法治評估隱藏了軟性支配力量。第二種支配手段是影響國家信用和聲譽。多種研究指出,法治評估的結果影響著投資者、消費者、游客、移民等人群對特定國家的觀感,從而影響其對人力、經濟等資源的獲取能力;“用腳投票”“政府競爭”“制度競爭”等理論均在不同角度驗證了不同制度水平對地區競爭力的影響,法治評估結果由此深刻地塑造著被評估國家的“制度吸引力”,乃至在一定程度上影響了這些國家的發展能力。法治評估甚至在一定程度上影響著全球資本和投資的流動,例如,國際主權信用評級普遍將法治情況納入各國評級依據,而評級機構其對法治情況的審查經常參考援引各種國際法治評估結果,評級結果則極大地影響著各國的全球金融信用和金融能力。〔47〕同前注〔18〕,David Restrepo Amariles 等文。表面上非強制性的國際法治評估,在此通過間接塑造制度吸引力和競爭力,而成為一種塑造規范性權威的制度行為。第三種支配手段是制造政治壓力。政治壓力沒有法律那種正式的規范性和強制力,卻可以通過抬升社會預期、引導公眾輿論來產生實質社會后果、控制國家行為。如一項研究表明,反腐敗指數的低排名導致肯尼亞政府面臨較大的國內輿論批評和政治壓力,而開展了反腐敗工程;〔48〕See Kevin E.Davis, Legal Indicators: the Power of Quantitative Measures of Law, Annual Review of Law and Social Science, Vol.10, p. 37-52(2014).而在另一個案例中,法治指數項目對巴西政府產生了政治壓力,使得其開始進一步推動司法改革,謀求提高司法效率。〔49〕See Pedro Rubim Borges Fortes, How Legal Indicators Influence a Justice System and Judicial Behavior: the Brazilian National Council of Justice and “Justice in Numbers”, The Journal of Legal Pluralism and Unoきcial Law, Vol.47:1, p. 39-55(2015).實際上,話語權是西方軟實力的核心組成部分,軟實力的常見運用形式就是通過話語權制造政治和輿論壓力,影響乃至破壞一國原有政治力量格局。法治指標的評估和解釋經常成為西方強化、運用自身法治話語權的手段,而由于法治評估技術中立性的偽裝,此種話語相較直白的政治話語能更無阻礙地在全球擴散傳播,在深層次上影響著全球權力格局。
正因為上述法治評估所表露出的權力支配性,法律多元主義者認為,在社會規范多元化的語境下,當前國際指標正逐步滲透進民族國家主權體系內的法律和政治權威結構,成為多種發揮實質性約束功能的國際規范中的一種。從這個意義上說,它雖然在形式上是非主權化、無強制性的規范手段,但仍能被視為一種準全球法,并逐步侵蝕著原有的以主權國家為中心的國際規范體系。〔50〕同前注〔18〕,David Restrepo Amariles 等文。
法治評估的技術中立假設認為指標是無價值性、非政治化的。但實際上,指標方法無法隔絕價值判斷,指標化實際上絕不僅是對社會事實的機械反應,而是知識觀念的生產。國際法治評估中不可避免地嵌入了政治意識形態,而意識形態構成了技術政治的觀念工具。
多種法治指標的制訂者展示出鮮明的政治意識形態立場。例如,美國保守派智庫傳統基金會(Heritage Foundation)明確自身的任務為“根據商業自由、有限政府、個人自由、美國傳統價值觀和強大國防原則,制訂和推動保守主義的公共政策”,該組織制訂的法治指標特別重視財產私有化和貿易金融自由化;美國非政府組織自由之家則坦言自己的使命是“反對民主的主要威脅……提倡更大的政治和公民自由,支持一線運動分子捍衛人權和促進民主變革”,該組織出臺的法治指標則主要關注人權領域。以上組織均有大量經費源自美國政府機構,且被認為存在明顯的右翼偏見;〔51〕See Mila Versteeg & Tom Ginsburg, Measuring the Rule of Law: A Comparison of Indicators, Law & Social Inquiry, Vol.42:1, p.100-137(2017).大量此類接受西方政府資金資助,或者和其母國政治勢力聯系緊密的所謂非政府組織在全球各國政治運動中表現活躍,乃至經常成為各種“顏色革命”的幕后推手,后者還因為在香港修例風波中的惡劣表現被我國實施制裁。法治指標在其活動中扮演了重要的意識形態擴散工具的角色。另外,法治指標還體現了博溫托·桑托斯所謂“新自由主義法律全球化”,此觀念的背景是華盛頓共識的形成,這一觀念特別重視私有財產權保護和合同執行,鼓吹私有化、貿易自由化、金融自由化、降低關稅和政府放松監管。其特別體現在各種營商環境評估體系中,以世界銀行的DB 項目為典型代表。該指標因為支持資本壓制勞工權益,乃至違背了國際勞工組織公約的精神,而面臨著廣泛批評,被認為推動了新自由主義議程,或代表了西方的商業利益。〔52〕See Kevin E.Davis, Benedict Kingsbury & Sally Merry, Introduction: the Local-global Life of Indicators: Law, Power, and Resistance, in Sally E.Merry, Kevin E.Davis & Benedict Kingsbury, The Quiet Power of Indicators: Measuring Governance, Corruption and Rule of Law, Cambridge University Press (2015).實際上近年多個發展中國家由于其自由化、去管制化路線導致經濟失敗乃至經濟危機,而中國特色社會主義道路堅持以公有制為主體、宏觀調控有力、市場監管有效、貿易金融政策穩健,取得了巨大的發展成就。西方在普遍不得不承認中國的經濟成就的同時,卻仍然堅持站在新自由主義立場上攻擊其他類型的制度方案,也再次凸顯出此類指標中新自由主義立場的意識形態本質。
對指標的意識形態性,學者有著清醒的認識。他們提出,指標化同時產生知識和權力,它將政治判斷隱藏在技術標準中,以將其偽裝為“客觀領域”,而不是通過政治辯論塑造的領域。以西方民主理想為代表的新自由主義法律制度,被視為現代法律體系的技術必需品,關于法律理想的政治參與和國際競爭被壓縮甚至被取消了。〔53〕同前注〔38〕,Tor Krever 文。而法治評估成為援助國、非政府組織、專家、社會活動家的平臺,供他們爭相向欠發達社會提供關于法律的理想模式。〔54〕See David Nelken, Contesting Global Indicators, in Sally E.Merry, Kevin E.Davis & Benedict Kingsbury, The Quiet Power of Indicators: Measuring Governance, Corruption and Rule of Law, Cambridge University Press (2015).指標一方面通過將意識形態制度化和文本化來制造其中立性表象,另一方面又將基于特定政治立場的制度安排包裝成具有某種道德優越性的必然選擇,以形成強大的觀念性約束力量,從而產生事實上的權力支配關系。
技術中立假設特別強調法治評估進程的平等性和自愿性,這一假設顯然有意無意地忽略了法治評估中權力支配行為和政治關系的存在。政治權力關系表現為單向的力量優勢與支配性,其本質上是不對等的。這種不對等的權力關系形態是理解國際法治評估中技術政治格局的基本起點。
此種關系的一方是以美國為中心的西方發達國家,另一方則是廣大的發展中國家。正如學者觀察后指出的,當代全球治理所依賴的指標,通常是由那些北方的富國設計和制定的,尤其以美歐或其占主導地位的國際組織為主,而廣大發展中國家在指標的制訂中幾乎沒有任何發言權。〔55〕See Sally Engle Merry & John M.Conley, Measuring the world: Indicators, Human Rights, and Global Governance, Current Anthropology, Vol.52:3, p. 83-95(2011).這一方面源自國際政治經濟秩序下發達國家在國家實力上的優勢地位,另一方面也源自西方傳統上形成的強勢意識形態及更為成熟的法治知識話語體系。在主權理論視野下,此種不對等權力關系實際上是西方政治權力對發展中國家主權的稀釋,從而使得指標成為發達國家在跨主權國家地理尺度上規訓國家行為的手段,從這個意義上說,指標的技術中立假設“不過是用技術—官僚主義話語掩蓋地緣政治力量的實際差異”。〔56〕同前注〔52〕,Kevin E.Davis, Kingsbury Benedict & Merry Sally 文。。
有時西方通過法治指標間接為發展中國家提供政治變革的議程,甚至使之成為當地政治斗爭中的強大角色,這種政治斗爭使得指標中隱藏的觀念與制度被“偷運”進當事國。此類情形在阿爾巴尼亞、肯尼亞和羅馬尼亞等國家多次發生。例如,美國國際開發署贊助了一項針對阿爾巴尼亞的反腐敗指數評估,而評估結果被美國駐阿爾巴尼亞大使用來批評該國一些政府成員,此言論在阿爾巴尼亞國內廣泛傳播之后,極大影響了該國領導人內部權力斗爭的格局。當前由于大部分發展中國家照搬了西方競爭性選舉民主體制,形成經常性的內部政治對抗,而國家實力的弱勢地位使得其國內政治力量格局極易被外部力量干擾,國際指標正成為此種干擾的趁手工具。正如Smoki Musaraj 所發現的,援引全球指標,往往會使本地政客與一個可疑的跨國機構保持一致立場,而追求一套不同于本地需求的政治利益。〔57〕See Smoki Musaraj, Indicators, Global Expertise, and a Local Political Drama, in Sally E.Merry, Kevin E.Davis & Benedict Kingsbury, The Quiet Power of Indicators: Measuring Governance, Corruption and Rule of Law, Cambridge University Press (2015).有時法治指標成為發達國家對發展中國家進行政治規訓的直接手段。例如,在羅馬尼亞申請加入歐盟期間,歐盟委員會發布了司法制度改革和反腐敗工作半年度報告,該報告援引了透明國際、自由之家和世界銀行的幾種指標,嚴厲批評了該國領導層,并以此否決羅馬尼亞的申請。而有歐盟法律專家明確指出,此類指標僅將法治視為一種后共產主義話語,將評估視為服務于一種政治轉型安排,而完全否定了羅馬尼亞本國的法治歷史淵源,也忽視了其本土需求,例如,羅馬尼亞本國專家更為關注的治理質量、公共行政政治化、政府與議會的溝通機制、法律的執行機制等問題被忽略了。這些專家因此認為,羅馬尼亞的國家權力被稀釋了,法治指標成為一種由跨國核查機制驅動的政治控制技術和紀律機制,它加強了發達國家的法治話語權力,并遮蔽了被評估國本土語境和自主話語權,間接支配了該國國內政治變革。〔58〕See Mihaela Serban, Rule of Law Indicators as a Technology of Power in Romania, in Sally E.Merry, Kevin E.Davis & Benedict Kingsbury, The Quiet Power of Indicators: Measuring Governance, Corruption and Rule of Law, Cambridge University Press (2015).而指標中針對競爭性制度構建“去合法化”敘事,實際上成為相關國家強化自身制度話語權霸權、推動排他性國際制度體系形成的政治工具。〔59〕Matthew C.Gertken, The International Balance of Power in Swift’s Discourse of the Contests and Dissensions, The Explicator, Vol.73:4, p. 243-247(2015).
當前我國在國際法治評估場域基本處于不在場狀態:其一體現為理論失聲,即對西方主導的國際法治評估體系主要采取引介學習的態度,卻無法對其展開審視、批判和理論對話;其二體現為實踐缺位,即主要關注國內法治評估,將其視為推動我國法治建設的工具,甚至將其嵌入我國政府的科層化運作,〔60〕參見姜永偉:《法治評估的科層式運作及其檢視——一個組織社會學的分析》,載《法學》2020 年第2 期,第129-141 頁。卻未能參與國際評估體系的構建。面對國際法治評估中的技術政治和權力規訓,我國有必要提供國際法治評估的中國方案,表達我國鮮明的政治、理論和技術立場,以消解西方技術政治,并落實習近平總書記“提高我國在全球治理中的制度性話語權”的要求。〔61〕參見《習近平談治國理政》第2 卷,外文出版社有限責任公司2017 年版,第244 頁。
首先,法治評估應充分闡發人類命運共同體理念。西方主導的法治評估隱藏著西方制度優越性的假設,秉持一種價值對抗的文明觀對其他競爭性制度進行“去合法化”建構,其實質是將歷史終結、文明沖突的政治意識形態嵌入了法治概念。我國在評估體系構建中應充分闡發人類命運共同體理念,強調人類社會作為有機聯系整體的形態,謀求開放創新、包容互惠的發展前景;要著重闡述新型全球治理體系絕非政治權力的轉移和經濟利益的重新分配,而是全人類的均衡、綠色、可持續發展。在此立場下,法治評估的中國方案應將法治的概念化從價值對立、概念對抗中解放出來,堅決拒絕法治概念的意識形態化敘事,轉而倡導一種基于人類命運共同體理念的溝通性權力敘事,更加注重以指標衡量在各國不同的發展水平和社會語境下,法治如何真實的服務于各國人民的充分發展,而非某種特定制度理想的實現。
其次,法治評估應遵循共商共建共享的全球治理觀。西方主導的法治評估體現著單邊主義和等級化(hierarchy)的權力關系,從而使西方通過話語霸權壟斷了規則制定權和評價權,嚴重壓制了發展中國家的治理話語權,使其在全球治理體系中邊緣化、對象化。我國在評估體系構建中應遵循共商共建共享的全球治理觀,倡導國際關系民主化,支持擴大發展中國家在國際法治事務中的代表性和發言權,以建立公正合理的國際秩序。因此要發揮聯合國在全球治理中的核心作用,依托聯合國法治機構和工作機制,與廣大發展中國家積極協調,推動優化聯合國法治評估體系,進一步擴大其全球影響。積極參與現有多邊機制互動,在“一帶一路”倡議、亞投行、RCEP 等機制中與發展中國家一同平等開展法治討論和評估,探索服務于區域合作和區域發展的新型法治評估機制,為中國法治話語提供合法性和道義支撐,為廣大發展中國家提供對西方主導的法治評估的替代性機制。
最后,法治評估應積極踐行新型人權觀。人權范疇的發展和豐富是人類政治觀念史上的重要現象。國際上第一代人權強調公民政治權利,第二代人權強調社會平等和經濟文化權利,第三代人權內容則強調自決權、發展權、環境權、通訊權、文化遺產權、代際公平等集體權利。西方主導的法治評估主要關注第一代人權,正如博溫托·桑托斯指出的,這導致改善世界亞群體生活機會的進步工程的失敗,其實質是用自由主義意識形態壓制并瑣碎化了集體權利,乃至引發了西方“現代性危機”。〔62〕參見[葡]博溫托·桑托斯:《邁向新法律常識:法律、全球化和解放》,劉坤輪、葉傳星譯,中國人民大學出版社2009 年版,第579-580 頁。實際上,第一代人權源自西方,特別是西歐歷史上獨特的社會結構和文化傳統,其中含有大量的意識形態假設,而制度應當根植于社會共同體的文化精神和具體實踐,在發展階段不同的國家激進的移植西方第一代人權的制度設計很可能導致制度失效或失敗。中國作為全球新型人權保障事業的倡導者、踐行者和推動者,應當在法治評估中避免陷入第一代人權話語中的意識形態之爭,轉以社會公正和集體人權的實質性提升為核心標準,衡量法治發展的實際社會效果。
在方法論層面,要納入自下而上的社會學方法。專家發現,西方主導的評估體系多數采取自上而下的規范方法,即主要評估法律系統內部的制度結構是否符合特定理論理想型。在這一路徑下,許多國家雖然評估結果良好,但由于國家能力的欠缺導致法治實際社會效能薄弱。這些學者因此提出,國家實際能力是法律實施效果的基本條件,評估應采取自下而上的社會學方法,關注公民實際接受的一般性約束及其具體社會效能。〔63〕See Marcelo Bergman, The Rule, the Law, and the Rule of Law: Improving Measurement and Content Validity, Justice System Journal, Vol.33:2, p. 174-193(2012).中國的發展經驗也證明,發展中國家尤其應重視國家組織、動員和治理能力,而非由意識形態推導出的特定法律體系和機構設置形式。中國的法治評估方案,也不應囿于法治的概念化和形式性要求,而應積極引入社會學方法,著重衡量在法律實施中所體現的國家治理能力和實際社會效果,使法治評估服務于世界人民的具體福祉而非某種虛無縹緲的政治觀念。
在知識論層面,要積極挖掘法治的地方性知識。福柯的政治批判理論要求關注不連續的、從屬性的、被去資格化的地方性知識,以消解權力規訓的單一化、獨斷性、規范性理論。〔64〕參見[美]約瑟夫·勞斯:《知識與權力——走向科學的政治哲學》,盛曉明、邱慧、孟強譯,北京大學出版社2004 年版,第112 頁。面對西方主導法治評估中的技術政治之規訓,中國方案應秉持“和而不同”的多元主義文明觀和法律觀,拒絕西方所謂的“法治普適論”“法律移植論”“法律全球主義”等觀點,尊重各國的社會文化情境,充分考慮不同發展階段國家的社會實際需求和價值序列差異,深入挖掘各國的法治地方性知識。在設計評估體系之前應當進行嚴謹的比較法和國別法研究,以理解各國法律體系生成的內在邏輯和本土情景,避免基于某種先在的抽象理論假設進行粗暴評價;評估中應注重評估指標和方法的區域化、國別化,靈活采用質性研究和社會調查方法,要謹慎進行指標的跨國適用和國別橫向比較。
在理論目標上,要著力構建中國法治話語。習近平總書記提出,“要著力打造融通中外的新概念新范疇新表述,講好中國故事,傳播好中國聲音,增強在國際上的話語權”。〔65〕《習近平關于社會主義文化建設論述摘編》,中央文獻出版社2017 年版,第197-198 頁。法治評估的中國方案, 要積極構建關于中國法治發展道路的主體性敘事,推動形成對法治概念的中國化闡釋與解讀;在制度設計上,要以中國改革開放以來取得的巨大發展成就為基本論據,在廣泛國際認可的基礎上,將諸如央地格局、試點創新、統籌規劃、分級施策、綜合治理等中國特色法治概念納入指標體系;在價值論證上,要進一步豐富中國特色社會主義理論體系,對中國優秀古典文化進行創造性詮釋,構建基于中國自身文化傳統及歷史經驗的價值元語言,為世界貢獻西方基督教傳統和新自由主義意識形態之外的人類社群間理性交流和凝聚共識的基本智識工具。經由制度和價值互相支撐的二元敘事,重新塑造中國國際法治話語權,為廣大發展中國家提供替代性的治理經驗。
在評估流程設計上,應引入“應答—建構主義評估”模式(responsive constructivist evalution)。在評估學領域,前三代評估的導向分別是測量、描述、判斷,“應答—建構主義評估”模式又稱為“第四代評估”,其核心導向是參與和協商。本模式采用自然主義的評估方法,即評估者放棄對評估對象的單向控制,而采納對象的視角和解釋自然地進入評估場域,以對象的視角和解釋為基礎,結合質性訪談、觀察和文獻分析加以擴展和具體化,而其核心流程是由評估對象全程參與指標構建和估值解釋。〔66〕參見[德]賴茵哈德·施托克曼、沃爾夫岡·梅耶:《評估學》,唐以志譯,人民出版社2012 年版,第128-132 頁。這一模式下的國際法治評估要求其全流程對評估對象國開放,將其參與解釋視角納入評估結果,從而避免評估國的單方向審視和價值獨斷。這一方法能有效地消解當前國際法治評估中的權力不對等和控制關系,并得以將評估深入到對象國的法治話語體系和社會情景,從而避免各類理論前見和政治偏見的影響。
在指標體系安排上,要從理論層面下沉到操作層面。(1)注意指標可測性問題,不應一味追求理論上的體系完備,對于過度理論化、價值化而導致無法避免主觀判斷的指標,應當謹慎使用;指標的選取應特別注意在被評估國社會條件下的易得性和可測性;(2)注意指標多重共線問題,清晰界斷各法治概念邊界,合理安排其權重比,避免一因多果、互為因果的指標共同進入體系,導致權重失衡和過度解釋影響評價的公正性;(3)積極構建客觀指標,細致論證法治效果與可觀測客觀數據的關聯強度和模型;謹慎使用基于感受性的主觀指標,并驗證主觀評價與實際法治績效之間的非線性關系,在評估報告中予以說明;(4)注重效能性指標,即通過實證標準檢驗法治實際社會效果的指標;謹慎使用過程性指標,即通過文本審查體現法律制訂實施特定程序性節點的指標,以保障指標衡量的是實際治理效果而非書本上的規則。
在結果運用上,要廣泛開展對現有評估結果解釋的檢驗性研究。當前國際政策學界開展的基于評估結果的定量實證研究,是將評估結果作為法治水平的可觀察值,檢驗其與其他社會現象的相關性。此種研究的邏輯是將數據分為系統模型和隨機殘項,其中模型嚴格對應著理論假設,而理論不可解釋部分則被納入隨機殘項予以忽略,〔67〕參見彭玉生:《社會科學中的因果分析》,載《社會學研究》2011 年第3 期,第1-32 頁。而由于理論解釋經常隱藏著政治前見,此種研究自然可能存在自覺不自覺的政治立場;而被隱藏的隨機殘項則可能干擾原研究的因果關系判斷,使得原理論假設不成立。對此,我國法學界應當積極引入實證方法,對此種隱藏了政治立場的相關性假設進行檢驗。一是進行國別個案研究,以個案直接證偽其假設;二是在隨機殘項中發現構建新的解釋變量,通過相關性檢驗證成替代性解釋;三是直接對原研究進行技術驗證,揭示其方法上的錯誤從而論證其結果的不成立;四是直接運用同樣的數據類型復現原研究,再次驗證兩個相同變量的相關性。實際上當前國際學界對原始研究的復現式研究、檢驗性研究是一個重要方向,我國學者應當積極回應這一知識需求,引入中國數據予以深化,以表達中國立場,發出中國聲音。
本文的討論起于對國際法治評估中技術政治的揭示和反思,終于對中國方案和立場的闡明,但其隱含的脈絡和根本歸依,則是我國在國際治理中制度性話語權的提高。而國際法治評估的中國方案,在此語境下應主要視為一種制度性話語工具和權力機制予以考察。但在此視角下,尚有以下幾個問題需加以注意和進一步的闡發:(1)國際制度性話語權構建需要深度的學科協同和政學協作。國際法治場域的話語權力格局,是由長期話語博弈后形成的場域規則、話語資本、話語習慣及國家間關系位置共同決定的;而由于學科邊界所限,本文僅能從法學學科內部視角出發,對法治評估中涉及法學概念和知識的話語內容進行討論,但構建國際制度性話語權是一個龐大的系統性工程,尚需在倡議動員、議程設置、話語平臺,傳播渠道、話語方式等領域進行全面提升,這有待于其他學科同仁共同深化研究;(2)要謹慎地處理法治知識一般性和特殊性的關系。本文在技術政治語境下,更加強調法治知識的特殊性,以要求擺脫西方知識權力范式的支配,在國際法治評估體系中展開中國法治的主體性建構。但這絕不意味著徹底否認法治知識的一般性要素,更堅決反對法治觀念上的極端本土主義和保守主義。要遵循習近平總書記“立足中國、借鑒國外,挖掘歷史、把握當代,關懷人類、面向未來”的中國特色哲學社會科學發展思路,平衡法治知識的一般性和特殊性要素,即要在國際法治評估體系構建中充分體現中國特色、中國風格、中國氣派,也要在摒棄西方政治意識形態支配的前提下充分吸收人類社會發展歷史上形成的一切優秀法律文明成果。(3)要對法學的自足性保持基本尊重。現代法學和法治觀念的基本假設是形式主義法治下法學的自足性,即將法學視為一個邏輯相對嚴整的體系,并依賴于法學本身的概念和方法體系對法律問題予以解答應對。由此觀念才能支撐司法獨立、法律職業化和法學教育專業化等現代法治基石。本文所采取的政治批判方法,在法學理論譜系中實際上是一種對現代形式主義法治體系和法學自足性的沖擊。需要明確,這一理論進路所采取的法學外部視角,僅用以關注西方主導的權力政治在各國法治系統外部的運行和作用機制,是一種“否定之否定”;當法治評估體系的構建進入具體法治制度規則領域時,仍要回歸法學的內部視角,充分尊重法學的自足性,基于形式主義法治的基本理念構建評估體系。