□ 蔡立東 郝 樂
內容提要 立基于“發展優位”的推進思路,我國司法大數據輔助審判應用得到長足發展。但由于未能超越技術中立觀和工具論,對技術的宰制性和司法人工智能的輔助性地位缺乏應有的自覺,對技術發展的階段性和復雜性之于大數據輔助司法審判應用的制約、對大數據技術在司法領域應用的適配性考量不足,尚未實現對司法大數據輔助審判的數據算法風險、功能異化風險、司法規律抵牾風險及應用實踐問題的有效規制。通過技術賦權與技術限權加強技術應用規制,通過核心禁區與業務痛點分析明確應用場景限定,通過程序規制與合理限度設置強化應用主體管控,能夠促進對司法大數據輔助審判應用的有效限定與規制,推進大數據在司法審判中的深度融合應用。
司法與大數據技術的結合為我國司法體制改革注入了前所未有的創新活力,中國的司法大數據輔助審判應用已走在世界前列,“智慧法院”建設實現從跟跑到領跑的跨越式發展。基于“發展優位”的司法大數據輔助審判推進思路,對司法大數據的應用規制相對寬松。與此適成對照的是,域外國家和地區對司法大數據的應用則較為審慎,不但對司法大數據的收集、使用設置較多限制,而且其應用較少涉及審判等法院核心業務。如歐盟通過《通用數據保護條例》《算法責任與透明治理框架》等建立了較為嚴格的數據和算法應用規制機制;①法國通過“司法大數據禁令”直接禁止基于“法官畫像”的司法裁判預測;②美國則將司法大數據智能輔助系統的適用限定于特定領域,并對其應用發展采取“漸進式”監管。③司法大數據輔助審判往往旨在提高司法效率、促進司法公開,較少向其加載規范法官自由裁量、促進統一法律適用、提高司法公正等價值目標。
司法大數據應用為一把雙刃劍,在推進司法效率提升,實現司法審判流程重塑、規則重塑的同時,也將給司法裁判活動、司法倫理觀念等帶來深刻的沖擊與挑戰,這在司法大數據與人工智能技術結合產生的司法大數據輔助審判領域體現得尤為明顯,不僅其應用成效未達預期,還產生“上熱下冷”“內熱外冷”的重要實踐面相。④當前,司法大數據輔助審判應用,很大程度上仍局限于通用大數據技術在司法場域的平移運用,對于大數據技術在司法領域應用的有限性和適配性考量不足,導致大數據與司法場域的結合性程度不高、融合性應用不強; 對技術的宰制性和司法人工智能的輔助性地位缺乏應有的自覺,對于司法大數據輔助審判的數據算法風險、功能異化風險和司法規律抵牾風險難以進行合理管控與有效規制。基于此,本文聚焦于分析司法大數據在審判中的應用限度,藉由對我國司法大數據輔助審判應用現狀的考察,揭示其應用帶來的潛在風險及問題,剖析問題產生的原因,進而提出司法大數據輔助審判的限度與規制策略,以期助益于大數據技術在司法審判中的深度融合應用。
大數據在司法審判中的應用持續迭代升級,學界對其認識和理解也不斷深化。關于司法大數據的概念,有三種典型的闡釋進路:有學者基于數據來源和面向對象,認為司法大數據是人民法院“在司法工作中形成的審判流程、執行信息、法律文書、庭審活動信息、司法政務、司法人事、外部協查等數據的總和及其關聯關系”;⑤有學者以大數據作為技術、工具和方法為視角,認為司法大數據是“利用大數據技術挖掘、分析和處理司法數據并解決有關司法實務問題的過程和方法”;⑥也有學者從大數據的基本特征出發,認為司法大數據是“由司法機關內外快速產生和流轉的案件、數據、視頻、音頻等多樣數據類型組成的,超越常規提取、儲存和分析能力且能夠分析和預測未來的海量數據”。⑦在本文看來,司法大數據既有資源面向,也有技術面向。司法大數據輔助審判,是通過大數據技術處理法院審判執行業務中形成的司法數據(包括各類結構化數據、半結構化數據和非結構化數據等),為司法審判提供必要的輔助支持。
目前,對司法大數據的應用,已形成“平臺化+智能化”模式。平臺化建設實現了對司法數據的資源整合,為司法大數據輔助審判提供支撐與前提。2013年,最高人民法院印發《人民法院信息化建設五年發展規劃(2013—2017)》,提出建設國家司法審判信息資源庫,籌建全國法院數據平臺。2013年底,人民法院數據集中和管理平臺初步建成。2016年,數據集中和管理平臺升級為大數據管理和服務平臺。2017年,國務院印發《新一代人工智能發展規劃》,明確要建設集審判、人員、數據應用、司法公開和動態監控于一體的智慧法庭數據平臺。2021年,最高人民法院發布《人民法院信息化建設五年發展規劃(2021—2025)》,要求基于大數據管理和服務平臺,構建司法數據中臺、智慧法院大腦和司法鏈綜合平臺。
我國現已基本建成覆蓋全國、覆蓋全部案件的司法大數據平臺。一方面,對內通過大數據管理和服務平臺匯聚來自全國法院的全量司法數據。截至2020年底,該平臺已匯聚全國2.24 億條案件信息和6.13 億份司法文件,成為全球最大的司法審判信息資源庫。⑧另一方面,對外基于可公開信息搭建中國審判流程信息公開網、中國庭審公開網、中國裁判文書網和中國執行信息公開網四大平臺。司法數據資源的匯聚整合,使多樣化的司法大數據分析與挖掘成為可能,推動了大數據技術在司法領域的深度應用,產生了輔助審判決策系統、輔助審判支持系統、輔助案件管理系統等司法大數據應用,實現了智慧審判、智慧管理、智慧執行等業務功能,形成服務審判執行、服務監督管理和服務司法公開的司法大數據應用格局。⑨
大數據是以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合,具有 “4V 特征”:即數據體量大(Volume)、數據類型多樣(Variety)、數據處理速度快(Velocity)和數據價值密度低(Value)。但“4V 特征”在司法大數據應用場域有其特殊性。從數據體量觀之,司法大數據與大數據其他應用領域的海量數據無法相提并論。從數據處理使用觀之,當前的司法大數據應用基本局限于結構化和半結構化司法數據,對于圖片、視頻和音頻等非結構化數據的分析使用相當有限。而且,由于數據化程度、應用技術水平和司法現實需求的差距,司法大數據的增速和處理速度與大數據的其他應用領域存在明顯差異。此外,司法大數據中典型個案的單體價值可能遠高于普通海量裁判文書的參考和適用整體價值。因此,司法大數據與大數據的基本特征存在一定程度的偏離。
不僅如此,司法大數據具有超出“4V”特征的其他特點。首先是客觀真實性(Veracity)。作為輔助審判應用的數據樣本,司法大數據是人民法院工作積累的司法數據集,需要完整保留司法活動記錄,妥善保管各個程序步驟的材料,以確保其客觀性與真實性。而冤假錯案、程序不規范等問題在司法實踐中現實存在,能夠反映客觀真實司法活動的數據,未必都是司法大數據輔助審判應用的可用數據,需要進行慎重的數據篩選和處理。其次是動態性(Vitality)。法律隨著經濟社會發展而不斷調整,新舊法律規范的更迭,導致大量“過期數據”產生。受司法政策等因素的影響,不同時期的裁判取向也存在一定的差異。如在不同的歷史階段、針對不同地域范圍和人群的犯罪特點,會形成特定的刑事政策和地方性的政策指引。司法大數據的案件樣本隨之更新變化,司法大數據輔助審判決策的分析結果也會因此不斷發生改變。在一定程度上,司法大數據對大數據基本特征的偏離,以及司法大數據超出“4V”特征的自身特點,決定了司法大數據輔助審判應用的相對有限性,也意味著通用大數據技術直接平移運用于司法領域的不適配性。
1.司法大數據輔助審判決策系統
司法大數據輔助審判決策主要實現司法裁判結果預測和類案推送(類案檢索)等功能。基于大數據、機器學習等技術,通過對大量已決案件的生效判決進行深度學習,可以實現司法裁判結果預測。其中的典型是上海刑事案件智能輔助辦案系統(以下簡稱上海“206 系統”)的“量刑參考”功能,該系統通過司法大數據分析、刑事文書標注和機器學習,建立量刑預測模型,為刑事案件量刑提供參考。⑩類案推送則通過司法大數據的分析、比對,篩選并推送以往相似度較高的已決案例,為法官對相似案件的裁判提供參考。最高人民法院2018年推出“類案智能推送系統”,該系統通過對司法文書中案情事實、法律適用等要素的提取構建案件畫像,進而輔助法官從海量已判決案件中發現類案。截至2020年,該系統對全部案由的識別準確率已達70%,民事和刑事案件排名前10 位案由的識別準確率已超過95%。?
2.司法大數據輔助審判支持系統
司法大數據輔助審判支持應用主要體現為司法文書自動生成、虛假訴訟識別等。通過對司法大數據資源的有機整合,可以自動生成司法審判所需的文書。河北省高級人民法院研發的具有文書自動生成功能的智審系統,能夠減輕法官30%以上的案頭事務性工作。?虛假訴訟識別系統通過云計算、大數據和智能算法等技術運用,能夠實現對于風險人員、風險案件的智能識別認定,輔助法官甄別虛假訴訟。江蘇省高級人民法院研發的“套路貸”虛假訴訟智能預警系統,從140.8 萬余案件中識別出疑似“套路貸”虛假訴訟案件1.9 萬余件,助推了對虛假訴訟的有效打擊和源頭治理。?
3.司法大數據輔助審判管理系統
司法大數據輔助審判管理主要作用于量刑偏離度預警、同案不同判預警、案件繁簡分流等。對于“同判度”較高的類案,基于司法大數據智能分析可以生成司法裁判結果預測,在裁判結果與之發生重大偏離之時可以自動預警。如北京法院的“睿法官”系統,在判決結果與預測結果發生重大偏離時,系統將自動預警,可實現監督的效果。通過司法大數據智能分案系統可以對各類案件進行精細化處理,針對不同類型案件的特點,綜合各項權重系數,自動測算案件所需辦案力量,并據此分配案件,提高“人”與“案”的分類科學性和適配程度。上海市第一中級人民法院建立的案件繁簡分流分類處置平臺,通過對案件的智能分類與分流,優化了審判資源配置。?
隨著大數據在司法領域融合應用的不斷深入,司法大數據輔助審判所面臨的風險和實踐問題逐漸顯現: 大數據技術賦能所帶來的數據算法風險對司法公正、司法權威構成潛在威脅;出現的功能異化風險僭越了輔助性地位,導致對司法固有屬性的削弱。由此對審判權的獨立行使、司法責任制度落實、司法倫理觀念、司法傳統文化等造成的挑戰與沖擊,給司法領域帶來的風險同樣不容小覷。此外,各類司法大數據輔助審判應用的實踐效果未達預期、應用口碑兩極分化也成為實踐中亟待解決的難題。
1.司法大數據輔助審判應用的數據風險
首先,數據瑕疵已然顯現。2020年,一份“假法規” 被多地人民法院在裁判文書中頻繁適用,?雖然2018年最高人民法院已通過民事裁定確認該“法規”并不存在,但截至2021年10月,以其為關鍵詞在中國裁判文書網中仍然能夠檢索到三百余篇裁判文書。?具有瑕疵的司法數據,以及違背事實和法律作出的錯誤裁判一旦成為數據分析源,基于司法大數據的裁判結果預測、類案推送等輔助審判應用,實際上可能形成掩飾、固化甚至放大錯誤的效果,影響司法公正的實現。
其次,數據缺失問題尚待解決。在部分案件中,對于司法裁判具有重要影響的信息并不完整,以刑事案件為例,通過實證研究建構的量刑結構方程模型顯示,從裁判文書中提取的人身危險性和社會危險性等量刑情節(因素)并不能百分之百地對量刑結論進行解釋。?部分對案件處理具有影響的案外信息(如特殊的被害加害關系等),部分對定罪量刑具有決定性作用的信息(如適用量刑情節的理由等),在裁判文書中沒有完整體現。雖然司法大數據具有客觀真實性,能夠完整記錄司法審判過程,但并非所有的司法數據都能服務于司法大數據輔助審判應用的研發,如記錄法官分析過程和實質考量要素的合議庭筆錄、案件審理報告、審判委員會的會議紀要等內部數據,目前就無法成為研發司法大數據輔助審判應用的底層數據。此外,數據壁壘、數據孤島的現實存在也造成一定的數據缺失。調研發現,大部分公安機關、檢察機關的文書并不能被掃描、標注并匯集到法院使用。司法數據的缺失,無疑會嚴重影響機器學習的質量。
2.司法大數據輔助審判應用的算法風險
大數據與司法的不斷融合,“算法黑箱”“算法歧視” 等已經成為司法大數據輔助審判應用所要面對的難題。“算法黑箱”的存在可能會加劇公眾對司法裁判的不信任,也會導致追責機制和監管制度難以落實。司法大數據輔助審判決策的目標是克服法官個人主觀性所帶來的裁判偏見和歧視,但算法決策本身也會產生“算法歧視”,而且這種歧視具有較強的隱蔽性,?當事人很難挑戰這種歧視并獲得有效救濟。2016年,美國“威斯康辛州訴盧姆斯案”所引發的爭議,意味著司法大數據輔助審判所招致的公眾質疑已經從單純的理性探討轉化為必須回應的現實。在該案中,被告認為初審法官參考基于大數據識別犯罪風險程度的評估工具COMPAS 對其量刑,侵犯了其未經正當程序不被剝奪自由的憲法權利,而COMPAS 的算法保密導致其無法質疑風險評估的科學性和公允性。雖然被告的異議被終審駁回,但該案體現出的因算法風險而引發的信任危機,成為將來司法大數據輔助審判應用發展不容忽視的問題。
1.司法固有功能的削弱
大數據技術在其他場景的應用優勢,反而可能成為顛覆司法固有屬性的潛在風險。一方面,當前部分司法大數據輔助審判應用不僅適用于司法裁判,還兼有司法管理、監督功能,無形中可能變成對辦案法官“綁手縛腳”的鎖鏈,導致其在裁判時過多地考慮案外因素,而不是或很難不受干涉地獨立行使司法裁判權,這催生了其與親歷性、封閉性等司法固有屬性的沖突。而且,司法大數據輔助審判應用的開發一般都外包給數據服務商或科技公司,技術人員可能通過算法設計和數據篡改不當地介入和影響司法,而這種潛在的對審判權獨立行使的干涉又難以被識別和發現。
另一方面,司法大數據輔助審判應用的泛化適用,實現了對司法全流程的技術、算法監控。如上海“206 系統”的功能涵蓋了刑事司法的審前、定罪和量刑程序,幾乎涉及了刑事司法裁判的所有流程。通過司法大數據等先進技術“構建靜默化、自動化、可視化的全流程監控系統,可以加固‘廉政邊界’,構筑‘數據鐵籠’,強化‘科技控權’”。?但在此過程中,“數據決策” 也將不斷影響、監控“法官決策”,審判權的獨立行使可能在技術賦權中被不斷消解。中國的司法文化始終蘊含著人文精神的光輝,司法裁判的情理法之平衡與社會道德倫理觀相契合,具有較強的說服力和社會認同感,可以促進司法“定分止爭”目的的實現。司法裁判中關于情理法的衡平因素,大數據量化分析難以有效挖掘,更遑論那些并未呈現于裁判文書中,但已然內化于法官心中并應用于司法裁判中的人文精神和價值判斷。此外,通過司法大數據的可計算性、可預測性模式以及現實功利的自覺與非自覺作用,習慣使用司法大數據輔助審判決策的法官,會被漸漸“培養”成為工具性、技能性極強的個體,這種技術理性力量對自我的侵入將直接導致法官個體喪失其行為本身應有的道德稟賦,也致使司法的固有功能被削弱。
2.輔助性地位的僭越
司法大數據輔助審判應用所具有的司法裁判結果預測、刑事量刑參考、同案不同判預警、量刑偏離度預警等功能,在司法實踐中,極易發生功能異化,這種功能異化的直接后果是司法大數據輔助審判應用由輔助性地位,向指導性乃至監督性地位的轉化。司法大數據輔助審判應用的功能異化肇因于其“輔助性” 定位和實際所具有的指導性、監督性等宰制功能發生“混同”。當多重功能歸于一個身份之上時,縱然定位清晰,其不同功能也會在事實上相互影響,或在“此消彼長”的拉扯中各行其是,或導致作用的相互消解,某一或某幾個較為強勢的功能吞噬其他功能。如果任由不同的功能屬性相互“競爭”,直接的后果是輔助性地位的反轉,指導性、監督性乃至主導性地位的確立。即使沒有造成輔助性地位的顛覆,在這種無制約、無秩序的“競爭”中,司法大數據輔助審判應用的輔助性地位也會變異,影響其功能發揮。
1.司法責任落實受到阻礙
司法大數據輔助審判可能會動搖法官審判權的獨立行使,為司法責任的落實設置障礙。首先,“審理者裁判”的核心意旨可能被虛置。如多數刑事案件智能輔助辦案系統的使用者,不限于法官,而擴展至法院內部、外部與刑事訴訟活動相關的多種主體,極有可能導致辦案法官的司法裁判受制于法院內外部的多重力量,與司法責任制所追求的由“審理者裁判”相背離。其次,“裁判者負責”的責任認定機制將會被懸空。司法大數據輔助審判應用的研發,算法工程師、數據分析師等技術人員必然參與其中,對應用功能的實現發揮關鍵作用。雖然在國家層面,技術研發風險已得到一定的重視,?但是司法大數據輔助審判應用的設計程序復雜、參與主體較多、算法不公開透明,即使程序設計出現問題,往往難以被使用者所發現。而且,很多科技公司對司法大數據輔助審判應用的研發幾乎不存在相關的制約規范與問責機制。一旦這些由多主體研發、多主體使用的司法大數據輔助審判應用被法官習慣性適用并形成過度依賴,將形成“審理者僅主導裁判,裁判者無法負全責”的尷尬局面,對其中可能存在的司法錯誤如何追責,將成為一個新的實踐問題。
2.司法倫理觀念受到沖擊
司法大數據輔助審判應用基于強大的數據分析和自我學習能力,在裁判結果預測、量刑預測、類案檢索等方面具有不可小覷的優勢。在這種強大的優勢面前,人類會不知不覺喪失主導地位:是更相信自己的經驗判斷,還是海量數據的分析結果? 隱藏在問題背后的陰霾可能給我們帶來更多的恐慌與不安: 司法大數據輔助審判應用在預測裁判結果時,難免影響案件中的倫理道德抉擇。面臨艱難的人性抉擇和拷問時,人常常會選擇逃避或尋求幫助,這時大數據智能分析結果便成了理想的避風港。隨著大數據和人工智能技術對司法裁判參與程度的不斷加深,年輕法官關于價值判斷的經驗積累將不斷削弱,而這種機器生成的“倫理道德判斷”會逐漸侵蝕甚至代替人的價值抉擇。或許這在現在還是“危言聳聽”的奇思,但“信儀器還是信醫生經驗”的難題,在人工智能應用席卷已久的醫學領域早已有所顯現,對于司法大數據輔助審判應用給司法裁判帶來的倫理道德價值抉擇危機之顧慮絕非杞人憂天。
對于司法大數據輔助審判的技術風險和應用風險之反思與規制尚屬“防患于未然”,對當前已暴露的應用實踐問題,則屬于司法大數據輔助審判應用必須面對和需要首先解決的現實難題。
1.對司法效率的提升未達預期
首先,在“案多人少”的壓力下,作為司法大數據生產者的一線辦案法官,缺乏錄入數據的激勵。當前,大多數司法大數據應用平臺基礎性建設并不完善,完成數據錄入需要耗費大量時間。如北京互聯網法院目前實現了無紙化辦案,為電子卷宗的智能深度應用打下良好基礎,但電子訴訟系統尚不能完全實現對電子化材料的自動分類、自動編目,當事人上傳的材料往往混亂無序,且有近20%自行上傳的材料不符合法院電子化材料的標準,需要逐一辨別與調整,加重了辦案法官的工作負擔。其次,錄入數據的規范性也難以得到充分保障,而且“數據孤島”“數據壁壘”的存在,導致法院對公安機關、檢察機關掌握的案件材料無法盡然使用,在一定程度上降低了數據質量,使司法大數據的應用實踐效果受到影響。此外,當前的司法大數據輔助審判應用的系統精準度有待提高。如大多數法院使用的類案檢索系統,一線法官認為檢索類目不夠細化,檢索結果的針對性和適配性不夠,無法實現高效的檢索和推送,反而加重了法官甄別檢索結果的業務負擔。
2.對應用實效的評價兩極分化
法官對司法大數據輔助審判應用的評價呈現明顯的兩極分化。一方面,部分基層年輕法官面對辦案壓力,對司法大數據輔助審判的需求和期待較高,對于各類輔助審判支持系統的應用比較積極。然而有法官也坦言,現有系統的設計功能較難實現,法官對司法大數據輔助審判應用的信任度不高,如有的智能系統能夠實現信息的自動提取和標注,但法官往往選擇自行標注。司法大數據輔助審判的應用實效與法官真實的業務需求之間存在一定差距,各種輔助系統在實踐中使用效果遠未達到預期。另一方面,部分法官對司法大數據輔助審判應用甚至給予了較為負面的評價。對某省刑事案件智能輔助辦案系統使用情況的調研表明,該系統基本沒有在刑事審判中得到應用,甚至有受訪法官對此持完全的否定態度,認為該系統僅僅處于起步階段,根本無法達到預期效果。?
目前,不論理論界還是實務界,主流觀點均主張和強調司法大數據應用對于審判的“輔助性”地位。但輔助性地位的厘定,大多立基于技術工具論及技術中立觀,這種解讀忽略了現代技術對自身邊界的超越與異化。樸素的工具論或許在技術并不發達的工業社會具有其歷史合理性,但已無法實現對現代技術的復雜性、豐富性的經驗描述,更無法厘清技術與社會的互動關系。一味的技術慕強心態和對“技術烏托邦”的沉迷,逐漸被關于現代技術的理性反思所牽縛。在現代社會,技術早已成為人類文化、文明和社會不可分割的一部分,無法將技術與其應用截然分開。技術的本質體現的是人性和物性的自洽,是社會屬性和自然屬性、恒定性與變動性的辯證統一。?事實上,技術并非中立意義的存在,而具有二重性。技術權力本質上具有利他性、整合性、競爭性、(隱性)操縱性等綜合特征。大數據技術權力利他性和整合性在司法場域中體現為司法大數據可以賦能于法官,從而提升司法效率、降低司法成本。但同樣不能忽視的是,技術權力具有競爭性與操縱性等屬性,大數據技術在司法審判中的應用也可能形成技術宰制性,以至于消解司法的固有屬性,限制法官審判權的獨立行使,顛覆司法大數據在審判中應用的輔助性地位。
歷史發展和人類解放從根本上源于技術的發展,但同時,技術是異己的力量,不能為了技術發展而忽視技術對人的支配。?在“人機合作”模式下,機器雖然未能達到與人具有同等法律地位的程度,但其作用已遠遠超過了傳統“工具論”的工具范疇。相較于以往的傳統技術,大數據與人工智能技術的獨特性在于其自主性,這種自主性或來自技術本身,或來自應用過程中社會賦予它的角色,此種屬性也是技術宰制性形成的內在機理。因此,應該在充分認識技術的自主性之前提下,明確司法大數據輔助審判應用作為“工具”的技術和參與“決策”的技術之間的區分。此處所說的參與“決策”,并不限于讓司法大數據輔助審判應用能直接進行決策,也包括其應用對人們的觀念、行為與相應的社會關系形成影響。司法大數據輔助審判應用對法官司法決策的多方“參與”,就成為功能異化風險的肇因。
當將問題重新聚焦司法大數據輔助審判應用,大數據技術賦能對于司法審判的影響,不僅在于為法官提供便利工作、提高效率的簡單工具。隨著各類司法大數據輔助審判應用的出現,其在司法審判活動中已不再純粹作為一種中立性的存在,而可能加劇控辯審力量的失衡。甚至也無法保證司法大數據技術不會被別有用心的技術賦能者不當操縱。司法大數據輔助審判,打破了司法審判活動各方參與主體之間原有的衡平關系,其帶來的是技術賦能對于社會資源、司法資源的再分配,將誘發司法活動參與者呈現出“強者更強、弱者更弱”的馬太效應。
一方面,隨著大數據技術與司法融合程度的不斷加深,由于各主體對技術的占有和使用基礎不同、認知能力各異,賦權效能將會出現較為明顯的分層,形成對主體的技術參差賦權。另一方面,作為司法大數據輔助審判應用的主導開發者,司法機關掌握著數據喂養、算法設計的決定權,將有助于提升其辦案質效的規則體系嵌入其中,占據技術賦能的“金字塔”頂端。訴訟參與人則更像是司法大數據技術的被適用者,只能被迫接受嵌入司法機關意志與規則設計的應用系統,處于較為弱勢的賦權地位,不可避免地淪為技術賦權場域的弱勢群體。司法大數據的技術參差賦權在司法實踐中已不鮮見: 在法官已經能夠使用各種司法大數據審判輔助應用時,老年人等技術弱勢群體還不知如何使用智能手機登陸“移動微法院”;在年輕法官充分享受著技術紅利帶來的司法效率提升時,年長法官還在耗費更多的時間為了績效考核不得不適應司法大數據輔助審判應用。應該警惕的是,司法大數據技術的應用僅讓少數司法活動參與者受益,而帶來對部分訴訟參與人訴權保障的犧牲。因此,應該堅持人性化的走向,從司法大數據應用于司法審判的實踐出發,在充分考慮人、社會和技術之間的互動與牽制關系上,摒棄對于司法大數據輔助審判應用的技術中立觀和工具論,重新審視司法大數據技術的本質及其異化的風險,并以此作為考察、建構和審慎限定司法大數據輔助審判應用輔助性地位的重要理論基點。
現階段的司法大數據輔助審判應用未理性正視大數據與人工智能技術發展與應用的階段性、復雜性特征,未充分考量司法數據質量對大數據技術應用的制約,未充分重視大數據分析對司法論證說理的不可達,未有效化解司法大數據輔助審判對法官自由裁量的削弱,未充分反思技術在司法場域的應用限度。
首先,司法大數據輔助審判應用建立在大數據和深度學習之上,司法數據的質量至關重要。從我國司法大數據的“量”來看,雖然大數據管理和服務平臺匯聚了全國法院的司法數據,解決了數據“有無”的問題,但并未達到數據的海量性。大多數司法大數據輔助審判應用的研發,以中國裁判文書網等可公開的非全量數據為基礎,大量不公開的司法裁判文書無由成為大數據分析樣本。從司法大數據的“質”來看,我國的司法裁判文書公開制度尚不成熟,大量格式不規范、內容不完整,甚至有錯誤的公開裁判文書沒有及時清理,司法數據的完整性、規范性、正確性無法得到保障,導致司法大數據的可靠性有所貶損。數據瑕疵雖可以通過規范裁判文書內容、提高裁判文書質量得以緩解,但在短期內難以得到有效改觀。此外,數據標注是司法知識圖譜構建的重要基礎,主觀選擇的數據標注決定了部分司法大數據輔助審判應用功能的實現程度。如上海“206 系統”的研發采取了人工標注和自動標注兩種形式,人工數據標注的質量受限于標注者專業知識水平,自動標注也需要人工進行審查校正,數據標注質量難以保障。而相應地,基于此開發的司法大數據輔助審判應用就無法實現準確的裁判預測等功能。
其次,司法大數據輔助審判應用的計算不能等同司法論證說理。大數據輔助審判決策的基本方式,是通過將開放的司法數據進行自然語言處理后,輸入機器學習的算法之中,得出一種或多種預測案件結果的模型。在通常情況下,此種算法并未實現對法律推理的復現,而是通過數據計算尋找判決中各個參數之間的相關性。?相關關系表征的是兩個或若干因素之間的關聯密切程度,不能揭示司法過程的推理和運作邏輯,即便把握了相關關系,也不能以此直接溯尋導致結果發生的原因。依據當前的大數據技術分析處理案件中的因果關系,得到的僅是量化關系的強度和正負性質,喪失了原有的必然性和方向性,?即量化后的裁判因果關系將蛻變為變量之間的相關關系,原有的裁判因果關系中某些重要的性質被改變,這將導致司法論證中結果性事實與原因性事實的聯結、原因性事實與特定法律后果的聯結被遮蔽。?司法大數據雖然能在事實認定上發揮積極作用,但對司法大數據輔助審判決策的應用不慎,將可能導致以數據計算的相關關系“顛覆”司法推理的因果關系,對公正裁判產生負面影響。
最后,大數據技術無法實現司法實質理性。司法的實質理性依憑司法的能動性,強調法官在司法裁判中價值選擇、經驗總結等主觀作用的發揮。在認知智能領域,大數據與人工智能技術的應用尚難望人類項背。人類有語言,有概念,才有推理,概念、意識、觀念等都是人類認知智能的表現。機器在重復性、規律性工作中已經表現出更好的效率,但還很難從事摻雜情感、道德、價值判斷等的事務,而這正是在解決疑難案件過程中法官需要做的主要工作。經驗產生于不同時間、不同地域、不同社會背景下,機器意義上的同案很可能并不是裁判意義上的同案。一個好的裁判,尤其是高級別法院的裁判,需要充分考慮裁判可能對社會秩序、社會價值取向產生的影響,而不是機械地照搬已有的他人經驗。基于“同案同判”作出的量刑規范化的努力,也存在以“機械正義”取代“個案正義”之嫌。從量刑制度改革來看,圍繞“電腦量刑”的爭議已存在多年,?司法大數據輔助審判應用在刑事司法裁判中對于量刑的輔助,致使相關問題的齟齬加劇。大數據與人工智能技術雖能使司法輔助審判應用更加精確化、標準化,但在客觀上卻將不斷擠壓法官的自由裁量權,不利于真正實現個案裁判的實質公正。
大多數司法大數據輔助審判應用的研發,局限于對通用大數據技術在司法領域的平移使用。目前在司法大數據輔助審判應用的系統開發具有優勢地位的科技公司間,存在相關技術標準不統一、系統不兼容等問題,技術壁壘導致在數據利用、深度學習等方面難以實現關鍵性、實質性的技術突破,也未真正實現大數據技術與司法領域的深度融合,使司法大數據輔助審判應用不能真正回應司法的現實需求。
首先,未充分考慮裁判邏輯、司法推理的特殊性。以類案推送為例,目前常用的關系抽取方法有關鍵字匹配法、向量空間法、知識圖譜法和深度學習法等,無論是采用通用的文本相似度模型“詞頻—逆文本詞頻模型”(TF-IDF),通過詞頻來計算案件相似度,還是利用“基于Transformer 的雙向編碼器表示模型”(BERT),通過不同文本之間的向量計算相似度,類案推送系統都采用自然語義識別技術自動抽取情節,再通過情節匹配程度來推送類似案件。?這種算法模型的建構與應用在其他領域或許可行,但在司法領域卻面臨極大的適應性難題。所謂類案,需在基本事實、爭議焦點、法律適用問題等方面具有相似性,?詞頻、文本等情節的匹配或許能夠找到事實情節相似的案件,但并不必然意味著案件法律關系、爭議焦點相似。如法官在辦理“非法拘禁”案件時,傳統的類案推送系統會識別“非法拘禁”標簽,進而推送數據庫內援引刑法第二百三十八條的裁判文書。但是不是“非法拘禁致人重傷、死亡” “使用暴力致人傷殘、死亡而構成故意傷害罪、故意殺人罪”以及“非法拘禁罪與故意傷害罪或者故意殺人罪數罪并罰”則在所不問,導致大量的裁判文書被打包推送,需要法官自行甄別其中有參考價值的判決。通過此種方式完成的類案檢索,不能有效捕捉句子在法律論證中發揮的功能,從簡單的法律用語信息檢索轉換為真正的法律論證檢索,司法大數據輔助審判的技術發展路長且阻。
其次,未充分考量司法場域的適用性。司法的固有屬性、現實需求使其對技術的專業性、精確度有著極高的要求。司法的公正性、權威性,也決定了社會與公眾對司法錯誤的容忍度相當有限。引發公眾強烈質疑的案件,可能會造成司法權威的斷崖式下跌。對于通用大數據技術而言,數據質量的判斷通常為形式性的,但在司法場域應用大數據,則應通過專業人士對裁判文書進行實質性審查,以充分保障樣本數據的正確性,進而提高司法大數據輔助審判應用的準確性與適用性。如短視頻平臺基于用戶畫像生成個性化推薦,只需要根據用戶的搜索、瀏覽記錄等個人信息提取興趣偏好并形成用戶畫像,從而進行特定視頻內容的推薦服務。在此過程中,僅需要進行形式性判斷,不需要考慮樣本數據中興趣愛好本身的“對”與“錯”、“好”與“壞”。作為司法大數據輔助審判決策的司法裁判結果預測、類案推送等應用,在算法訓練時應該對于法院判決的對錯進行判斷,對錯誤數據、過期數據等不匹配數據進行篩選、剔除,如果機器學習的歷史裁判文書中存在錯誤判決,將可能會輔助法官作出錯誤的判決。此外,對于某些通用大數據技術的應用,也應秉持相對謹慎的態度。如出于對法官隱私保護、審判權獨立行使等方面的考量,對基于法官“畫像”的司法裁判結果預測也需要進行嚴格約束與限制。
以對司法大數據輔助審判技術中立觀和技術工具論的批判性反思為前提,以對司法大數據輔助審判應用在技術、功能和本體層面的局限性之剖析為基礎,可以為司法大數據輔助審判應用限度的明確錨定重要面向與有力抓手。具言之,以堅守司法大數據輔助審判應用的輔助性地位為主軸,防止其向技術宰制性地位蛻變。在技術規制層面,重視技術的賦權與限權之衡; 在應用場景層面,明晰核心禁區與業務痛點;在應用主體層面,強化程序規制與合理限度管控,進而強化對司法大數據輔助審判的安全管理與風險防控,合理規避與化解司法大數據輔助審判應用的風險及實踐問題,實現對司法大數據輔助審判應用的有效限定與規制。
從賦權之促到限權之縛,明確司法大數據輔助審判應用的實踐指向。超越簡單的技術工具論和純粹的技術中立觀,擺脫形而上學的技術觀之束縛,化解司法大數據在審判應用中所面臨的風險及問題,通過合理的引導,使司法大數據成為提升司法質效的重要手段。“技術賦權”思想揭明了社會公眾通過新的技術手段實現自我增權的現實途徑,以“技術賦權”實現司法的人權保障與司法大數據輔助審判的互動與融合,可以為充分激活大數據技術的正面價值提供理性指導。但從根本意義上講,“技術賦權”與技術中立觀一脈相承,難以真正解決司法大數據輔助審判應用的技術研發和適用難題。因而,在強調技術“賦權”的同時,必須基于大數據技術的負荷所帶來的隱憂,重視對技術的“限權”。與“賦權”所發揮的效用來自于技術本身一樣,“限權” 強調通過對大數據技術本身的限制,實現對于司法大數據在審判中的應用規制。
通過充分考量技術的正向效應與負面價值,實現技術“賦權”與“限權”之間的衡平,重塑司法大數據輔助審判技術觀。建構司法大數據輔助審判應用的治理原則和規制框架,達成對于司法大數據應用的風險防控、安全管控和合理適用。從實現路徑來看,可以從兩個層面“雙管齊下”:
首先,加強內部重構。對于司法大數據技術風險的防控,首先應深入算法的“頂層設計”,比照“阿西莫夫機器人三大定律”,以遵循倫理和安全原則為基礎,為規范司法大數據輔助審判應用的研發筑牢基本準則和底線,使司法大數據輔助審判應用做出的決策參考不會違背和挑戰基本的司法倫理。其次,加強外部監管。實行設計問責和應用監督并重的雙層監管結構,實現對人工智能算法設計、產品開發和成果應用等的全流程監管。?從事前的規制到事后的問責,監管應該貫穿司法大數據輔助審判應用的研發和適用全流程。在遵循司法規律的前提下,強化對“算法歧視”“算法偏見”的法律規制,有序穩妥地推進數據及算法的優化,防范和規制司法大數據輔助審判的技術賦能風險。具體而言,通過建構并完善司法大數據應用研發規范,確立司法大數據輔助審判應用研發的審核機制與問責機制,區別司法大數據應用的研發者和使用者責任;針對技術的魯棒性、數據算法風險等確立風險預防機制,強化對司法大數據應用的技術風險管理,以確保司法大數據輔助審判的可靠性; 加強司法大數據輔助審判應用的可追溯性、可解釋性和算法的公開,推進司法大數據應用技術透明度的提高,以增強司法大數據輔助審判的可信賴性; 提升司法審判活動中相關主體在司法大數據應用設計中的參與度與監督作用,促進司法大數據輔助審判應用的技術“平等賦權”,實現對技術弱勢群體的權益保障。
司法大數據輔助審判所帶來的技術風險、司法制度抵牾風險,很大程度上來自于對司法大數據應用在審判全流程不加區別、不加限定的適用。因此,應結合技術發展的階段性特征,考量司法活動特點、司法現實需求和大數據在司法審判中應用的潛在風險等,并對其進行適配性調整,實現對于司法大數據輔助審判應用場景的有效限定。
首先,明確業務痛點,限定適用場景。現階段的司法大數據輔助審判應用,其主要功能是輔助進行信息的高效處理。因此,應將大數據信息處理的優勢和司法需求充分結合,明確司法大數據輔助審判的應用場景。其一,為緩解法院“案多人少”的壓力,司法審判中重復性、機械化、可替代性的工作可以委諸司法大數據輔助審判應用。如文書自動生成等司法大數據輔助審判支持應用,能有效減輕法官的事務性工作負擔。其二,利用司法大數據輔助審判應用對司法形式理性實現的重要作用,發揮其在規范辦案程序、單一證據校驗等方面的核心優勢,減少司法任意性。其三,通過司法大數據輔助審判算法決策,能夠以程序性、公式化計算來優化訴訟程序與處理簡單案件。如利用司法大數據輔助完成對簡易案件的速裁,使法官從簡單案件中脫身,處理專業化需求更高的重大疑難案件。其四,利用司法大數據輔助審判應用促進對司法資源的合理分配,如通過案件繁簡分流等司法大數據輔助審判管理應用,促進辦案質量和審判效率的提高。
其次,確定核心禁區,建立負面清單。基于司法大數據輔助審判存在的技術風險、技術應用限度,明確其適用的范圍與邊界。通過對核心禁區的明確,建立司法大數據輔助審判負面清單,限縮司法大數據輔助審判應用的適用領域。其一,從技術層面,要充分發揮技術對司法的賦能作用,但對于不符合司法規律、未能與司法固有屬性充分融合的司法大數據輔助審判應用,應明確限定其使用的核心禁區。如鑒于司法大數據輔助審判在認知智能方面的發展限制和天然缺陷,需要進行價值判斷的疑難復雜案件,不應該使用司法大數據輔助審判決策功能。其二,從應用層面,凡可能存在無法避免的重大技術風險,或可能導致無法控制的司法規律抵牾風險,乃至沖擊司法基本價值與功能的司法大數據輔助審判應用都應列入負面清單,禁止其在實踐中的適用。當然,因應技術的未來發展、法律的變動,核心禁區和負面清單需要動態調整。
司法大數據輔助審判應用輔助性地位的限定,主要是對于技術工具屬性的重申和司法者主體地位的再強調。對司法大數據審判輔助應用的適用,應以保障法官的自主性和能動性為前提,通過程序規制與技術設計,將其適用嚴格控制在一定限度內。
首先,嚴格限定使用權限。嚴格限制司法大數據輔助審判應用適用主體的權限,具有裁判結果預測、量刑參考等輔助審判決策功能的司法大數據應用,其輔助決策對象只能是辦案法官,而不能是司法管理者、監督者。當然,司法管理者、監督者可以在其職權行使范圍內使用司法大數據輔助審判應用的部分功能,但其享有的使用權限不應該與辦案法官完全相同,司法管理者、監督者獲取的相關個案信息應經過一定的處理,如量刑偏離度預警只能展現一定的偏離程度(分為輕微、中度、嚴重)等,上述數據也不能直接作為法官績效考核和司法監督權行使的依據。公檢法不同機關主體,應該有區分地適用司法大數據輔助審判應用的輔助功能,不能因片面強化公檢法互動,背離以審判為中心的訴訟制度改革的內在邏輯。既要保證司法大數據在審判工作中有效發揮作用,又要充分保障辦案法官的判斷權和裁量權。
其次,充分限定使用限度。司法大數據輔助審判的功能異化主要體現為其“輔助性”定位和實際上所具有的指導性、監督性等宰制性功能發生的“混同”。司法大數據應用的輔助性,應該以辦案法官和司法大數據輔助審判應用的職能分立為基礎,強調辦案法官的優先地位。必須自覺地將司法大數據在審判中的適用嚴格定位為“輔助性”,從制度上保證其監督性和指導性作用的發揮不能突破輔助性功能的限度。如在具體的功能設計上,可以將司法大數據輔助審判應用中影響司法決策的司法裁判結果預測、量刑參考等功能嚴格限定為辦案法官“自查”的手段,由辦案法官自主決定是否適用,法院內部和外部任何主體不得強制辦案法官適用,變外部監督為辦案法官的自我監督。只有這樣才能夠真正使司法大數據在審判中的應用始終處于輔助性地位,在充分發揮其應有功能和作用的同時,避免僭越輔助性地位而形成技術宰制性。
最后,明確限定使用程序。為了既不突破司法大數據輔助審判應用的輔助性定位,又有限發揮其指導性和監督性作用,實現辦案法官的自我監督,需要限定司法大數據輔助審判應用的適用程序。如在具體的流程設計上,可以對司法大數據輔助審判應用不同功能適用的時間段作出嚴格限定,同案不同判預警、量刑偏離度預警等兼具司法管理、監督的功能,在辦案法官完成裁判文書的初步寫作、得出一定的裁判結果之后,才能作為一種“校驗”來使用。是否使用此“校驗”功能,也應賦予辦案法官最大程度的自由決定權。
在“發展優位”的推進思路下,我國司法大數據輔助審判應用在未充分考量司法大數據的基本特征、技術發展與技術本質的前提下展開,對技術的應用限度認知不足,對于技術的宰制性體悟不深,對輔助性地位的堅守不徹底,導致其在技術賦能層面存在數據算法風險,應用場景之中蘊含功能異化風險,應用效應層面產生司法規律抵牾風險,以及應用效能未達預期等實踐問題。面對大數據在司法領域融合應用中的風險與問題,需要立足司法大數據技術的輔助性,通過技術的賦權與限權之衡實現技術應用規制,通過核心禁區和業務痛點的明確達至應用場景限定,通過應用程序和合理限度的厘定強化應用主體管控,進而完成當前階段對司法大數據輔助審判應用限度的確定。最高人民法院可出臺相應的司法大數據輔助審判應用規范,為大數據在司法審判中的深入融合應用提供有效指引,以完善對司法大數據輔助審判應用的規制,將“發展優位”順勢轉變為高質量發展優勢。
注釋:
①European Commission for the Efficiency of Justice(CEPEJ), European ethical charter on the use of Artificial Intelligence in judicial systems and their environment, https://book.coe.int/en/computers-and-law/7842-european-ethicalcharter-on-the-use-of-artificial-intelligence-in-judicialsystems-and-their-environment.html.
②王祿生:《司法大數據應用的法理沖突與價值平衡——從法國司法大數據禁令展開》,《比較法研究》2020年第2 期。
③在美國,如刑事案件智能輔助系統的適用僅局限于警情預測、人臉識別、取保候審和量刑風險評估等特定領域,美國法院和州立法機構分別通過判例和法案的形式對其應用進行規制。See Artificial Intelligence:Emerging Opportunities, Challenges, and Implications for Policy and Research, https://www.gao.gov/products/gao-18-644t.
④左衛民:《熱與冷: 中國法律人工智能的再思考》,《環球法律評論》2019年第2 期。
⑤?孫曉勇:《司法大數據在中國法院的應用與前景展望》,《中國法學》2021年第4 期。
⑥⑨大數據在司法審判中的融合應用研究課題組:《限度與深化:大數據在司法審判中的融合應用研究》,《中國應用法學》2021年第2 期。
⑦張嘉軍:《司法大數據的價值功能、應用現狀及其應對》,《鄭州大學學報(哲學社會科學版)》2018年第1 期。
⑧?陳盨、田禾主編:《中國法院信息化發展報告No.5(2021)》,社會科學文獻出版社2021年版,第15 頁。
⑩崔亞東:《人工智能與司法現代化》,上海人民出版社2019年版,第114~115 頁。
?喬文心:《智慧路上 “從頭越”——人民法院加強信息化建設綜述》,《人民法院報》2018年4月27日,第2 版。
?上海法院:《構建要素模型 優化資源配置——上海一中院啟用案件繁簡分流分類處置平臺》,http://shfy.chinacourt.gov.cn/article/detail/2018/10/id/3533021.shtml(2021年10月20日訪問)。
?澎湃新聞:《一“處理意見”被多地法院引用判案,最高法明確“沒出臺過”》,https://baijiahao.baidu.com/s?id=167 3711834549068530&wfr=spider&for=pc(2021年10月12日訪問)。
?該“假法規”為“最高人民法院關于審理民事糾紛案件中涉及刑事犯罪若干程序問題的處理意見”,雖然最高人民法院早已通過民事裁定明確“本院沒有出臺過該處理意見”。但以其為關鍵詞在中國裁判文書網進行檢索,仍能得到318 篇裁判文書,檢索時間:2021年10月12日。
?李安:《量刑實證研究的方法論檢視:從實證觀念到實證技術》,《中外法學》2009年第6 期。
?羅洪洋、李相龍:《智能司法中的倫理問題及其應對》,《政法論叢》2021年第1 期。
?閔凌欣:《智慧法院: 釋放不一樣的司法紅利》,《福建日報》2018年4月21日。
?《新一代人工智能發展規劃》強調,要制定人工智能產品研發設計人員的道德規范和行為守則,實現對于人工智能算法設計、產品設計和成果應用等的全流程監管。
?李訓虎:《刑事司法人工智能的包容性規制》,《中國社會科學》2021年第2 期。
?劉同舫:《技術的當代哲學視野》,人民出版社2017年版,第8 頁。
?管錦繡:《馬克思技術哲學研究》,湖北人民出版社2015年版,第92 頁。
?郭銳:《人工智能的倫理和治理》,法律出版社2020年版,第156 頁。
?王天思:《大數據中的因果關系及其哲學內涵》,《中國社會科學》2016年第5 期。
?馮潔:《大數據時代的裁判思維》,《現代法學》2021年第3 期。
?關于“電腦量刑”的爭議,有學者認為“電腦量刑”將量刑簡化為“刑的量化”,并未對影響刑罰的所有因素進行綜合考量與平衡; 也有學者提出刑事訴訟 “事關人命、自由、國家目標以及社會正義”,因而“更需要保留基于人格修養的心證以及感化的余地,也更難于進行數碼機械化的技術處理”。參見虞平:《量刑與刑的量化——兼論“電腦量刑”》,《法學家》2007年第2 期; 季衛東:《電腦量刑辯證觀》,《政法論壇(中國政法大學學報)》2007年第1 期。
?劉艷紅: 《大數據時代審判體系和審判能力現代化的理論基礎與實踐展開》,《安徽大學學報 (哲學社會科學版)》2019年第3 期。
?《最高人民法院關于統一法律適用加強類案檢索的指導意見(試行)》第一條規定:本意見所稱類案,是指與待決案件在基本事實、爭議焦點、法律適用問題等方面具有相似性,且已經人民法院裁判生效的案件。
?《新一代人工智能發展規劃》,http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm(2021年12月10日訪問)。