章 瑾
(安徽大學 法學院,安徽 合肥 230601)
1980年,美國著名思想家阿爾文·托夫勒在著作《第三次浪潮》中寫道“大數據是未來信息社會的重要表現形式”[1]。借助于信息化時代的東風,數字資源日益成為社會治理的重要途徑,對此習近平總書記提出要“推動大數據、人工智能等科技創新成果同司法工作深度融合”。2021年12月中央政法委印發《關于充分運用智能化手段推進政法系統頑瘴痼疾常治長效的指導意見》提出探索建立檢察大數據法律監督平臺,暢通檢察數據歸集調用,貫徹數字化監督。
回顧改革進程,從“電子檢務”到“智慧檢務”的更新換代,數字化技術貫穿改革全過程。大數據法律監督依托于前兩階段的實踐成果,政策引導與技術支持相對較為完備,為大數據發揮作用提供了現實基礎。但隨著司法改革的進一步推進,單一的數據渠道已難以滿足現代化的監督需求,打通執法司法數據聯通渠道,深挖數據內蘊價值成為轉變現代化數字監督的新型范式。
大數據法律監督是“大數據”+“法律監督”,是手段與目的的結合。其通過個案處理,歸納案件特征,利用設計好的數據模型進行同類案件數據的碰撞、篩選、對比、歸類從中發現隱蔽的違法犯罪線索,行使個案追蹤的同時促成類案監督,最終達到社會治理效果[2]。大數據作為數字化工具,是多重技術的集合體。數字技術包括數據采集、數據處理、數據挖掘等幾個層面。
1.數據采集
數據采集方式包括軟件接口對接、開放數據庫、底層數據交換。檢察機關數據采集來源是法院裁判文書、執行卷宗、執法司法部門查詢信息等,通過集成數據分析可實時了解案件走向、案件性質、類案特點。
2.數據處理
法律監督平臺數據處理方式主要是數據碰撞和對比。數據碰撞指在兩個及兩個以上數據庫中,輸入相關數據,運用專門數據軟件進行碰撞,通過整合數據、對比數據展開專業分析[3]。2020年,浙江省紹興市柯橋區人民檢察院通過個案的異常線索與類案數據進行碰撞對比,挖掘出多起虛假訴訟案件,數據碰撞的應用為民事監督工作提供了技術支撐[4]。
3.數據挖掘和文本挖掘
數據挖掘與文本挖掘是處理大數據的兩大支柱技術,不同形態數據要求不同的數據挖掘和分析方法。數據挖掘用于處理結構性數據,文本挖掘用于處理非結構性數據。法院判決文書、紙質卷宗等作為典型的非結構化數據,檢察機關可利用自動化文本挖掘技術處理從而獲得監督對象的預測與趨勢[5]。
1.我國大數據法律監督實施現狀
(1)探索創新大數據法律監督平臺
大數據時代的到來,為推進法律監督方式轉變提供了機遇。如何抓住時代機遇,助力法律監督華麗轉型是各級檢察機關智慧建設的重要內容。自最高檢提出“大數據賦能檢察監督”以來,各級檢察機關積極創新,不斷為創新監督平臺添磚加瓦。2022年6月,全國檢察機關舉辦“大數據法律監督模型競賽”,各地檢察工作人員集思廣益報送近600個法律監督模型參評,賽品分為應用類、原型類、創意類三種類別,力爭為大數據法律監督提供多樣形式和運行載體[6];同年,安徽省人民檢察院以解決實踐突出難題為目標啟動大數據法律監督模型競賽,各級檢察院提供創意55件,作品44件[7];鄭州市人民檢察院組織全市檢察機關大數據法律監督模型競賽,提供作品29件[8];自上而下的集體參與體現了我國檢察機關積極探索大數據技術,適應數字化時代的大數據思維,致力為社會治理提供源源不斷的檢察之智。
(2)建設地方性檢察機關大數據監督平臺
2022年,張軍同志在全國檢察長(擴大)會議上再次提出以“檢察大數據戰略”賦能檢察工作高質量發展,做好檢察信息化轉型升級。為積極響應實踐倡導,我國檢察機關集思廣益,各省各市紛紛推出符合自身特色,彰顯新時代檢察職能的法律科技,具體如表1所示。

表1 部分省市大數據法律監督應用系統
表1列舉了浙江、江蘇、廣東、貴州等六個省市的大數據法律監督系統。以浙江省為例,浙江省紹興市人民檢察院推出“民事裁判智慧監督系統”,該系統以裁判文書為切入口,分析提煉案件的關鍵要素,通過數據碰撞、數據對比、數據篩選確定異常案件,歸納出異常案件的監督方向,實現精準打擊。紹興市人民檢察院在“民事裁判智慧系統”研發應用前,每年辦理虛假訴訟案件的數量僅為個位。如圖1所示,2017年辦理虛假訴訟監督案件9件;系統上線后,2018年上升至101件,2019年達到了215件,2020年則達到463件,辦理虛假訴訟案件的數量呈指數級增長[9]。

圖1 虛假訴訟案件數量統計
紹興市人民檢察院作為最高人民檢察院確定的首批“大數據法律監督研發創新基地”,堅持“精準監督”要求,有效利用數據技術督促法院糾正不當民事裁判,有效維護社會公共利益。
2.大數據法律監督平臺的功能
(1)提升檢察機關監督能力和監督效率
首先,數字化監督平臺有助于提升監督能力。法律監督能力包括發現違法能力、界定違法能力、證明違法能力[10]。發現違法行為是正確履行法律監督職能的現實基礎。信息化時代,檢察機關獲取監督對象信息數據渠道狹窄,存在多處監督盲區。在大數據法律監督平臺應用下,檢察人員足不出戶,敲動手指便可以主動了解檢察數據量、在數據分析的基礎上察覺違法犯罪線索并據此調查取證,實現主動監督、事前監督;其次,大數據法律監督平臺轉變監督方式,促進監督效率。“高效”意味著以最低成本解決糾紛,利用大數據及時分析、推送風險案件,提升檢察機關辦案效率。同時檢察機關通過類案監督,總結各類案件事實要素、裁判規則特點,利用數據對比便可快捷發現異常案件,依據案件性質移送各自處理機關,有效提高辦案質效。
(2)積極回應社會訴求
滿足人民群眾對美好生活的向往是大數據法律監督的出發點和落腳點。隨著互聯網技術的飛速發展,新型犯罪形式層出不窮,依靠互聯網、數字工具等前沿技術進行隱匿性、專業性、智能性的犯罪對傳統法律監督提出了新挑戰。大數據的引入解決了傳統法律監督難以關注的監督盲點。2020年,浙江省杭州市拱墅區人民檢察院利用數據監督平臺發現不法分子利用商事登記虛假注冊公司,嚴重侵害人民群眾的財產利益。拱墅區檢察院通過個案要素,在檢察業務數據中深挖類案線索,形成以點及線、以線及面的打擊局面,粉碎一條線整片區的黑灰產業,回應了打擊大數據時代特殊犯罪、保護社會財產利益的人民訴求。
(3)提高社會治理水平
“科學技術是第一生產力”,實現國家治理能力和治理體系現代化離不開數字化技術的助力。2021年2月,習近平總書記主持召開中央全面深化改革委員會第十八次會議強調法治建設需末端前端一體掌控,持續在法治軌道上推動社會治理創新。檢察機關作為國家治理能力和治理體系現代化的踐行者,必須與時俱進以更好的檢察質效適應社會發展需求。社會治理水平的提高需堅持法治化、科學化治理手段,運用數字化技術,及時將傳統法律監督方式向新時代監督范式轉變,推進法治社會建設。
大數據法律監督在不斷實踐的過程中,除了具備司法效率提高、監督盲點減少等優勢外,也需面對無法回避的實踐困境——數據壁壘問題嚴重、新型人才短缺以及業務技術融合度低。
1.數據壁壘問題嚴重
黨中央出臺《中共中央關于加強新時代檢察機關法律監督工作的意見》中提出,需健全行政執法、刑事司法銜接制度,助力形成協同辦案、專案專辦的數據共享機制。協同辦案關鍵在于數據共享,但各部門間的不開放、不共享、不整合導致數據難以盤活,成為各自部門的“死數據”,嚴重影響檢察質效。
第一,檢察機關內部的數據壁壘。一是數據庫權限問題。檢察機關作為專門法律監督機關,具備獨立的檢察數據庫。檢察數據庫的設立目的是供全國檢察機關使用,便于檢察數據實時共享。但基于人為設置,數據庫查詢權限呈現倒三角構造,級別越高查詢權限越廣,級別越低查詢限制越多。這明顯與我國檢察實踐需求相悖,不合理的權限設置阻礙了檢察人員查詢案件、監督案件的監督權力,數據僅為局部流通,難以形成全面覆蓋。二是各級檢察院數據處理能力各異。受經濟發展水平、設備設施、技術網站等多重因素影響,我國各級檢察院呈現數據管理標準、數據處理標準、數據處理平臺等參差不齊的監督現狀。欠發達地區因設備落后難以支撐復雜數據與高級別數據分析,即使收集到數據,也無法真正實現數據監督。
第二,執法司法部門的數據壁壘。建立政法跨部門協同辦案平臺是建設新時代法律監督的重點課題,但數據壁壘使得協同共享機制難以運轉。這主要體現在三個方面:一是專網隔離,執法司法部門各自具有專門的業務網絡,為保障數據安全,各專網之間相互隔離。各部門甚至會采取分級保護各自管理的原則,防止網絡的混同。基于嚴密的物理隔離網絡,數據無法實現有效流通;二是系統獨立,執法司法部門職能不同,開展的業務系統存在差異。系統之間相互獨立,開發平臺、業務流程的各異導致數據共享交換成為難題;三是數據相異,部門間的業務系統中含有大量的異構數據源,數據庫構建、數據來源、數據結構的不同導致數據接口難以統一,難以形成完整數據鏈條。
第三,社會主體的數據壁壘。大數據法律監督最終目標是實現社會治理,利用“監督促進治理”。除了對執法、司法部門數據進行有效聯通外,對于公司企業、行業運營者、消費者等社會主體數據同樣要給予關注。社會主體間的數據壁壘體現在:一是檢察機關與社會數據庫難以有效聯通,當前檢察機關能夠接觸到的數據庫僅為公開的政務數據查詢系統、購買的互聯網公司數據等,但這只是社會數據庫的零星瑣碎,檢察機關與很多行業、部門的數據脫節導致難以掌握第一手監督線索,阻礙監督工作的實時效益;二是法律監督過程中的社會數據庫查詢程序繁瑣復雜。社會數據庫不像機關數據庫整齊統一,其所牽涉社會主體的信息極廣,數據數量的龐大導致查詢結果不精確,檢察機關完成數據集成后需再次清洗過濾無效、異常信息,該過程無疑極為消耗司法資源[3]。
2.大數據新型人才短缺
黨的十九屆五中全會指出要深入實施“人才強國”戰略,深化變革數字人才結構。大數據時代數字化檢察人才隊伍建設成功與否關乎網絡強國、數字中國建設進程。
(1)檢察人員缺乏大數據戰略思維
思維決定行為,行為決定結果。2022年1月,全國檢察長(擴大)會議提出,要樹立大數據戰略思維,運用大數據助力法律監督“本”的提升和“質”的嬗變。檢察人員囿于傳統監督理念,難以適應新時代辦案方式。一方面缺乏大數據基本認知,辦案視野狹窄[11]。檢察人員錯誤地將大數據等同于人工智能、輔助辦案。大數據是人工智能的一部分,但并不完全等同于人工智能,兩者有著運轉價值相異的本質差距。另一方面操作過程不清,實際辦案難以聯想到大數據,運用程度低。部分檢察人員雖具有大數據監督意識,但技術能力有限。面對海量數據,如何有效將個案有用的數據剝離出來并深度分析、整合就顯得力不從心[3]。檢察人員作為法律監督的實際推動者,對于數據法律監督的實效起著舉足輕重的作用,檢察人員的數據素養和數據意識直接影響到數據監督平臺的運行實效。
(2)檢察隊伍人才培養力度低
當前大數據門檻較高,檢察人員通過大數據司法辦案、訴訟監督等職能都需要豐富的檢務經驗與大數據專業知識來支撐數據工作。檢察人員作為法律人員,僅受過法學教育,對跨專業的數字化技術了解甚少。大數據時代對檢察人員提出了更高要求,其不再局限于法學人才而是要求具備法學基礎又精通數據技術的復合型人才。當前檢察機關的選拔方式仍是公開考試,面向群體是法學專業人士。隨著專業化要求的提高,發達地區更是將報考條件限制到碩士及本科專業,有的檢察院甚至將條件明確為法學學碩。此舉進一步限縮了報考考生的范圍。法學人才的越發堆積導致復合型人才難以進入檢察機關就職,檢察隊伍復合人才比例低。
3.業務與技術融合度低
業務與技術的相互融合是信息化建設的難點,當前大數據平臺僅將書面材料轉化為計算機數據,將線下數據變為線上數據,未深入挖掘“大數據+檢察”的運轉價值。相較于發達國家走在時代前沿的數據獲取、數據整合、數據分析技術,我國尚處于數字技術摸索階段。一是數據監督模型建設不完善。雖然全國各地已研發出多項優質數據模型,但仍與實踐需求有著質的差距,且已研發投入使用的數據模型僅限于開發機關使用,覆蓋面極小;二是數據利用程度低。當前我國已采取檢察業務應用系統2.0版本,該系統由流程辦案、智能輔助、數據應用、知識服務四個方面組成,是在檢察業務應用系統1.0基礎上的技術革新。但該系統研發重點仍局限在辦案業務流轉上,量刑建議、文書法規、案例檢索等功能模塊有待健全。多項數據庫未能有效整合致使檢察數據的二次挖掘深度有限,數據價值未能充分發揮。
1.破除數據孤島困境
數據孤島的出現本質在于主數據標準的建立與主數據集中管理的問題。因此解決數據壁壘必須從主數據構成出發,在不同平臺建立起統一的數據執行標準[12]。
內部,各級檢察機關建立數據共享機制。一是構建主數據為主干,其余數據為分支的數據系統應用格局。由最高人民檢察院建立統一業務數據系統與共享數據平臺,形成以最高人民檢察院為核心,省、市、縣、區各級檢察院層層分級、層層輻射的數據應用格局,實現卷宗實時上傳、信息實時錄入、流程實時更新。二是摒棄查詢權不平等設置,確保各級檢察人員平等享有數據查詢權。因某些管轄案件可能存在保密需求,對于涉密案件可采取局部隱蔽措施,構建以公開為原則,保密為例外的數據共享機制。三是統一數據執行標準。各級人民檢察院雖建立起以最高人民檢察院為核心的數據系統,但鑒于各地的發達與設備齊全度,具體應用平臺仍有差異,因此需建立起不同平臺統一數據執行標準。各級檢察院可通過統一主數據編碼,梳理相同含義不同編碼的信息,根據設計好的轉換規則將源系統數據轉化為統一的數據格式,根據數據性質與應用要求建立數據標準。
外部,建立跨部門執法司法數據共享平臺,拓寬社會數據庫聯接渠道。一是在職能部門之間建立起信息數據庫聯網,打破物理數據壁壘。通過建立統一數據處理平臺,將數據轉入結構相同、接口統一的數據倉庫,實時更新數據接口層數據,保障完整性、及時性、一致性。二是建立數據實時交換平臺,擴大平臺覆蓋面,深入多家執法司法部門單位、社會主體數據庫。按照國務院《政務信息系統整合共享實施方案》部署內容,各機關需依托政務網信息共享平臺促進部門之間的信息共享和業務協同[13]。檢察機關主動與執法司法部門等信息數據實行聯通,促成執法司法部門辦案系統連接、數據自動交換和信息共享;針對社會數據庫,檢察機關應當主動拓展信息查詢渠道,利用公安機關等執法機關的便捷優勢與通訊、金融等相關機構取得聯系,爭取他們對檢察工作的支持,以求加入各行業的數據系統[14]。三是依托人工智能、大數據等前沿科技,將人工核驗的檢察監督模式轉變為機器代替人工進行數據過濾、清洗,提高社會數據庫應用的針對性與科學性,提高檢察質效。
2.新型人才培養對策
首先,樹立檢察人員大數據戰略思維。大數據建設關鍵在于大數據戰略思維,具有大數據戰略思維的檢察數字人才是數據監督的踐行者。領導干部作為檢察隊伍的引導者要發揮帶頭作用,積極學習大數據理論知識,開展數字檢察活動,深入推動大數據賦能法律監督。
其次,提高檢察人員數據應用水平。檢察機關作為新時代監督機關,應抓緊培養貫徹數字化思維、運用數字化技術、熟練大數據工具的檢察數字人才。一是要引入高校、科研所等專業科技人才,適當放開選拔標準,為復合型人才提供機會。二是要加大數據應用能力培訓,提高檢察人員的數據素養。課程培訓結束后加大數據應用實戰訓練,促進理論實踐雙融合,提高檢察人員運用大數據的能力。
最后,制定檢察人員大數據素養的考核規則。為了更好地促進檢察人員樹立大數據戰略思維,提升大數據運用能力,需要制定大數據素養的考核規則,明確評估標準。通過量化檢察人員素養水平,實行獎勵考核機制,實質提高檢察人員樹立大數據戰略思維、適用大數據工具的積極性。
3.提高業務技術融合度
業務與技術融合程度決定了法律監督的工作質效,其離不開應用建設與技術保障。應用建設與技術保障是釋放法律監督新動能的數字引擎。一是加大財政投入,為應用研發提供物質基礎。當前我國研發的法律監督模型彌補了局部司法領域的短板弱項,鑒于檢察監督工作的嚴謹性,法律監督模型評判標準高于普通模型,研發周期更長。對于具有長遠應用意義的法律監督模型可作為優質模型進行深度研究。通過監督模型的不斷創新,為檢察事業提供有力工具。二是各級檢察院應當成立信息技術保障部門,為檢察院提供公共信息核查功能,全方位加強信息系統的運用,提高頂層設計與全面設計統一度。例如最高人民檢察院為滿足新時代技術要求,創建檢察技術信息研究中心,承辦信息技術規劃與組織實施,主動納入數字科技人才為檢察事業保駕護航。三是深挖數據線索,實現二次利用。當前檢察業務應用系統版本模塊局限于辦案流轉,客觀數據設置需完善。通過整合現有的檢察辦案平臺,上線量刑輔助、檢察建議、案例檢索等多種功能模塊,實現一個平臺多項應用。
習近平總書記提出,大數據是信息化的發展階段。大數據法律監督的提出是檢察機關深入貫徹法治中國思想、法治中國建設的關鍵步驟。2015年,黨的十八屆五中全會明確提出實施國家大數據戰略,檢察機關大數據戰略作為國家大數據戰略的重要組成部分,事關現代化檢察發展質量。貫徹檢察機關大數據戰略需樹立數據思維、提高理論高度、強化業務能力,為實現國家治理能力與治理體系現代化持續提供檢察智慧。