基金項目:上海市科技委員會軟科學研究項目“新一代人工智能技術(shù)的刑事司法應用”(項目編號:22692111900)
中圖分類號:D925.2 文獻標識碼:A 文章編號:1003-854X(2025)08-0137-08
隨著人工智能技術(shù)被納入國家戰(zhàn)略,科技創(chuàng)新成果與司法工作深度融合,智能化辦案成為我國刑事司法改革的重要方向。其中,刑事證明的智能化因契合“以證據(jù)為核心”“嚴格排除非法證據(jù)”等原則,同時又能體現(xiàn)人工智能所帶來的效率優(yōu)勢,從而具有重要實踐意義與研究價值。刑事證明智能化的基本邏輯,是以人工智能系統(tǒng)為載體,基于預設的標準和算法,對被轉(zhuǎn)化為數(shù)據(jù)形式的證據(jù)信息進行智能化審查;進而在審查證據(jù)信息的基礎上,模擬證據(jù)推理乃至法律推理行為,形成“證據(jù)推理+ 法律適用 Σ=Σ 司法決策輸出”的“三段論”法律推理模式。狹義的刑事證明智能化指的是人工智能參與證據(jù)審查和證據(jù)推理,但是,智能系統(tǒng)全案司法決策流程的啟動,都離不開對證據(jù)信息的錄入。
考察世界范圍的相似實踐,美國的COMPAS系統(tǒng)與英國倫敦大學司法決策系統(tǒng)對刑事證明智能化的涉獵相對深人;①而在我國,初步形成于2017年的上海刑事案件智能輔助辦理系統(tǒng)(即“206”系統(tǒng))被視為是刑事證明智能化實踐的“標桿、先河、突破”之一。時至今日,我國乃至世界上多數(shù)智能辦案系統(tǒng)仍由人工完成證據(jù)審查和證據(jù)信息錄入,對刑事證據(jù)的智能化處理涉及并不深入,此為相關(guān)實踐的主要局限。眾多學者對刑事司法整體的智能化改革發(fā)表有重要研究,但對“人工智能 + 刑事證明”這一細分論題,深入涉及的針對性、系統(tǒng)性研究同樣相對較少,此為相關(guān)研究的主要局限。在法律人工智能領(lǐng)域,法學一側(cè)研究和人工智能技術(shù)一側(cè)研究雖一定程度呈現(xiàn)相向而行的融合趨勢,但仍一定程度表現(xiàn)出“各說各話”的脫離感,法學研究對刑事證明智能化乃至法律人工智能整體的預期相對理想化,當然,這也與刑事證明智能化領(lǐng)域可供考察的實踐樣本的確不充裕相關(guān)。
一、人工智能技術(shù)參與刑事證明的研究發(fā)展
在基于人工智能技術(shù)打造的刑事司法辦案系統(tǒng)中,根據(jù)預設算法和邏輯,對數(shù)據(jù)化的證據(jù)信息進行處理,并輸出結(jié)果性賦值的技術(shù),筆者簡稱為智能證據(jù)審查技術(shù)。在系統(tǒng)中錄入證據(jù)信息、系統(tǒng)對證據(jù)信息作數(shù)字化處理并進行智能化的分析,形成了智能證據(jù)審查的基本流程。這同時也是智能辦案系統(tǒng)基于此基礎而進行的證據(jù)推理模擬、全案法律推理模擬,進而輸出全案司法決策的起始一環(huán)。(證據(jù)推理一法律推理模擬技術(shù),以下合稱為“推理模擬技術(shù)”)
盡管早期流行的“AI法官”概念因其可行性問題早已逐漸淡出討論,然而,追求在人工智能系統(tǒng)中模擬證據(jù)推理、法律推理行為,仍舊是法律人工智能領(lǐng)域的重要技術(shù)命題。有學者認為,人工智能技術(shù)一方面在實踐中所展現(xiàn)出的統(tǒng)一證據(jù)標準、指引證據(jù)規(guī)則、檢驗證據(jù)瑕疵等功能,將對刑事證明的實踐質(zhì)效產(chǎn)生積極影響;另一方面又關(guān)涉到提升正當程序、減少程序冗余、控制錯案產(chǎn)生等刑事司法價值問題,對證據(jù)加強實質(zhì)審查也符合“以審判為中心”改革中“以證據(jù)為核心”的要求。人工智能既能提供高效處理大量證據(jù)信息的效率價值,也能提供進一步保障證據(jù)質(zhì)量的公正價值。
相關(guān)細分領(lǐng)域研究重點聚焦兩個維度:一是在技術(shù)維度,探討人工智能技術(shù)如何妥善模擬證據(jù)推理、司法決策;二是在理論維度,探討法律人工智能語境下的“證據(jù)標準”應如何界定及其與傳統(tǒng)意義上“證明標準”的關(guān)系。國內(nèi)研究主要側(cè)重后一維度,有觀點認為,人工智能技術(shù)對刑事證據(jù)質(zhì)量的保障作用,正是建立在對“證據(jù)標準”實現(xiàn)統(tǒng)一的基礎上;此外,“證據(jù)標準”概念的引入,也反映著人工智能技術(shù)為司法活動所帶來的影響,有學者指出,“當前如何進一步強化人工智能背景下的證據(jù)與證明理論研究是十分重要的命題”;同時有觀點認為,智能系統(tǒng)所統(tǒng)一的“證據(jù)標準”是證明標準的下位概念,證明標準是從主客觀綜合維度對證據(jù)能力的審查標準,而證據(jù)標準帶有相對更強的客觀屬性,是證明標準在智能化系統(tǒng)中(部分)量化的、具象化的體現(xiàn)。
域外研究則對技術(shù)維度關(guān)注更早,并發(fā)展出兩條技術(shù)路徑:一是以法律推理為本源,追求人工智能技術(shù)對包括證據(jù)推理在內(nèi),全案法律推理過程的準確還原:美國威格摩爾教授早在20世紀30年代便設計了圖示化的證據(jù)推理模型;而在20世紀90年代,瑞典瓦爾格倫教授在法律推理“三段論”模式的基礎上,更具體地將法律推理模擬拆分為七步,更契合實踐中的法律推理行為。這條路徑在實踐中的代表性實踐產(chǎn)物,除上海206系統(tǒng)外,還有英國倫敦大學開發(fā)的司法決策系統(tǒng);另一條路徑是以信息技術(shù)為本源,打造司法決策平臺,將其他領(lǐng)域的智能系統(tǒng)主流決策模式沿用至司法決策系統(tǒng),其代表是美國COMPAS系統(tǒng)。這種模式基本遵循貝葉斯決策理論等數(shù)學、統(tǒng)計學方法,即在不完全情報信息下,對部分未知的狀態(tài)用主觀概率估計,然后對預期發(fā)生概率進行修正,最后再利用期望值和修正概率,作出最優(yōu)決策。這種決策模式,最為典型的便是我國飛速發(fā)展的智能駕駛技術(shù)。
總的來看,人工智能技術(shù)的發(fā)展和相關(guān)法學研究的推進是互相促進的,智能技術(shù)參與刑事司法的整體水平也伴隨著從“三段論”到“七步法”的理論發(fā)展,由“弱人工智能”向“強人工智能”逐步邁進。
二、人工智能技術(shù)參與刑事證明的實踐效果
智能證據(jù)審查技術(shù)是由光學字符識別、自然語言處理、語義要素提取、機器學習等一系列智能化“子技術(shù)”的結(jié)合而成的技術(shù)體系,并在系統(tǒng)中整合為證據(jù)格式瑕疵校驗、證據(jù)關(guān)聯(lián)性校驗、證據(jù)完整性校驗三項證據(jù)審查模塊,在完成證據(jù)審查的基礎上,可進一步模擬全案法律推理,輸出司法決策。筆者在試用該系統(tǒng)的上海市、山西T市、寧夏Y市、浙江H市等地對刑事辦案人員進行了調(diào)查研究。
(一)智能證據(jù)審查技術(shù)的實踐情況
從整體上看,數(shù)據(jù)表明,智能證據(jù)審查技術(shù)在上海市刑事司法機關(guān)的使用頻次自2017年以來整體增長,在2020年達到峰值約17萬次,其余年份穩(wěn)定在9到14萬次區(qū)間。參與刑事案件比例在2020和2021年分別達到23729件、22637件,各自占上海市全年一審刑事案件的約 82% 和 81% 。
具體來看,一是人工智能技術(shù)審查證據(jù)質(zhì)量,對采取強制措施的證據(jù)門檻有可見的提高,幫助避免產(chǎn)生證據(jù)不足而貿(mào)然適用強制措施的現(xiàn)象。筆者統(tǒng)計的十類刑事案件中,除假冒注冊商標、銷售假冒注冊商標商品兩類外,其他類型案件中,使用206系統(tǒng)辦理的案件中不捕率均高于未使用系統(tǒng)審查案件的不捕率,如上海市2021年某區(qū)幫助信息網(wǎng)絡犯罪活動罪的不采取強制措施比例從 14.29% 提高到了 58.82% ;二是從“案結(jié)事了”,節(jié)約司法資源的角度,上海市某區(qū)206系統(tǒng)參與辦理的案件,被告人上訴比例為 5.22% ,系統(tǒng)未同步參與案件中,被告人上訴率為 7.4% ;三是具備機器學習能力的智能系統(tǒng),能夠隨著案例錄入的增加,通過學習過往數(shù)據(jù)從而逐漸增強識別能力。例如,上海市公安部門使用206系統(tǒng)在案件中成功識別證據(jù)瑕疵的案件占比從2019年的 13.86% 提高到了2022年的 38.31% 。
從使用者的反饋來看,人工智能技術(shù)能夠較深程度介人證據(jù)審查,能夠一定程度參與到量刑參考、被告人社會危險性、被告人逮捕必要性等的審查評估當中,能夠輸出輔助性司法決策。不過,206系統(tǒng)的使用頻次在2021年達到峰值后不升反降,或可說明經(jīng)歷了一段時間的使用熱潮后,技術(shù)的實用性、準確程度并沒能完全得到實務界的認可。2022年上海市法院使用206系統(tǒng)全案量刑參考功能的頻次只有2019年的約 10% ,但社會危險性評估、逮捕必要性審查(檢察院)的使用次數(shù)連年保持穩(wěn)定。數(shù)據(jù)間接說明,智能系統(tǒng)的審查、推理準確度,隨著其需要處理的案件信息的復雜程度上升而下降。
上海市刑事司法機關(guān)于2022年將數(shù)組過往案件錄入206系統(tǒng),并將結(jié)果與歷史判決進行比對,得出206系統(tǒng)的全案量刑參考準確率介于 76% 到82% 之間,平均值約為 79% 。這一準確度意味著,當前技術(shù)水平下,如人工智能主導證據(jù)推理和司法決策,至少 20% 的案件有可能為智能系統(tǒng)所誤判,且基于人工智能系統(tǒng)中算法的普適性,其在個案中所產(chǎn)生的錯誤結(jié)果,難以為辦案人員所發(fā)現(xiàn)和校正。
(二)智能證據(jù)審查與傳統(tǒng)證據(jù)審查的優(yōu)劣異同
智能證據(jù)審查技術(shù)的三項具體功能,正好與證據(jù)三性一客觀性、關(guān)聯(lián)性、合法性,具備一定程度的對應關(guān)系。用是否能夠充分審查“證據(jù)三性”為標準,考察證據(jù)智能處理技術(shù)的實踐情況,對此有學者認為,這是將“證據(jù)標準”的內(nèi)涵“從證明力評價轉(zhuǎn)向證據(jù)能力判斷”。
1.證據(jù)關(guān)聯(lián)性校驗與證據(jù)關(guān)聯(lián)性審查作用相近
二者的主要目的都是檢查單個證據(jù)與案情的聯(lián)系、排除無實質(zhì)關(guān)聯(lián)的證據(jù)、遏制冗余證據(jù)程序的產(chǎn)生。證據(jù)關(guān)聯(lián)性既包括證據(jù)在客觀上與案情的實質(zhì)關(guān)聯(lián)性,也包括相對主觀的“基本證明價值”,即證據(jù)用于還原案件事實的關(guān)系密切程度。證據(jù)關(guān)聯(lián)性校驗,其重點是對證據(jù)信息的客觀屬性的校驗。這種校驗也能夠促使辦案人員在系統(tǒng)中錄入證據(jù)的時候,會對證據(jù)的關(guān)聯(lián)性進行額外的一步心證過程,確保證據(jù)滿足證據(jù)標準,這種心證便是對“基本證明價值”的主觀評價方式。但是,“證明價值”作為一種主觀評估方式,難以用量化方法固定評價標準,從而通過基于數(shù)字邏輯的人工智能技術(shù)實現(xiàn)完全統(tǒng)一。換言之,傳統(tǒng)刑事司法的“證明標準”與人工智能技術(shù)所統(tǒng)一的“證據(jù)標準”概念之間,存在一道主觀與客觀之間的天然溝壑。證明標準是對主觀證明價值與客觀證據(jù)屬性的綜合評價,而證據(jù)標準則偏向于評價證據(jù)的客觀屬性、量化數(shù)值,不涉及主觀上的證明價值。
2.證據(jù)格式校驗與證據(jù)合法性審查部分重合
證據(jù)格式瑕疵校驗與證據(jù)合法性審查之間存在一定關(guān)聯(lián),但內(nèi)含作用并不完全一致。證據(jù)的合法性既包括證據(jù)格式的合法性,也包括取證程序的合法性。證據(jù)格式瑕疵校驗主要通過對證據(jù)信息中較為容易轉(zhuǎn)化為數(shù)據(jù)的格式要件信息進行審查。格式要件存在于法律文書、訊問筆錄、專家性一專業(yè)性證據(jù)等證據(jù)信息當中。經(jīng)統(tǒng)計測算,206系統(tǒng)對機打文件的格式審查準確度高于 98% ;對圖案及手寫文件的審查準確率也接近 95% ,較為理想。但是,在技術(shù)層面,對人為完成的取證程序進行合法性審查,似乎難以通過量化方式轉(zhuǎn)化為證據(jù)信息,智能系統(tǒng)也無法超越辦案人員所錄人的案件信息范疇對取證程序進行針對性檢查。
以刑事錯案相關(guān)研究為角度,多數(shù)情況下,錯案中取證違法問題產(chǎn)生于前,證據(jù)格式問題往往作為程序違法的產(chǎn)物形成于后,部分案件中只存在程序問題而不涉及格式問題。也就是說,一旦某刑事證據(jù)存在程序性瑕疵、不存在格式性瑕疵,人工智能技術(shù)便可能無法檢測到該證據(jù)的合法性問題。
3.證據(jù)完整性校驗與證據(jù)客觀真實性審查區(qū)別 明顯
證據(jù)的客觀真實性強調(diào)證據(jù)與案件事實存在客觀聯(lián)系,且這種邏輯關(guān)系是真實存在而非偽造。刑事證明實踐中側(cè)重于調(diào)查證據(jù)形成的原因、還原證據(jù)所處的客觀環(huán)境、檢查證據(jù)是否為原件(真實)以及審查提供或獲取證據(jù)人員與案件的利害關(guān)系等方面。智能技術(shù)的證據(jù)完整性校驗,其側(cè)重點在于驗證證據(jù)鏈條的完整性,即各證據(jù)之間的關(guān)聯(lián)系數(shù)是否達到形成邏輯閉環(huán)之強度,證據(jù)鏈條整體強度是否達到閾值。
雖然從邏輯上看,各證據(jù)的客觀真實性與全案證據(jù)鏈條的強度顯然是正相關(guān)的,但是二者并不能近似地看待。人工智能技術(shù)對證據(jù)完整性的審查,一定程度是建立在辦案人員對部分案件信息進行研判,并將研判所得的信息錄人系統(tǒng)轉(zhuǎn)換為數(shù)據(jù)形式,即帶有主觀屬性的“數(shù)據(jù)投喂”。人為的“數(shù)據(jù)投喂”,反而會降低智能系統(tǒng)審查證據(jù)信息的客觀性、影響了審查結(jié)果輸出的可信度。系統(tǒng)對某些不合法證據(jù)便可能“將錯就錯”,不能予以有效排除,且由于人工智能算法對案件的普適性,系統(tǒng)很難在個案審理中充分識別“將錯就錯”的證據(jù)。人工智能技術(shù)未能排除的問題對辦案人員來說會更加隱蔽、更加難以察覺和補正,從而增加錯案發(fā)生的可能性。
(三)推理模擬技術(shù)的實踐觀察
各國構(gòu)建智能司法決策系統(tǒng)的共同目標之一,都是實現(xiàn)人工智能技術(shù)對證據(jù)推理一全案法律推理的模擬,只是系統(tǒng)的構(gòu)建路徑分為法律本源和技術(shù)本源兩種。作為技術(shù)本源的美國COMPAS系統(tǒng),高度反映出信息科學決策理論的影響,技術(shù)本源可以服務于各種決策模型,而法律推理模擬則是在技術(shù)基底上所加載的一類特化功能。基于這一模式打造的,如美國COMPAS、我國浙江大數(shù)據(jù)刑事辦案平臺等,其系統(tǒng)框架通常是二段式、總分結(jié)構(gòu)的:首先圍繞大數(shù)據(jù)技術(shù)和弱人工智能技術(shù)搭建基礎平臺,再在平臺上結(jié)合不同算法衍生出多個類似“小程序”的支線辦案模型,每個模型有特化算法。而采取法律本源模式的上海及英國系統(tǒng),法律推理行為仍是核心,人工智能技術(shù)是用來實現(xiàn)法律推理模擬的工具。基于“三段論”“七步法”打造的法律本源模式,運行框架是流水線式,步步遞進的,整個系統(tǒng)由一整套普適算法體系貫穿流程始終,在非人為干預的情況下,無法繞開任一環(huán)節(jié)。
從推理模擬技術(shù)、智能司法決策系統(tǒng)的實際使用情況看,關(guān)涉的案件信息越復雜,人工智能對其模擬、推理的效果也就越受限。究其原因,在于人工智能技術(shù)從天然上難以準確模擬某些主觀的、程序性的、復雜的司法活動,譬如人工智能如何妥當模擬心證過程;再如,如何將辦案人員自由裁量、自由心證、證明標準問題進行進一步數(shù)據(jù)化;當法律推理路徑不單一時,系統(tǒng)應當如何選擇證據(jù)推理路徑,等等。更為復雜的問題是,作為社會科學與信息科學的交叉領(lǐng)域,刑事證明智能化的很多問題不能單純按照技術(shù)問題或法律適用問題去看待。例如,一旦算法設計者認定不同推理路徑存在正誤優(yōu)劣之分,這便又將帶來如何解釋算法選擇、如何避免算法黑箱、如何證否算法歧視、如何避免普適性系統(tǒng)決策對個案特殊情況的忽視等一系列問題。證據(jù)推理模擬的路徑選擇、價值判斷等問題背后,還蘊藏著刑事司法層面,乃至法社會學等深層次因素的權(quán)衡。總的來看,上海等地的實踐,反映出當前人工智能技術(shù)參與刑事證明“強實體、弱程序、強量化、弱主觀”的特點,實踐中仍在一定程度上依賴辦案人員對案件信息的初步處理與“數(shù)據(jù)投喂”。
三、人工智能技術(shù)參與刑事證明的優(yōu)勢與困境
實踐證明,人工智能參與刑事證明,一定程度起到了保障證據(jù)質(zhì)量、遏制證據(jù)程序冗余、降低司法資源消耗等作用,為刑事證明活動同時提供了效率價值和公正價值。但是,實踐同樣反映出人工智能技術(shù)參與刑事證明所面臨的局限性。它們或表現(xiàn)為技術(shù)阻礙,限制刑事證明智能化的更高層次發(fā)展;或本質(zhì)上人工智能技術(shù)在司法領(lǐng)域的天然局限性;抑或是智能司法決策系統(tǒng)在某些應用場景中所暴露的體系性問題。
(一)證據(jù)智能處理技術(shù)的優(yōu)勢與經(jīng)驗
第一,在實務維度,人工智能技術(shù)能夠在刑事證明過程中對客觀、量化的證據(jù)標準進行統(tǒng)一,對部分類型的證據(jù)瑕疵進行有效和高效的審查;還能在實務中起到倒逼辦案人員重視證據(jù)合法性、通過高效指出證據(jù)瑕疵遏制程序冗余、為證據(jù)質(zhì)量提供糾偏與兜底機制等一系列作用。學者預期如“雖然數(shù)據(jù)化的證據(jù)標準無法取代證明標準,但其能夠為司法人員辦案設置外部約束條件”、“清單化的辦案指引被認為能夠幫助減少刑事訴訟活動的主觀性和任意性”等,均為實踐所印證。
第二,在證據(jù)法學維度,刑事證明智能化的實踐進一步明確了“證據(jù)標準”與“證明標準”的理論異同。近年來學者對“證據(jù)標準”的解讀看似形成了統(tǒng)一,但實際上分化為兩種形態(tài)。形態(tài)其一是廣義的、貼近傳統(tǒng)刑事訴訟法語境的證據(jù)標準,以證據(jù)能力為評價標尺,以證據(jù)三性為主要參照。廣義的證據(jù)標準,既包含客觀的、數(shù)據(jù)化的證據(jù)標準,也包括涉及主觀判斷的“心證標準”,語義邊界相對開放,但仍小于“證明標準”的語義范疇。形態(tài)其二是只針對客觀的、可量化的、數(shù)據(jù)化的證據(jù)信息的,狹義的證據(jù)標準,是司法智能化背景下“對客觀層面證明標準的技術(shù)化改造”,其語義邊界是相對鎖閉的。從結(jié)果上看,人工智能技術(shù)參與刑事證明,目前所能統(tǒng)一的正是狹義的證據(jù)標準。狹義的“證據(jù)標準”概念,主要關(guān)注客觀層面的證據(jù)能力、數(shù)字化的證據(jù)屬性,一方面能夠較好地與傳統(tǒng)證據(jù)法學的“證明標準”概念既厘清邊界,又體現(xiàn)法律人工智能帶來的影響;另一方面,也能更好地反映出司法人工智能技術(shù)目前所能達到的實踐水平,從而遏制相關(guān)學術(shù)研究與實踐現(xiàn)狀存在一定程度脫離的現(xiàn)象。在理論上對“證據(jù)標準”進行更好地界定,并將其與傳統(tǒng)刑事訴訟中的“證明標準”進行語義的區(qū)隔,在刑事證明研究領(lǐng)域是重要的理論貢獻。
第三,在法律人工智能維度,部分證明了以法律推理本源模式構(gòu)建智能司法決策系統(tǒng)的可行性。實踐證明,基于“三段論”的傳統(tǒng)證據(jù)推理、法律推理基本范式,仍可為新時代的人工智能司法決策系統(tǒng)所沿用。
(二)人工智能參與刑事證明的局限與矛盾
1.智能證據(jù)審查技術(shù)的實踐局限
人工智能技術(shù)參與刑事證明,在實踐中雖然能夠較好地實現(xiàn)對數(shù)據(jù)化的證據(jù)信息的審查,但尚無法全面覆蓋刑事案件辦理中對證據(jù)進行全面、實質(zhì)審查的實際需求。人工智能參與刑事證明,能夠?qū)ΚM義的證據(jù)標準進行較好地統(tǒng)一,但僅統(tǒng)一狹義的證據(jù)標準,在實踐中能起到的作用相對受限。
微觀層面,一是智能系統(tǒng)提供的證據(jù)指引功能,在實踐中對辦案人員的提醒效果、指引作用是可觀的。但嚴格來講,上述作用只是將法律規(guī)范電子化地呈現(xiàn);二是證據(jù)完整性校驗的目的不完全等同于證據(jù)客觀真實性的審查,這便要求辦案人員人工完成對證據(jù)客觀真實性的確認;三是證據(jù)關(guān)聯(lián)性的校驗能夠在實踐中發(fā)揮作用,但此類瑕疵的出現(xiàn)頻率相對較低、對案件影響相對較小,也相對容易為辦案人員所排除。
中觀層面,一是效率維度,刑事證明智能化過程中,“證據(jù)標準”的主要參照是法律法規(guī)中那些可量化、數(shù)據(jù)化的標準,也可以相對概括性地認為“證據(jù)標準”是“證明標準”的客觀、量化部分。但是,辦案過程中,仍需要對取證程序合法性等難以量化的證據(jù)問題進行實質(zhì)審查,人工智能系統(tǒng)在這方面便較為被動,依賴辦案人員初步處理后的“數(shù)據(jù)投喂”,但人為處理和“投喂”數(shù)據(jù),一定程度抵消了人工智能技術(shù)所提供的,快速處理大量案件信息的效率價值;二是理論維度,因第一點導致,人工智能技術(shù)所形成的“證據(jù)標準”,其邊界達不到“證明標準”的范疇,一旦案件較為復雜,迫使辦案人員介入,相關(guān)證據(jù)問題便不可避免地回歸到傳統(tǒng)刑事訴訟的“證明標準”語境中,對司法人工智能語境下,“證據(jù)標準”的理論價值產(chǎn)生消解;三是司法公正維度,案件辦理中對“證明標準”的回歸,因納入更多主觀因素,同樣會消解智能系統(tǒng)處理證據(jù)信息的客觀性,從而對司法決策的公正性和可信度帶來影響。
2.人工智能參與刑事證明的技術(shù)困境
審查證據(jù)到司法決策,刑事證明和證據(jù)一法律推理,既包含對實體法部分的分析、解構(gòu)、量化,也包含程序法部分的涵攝、歸納、概括、印證。應用人工智能技術(shù)審查證據(jù),其基本邏輯分為兩步,即先將案件中所產(chǎn)生的程序性、主觀性內(nèi)容的信息進行抽象化概括,即事實到抽象;再將概括的結(jié)果印證于智能系統(tǒng)預設的證據(jù)程序性標準,即抽象到結(jié)論。人工智能技術(shù)處理大量數(shù)據(jù)化證據(jù)信息的能力優(yōu)秀。但這是建立在證據(jù)信息必須是容易被數(shù)據(jù)化,并建立統(tǒng)一標準的前提下的。而在涉及刑事證明主觀性、程序性因素的推理與評價部分,人工智能技術(shù)作為一項計算機科學技術(shù),暴露出其天然局限。
一是受到算法自身的制約。人工智能系統(tǒng)對案件信息、證據(jù)信息的抽象化,實際上是一種通過算法進行分類的過程,好比將寫著不同數(shù)值的證據(jù)信息乒乓球放入寫著不同抽象歸納結(jié)果編號的抽屜中。如果系統(tǒng)預設一項證據(jù)歸納結(jié)果按 0,1,2… 的順序分為不同抽屜,那么當乒乓球(即數(shù)據(jù)化的證據(jù)信息)所代表的值是0.49,它會進入0號抽屜,而寫著0.51的球會進入1號抽屜。由于人為設計的系統(tǒng)要么預設、要么通過算法得出,一定存在嚴格、死板的數(shù)值劃定邊界,因此智能系統(tǒng)的“抽屜”個數(shù)一定是有窮的,不同的“抽屜”之間一定會被劃分出互不交叉的邊界。0.49與0.51的賦值,說明兩條案件信息所反映的實際情況可能很接近,卻在系統(tǒng)中形成了0和1的本質(zhì)差別。由于計算機系統(tǒng)只能處理數(shù)據(jù)化的案件信息,這就導致算法有可能將不具有本質(zhì)差異的兩個案件推理為截然不同的司法決策結(jié)果。
二是算法選擇上的單一性。針對某一組證據(jù)信息進行抽象化,可能存在兩種甚至更多種證據(jù)推理路徑,作為法律推理者,不同的個人經(jīng)歷決定了不同的觀念,從而產(chǎn)生了不同的證據(jù)概括方式,面對同樣的證據(jù),不同的人可能選擇不同的證據(jù)推理路徑,結(jié)果自然產(chǎn)生分化。③但是,只要符合法律規(guī)則和證據(jù)概括范式,哪條推理路徑是正確的、或不同推理路徑之間孰優(yōu)孰劣,是一個難以回答的問題,也是法律推理者可以在法律框架內(nèi)自由裁量的。證據(jù)推理和證據(jù)概括的路徑選擇,本就會受到個人心證的影響,人工智能技術(shù)似乎并沒有“資質(zhì)”去定義司法人員所選擇的不同證據(jù)概括、證據(jù)推理路徑的正誤之分。盡管司法決策系統(tǒng)的設定是為了追求客觀性、公平性,但其算法一定是體現(xiàn)設計者意志的,例如對“抽屜”界限的劃分,代表了設計方的普適性路徑選擇。但在現(xiàn)實的刑事證明中,辦案人員自由心證與個案個性共同作用,造成每個案件都有其獨特的證據(jù)推理路徑、證據(jù)概括方式。因而,人工智能系統(tǒng)的算法普適性,會造成在個案中忽略案件特性,以及推理路徑選擇未必符合案件實際情況等兩點問題。
三是人工智能技術(shù)對復雜案件信息的適應性偏低。如前所述,上海系統(tǒng)的全案司法決策結(jié)果匹配率在 76% 到 82% 之間,均值是 79% 。同為法律推理本源的英國倫敦大學司法決策系統(tǒng),其結(jié)果匹配率也恰好是 79% 。這說明對于案情相對簡單、主要證據(jù)信息易于數(shù)據(jù)化(如貪污金額、傷殘等級、血液酒精濃度等)的五分之四案件,中英兩國的法律推理本源系統(tǒng)都能較為妥善地處理;而剩下五分之一的案件,案情較為復雜,涉及程序違法、情節(jié)模糊等難以量化情況,案件信息難以精準對應智能系統(tǒng)的審查標準,或智能系統(tǒng)在證據(jù)推理的路徑選擇上與過往案件中司法人員的選擇不一致,導致這部分案件的模擬司法決策結(jié)果產(chǎn)生偏離。中英兩國近似的實踐結(jié)果證明,人工智能技術(shù)在刑事證明中的局限性,絕非上海實踐的個別現(xiàn)象,而 80% 左右的全案司法決策準確率是不夠?qū)嵱玫摹?/p>
刑事證明乃至司法決策,因其具有最高層次的嚴肅性和精確性,對智能技術(shù)所輸出的結(jié)果有著相對最高層次的要求。人工智能技術(shù)在其他領(lǐng)域的預測性決策系統(tǒng)中,能夠在高精度算法、大數(shù)據(jù)模型、概率修正法等手段結(jié)合的作用下,提供相對最優(yōu)決策結(jié)果;但這樣的預測屬性、相對最優(yōu),并不完全適用于追求精確判斷、絕對最優(yōu)的智能司法決策系統(tǒng)。“為一項主觀判斷活動的結(jié)果設定客觀標準,本身在邏輯上難以自洽。”
3.智能系統(tǒng)參與刑事證明的體系矛盾
法律本源模式也具有至少兩方面的體系局限:一是其所要求的技術(shù)水平較之技術(shù)本源系統(tǒng)更高,但當前人工智能技術(shù)水平尚未完全滿足實踐需求,且人工智能參與刑事證明具有天然局限;二是法律本源模式的穩(wěn)定性相對較低,任意一個技術(shù)節(jié)點出現(xiàn)了漏洞,對于證據(jù)推理模擬和司法決策輸出的質(zhì)量都會產(chǎn)生難以根除的影響。
那么,以美國COMPAS為代表的技術(shù)本源系統(tǒng),是否能夠避免法律推理本源系統(tǒng)的體系局限性呢?信息技術(shù)本源的辦案系統(tǒng),由于其總分式的算法框架,不存在“牽一發(fā)而動全身”的不穩(wěn)定性。
其司法決策的本質(zhì)方式,是在不完全情報信息下,對未知狀態(tài)用主觀概率估計,然后通過概率學、統(tǒng)計學算法進行修正,再利用期望值和修正概率作出最優(yōu)決策。相似的如浙江大數(shù)據(jù)辦案平臺,其針對特定類型犯罪的探測功能,便是在部分信息未知的情況下,通過瞄準某一犯罪類型的專門算法,預判犯罪嫌疑點位。
浙江系統(tǒng)不涉及刑事證明,而深度涉及這一領(lǐng)域的美國COMPAS系統(tǒng),其流程關(guān)鍵一步是嫌犯在系統(tǒng)中回答137一287個問題,使司法決策機制輸出量刑建議或社會危險性評價等結(jié)論性結(jié)果。?嫌疑人的“供述式”答題,本質(zhì)上是決策理論中的概率修正法,使系統(tǒng)基于普適算法劃定案件司法決策較為泛化邊界的基礎上,通過這些具體問題,為“最優(yōu)決策”限定較窄的邊界,生成貼合本案事實的司法決策結(jié)果。但COMPAS的主要問題有兩個方面:一方面是證據(jù)信息的主觀性和穩(wěn)定性問題。嫌疑人回答問題的行為是對客觀事實的主觀判斷,包含嫌疑人的自身認知、個人情感。這必然削弱系統(tǒng)結(jié)果輸出的客觀性、可靠性;另一方面是證據(jù)審查的效果存疑。一是COMPAS通過選擇題為證據(jù)的數(shù)據(jù)化進行賦值,一旦各個選項均不貼近實際案發(fā)情形,則存在較高的司法決策結(jié)果偏離實際案情的風險。二是被告人“供述式”答題具有終局性,導致對證據(jù)的實質(zhì)審查淪為對嫌疑人主觀供述的虛化審查。三是作為系統(tǒng)結(jié)果輸出前的最后一步,被告人答題所帶來的,主觀認定偏離客觀事實的風險沒有任何控制機制加以消除。以上問題共同作用,也在美國實踐中綜合造成了以Loomis案為代表的一些爭議性案件。
帶有預測性的“最優(yōu)司法決策”直接沿用到嚴格、嚴肅的刑事證明過程當中,追求的仍是相對最優(yōu)解,在最理想的情況,即數(shù)字“抽屜”無限連續(xù)的情況下,相對最優(yōu)解才能趨近絕對最優(yōu)解。證據(jù)推理模擬的理想情況,是用完全客觀的信息來源和合乎法律邏輯的推理,所形成的“絕對最優(yōu)”結(jié)果,不是基于一個開放信息區(qū)間而得出的“相對最優(yōu)”。而且,“相對最優(yōu)”是基于優(yōu)勢概率作出的選擇,一定程度上違背我國刑事證明中“排除合理懷疑”的標準要求。對證據(jù)推理、法律推理進行模擬,追求的是確定性、需要的是盡可能嚴格的證據(jù)標準、是(理想條件下)絕對客觀的案件信息和系統(tǒng)絕對的最優(yōu)算法,反而要盡可能限制司法決策系統(tǒng)的預測屬性,這與司法以外很多領(lǐng)域的決策方式相悖。
4.人工智能參與刑事證明的實踐效果與理論預期存在距離
總的來看,以法律本源模式構(gòu)建司法決策系統(tǒng),能夠形成特化算法,更好地還原法律推理行為,但是當前人工智能技術(shù)的發(fā)展水平還無法充分滿足本模式的技術(shù)需求;技術(shù)本源模式的主要問題則正好相反,在于其算法的特化程度不夠,直接沿用其他領(lǐng)域智能決策系統(tǒng)的構(gòu)建方法,會導致系統(tǒng)的預測屬性、對相對最優(yōu)的追求,與刑事證明智能化的應有邏輯存在背離。
學者預期人工智能技術(shù)能夠在刑事證明中幫助統(tǒng)一證據(jù)標準、規(guī)范辦案行為、保證辦案質(zhì)量、提高辦案效率,這些能夠為實踐所印證。?但是,人工智能技術(shù)在刑事證明中所反映出的技術(shù)性與體系性局限,共同影響著刑事證明智能化的實踐效果,部分消解了技術(shù)帶來的公正價值和效率價值,這是理論研究無法預見到的。過往研究中,學術(shù)界對人工智能技術(shù)應用于刑事司法實踐的總體態(tài)度較為樂觀,對人工智能技術(shù)的自主解決問題能力期待偏高,而對其本質(zhì)的工具屬性有所忽視;而與之相對,直接參與實踐的實務界并沒有給出十分積極的態(tài)度與反饋,正如有學者發(fā)現(xiàn),“與官方話語的積極性呈現(xiàn)鮮明不同的是,辦案一線對于這類技術(shù)的話語則呈現(xiàn)出消極的一面,并形成懷疑話語、否定話語和抵觸話語三類表達。”?還有學者認為,“我們需要認識到紙面上形式真實的法律信息與實踐中實質(zhì)真實的法律信息之間的鴻溝。”
四、人工智能技術(shù)參與刑事證明的進路
刑事證明智能化這一細分領(lǐng)域,進一步發(fā)展的根本問題有兩個:一是如何更為完善地在智能系統(tǒng)中,建設量化的證據(jù)標準體系;二是如何在證據(jù)推理模擬中更好地體現(xiàn)“證明標準”。
(一)理論層面:實現(xiàn)廣義的證據(jù)標準
目前人工智能參與刑事證明的相關(guān)理論研究預期高于實際實踐水平,但這也合乎常情,并無必要通過調(diào)低理論預期的方式去匹配實踐效果,只是應當避免因理論預期與實踐過大而招致的“反智化”現(xiàn)象。 ? 因而,重中之重是對人工智能技術(shù)及其在刑事證明、司法決策中能發(fā)揮的作用保持理性和審慎的態(tài)度。
假設在法律人工智能語境中對證據(jù)標準的概念一直采取嚴格的、狹義的語義邊界,那么司法人工智能系統(tǒng)是否能在將來完整準確還原全案法律推理,模擬價值衡量、推理路徑選擇、自由心證等包含較多主觀性因素的司法行為,否則這一系列命題便失去了討論和研究的價值。這將對刑事證明智能化的發(fā)展注入消極情緒,于相關(guān)研究也并無裨益。因此,從可行性角度出發(fā),建議將在系統(tǒng)中實現(xiàn)以廣義的證據(jù)標準處理證據(jù)信息作為人工智能技術(shù)參與刑事證明的下一階段目標;待技術(shù)條件更加成熟時,再進一步探索對“證明標準”的全面數(shù)據(jù)化,從而實現(xiàn)對證據(jù)推理一法律推理的進一步模擬,提高法律本源司法決策系統(tǒng)輸出決策結(jié)果的準確性。
(二)技術(shù)層面:加強智能技術(shù)在刑事證明中的“橫向”擴展
人工智能技術(shù)在刑事證明中的天然局限性,法律本源司法決策系統(tǒng)的體系脆弱性,都是難以被克服的,因此,刑事證明智能化向更高技術(shù)水平的“縱向”發(fā)展,短時間內(nèi)難度相對較大。但刑事證明智能化的今后發(fā)展絕非走入死局。以保障證據(jù)質(zhì)量為核心目的,技術(shù)角度實現(xiàn)破局的關(guān)鍵在于通過更加靈活的方式“繞開”人工智能技術(shù)的瓶頸,應用“橫向”信息技術(shù)擴展,代替“縱向”技術(shù)突破。以法律本源系統(tǒng)的完善為視角,應當充分借鑒技術(shù)本源系統(tǒng)的優(yōu)勢,不能忽視以大數(shù)據(jù)技術(shù)等“橫向”信息技術(shù)在開放網(wǎng)絡空間信息獲取方面的提升作用。這種作用以我國浙江、貴州等省智能刑事辦案系統(tǒng)為范例,實踐效果有目共睹。上海系統(tǒng)前期的研發(fā)重點是系統(tǒng)內(nèi)部的、封閉空間的推理模擬技術(shù),注重司法人工智能技術(shù)的“縱向”研發(fā),即向強人工智能水平推進。而在“縱向”技術(shù)短時間內(nèi)難以達到更高層次的現(xiàn)狀下,對“橫向”技術(shù)在開放或半開放網(wǎng)絡空間快速、精準、大量獲取相關(guān)信息所能帶來的效率價值,可以進一步加以利用,其優(yōu)點在于三個方面:一是效率層面,為人工智能系統(tǒng)帶來數(shù)據(jù)獲取能力的強化、模型庫規(guī)模的提升,放大人工智能技術(shù)為刑事證明所提供的效率價值;二是審查準確性層面,大數(shù)據(jù)技術(shù)在網(wǎng)絡空間獲取的樣本越多,對司法決策結(jié)果的修正作用就越好。綜合大數(shù)據(jù)技術(shù)的“相對”證據(jù)標準,與推理模擬系統(tǒng)所預設的“絕對”證據(jù)標準,便可一定程度填補人工智能系統(tǒng)審查主觀性、程序性證據(jù)信息的短板,使“相對最優(yōu)”與“絕對最優(yōu)”的兩種證據(jù)推理模式互為驗算和補充;三是系統(tǒng)結(jié)構(gòu)層面,橫向技術(shù)的融合還能對法律本源系統(tǒng)自身的結(jié)構(gòu)性問題進行一定程度的彌補,削弱線性模式下各技術(shù)點位產(chǎn)生瑕疵對終局決策輸出的影響,提高智能司法決策系統(tǒng)的準確性。
(三)制度改進層面:豐富案件數(shù)據(jù)制度
雖然本文主要討論的是人工智能參與刑事證明的應用效果和理論映射,但也不能忽視有關(guān)制度改進為實踐質(zhì)效所提供的積極影響。上海在實踐中暫未建立跨刑事司法機關(guān)的數(shù)據(jù)化案件信息互通機制,各刑事司法機關(guān)數(shù)據(jù)范圍僅限于本市本機關(guān),沒有接入更龐大的數(shù)據(jù)庫或開放網(wǎng)絡。系統(tǒng)只能提取有限的案件信息,在比較小的參考范圍內(nèi)與類案進行比對。對此,可以參考和借鑒浙江等地的實踐經(jīng)驗,完善刑事司法跨部門的案件信息通道制度、或建立數(shù)據(jù)共享平臺,充分發(fā)揮“橫向”技術(shù)的作用。在刑事辦案系統(tǒng)不能毫無限制地接入開放網(wǎng)絡空間的條件約束下,可考慮在省一級由刑事司法各機關(guān)共建案件信息的局域網(wǎng)絡。如此,證據(jù)智能處理技術(shù)至少可以一定程度結(jié)合“橫向”技術(shù),對既往案件信息進行更全面地分析和比對,形成更加精準和統(tǒng)一的證據(jù)標準邊界,并以“相對的”證據(jù)標準作為輔助,修正證據(jù)信息審查和證據(jù)推理模擬的結(jié)果,進一步提高人工智能技術(shù)審查刑事證據(jù),以及模擬證據(jù)推理一法律推理所輸出的結(jié)果質(zhì)量。
五、結(jié)語
人工智能參與刑事證明,具有鮮明的“強實體、弱程序、強量化、弱主觀”特點。其積極影響在于,一是在實踐中提供了一定的公正價值和效率價值,使數(shù)據(jù)化的證據(jù)標準實現(xiàn)了有效統(tǒng)一,保障了證據(jù)質(zhì)量;二是進一步明確法律人工智能語境下“證據(jù)標準”的概念,并與傳統(tǒng)刑事司法中的“證明標準”概念進行區(qū)分;三是證明了威格摩爾“三段論”和瓦爾格倫“七步法”用于模擬證據(jù)推理、法律推理行為的可行性。但實踐中也反映出人工智能參與刑事證明,存在著技術(shù)性和體系性的雙重局限:人工智能技術(shù)的自身局限性對其參與刑事證明的使用場景與實踐效果有著不小的限制,尤其是對主觀性、程序性的證據(jù)信息,處理能力較為有限;智能系統(tǒng)在刑事證明中一定程度上仍依賴辦案人員對案件信息的初步處理和數(shù)據(jù)投喂;推理模擬技術(shù)準確率不夠理想,兩種全案司法決策系統(tǒng)的構(gòu)建模式各自存在缺點,并反映出司法決策與人工智能技術(shù)存在一定程度的不兼容現(xiàn)象。這些局限對刑事證明智能化的公正價值和效率價值有所消解、理論預期與實踐效果產(chǎn)生明顯差異。就今后發(fā)展來看,其一要調(diào)整發(fā)展預期,以在系統(tǒng)中應用廣義的證據(jù)標準審查證據(jù)信息,作為下一階段的技術(shù)目標;其二要設法技術(shù)破局,將人工智能技術(shù)進一步結(jié)合其他“橫向”技術(shù),豐富司法決策系統(tǒng)的技術(shù)能力與應用場景,增強系統(tǒng)輸出結(jié)果的準確性;其三要加強制度建設,以行政手段推動人工智能在刑事證明中的更深更好應用。
作者簡介:陸宇光,上海交通大學凱原法學院博士后流動站研究人員、助理研究員,上海,200232。
(責任編輯 李濤)