汪政輝
關鍵詞人工智能 類案推送 法律適用統一
中國的司法質量及司法能力在不斷完善,但與此同時,人民群眾最關心的還是審判是否公正,所謂的公正,即包含裁判是否穩定。同樣的一個糾紛,是不是能夠得到穩定的裁判輸出,當權利受到侵害,或者說社會、企業團體、人民群眾遇到同樣的問題,會不會每次都受到公平相同的裁判,執法是否統一和穩定。
對于類案的標準也需要站在具體的需求場景中去分析,類案的應用在大部分場景中其實是為了保證司法辦案人員的心理確信,特別是較為復雜的案件。以民事案件為例,對難以把握裁判結果的案件,爭議焦點一致、案件標的基本一致,參考程度更大;而針對需要審理思路的案件,則只需要爭議焦點基本相似即可,對于類似案件有一個判例審理經驗的共享。
刑事案件的出發點為定罪和量刑,即案件的具體罪名的構成要素以及刑法總則中與量刑有關的要素信息,即刑法總則中有關量刑的要素及分則中對于罪名的犯罪構成要素及不同罪名中的要素信息。如何判斷兩個刑事案件的類似性,基于不同的需求存在不同的場景區分。第一種需求:案情相似的案件查找。這種案件解決的基本問題為類似案件的量刑以及類似案件的首先需要案件罪名一致,這同時包含了一人或多人數罪多罪名的案件的罪名一致性;其次案件的總則量刑要素一致,例如兩個案件嫌疑人均是自首方式到案、且均是累犯,嫌疑人均是殘疾人;最后確定分則中不同罪名的犯罪構成,即案情信息是否一致。這種方式可以較為精確的定位,但存在的問題是對于同案的罪名不同判的場景下,辦案人員在難以把握案由的情況下如何推送準確的類案。第二種需求,案件裁判要旨一致的案件查找,針對某些特殊案件,難以查找到相似案例的情況下,需要基于案件的相似或者相同裁判要旨進行檢索,推送類似案例,例如案件均涉及到詐騙罪與盜竊罪區分的問題,那么如何界定該案件是盜竊罪還是詐騙罪,對于此類此罪彼罪的問題尋找相似或者相同裁判要旨的案例,確定相似案件的法律適用情況及案件辦案思路。
目前,人工智能總體屬于發展階段,我國人工智能水平與國外相比,差距仍然不小,我國的人工智能建設起步晚,但是前景十分廣闊,追趕之勢十分迅猛。人工智能的感知智能技術目前相對于較強,對于圖片文字印刷體的識別能力較強,而對于中文的認知技術能力,由于才剛剛起步,頂尖技術僅能做到語言內容的查找,且大段信息識別的效果較差,需要將所識別的內容要素碎片化才可達到可用的效果。
人工智能的優勢在于輔助查找,以及替代人完成繁重重復的簡單工作。目前感知智能應用較為廣泛的目前有人臉識別、語音與文字的轉換、翻譯以及圖片轉文字的OCR能力。而自然語言處理技術需要集合真實的場景,以人的經驗和理解對機器進行訓練,從而輸出可以進行自動語義識別的模型,所以針對不同場景會輸出不同功能的模型,從這方面來說認知智能技術難度要高于感知智能,不僅僅需要技術的積累,更需要對于場景的深入了解及細分。
目前人工智能技術在司法行業的應用主要包括了紙質卷宗的電子化,即將紙質卷宗中的內容轉換為可復制可粘貼的文本信息;案件信息識別,即將案件卷宗中犯罪嫌疑人信息、發破案情況、案件事實等信息進行識別,輸出有關發破案經過的輔助案件審查工作等等。在司法行業應用較為成功的例子當屬上海“206工程”的證據校驗功能,其能夠對于證據材料進行識別,輸出證據中所存在的瑕疵及問題,輔助辦案人員進行證據合法性審查,推動司法規范化。
(一)類案應用現狀分析
現有的類案在真實辦案中的使用情況不容樂觀。對于類案相關應用產品的了解,主要基于兩個方面的信息點:一是通過網上的相關發布消息及公司網站的推廣了解,進行相關信息的調研及產品試用;二是深入各法院檢察院對檢察官法官的日常工作中,所使用的相關類案產品及類案檢索方式進行了解。基于前期很多調研,及相關專利資料以及論文的內容來看,目前類案的研究主要都是參與司法行業的企業所做的專利或者各法院研究室、各學者所做的關于類案推送的研究。其中應用推廣現狀較好的,可提供較完整數據的,在辦案人員日常辦案或者專家學者、律師日常工作提供推送、檢索功能的主要有這幾個產品:法信類案推送(由司法大數據研究院主導建立,是中國首個法律知識和案例大數據融合服務平臺,2016年3月31日在中國最高人民法院上線)、上海二中院C2J(由上海二中院自主研發,上海全市推廣)、北大法寶類案推送(由北京大學法制信息中心與北大英華科技有限公司聯合推出的智能型法律信息一站式檢索平臺)。
在對于整體市場情況及相關功能了解的基礎上,對相關產品進行了試用,確定基礎上應用情況闡述目前大部分廠商所做產品的推送的使用方式主要為:(1)用戶主動輸入案情進行相似案件檢索,一般在搜索框中輸入案件案情進行檢索;(2)用戶選擇案件標簽(例如自首、入戶盜竊、盜竊虛擬財產等與案情相關的標簽)進行檢索;(3)用戶輸入文書(目前主要為判決書、起訴書、起訴意見書),基于文書中的案情信息推送類似案件。
對以上的產品的類案推送的產品使用方式以及所推送的相關結果的維度及準確度進行分析,相關產品的后臺邏輯一般分為兩種:
第一種是依靠關鍵詞以及分類檢索的類案搜索功能,例如北大法寶、C2J。該種檢索邏輯僅僅只能根據判決書或者相關典型案例中所出現的關鍵字來進行匹配搜索,而且一定要精確匹配上。例如輸入搜索“匕首”,只能搜到文中帶有“匕首”字詞的判決書,而“小刀”“水果刀”等兇器均無法輸出;搜索“到案后如實供述犯罪事實”并無法搜索出坦白的情節,即使可以搜到也只能搜到判決書中明確提到“到案后如實供述犯罪事實”內容的案情。
第二種是基于低級自然語言檢索能力進行的全文匹配,例如法信、擎盾。即用戶主動將案情全覽輸入進行檢索或者用戶輸入某個文書(例如起訴書、判決書),基于對于案情的識別結果推送出相似的案件。但是經過試用并不能得到相似的案情,目前相關案情的搜索都僅僅只能搜索出極為簡單的案情描述,且推送的結果并不準確。例如搜索“盜竊1000元”可以搜索出來與盜竊的價值1000元物品相關的案件,雖然搜索結果較粗;如果輸入的搜索內容相對較為細致,例如“在2019年10月20日,王某某在上海市某小區入戶盜竊蘋果手機,手機價值4000元”,則出現兩種情況,識別不出內容或者推送內容的關聯度較粗并不是辦案人員所需要的。
第三種是基于標簽選擇式的案情檢索功能,例如法信,但此種檢索的方式標簽的設置維度較粗。這種方式相對來說更為準確一點,選擇標簽之后,以標簽設置的維度為前提可以推送出與選擇的標簽相關聯的案件的判決書。但仍然存在推送結果維度較粗的情況,所推送的內容也并不能達到理想化的狀態,即推送的內容可以輔助進行案件審查。實際并沒有推送和實際需要的類似案例。
綜上所述,目前市面上的類案推送的產品實現邏輯均存在效果不好的問題,所推送出來的案件并不是辦案人員需要的,案情的相似度并不高,仍然需要辦案人員去一個個查找;同時辦案人員從案件里面得到案件的辦案思路及案件具體的細節描述的需求并沒有得到滿足,法律適用的思路也極為有限,并沒有得到較好的應用。
(二)現有問題及難點分析
以下就現有的類案推送產品及其在辦案場景下的應用情況綜合來說主要存在以下問題
1.人工智能技術的不成熟
背景中已經提及,目前人工智能技術,特別是認知智能技術才剛起步,現有的人工智能技術的認知水平程度上來說也只有五六歲兒童的智力水平,人工智能技術尚在探索階段,技術并不成熟。同時目前針對人工智能技術中認知技術的開發也是與實際的用戶場景緊密結合的,目前人們對于這塊的行業認知程度的不同,也導致了技術落地的難度加大。
2.數據積累不全面
目前的數據積累的不全面主要體現在目前的類案產品所推送的案例僅僅只局限于判決書,即使是公報案例也只是提供一些簡單的案件關鍵信息及裁判要旨,但對于具體的案例辦案思路及爭議焦點、學界意見相對是缺失的,而且很多案件對于案件走向極為關鍵的細節案情也并無提及。辦案人員實際需要的,其實是案件的整體走向,案件的爭議焦點,案件的審判結論,學界意見等等。而對于辦案人員來說,推送案件的全面數據,包括所推送案件的辦案思路,案件的爭議焦點歸納,相關學者的意見等等信息恰恰是能夠輔助案件審查的關鍵,提升辦案人員的心理確信。
3.數據質量無保障
產品所推送的裁判文書數據來源并不確定,其次文書所涉及的案件的辦案質量也無法保障。目前類案推送產品的文書資源來源基本來源于裁判文書網的判決書數據以及最高檢發布的指導案例及最高法、各省、直轄市、自治區高級人民法院、檢察院發布的典型案例。指導案例及典型案例相對質量較高,但是裁判文書網的案件數據并沒有進行篩選過,很多數據甚至存在錯別字情況。
4.業務理解不充分
目前普遍存在一個問題,即對于司法辦案業務熟悉了解的人對于技術并不了解,而對于技術了解的人對于司法辦案業務及法律知識并不了解,現在很多高校已經開設了人工智能法學專業,為這方面的問題提供了一種解決思路。
對于目前所存在的問題,在智慧司法這一背景下,為了達到類案推送的實際作用,不僅僅是技術方面的推動,最重要的其實是底層的法學知識、法律資源及案件審查方法論的支撐,即類案推送的知識維度+推理模型構建,這樣才能為司法所用,為辦案人員所用。如圖1所示,建立底層的基礎數據及知識庫顯得尤為重要,這就需要法律法規、裁判文書、案例庫以及法學知識的支撐,但只有基礎數據并沒有辦法實現有效的利用,如何在海量的數據中找到辦案人員所真正需要的,這時候就需要知識庫將數據進行分類,碎片化,便于檢索、推送。建立類案的知識圖譜,將法律推理形式拆解為完整的制定法規則.案件事實.裁判結論.裁判思路,在此論證結構下類案同判的法律推理構成要素為指導性案例中的裁判要點和裁判規則,形成了案件相似性判斷以及價值論辯的內部證成以及外部證成過程。最后基于人工智能的底層能力基礎及計算機技術將知識與數據相結合,形成真正的應用平臺。
(一)建立完備的法律大數據體系
數據的收集要保證足夠完整,不出現紕漏,保證法律資源數據的完整性與及時性。從文書數據方面來說,盡管最高人民法院2013年所建立的裁判文書網構建裁判文書的統一收集渠道,但數據庫中所包含的文書主要是近幾年的,缺乏長時間的驗證及司法經驗的提煉,數據不完整,參考價值有限。從法律法規依據方面來說更新的法律法規,司法解釋,指導意見等需要及時更新,在大數據及人工智能技術蓬勃發展的背景下,充分利用數據收集所帶來的紅利。
(二)形成完備的知識架構體系
法律數據碎片化的質量與程度決定了類案推送結果的質量,只有建立完備的知識架構習題,才能將法律科學技術與法律業務場景緊密結合起來,確定案件審查的邏輯,確定標簽體系的合理性,類案推送的結果才能具有最佳的數據匹配效果。這就需要具有法律業務知識的人加入知識架構體系的建立中,完善現有產品的知識架構體系。
(三)技術快速迭代升級
認知智能技術優化程度決定了識別效果的準確性,至少需要達到準入門檻,這就需要基于所構建的完備的知識架構體系對模型進行精確化訓練。第一步,準確識別所構建標簽體系的內容,將判決書等文書進行碎片化處理,形成一個個碎片化的審查依據;第二步,將碎片化的審查依據基于知識的邏輯進行重組排列并一一對應起來,形成準確的類案推送結果。
(四)確定統一的證據證明標準
在立法上利用補充詳細的司法解釋等手段來實現法律適用統一,明確法律適用的范圍以及證據證明標準,基于辦案經驗及分析近年來的案件證據體系來確定案件的證據體系,輸出案件情形所需要的不同案件證據體系,明確各類案件情形證據的證明力及證明標準,確定統一的規則,形成完整證據鏈條。通過明確事實認定和情節認定的證據體系依據,增強辦案人員內心確信,提升整體辦案質量。
緩解人案矛盾以及統一法律適用是當下檢法系統面臨的更加迫切的問題,已經不斷有在這方面進行探索的產品應用的出現,但在調研的過程中不斷會收到基層辦案人員對于科技手段運用在辦案場景中表現出了極大的抵觸情緒和方案。如何緩解這一矛盾以及如何推動法律適用統一成為了當前比較迫切解決的問題之一。通過將大數據及人工智能技術融入司法辦案中,實現類案知識推送的精細化,是解決當前問題的重要舉措。我相信在不久的將來,人工智能能夠融入司法辦案過程中,與司法辦案過程緊密結合,實現“讓人民群眾在每一個司法案件中感受到公平正義”。