朱福勇,龍依雯,王 凱
(1.西南政法大學 人工智能法學院,重慶 401120;2.中經柏誠科技(北京)有限責任公司,北京 100096)
早在1970年,布坎南(Buchanan)與亨德里克(Hendrick)發表《關于人工智能和法律推理若干問題的考察》一文[1],拉開了司法裁判領域人工智能研究的序幕[2]。作為人工智能的核心內容,推理是從一個或幾個已知的判斷(前提)推出新判斷(結論)的過程[3],在人工智能步入以深度學習為主導的階段,推理技術亦與此保持同步發展,將規則演繹系統、專家系統、機器學習、貝葉斯網絡、知識圖譜乃至事理圖譜等先進的推理技術[4]應用但不限于制定法的規則之中,將在一定程度上提升訴訟風險知識庫和訴訟風險預測的準確度。實踐中,我國人工智能推理規則在訴訟風險預測的應用上處于初級層面,其面臨訴訟風險規則知識庫匱乏和訴訟分析方法技術不高兩大挑戰,而理論界對此關注不多。隨著最高人民法院2019年《工作報告》“全面建設智慧法院,發揮司法大數據管理和服務平臺作用,為群眾訴訟提供服務,為科學決策提供參考”的提出[5],人工智能推理在訴訟風險分析中的研究顯得極為必要和迫切。為此,本文通過對500件案例類型化后的隨機調取,并收集起訴狀、證據、案情和裁判文書,在解析多方證據關聯分析模型的基礎上,依據法律法規中的風險點,設計開發訴訟時效性規則知識庫、當事人行為規范性規則知識庫及證據有效性規則知識庫,結合多方證據關聯模型,融合法律法規知識庫和訴訟風險規則知識庫,運用決策樹算法、關系網絡推理方法列舉分析可能存在的訴訟風險點,以期精準識別訴訟風險,為民眾提供全面的訴訟決策指引有所裨益。
訴訟風險是指當事人在訴訟活動中可能遇到的一些爭議事實以外的因素,這些因素會影響案件的審理和執行,使得當事人通過訴訟以期保全的法益增添無法實現的風險[6]。這些風險集中于證據有效性、訴訟時效性以及當事人行為規范性等方面。在此,本文以民間借貸糾紛為例,以當事人起訴為視角,對上述三個方面分別進行分析。
1.證據有效性
在司法理論和實踐中,證據有效性主要從證據能力和證明力兩個方面進行判斷。前者是指證據資格有無的問題,后者是指證據對案件事實的證明程度或者影響力,證據證明力大小取決于證據與待證事實之間的關聯程度,證據是否可靠及其有多大證明價值,由法官進行判斷,屬于法官依法心證的范疇。而這正是證據采信標準所要解決的問題,即證據的證明力問題[7]。在民間借貸糾紛中,當債權憑證、借款支付憑證、還款憑證等不是原件且與原件不相符時,或者上述憑證不具備真實簽章或公證時,存在證據不真實的訴訟風險。支付憑證、還款憑證、鑒定意見等出具主體不合法,或者證據形式與法律規定不相符,或者證據搜集程序違反法律規定,則存在著證據不合法的訴訟風險。上述憑證以及借還款事實佐證、視聽資料、鑒定意見等與起訴狀中相關信息比對不一致,則存在證據無關聯性的訴訟風險。對于舉示證據的一方與證人有利害關系,或者本金、利息、違約金、還款時間、還款金額等與起訴狀、證人證言、視聽資料中相關信息比對不相符,則構成證明力降低的訴訟風險。對證據來源的可靠性分析,需要結合舉示證據的一方或者證人的知識水平、身份和動機進行分析,而判斷證據內容是否可信,則需要就證據內容的可能性、一致性、合理性與詳細性一并考慮。對證明價值的評判是法官對證據內容、意義在法律上所做出的價值判斷,需要按照先單個證據或單組證據、后全部證據的順序進行。上述情形只要存在些許瑕疵,則可能會產生證據證明力銳減甚至喪失之風險。
2.訴訟時效性
權利人在法定期限內不行使權利,其權利即依法消減的時效稱為消滅時效,我國民法稱其為訴訟時效[8]。從《人民法院民事訴訟風險提示書》規定來看,原告訴至法院后,被告提出原告起訴已超過法定的保護期間,而原告未對被告主張的事實提供相反的證據證明,其訴請難以得到法院支持。我國《民法典》第188條規定,在民間借貸糾紛中,超過訴訟時效的風險主要有兩種情形:一種是借據、收據、欠條等債權憑證約定還款期限到期產生的風險:借款日期到訴訟風險評估之日,超過20年或催款時間到訴訟風險評估日期超過3年;另一種是上述借款憑證未約定還款期限,起訴狀、借還款佐證(證人證言、微信/支付寶/短信等)信息中有債權人催款、債務人無意還款的語義及時間,催款時間到訴訟風險評估日,時間超過3年。
3.當事人行為規范性
按照我國《民事訴訟法》第121條的規定,起訴狀應當記明當事人的基本情況、訴訟請求和所根據的事實與理由、證據和證據來源、證人姓名和住所等內容。對于當事人提供的基本情況或者信息不全,訴訟請求和所根據的事實與理由含糊不清、模棱兩可,證據和證據來源、證人姓名和住所缺失,以及起訴狀未寫明日期或無原告簽章等,均存在起訴行為不規范之風險。與此同時,還存在以下訴訟行為不規范之風險:訴訟主體不適格、管轄權錯誤等情形。
依據我國訴訟法及其司法解釋的規定,通過對裁判文書、當事人舉示的證據材料和電子卷宗等樣本的收集、梳理、數據加工,適用關鍵句篩選、句法分析、模式匹配和分類預測等技術,通過Bootstrapping[9]等樣本采樣和多分類器投票算法進行風險規則和數據關系的高效抽取,可以構建訴訟風險規則知識庫,由分析規則和數據關系構建事理圖譜,最終形成訴訟風險規則模型(見圖1)。

圖1 訴訟風險規則知識庫的構建模型
1.訴訟風險規則知識庫的歸入
規則知識庫將專家對某個領域的經驗知識轉化成通用規則,通過匹配輸入信息和規則知識庫前提條件推出結果[10]。它“涵蓋大量的程序性概念和關系、相關實體之間關系的推理邏輯,集成的數據層和模式層,以及規則模型與推理模型,使當事人能夠自助獲取專業化訴訟意見,正確評估訴訟走向,形成合理的訴訟預判,減輕當事人的訴訟成本,分流非必要訴訟”[11]。以民間借貸糾紛為例,訴訟風險規則知識庫構建采用如下方法。
首先,對訴訟法及其司法解釋分別進行分句數據加工、文本分析、關鍵句篩選、句法分析,運用NLP技術[12],挖掘民間借貸糾紛潛在的訴訟風險點。
其次,通過剔除語義噪音,利用觸發詞[13]、模式匹配和分類預測,從文本中完成相關句子的篩選,將民間借貸糾紛訴訟風險點根據特征相似度分別歸入行為規范性、訴訟時效性、證據有效性,并將其標簽化,建成通用的數據模型,形成民間借貸糾紛訴訟風險規則。
最后,對證據有效性法條識別并分類時,將我國《民事訴訟法》第67條和第70條第1款等法條梳理得到的訴訟風險規則歸入證據有效性風險規則知識庫;對訴訟時效性法條識別并分類時,將由《民法典》第188條等規定總結得到的訴訟風險規則歸入訴訟時效性風險規則知識庫;對行為規范性法條識別并分類時,將由《民事訴訟法》第119條和第143條等規定梳理得出的訴訟風險規則歸入行為規范性風險規則知識庫。
2.訴訟風險規則模型的形成
在證據關聯分析模型的基礎上,基于多方證據、裁判文書和電子卷宗等文書以及海量案件信息,從不同類型案件進行證據的特征提取和規律描述,標記多方證據之間的邏輯關系,利用貝葉斯網絡[14]選取概率最大的證據鏈作為最優可信的證據鏈條。在技術上,采用Bootstrapping等樣本采樣和多分類器投票算法進行風險規則和數據關系的高效抽取,使風險規則的關鍵詞與證據關聯模型中的最優可信證據鏈的證據要素相匹配。例如,依據我國《民事訴訟法》第70條第1款的規定,提取訴訟風險規則中的“書證”,與證據要素庫中的“債權憑證”“借款支付憑證”“還款憑證”等證據要素進行匹配,將其作為構建事理圖譜的最小單位。在此基礎上,形成訴訟風險規則模型。從結構上來看,事理圖譜是向與環的結合,節點指向事件,向邊表示事件之間的關系,它依循邏輯序列,通過對類案證據的梳理和學習,按照支持度和置信度,以及邏輯關系形成一定的規則,輔之以法律專家意見,提升證據鏈條的精準性[15]。例如,在民間借貸糾紛中,假設存在借貸關系,“張通過銀行轉賬借給王1萬元”“李為王提供一般保證”,事理圖譜有助于對張的訴請是否超過訴訟時效、訴至法院后證據鏈條是否閉合的判斷,以及進一步預測能否通過要求李承擔保證責任來實現1萬元的債權等,對各個法律事實內在邏輯進行深入挖掘,得出因果、順承邏輯關系,形成一個對訴訟風險進行預判的完整體系。證據真實性訴訟風險規則事理圖譜包括“證據是否為原件、復制件與原件是否相符”和“是否具備有真實簽章或公證”兩個部分。將“債權憑證”“借款支付憑證”“還款憑證”“借、還款事實作證”整合到證據真實性風險規則中,即可形成證據真實性訴訟風險規則事理圖譜,進而由證據能力、證明力、訴訟時效、起訴要件等規則構建訴訟風險規則模型。
規則推理是專家系統中常用的推理機制,其為基于規則表示的知識系統,主要采用規則知識庫推理生成問題解決結果[16]。基于訴訟風險規則模型,依托多方證據關聯模型,結合證據條件可信評估方法,圍繞訴訟請求,采用關系推理網絡正向推理,得出對訴訟時效性、行為規范性、證據有效性的風險識別與預測。由于上述“三性”所涉問題判別的特征顯著,采用淺層判別模型便能以較小的成本實現風險的預測,因此,采用決策樹的ID3算法,輸入訴訟證據向量,輸出對訴訟規范性、行為規范性和證據合理性的二分類,進行訴訟風險預測與評估。
通過對多方證據、訴訟材料、裁判文書和電子卷宗等研究載體中的有效信息的實體識別和證據特征提取、歸類、去噪等規范化、格式化處理,得出最優可信證據鏈的結構化證據,作為數據來源輸入訴訟風險規則模型。同時,結合訴訟風險規則知識庫,對訴訟風險規則的關鍵詞與證據關聯模型中的最優可信證據鏈的證據要素進行匹配(見圖2),奠定下一步操作之基礎。

圖2 訴訟風險規則數據來源及特征向量的提取
訴訟風險規則特征向量的提取方法是:根據結構化的證據要素模型,基于訴訟請求、案件事實輸入多方證據關聯圖譜,由訴訟風險規則知識庫和相關證據條件可信評估概率對訴訟證據進行特征提取和量化,將離散證據要素轉變為特征向量。例如,在民間借貸糾紛中,證據真實性訴訟特征設計與量化是通過“證據是否是原件或與原件是否相符”將數據分為兩類:若不是原件或者復印件與原件不符,則定義為有違反證據真實性的風險,編碼為1;反之,進入二級分類。以“證據是否具備真實簽章或公證”為標準,將數據分為兩類,即若具備,則定義為無證據真實性風險,編碼為0;若不具備,則定義為有證據真實性風險,編碼為1(見表1)。通過二層級別分類,篩選出無真實性瑕疵的證據,此為將證據特征化的必須操作。

表1 民間借貸糾紛中證據真實性訴訟特征設計與量化
與此同時,在訴訟時效性、行為規范性、證據有效性的風險輔之“設定選項”“問答”方式輸入,使特定向量的提取更加明確。這里以自然人之間民間借貸糾紛(非擔保型)為例予以說明。
問題1:出借人是否有借款支付憑證?(*)
A.銀行匯款憑證 B.現金憑證 C.微信/支付寶轉賬憑證 D.無借款支付憑證
選擇A對應的特征意義:銀行匯款支付憑證合法
(問題1選擇B的進行此項提問)問題2:現金收據憑證是否有債務人簽字或蓋章?(*)
A.有債務人簽字或蓋章 B.無債務人簽字或蓋章
選擇A對應的特征意義:現金收據支付憑證合法
選擇B對應的特征意義:債務人名稱不匹配或沒有簽字/蓋章的,現金收據支付憑證合法性存在問題
(問題1選擇C的進行此項提問)問題3:微信/支付寶轉賬憑證是否通過鑒定?(*)
A.通過鑒定 B.未通過鑒定/未鑒定
選擇A對應的特征意義:電子證據借款憑證與原件相同
選擇B對應的特征意義:電子證據借款憑證的真實性存在問題
(未識別到借款憑證的進行此項提問)問題4:是否訂立書面的借款合同或借據?(*)
A.訂立書面借款合同或借據 B.未簽訂書面借款合同或借據
問題1選擇A/B/C,問題4選擇A/B的風險結果:自然人之間的借款憑證可以采用書面形式或者口頭形式,自出借人提供借款時生效。認定出借人已向借款人交付了借款可以從如下五個方面進行判斷:(1)自借款人收到現金款項時;(2)自資金到達借款人賬戶時;(3)自借款人依法取得票據交付權利時;(4)自借款人依法取得對特定資金賬戶實際支配權時;(5)按照約定并實際履行完成時。
問題1選擇D,問題4選擇A/B的風險結果:自然人之間的借款合同可以采用書面形式或者口頭形式,但合同的訂立并不意味著借款合同的生效。自然人之間的借款合同,自出借人提供借款時生效。出借人無支付憑證或尚未將借款交付給借款人,故而借款合同雖已成立但未必生效。
(問題4選擇A的進行此項提問)問題5:借款憑證是否有雙方簽字或蓋章?(*)
選擇A對應的特征意義:借款憑證合法
選擇B對應的特征意義:借款憑證缺少簽字/蓋章,合法性存在問題
(未識別到借款憑證借款金額,如未上傳支付憑證補充信息)問題6:借款實際金額為人民幣____元。
(借款憑證-借款信息-借款金額)(銀行匯款單/現金收據-匯款金額/收款金額)(支付寶/微信轉賬憑證-轉賬金額)
(未提取到約定利息的進行此項提問)問題7:借款是否約定了利息?(*)
A.未約定利息 B.約定年利率為____%(書證-借款憑證-借款信息-約定利息)
(未提取到逾期利息或違約金的進行此項提問)問題8:是否約定了逾期利率?(*)
A.未約定逾期利率 B.約定了逾期年利率為____%(書證-借款憑證-借款信息-約定違約金)
薪酬獎勵是激發員工工作熱情、提高工作效率的最有效最直接的方式,酒店可以針對那些對薪酬不滿意的員工采取薪酬激勵來留住員工,但前提是酒店一定要完善獎勵制度并嚴格執行,否則會適得其反。因此酒店可以通過建立合理的獎勵制度來留住員工。酒店的獎勵制度一定要公開透明,讓員工知道酒店是公平公正的,并且是有理有據的,這樣才能讓員工信服。同樣的,若是員工未達到相應的崗位要求或者做出對酒店不利的事情,也應適當的予以懲罰,
(未提取到約定還款日期的進行此項提問)問題9:是否約定了還款時間?(*)
A.未約定還款日期 B.約定了還款日期,為____年____月____日(書證-借款憑證-借款信息-約定還款日期)
(未提取到還款支付憑證的進行此項提問)問題10:被告是否有還款行為?(*)
A.有 B.無
(問題10選擇A的進行此項提問)問題11:還款實際金額為人民幣____元(加入借款憑證-借款信息-借款金額)
(問題9選擇A的進行此項提問)問題12:目前是以下哪種情況?(*)
A.借款日期到現在已超過20年 B.借款日期到現在未超過20年,距離上次向被告主張還款已經超過3年 C.沒有上述情況
選擇A/B對應的風險結果:已超訴訟時效。對已超訴訟時效的訴訟請求,法院受理后,對方當事人提出該訴訟抗辯,經查明,無中止、中斷、延長事由的,將判決駁回該訴訟請求;對方當事人未提出該訴訟抗辯,則視為其自動放棄該權利,法院不得依照職權主動審查。
選擇C對應的風險結果:未發現訴訟時效風險。權利人在法定訴訟時效期間內提出訴訟請求的,法院應當受理并支持其訴訟請求。
問題13:借款發生時,借款人處于何種婚姻狀況?(*)
A.婚姻關系存續期間 B.離婚后 C.未婚
(問題13選擇A的進行此項提問)問題14:請問借款人配偶是否在借貸合同上簽字?(*)
A.配偶有簽字 B.配偶未進行簽字
(問題13選擇B的進行此項提問)問題15:借款用途是以下哪種情況?(*)
A.家庭日常 B.夫妻雙方共同經營公司或其他業務 C.沒有上述情況
(加入借款憑證-借款信息-借款原因)
選擇A對應的風險結果:夫妻均在貸款合同上簽字或者夫妻一方事后追認等共同意思表示所負的債務,一般認定為夫妻共同債務。因此,借款應當由夫妻共同償還。
選擇B和選擇A對應的風險結果:在婚姻關系存續期間,夫妻一方以其名義為家庭日常生活需要所負的債務,應界定為夫妻共同債務,由夫妻共同償還。
問題14選擇B,問題15選擇B對應的風險結果:夫妻一方在婚姻關系存續期間以個人名義為夫妻雙方共同經營的公司或其他義務所負債務,為夫妻共同債務,應當由夫妻借款人共同償還。
問題14選擇B,問題15選擇C對應的風險結果:在婚姻關系存續期間,夫妻一方以個人名義超出家庭日常生活需要所負的債務為個人債務,應界定為非夫妻共同債務。
問題16:借款人是否有如下行為?多選(*)
A.未按照約定用途使用借款 B.未按照約定還款及付息
選擇A對應的風險結果:借款人未按照合同約定的借款用途使用借款的,借款人構成違約。
選擇B對應的風險結果:借款人收取借款后,未按照借款合同的約定返還借款、支付利息的,借款人構成違約。
問題17:原告是否出庭?(*)
A.單獨出庭 B.與委托代理人一同出庭 C.由委托代理人代為出庭 D.不出庭,也無委托他人代為出庭
選擇C對應的風險結果:由代理人或律師代替出庭可能會增加訴訟風險。委托代理人無法真正代替當事人的位置,當事人本人沒有出庭有些事實很難查清,會拖長審理期限。在當事人本人不出庭的情況下,當事人的知情權會受到影響,會弱化當事人對訴訟代理人的監督。如果委托代理人與當事人本人就案件事實向法院所作陳述不一致的,以當事人本人的陳述為準。如沒有特殊情況,建議當事人和委托代理人一起出庭。
選擇D對應的風險結果:本人不出庭,沒有其他人代替出庭的訴訟風險極高。根據民事訴訟法有關規定,對不按時出庭或者中途退庭,經傳票傳喚,無正當理由拒不到庭,或者未經法庭許可中途退庭的原告,法院依法按自動撤回起訴處理。
(如有上傳證人證言的進行此項提問)問題18:證人是否可以出庭作證?(*)
A.是 B.否
選擇B對應的風險結果:除法律和司法解釋規定的證人確有困難難以出庭的情形之外,當事人提供證人證言的,證人應當出庭作證并接受質詢。證人不出庭作證的,可能影響該證人證言的證據效力,甚至不被采信。
問題19:雙方當事人是否有以下情形?(*)
A.一方或雙方是外國人或港澳臺居民 B.借款借出地在國外或港澳臺地區
選擇A對應的風險結果:若當事人一方或雙方為外國人或者港澳臺地區的居民,即本案具有涉外因素,需按照涉外民事訴訟的相關規定確定管轄權。
選擇B對應的風險結果:如果借款是在境外借出的,即本案具有涉外因素,需按照涉外民事訴訟的相關規定確定管轄權。
(未提取到借貸憑證中有爭議解決約定的進行此項提問)問題20:雙方當事人有無約定爭議解決方式?(*)
A.已明確約定法院管轄 B.已明確約定仲裁解決 C.未明確約定爭議解決方式
選擇A對應的風險結果:在符合法定起訴條件的情形下,可以向具有管轄權的人民法院提起訴訟。
選擇B對應的風險結果:不符合法院起訴條件,請向爭議解決約定仲裁委提起仲裁裁決。對仲裁裁決不服,可申請法院撤銷。
選擇C對應的風險結果:在符合法定起訴條件的情形下,可以向具有管轄權(被告所在地或合同履行地)的人民法院提起訴訟。
決策樹是一種用樹形結構構造的分類模型,其為倒樹結構,由根結點、內結點、葉結點和邊組成,其中根節點是最“源頭”的結點,是決策樹的始端,葉節點包含特征屬性測試條件,每個葉節點代表一個類別,其功效在于分類或者回歸,即在對決策樹上的每一個內部結點分析和判斷的基礎上,獲得一個子結點的結果。ID3算法是決策樹的一種,采用自頂向下的貪婪搜索遍歷數據集來建立預測模型[17]。它是以信息增益為標準,選擇決策樹的節點。信息熵[18]可以描述信息的不確定性,信息熵與不確定性具有正向相關性,即信息熵愈大,由此帶來的不確定性愈高。計算信息熵的公式如下
(1)
(1)式中,D表示隨機變量,pk表示隨機變量的可能取值k所占的比例,k的取值范圍是從1到K;定義為集合D的經驗熵Ent(D)與特征a給定條件下D的經驗條件熵Ent(D,a)之差即為特征a對訓練數據集D的信息增益Gain(D,a)[19]。計算信息增益的公式如下
(2)
(2)式中,Ent(D)為數據集D的熵,Ent(Dv)是數據集Dv的熵,Dv是D中特征a取第v個值的樣本子集,V是特征a取值的個數。由公式選擇最優子項繼續向下分裂建樹,最優的子項同樣具備最強的分類能力,通過對信息增益最大的特征為決策樹一個節點的選取,旨在以此遞歸,進而獲取整個決策樹[20]。
利用ID3算法進行決策判定,以“是否是原件或者與原件相符的復印件”為分裂屬性,則產生兩個子集,其加權和為0.5,信息增益為0.5;以“是否具有真實簽章或公證”為分類屬性,則產生兩個子集,其加權和為0.5,信息增益為0.5。通過計算得出,二者信息增益值相等,不妨以“是否是原件或者與原件相符的復印件”作為決策樹的根節點,通過遞歸形式對子節點分類,可得出各層節點(見圖3)。

圖3 民間借貸糾紛中部分證據真實性決策樹建構圖
輸出末端節點,整合為格式規范的對應于訴訟時效性、行為規范性和證據有效性預測的二分類預測。例如,在民間借貸糾紛中,債權憑證不具有真實的簽章,則輸出“債權憑證有違反證據真實性的風險”之結果。
在理論推演和解析的基礎上,采用HTML、CSS程序語言,使用Access數據庫作為在線數據庫形成訴訟風險分析預測規則知識庫,開發了一款訴訟風險預測工具(見圖4)。目前,涵蓋借貸糾紛、婚姻家庭、勞動爭議、工傷賠償、房產糾紛、交通賠償、遺產繼承等,進入訴訟風險分析與結果預測平臺,按照案件的性質,根據流程填寫相關信息,能夠在線出具專業性的訴訟結果預測意見書。

圖4 訴訟風險預測工具
下面選取一個民間借貸糾紛實例予以演示,表2為源糾紛屬性,通過人工分析得出訴訟風險分析結果(見表3)

表2 源糾紛屬性

表3 人工訴訟風險分析結果
在預測工具頁面內直接上傳民事訴狀、借款、支付憑證等信息,使其主動獲得目標案例屬性值,如有需特別提問的問題或未檢測到需上傳的重要信息,可通過問與答的形式輸入,如圖5將源糾紛民事起訴狀等信息和所回答的重要問題生成訴訟風險分析與結果預測意見書(見表4)。

圖5 糾紛信息和重要問題問答系統
通過對比表3人工訴訟風險分析結果和表4訴訟風險分析與結果預測意見書,可以發現人工智能分析不僅涵蓋了人工分析的結果,而且給當事人提出更多訴訟風險分析與結果預測意見書的實用建議,初步證明了在本文理論基礎上,設計的訴訟風險預測工具的有效性和可行性。

表4 訴訟風險分析與結果預測意見書
為了保證實驗結果更具說服力,在最高人民法院案例庫中隨機選取民間借貸糾紛、追索勞動報酬糾紛、機動車道路交通事故損害賠償糾紛、法定繼承糾紛和房屋租賃合同糾紛5類案件各100個案例進行測試,采用混淆矩陣[21]對人工智能訴訟風險預測工具進行性能評估(見表5)。
混淆矩陣對角線元素表示各風險類別能夠被工具正確預測的數量,由表5數據可知,訴訟風險預測工具的準確率達到78%,說明其對實際案例適用已達至一定水平,多數情況下,與人工分析相比,混淆矩陣的效率性和準確性均得以體現,整體運行效果良好,將該工具用于實踐具有可行性。但是,該工具不能預測出部分訴訟風險結果,原因在于,其規則知識庫和推理機制在模型優化過程中還有進一步發展的空間。但這并不意味著這類風險預測工具的分析性能較之人工分析能力不堪一擊,相反,在優化模型與增大數據樣本、擴大數據庫容量的基礎上,人工智能訴訟風險預測的未來具有相當的可期待性和市場競爭力。

表5 訴訟風險預測的混淆矩陣
本文通過模式匹配、分類預測等推理技術構建了訴訟時效性、當事人行為規范性、證據有效性三個規則知識庫,運用事理圖譜、決策樹等推理技術設計出可行的訴訟風險預測模型,并基于本文理論研發了風險預測工具且進行實例測試。在驗證本文理論的可操作性及實用價值的同時,78%的準確率表明其在相較人工分析的高效基礎上準確率也較高。然而,“法律是灰色的,而生活之樹常青”,我們應當看到現實紛爭具有復雜性,現有的知識規則庫難以完全覆蓋,人工智能也可能因無法自主完成沖突規則、選擇規則、規則缺漏和適用規則導致個案處理不公正等情形的處理,其分析速度和程序、價值判斷,以及處理路徑還存在著進步空間。未來,更多的法律規則將被納入風險規則知識庫并實時更新,通過優化算法、提高機器運行速率等方式,人工智能分析速度、準確性和推介路徑將得到不斷提升,從而更好地提高人工智能訴訟風險分析的實用價值和用戶使用體驗。當然,更加成熟的訴訟風險分析應用于人工智能訴訟結果的預測,為其提供評估結果輸入服務和風險識別技術支撐,也會最終應用于人工智能訴訟風險分析和結果預測平臺的研發。技術革新常常帶來社會的變革,人工智能技術在訴訟領域的深度運用必將掀起法律服務產品標準化推廣的浪潮,引領法律科技市場的蓬勃發展,在算法的縝密推理和代碼的敲擊聲中開啟一個嶄新的司法時代。