嚴劍漪
2017年7月10日,全國司法體制改革推進會在貴州省貴陽市召開,中共中央政治局委員、中央政法委書記孟建柱在會上強調,要以習近平總書記系列重要講話精神為指南,更加積極主動擁抱大數據、人工智能新時代。與此同時,一個神秘的“206工程”也在此次大會上揭開面紗。
司改目標+智能革命
在貴州大會召開的這一天,上海肇嘉浜路308號,一場如火如荼的研發已經悄然進行了整整154天。64位來自上海法院、檢察院、公安機關的業務骨干,215位科大訊飛公司的高精尖技術人員,夜以繼日埋頭研發,這一切,都是為了一個未來法院人工智能系統的橫空出世——“上海刑事案件智能輔助辦案系統”,又名“206工程”。
2017年2月6日,中共中央政治局委員、中央政法委書記孟建柱來到上海高院調研,也就在這一天,中政委明確要求,由上海高院研發一套“推進以審判為中心的訴訟制度改革軟件”,該軟件后被定名為“上海刑事案件智能輔助辦案系統”。
“黨的十八大以來,人民法院依法糾正了34件重大冤假錯案,這些冤假錯案之所以發生的一個很重要的原因,就是事實不清、證據沒有做到確實充分。”上海高院黨組書記、院長崔亞東說,“現在我們研發這套系統,一是要解決刑事案件辦案中存在的證據標準適用不統一、辦案程序不規范等問題;二是系統具有校驗、把關、監督功能,可以及時發現證據中的瑕疵與矛盾,及時提示辦案人補正或作出說明,確保提請逮捕、移送審查起訴的案件符合法律規定的標準,提升辦案質量和效率,實現防止冤假錯案、減少司法任意性、推進以審判為中心的刑事訴訟制度改革的目標”。
那為什么叫“206工程”呢?崔亞東笑著說:“因為交辦日期是2月6日,所以簡稱為‘206工程!”
2月中旬,上海高院成立了以崔亞東為組長的“206工程”領導小組及辦公室,辦公室下設業務組、技術組、綜合組和專家咨詢組。同時,經上海市委政法委同意,“推進以審判為中心的訴訟制度改革軟件”工作聯席會議制度建立。
緊接著,上海確定了33家法院、檢察院、公安機關作為試點單位,8個區級司法局和上海市律協作為調研單位,同步推進專題調研、數據整理與制定證據標準工作。上海高院先后組織了34次專題調研,收集到78條意見、建議,132條需求,收集公檢法系統案件電子卷宗、裁判文書、庭審筆錄、審理報告、退查退捕說明等資料16.55萬份。
專家經驗+模型算法
“人工智能最重要的三個環節,是專家經驗、模型算法和海量數據。”科大訊飛法院產品線產品部經理金澤蒙所帶領的軟件研發技術組常常在上海高院“206工程”研發基地開會討論到凌晨。那么,如何讓機器來學習人類的法律思維呢?
“我們預定了機器學習的規則,從統一證據標準、制定證據規則、構建證據模型三方面入手。”上海高院副院長、全國審判業務專家、“206工程”業務組負責人黃祥青介紹。
2月中旬,上海高院結合司法實踐,聚焦常見多發、重大、新類型等案件,選擇了7類18個具體罪名,逐項制定證據標準,計劃到2017年年底前分三批完成。
“證據規則,主要是針對單一證據而言,即按照證據‘三性的要求,在收集、固定、保存中所應遵循的規范。”黃祥青進一步解釋,為了配合系統研發,上海高院制定了上海刑事案件證據收集、固定、審查、判斷規則,對刑事訴訟法中的八類證據,詳細規定了收集程序、規格標準、審查判斷要點,對量刑證據、程序證據的收集、固定作了明確。
2月下旬,第一批證據模型構建小組也隨之建立。上海高院從高院、浦東、徐匯、虹口、長寧等法院抽調精兵強將,分別組成了命案組、盜竊罪組、電信網絡詐騙類案件組以及非法吸收公眾存款罪組4個組。上海浦東法院刑庭庭長、全國模范法官馬超杰是一位有著26年刑事審判經驗的學者型法官,他負責電信網絡詐騙和非法吸收公眾存款罪兩個證據模型小組的工作。他展示了一份模型構建材料,在密密麻麻的表格里,僅僅一個“電子數據”,就被細分為電話、電子文件、計算機日志、電子郵件、聊天記錄、網頁、IP地址、手機錄音、短信、第三方網絡支付平臺交易記錄等多種形式。
除了法院的專家團隊外,公安和檢察院的業務骨干同樣發揮了重要作用。
上海市檢察院偵查監督處的陳漫卿已經工作8年,對軟件開發很有興趣。2017年3月,她正式加入“206工程”,隨時與業務組、技術組溝通檢察院匯總的需求,其中文書導出、證據相似情況案件推送、辦案程序監督、社會危險性審查、檢察監督、量刑建議參考等需求功能被“206工程”采納。
智能識別+自動校驗
“目前,‘206工程主要由上海刑事案件大數據資源庫、上海刑事案件智能輔助辦案應用軟件、上海刑事案件智能輔助辦案系統網絡平臺三部分組成。”上海高院副院長、“206工程”技術組負責人郭偉清對人工智能技術已經非常熟悉。
截至6月底,上海刑事案件大數據資源庫匯集了1695萬條數據,其中案例庫案例9012個、裁判文書庫文書1600萬篇、法律法規司法解釋庫條文948384條、辦案業務文件庫各類規范性文件638件。與此同時,證據標準庫、電子卷宗庫將隨證據標準的制定及開發的案由同步更新。
“系統通過運用深度神經網絡模型和圖文識別(OCR)技術,基于對1.5萬余份卷宗材料的學習,初步實現了對各種證據的印刷體文字、部分手寫體文字、簽名、手印、簽章、表格、圖片等智能識別、定位和信息提取,對單一證據實現了自動校驗。”郭偉清說。隨著技術的不斷完善,未來的“206工程”將具備證據標準指引、單一證據校驗、逮捕條件審查、社會危險性評估、證據鏈和全案證據審查判斷、非法言詞證據排除等20項功能,其中13項已經完成,還有7項功能正在開發中。
5月3日,“上海刑事案件智能輔助辦案系統”正式試運行,6家法院、6家檢察院、13家公安機關試點單位上線。
“我輸入一個卷宗后,系統馬上提示我沒有附物品勘察清單。”徐匯公安分局漕河涇派出所民警俞昕體驗了一把“智能輔助”,“那個案子的犯罪嫌疑人是被群眾扭送到派出所的,作案工具同時被送到派出所,我是后到現場進行勘察,所以沒有關于作案工具的清單。我在備注欄里寫明情況,案子提交到了檢察院”。
徐匯檢察院公訴科檢察官許磊也有自己的用戶體驗:“過去我們拿到的是冷冰冰的卷宗,現在系統羅列出來的瑕疵可以幫助承辦人快速理清思路,找出辦案的關鍵點,這極大地提高了辦案效率,而且全程留痕,對落實司法責任制也有好處。”
截至6月底,“206工程”共錄入案件60件,錄入證據19316份,提供證據指引2622次,發現證據瑕疵點48個,提供知識索引查詢348次,總點擊量達5.6萬次。
“人工智能不是人的智能,當前人工智能的主流算法模型是深度神經網絡模型,這個模型優勢在于可以自學習,可以對學習過的知識聯想學習,但是訓練這個模型需要大量數據。目前,我們構建了一個‘206工程的初始模型,還得有專家知識供機器學習,隨著系統不斷被應用,提供的數據越來越多,我相信機器表現會越來越好。”金澤蒙說。
據悉,為了讓“206工程”這個初生“嬰兒”慢慢學習,研發團隊已進入小規模數據的人工標注階段,公檢法三家的業務骨干們對掃入系統的卷宗內容進行精細化標注。
法院的人工智能時代已經到來,未來的“206工程”會替代法官嗎?
“創造性思維是電腦永遠無法模擬的,‘206工程只是輔助辦案,法官可以借助它的技術手段來幫助判斷,但不可能被替代。”馬超杰說。
“系統的定位是‘智能輔助辦案系統,實際上是為法官、檢察官、偵查人員配備了一名‘智能辦案助手,不能理解為‘機器辦案,更不能理解為‘機器定案量刑。”崔亞東說。