舒怡 毛國慶
關鍵詞 “智慧法院” 智能化 信息化
基金項目:2018年度國家重點研發計劃項目“智慧法院綜合示范及效能評價”(項目批準號:2018YFC0831600)的階段性成果;課題名稱:“智慧法院總體設計、一體化應用平臺構建及綜合示范”的階段性成果(課題編號:2018YFC0831606)。
作者簡介:舒怡,北京國雙科技有限公司知識與數據智能中心知識架構部總監;毛國慶,北京國雙科技有限公司知識與數據智能中心知識架構部資深咨詢顧問。
中圖分類號:D926.2? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ?? ? ? ? ? ? ? ? DOI:10.19387/j.cnki.1009-0592.2020.10.031
2020年3月,中共中央政治局常務委員會召開會議提出,加快5G網絡、數據中心等新型基礎設施建設進度,新基建涉及諸多產業鏈,是以新發展理念為引領,以技術創新為驅動,以信息網絡為基礎,面向高質量發展需要,提供數字轉型、智能升級、融合創新等服務的基礎設施體系。新基建中,知識驅動是智能升級的核心,在建設體系設計中具有重要作用。在新基建背景下,結合司法改革和法院信息化建設的需求,知識也將成為智慧法院建設從信息化向智能化轉型的核心驅動[1]。2020年6月30日,周強院長在“扎實做好民法典學習貫徹實施工作”的講話中提到,“要加強智慧法院建設,加強數據中臺建設,強化在線服務,深化人工智能應用,強化大數據驅動,為準確適用民法典提供強有力科技支撐”;其中,將數據中臺建設和民法典適用相結合就是知識體系驅動信息化建設的一個最好場景[2]。
“萬物互聯、萬物皆數”時代,一方面數據量飛速增長,愈加呈現出多源、多態、高維和異構的大數據特點;另一方面人工智能等新興技術進入高速發展的快車道,從支持海量運算、復雜運算的計算智能、到基于大量學習語料的模擬感知智能、直至探索自動化的知識理解和知識推理能力的知識智能[3]。數據、信息、知識的DIKW金字塔框架模型的價值逐漸被重視,并從認知指導層面走向實踐指導層面。知識以及領域的知識體系成為信息化向智能化轉型的核心驅動。
從信息化建設的發展進程主要分為三個階段:IT(Information Technology)階段是傳統信息技術時代,通過ERP、OA等流程性、管理性系統,以業務參與人自主填報為信息采集的方式,實現線下業務電子化,線上業務數據化,以用數據記錄企業的業務活動為主要特點。DT(Data Technology)階段是大數據時代,通過數據倉庫、數據中心、數據平臺等數據處理技術,實現數據的集成化和標準化,以“全域”數據的匯聚、治理為主要特點。KT(Knowledge and Data Intelligence Technology)階段是知識智能時代,一方面通過機器學習、深度學習、神經網絡等人工智能技術,實現了數據知識化;另一方與專家知識工程相結合,構建領域知識圖譜,實現業務智能化,以基于領域知識圖譜的行業智能應用為主要特點。
(一)與傳統知識的比較
傳統的知識體系,是某一特定領域內學習、工作、研究的組織,通過長期的訓練所形成的一種“領域知識壁壘”。既有話語體系的壁壘、思維方式的壁壘,也存在應用技能的壁壘。傳統知識體系一般是封閉的,知識的演化和推進是逐步發展的,具有可解釋性的;知識的學習、理解和應用高度依賴于人。傳統知識體系在一定領域內既有理論預設又有經驗歸納[4]。一般體現為符號主義的專家系統。
傳統的知識體系,忽視了大數據及在沒有先驗理論的情況下從數據中提取知識或者見解能力。
(二)與大數據比較
首先,我們這里的大數據是廣義的大數據,既包括領域內能夠獲取的,具有信息價值的海量數據;也包括大數據挖掘相關的技術及挖掘結果。
海量數據和機器學習的技術突破,以及近年來人工智能在語音識別、圖像識別等感知智能場景中取得的突出成就,使得“大數據認識論”成為知識工程領域的新范式。“大數據認識論”是一種去因果分析的概率認知,即對給定數據集進行相關性變量挖掘。知識發現的過程由技術和算法驅動,沒有因果關系的介入。可以說大數據應用的最重要特征就是“追求相關、放棄因果” 。
大數據認知論在通識領域有很好的實踐,但進入專業領域,由符號主義的專家系統向連結主義的概率系統轉變出現了問題:第一,業務專家通過長期培訓形成因果性分析方法,機器學習的不可解釋性和專家的演繹思維發生沖突,使得機器學習的結果受到質疑,無法為專家提供知識輔助。第二,專家在個案業務處理過程中,依靠經驗直覺。很多影響因果判斷或者自由裁量的信息在過程中被逐步發現,逸散,無法沉淀為被學習的數據,進行機器學習。機器學習的結果精準度降低[5]。第三,政務、司法等業務辦理過程中,依賴的規則或者說原則是復雜的,存在沖突、說服、共識的交互機制。機器學習和概率論認知缺乏必要的理論博弈和說理交互。
當然,我們不是要在專業領域內排除“大數據認識論”,而是要分場景、分業務、分權重雙軌應用“決定論”(專家系統)和“概率論”(數學統計)。同時知識體系中涵蓋的“大數據”,既包括有信息價值的“數據”本身,也包括實踐中廣泛存在的基于學習算法而實現規律挖掘的“大數據智能”。下文中將在智慧法院場景下進行詳細闡述。
(一)法院現有業務支持系統可以分為案件辦理系統、信息公開系統、辦公系統
其中案件辦理系統集群,根據法院的業務流程,以及服務的對象、功能的不同分列為各個服務子系統。以審判過程中相關的系統集群為例,如電子送達平臺、破產平臺、減假暫辦案頻臺、審委會會議系統、庭審系統等,這些系統又和辦案平臺有一定的數據交互關系。上述系統的設計目標主要以無紙化辦公、業務流程管理為主,知識的應用內核較少[6]。智慧法院系統工作原理大體可以分為以下幾個部分:最高院系統中包括訴前、訴訟服務平臺、電子送達、全國執行管理系統、執行監控、失信懲戒以及司法管理系統等。通用業務處理平臺,其包括基礎平臺,訴訟類、審判類、執行類以及管理類通用組件。通用數據知識平臺,其中包括通用業務數據、通用知識、通用信息化運行數據、立案信息、道交糾紛信息以及信息系統運行數據平臺等幾個部分。除此以外,還包括外部系統,是執行聯動相關系統、公安、檢察院以及司法局等系統。對外還包括全國通用司法公開相關系統。
(二)“認知”智能對知識體系構建的要求
自2015年起,最高人民法院編制并滾動式修訂《人民法院信息化建設五年發展規劃》,對智慧法院建設提出頂層設計需求,智慧法院一體化應用體系初步形成。發布了《最高人民法院關于加快建設智慧法院的意見》,智慧法院信息化建設“互聯網+司法服務體系”逐步呈現。建立司法公開平臺:以中國裁判文書網、中國審判流程信息公開網、中國庭審直播公開網、中國執行信息公開網為核心,實現了公開平臺與各地辦案系統的對接;建立了司法大數據管理和服務平臺,實現了各地審判管理數據集中上報;建立人民法院信息可視化質效管控平臺,具備對信息化運行數據進行集中管理的技術框架。同時,也積極探索執行、人事管理、檔案管理、司法協助、破產重整、電子送達等全國統一系統。地方法院方面,智慧法院的頂層設計也有出臺,上海法院2016年底制定《“數據法院”建設發展規劃》(2017-2019),確定了法院信息化建設要以“一個戰略”(大數據戰略)“兩個行動(‘互聯網+‘人工智能+)”為驅動[7]。
在以上頂層設計設計之下法院信息化建設的發展體現出以下四個趨勢:
流程管理系統仍然為法院信息化系統的核心;但智能輔助應用增多,輔助應用或以模塊形式或以單獨系統的模式與流程管理系統進行數據交換。比如根據流程系統中案件數據推送知識的類案推送系統;根據OCR識別的起訴書,解析信息項幫助法官填報流程系統的江西法院E助理系統,以及服務開庭的庭審語音系統和遠程開庭系統等等的應用。
流程管理系統逐漸成為數據的采集和生成端,部分法院嘗試建設大數據平臺和數據中臺,以改變數據只能沉積在流程管理系統內,流程管理系統升級各對接應用系統均需要進行調試的狀況。大數據平臺和數據中臺的構建使得數據的存儲脫離了流程管理的場景,更多的數據可以向平臺中匯入,同時數據可以更好的進行融合、根據服務的不同業務需求進行異質性的標簽化處理,較好的解決數據應用標準和數據規范化問題。
數據利用增加,數據中臺的理念使得各法院對于數據的應用有了更大的想象空間。法院開始嘗試為當事人提供司法數據服務,基于數據統計分析的當事人司法輔助系統,調解平臺、問答系統在浙江、山東都有落地。
在數據利用增加的同時,知識的檢索、知識與辦案系統的結合也成為了新的信息化建設方向。比如2019、2020年兩次在最高法兩會報告中國提到的法信系統,為法官提供了法律法規、裁判文書、專家觀點、圖書期刊等多類知識數據,并實現各類數據之間的關聯。同時根據知識的分析和推送,優化的文書寫作系統,工具型系統也借助知識智能進一步升級,比如庭審語音系統,開始嘗試利用語音直接進行文書的生成,個別法院的遠程開庭系統法官端有法條檢索和知識推送的功能等。
當然智慧法院的應用也出現了一些問題,比如法律解釋是法律知識表達的核心問題,其中包含人類特有的價值和目的考慮,具有極強的主觀能動性。個案中,基于數據的概率計算結果能否正確替代知識表達,需要進一步的知識驗證。而現有系統,由于沒有對于知識的準確定義,知識查詢、知識推薦的結果差異較大。還比如有的人工智能模型開發所依托的數據不完整或者模型構建中因缺乏對法律常識的理解在數據采集上出現異質性偏差。這些問題可以用專家知識和專家經驗去進行修正。
以刑事犯罪網絡挖掘為例 ,如美國學者在描述犯罪網絡挖掘時所提供的資料顯示,不同的挖掘算法給出的結果是有差異的,和根據有經驗的檢察官給出的結論也存在一定的距離。因此在特定領域中,專家知識和專家經驗是非常重要的。
上述趨勢和問題實際上反映出的是智慧法院發展對“認知”智能發展的要求,而“認知”智能發展需要知識內核的驅動,對智慧法院知識體系構建提出要求。
不論以怎樣的方法開展智慧法院知識體系的建設,對于司法知識處理技術邏輯和流程是一致的。知識來源可以是文本型知識,也可以是實踐演繹型知識,知識初步處理后需要進行驗證與優化,驗證和優化后的知識都需要在司法場景中進行映射。在場景中映射的知識可以進行量化分析和趨勢分析,進一步對其中具有因果關系的部分進行影響機制分析。同時知識在處理后仍然作為知識流的一步分進行流轉,通過知識
庫和知識在應用系統中的嵌入實現知識對行為的干預,以及知識的有效性評價。司法知識的構建邏輯具體包括以下幾個方面:知識來源,主要是對文本型知識拆解,結合實踐演繹。進行文本型知識拆解與應用主要是初步構建、驗證與優化,知識在司法程序中的映射,結合實踐經驗中的知識積累,為文本型知識拆解提供幫助。之后進行知識體系運轉,進行數據統計、知識流轉。司法知識體系工程,通過本文類知識的拆解、應用以及知識系統評價;知識驅動的智慧法院建設;經驗知識的識別、驗證、評價以及積累。
知識以及領域的知識體系成為信息化向智能化轉型的核心驅動已經成為行業共識和建設的發展方向。現階段,知識內核對于一般的司法行為或者行政行為不應盲目直接干預,更需作為一種決策輔助手段予以提供。這是因為,一方面專家系統或數據挖掘所提供的知識,往往是有局限性的,是“過去”的探索結論;在新的環境下,新的信息可能難以被捕捉,以致無法影響現有知識內核系統得出“新”的結論和建議。另一方面,人的價值判斷是司法和行政行為中非常重要的環節,比如“比例原則”的適用,往往需要具體事件在具體環境中考量,這一部分價值判斷是目前的知識內核系統無法替代的。
注釋:
王祿生.論法律大數據“領域理論”的構建[J].中國法學,2020(2).
楊燾,楊君臣.人工智能在司法領域運行的現狀及完善對策研究——以成都法院為樣本進行分析[J].科技與法律,2018(3)(總第133期).
PaoloCampanaa, FedericoVareseb:Studying organized crime networks: Data sources, boundaries and the limits of structural measures,Paolo Campana and Federico Varese, Social Networks, https://doi.org/10.1016/j.socnet.2020.03.002.
參考文獻:
[1] 楊臨萍.司法體制改革與智慧法院的實踐與探索[M].法律出版社,2019.
[2] 呂艷濱.人民法院信息化3.0版建設應用評估報告以山東法院為視角[M].中國社會科學出版社,2017.
[3] 王昊奮,漆桂林,陳華鈞.知識圖譜:方法、實踐與應用[M].電子工業出版社,2019.
[4] 趙軍.知識圖譜[M].高等教育出版社,2018.
[5] 曾鯤.大數據時代如何構建智慧法院——以1059名法官的訪談實錄為樣本[J].東南司法評論,2019(9).
[6] 黃曉云.智慧法院:以現代科技應用助推司法改革[J].中國審判,2017.
[7] 高曉桐.關于智慧法院建設現狀的思考[J].法制博覽,2019(8).