李建平 韓建軍 楊雅冰
摘要:人工智能已經影響到社會的各方面,成為生產力發展的重要推動力量。在法律領域,人工智能也逐漸發揮出重要作用。將人工智能技術運用于法律領域有助于滿足社會對高質量法律服務的需要。文章梳理了國內外人工智能技術在法律信息檢索的研究進展情況,并分析了智能化法律信息檢索的發展趨勢。指出建設工程領域的法律糾紛具有顯著的技術特征,法律關系較為復雜,在這樣的垂直領域,結合了知識圖譜的人工智能技術將有助于建立更加客觀、公正的類案檢索系統,從而促進法律的統一適用。
關鍵詞:人工智能;法律;類案檢索;建設工程
中圖分類號:TP391.1? ? ? 文獻標識碼:A
文章編號:1009-3044(2023)35-0016-04
開放科學(資源服務)標識碼(OSID)
0 引言
隨著科技的發展,人工智能已經滲透到生產、生活的各方面,成為生產力發展的重要推動力量。在法律領域,人工智能也逐漸發揮出重要作用,國務院于2017年7月發布《新一代人工智能發展規劃》提出要“建設集審判、人員、數據應用、司法公開和動態監控于一體的智慧法庭數據平臺,促進人工智能在證據收集、案例分析、法律文件閱讀與分析中的應用,實現法院審判體系和審判能力智能化。” 2021年3月,十三屆全國人大四次會議通過的《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》明確提出要進行加強智慧法院建設。2021年12月,國家發改委印發《“十四五”推進國家政務信息化規劃》,提出要構建以審判為中心的業務協同辦理平臺,提升“智慧法院”“智慧檢務”“智慧司法”應用水平和協同能力,提高審判執行、多元解紛、司法公開、法律監督、刑罰執行、法律服務、協同辦案的智能化水平。
人工智能應用于法律領域成為學科交叉融合的新熱點,并且產生了將數量化方法及計算機應用于法律領域的新學科,即計算法學[1]。現階段,我國司法領域的人工智能應用主要包括兩方面:文書制作電子化及司法信息數據化[2]。2017年4月20日,最高人民法院印發《最高人民法院關于加快建設智慧法院的意見》,2018年1月3日,最高人民檢察院印發的《最高人民檢察院關于深化智慧檢務建設的意見》,上述文件成為法檢系統智能司法平臺建設工作的指引。由此可見,隨著我國人工智能產業的不斷發展,人工智能與法律行業將更加深入地結合,在提高工作效率、維護社會公平、促進經濟發展等方面發揮顯著的作用。
另一方面,為統一法律適用,提升司法公信力,類案檢索在我國司法實踐中發揮出越來越重要的作用。2020年7月31日開始實施的《最高人民法院關于統一法律適用加強類案檢索的指導意見(試行)》將類案檢索定位為具有中國特色的、成文法體系下的具體制度,旨在實現法律的統一適用。2021年12月,《最高人民法院統一法律適用工作實施辦法》開始實施,進一步規定了類案檢索的適用情形和檢索范圍。
目前的案例檢索系統多以標簽的匹配進行類案搜索,匹配準確度和推送的案例質量尚不能滿足實際要求,改進類案檢索技術需要努力思考如何將人工智能領域先進的算法與法律行業的特性結合起來[2-4]。
1 智能化法律檢索的國內外發展現狀
法律的信息檢索走向智能化是必然發展趨勢[1]。國際人工智能與法律協會(IAAIL) 在1991年的成立,標志著法律人工智能逐步走向成熟,法律人工智能包括了概念上的或者基于模型的法律信息檢索等十大主要議題[5]。
根據用戶的請求,自動提取法律數據庫信息并進行判例信息檢索是對于正確處理各類案件具有重要意義[6]。基于人工智能的具有自然語言處理能力的檢索系統不但能夠提高律師的工作效率,而且可以極大地降低司法成本[7]。智能化、自動化的法律檢索將成為“人工智能+法律”的重要趨勢[8]。法律信息智能檢索可以理解待決案案情并自動識別檢索信息,從而能夠較為精確地檢索到匹配信息。整個工作全部自動化,可以提高法律工作者的工作效率。同時,精準高效的法律信息檢索可以推動法律文件自動化分析、生成及基于判例的案件預測,給法律行業帶來更深刻、更徹底的變革。
為實現高效精準的法律信息檢索,傳統的檢索方式已經不能滿足需要,隨著信息技術的發展,諸多先進技術手段被應用于法律信息智能檢索,主要進展包括:
1.1 相關性
在檢索過程中,輸入信息與輸出信息的相關性對于判例信息檢索具有關鍵作用,Opijnen等[9]提出了一種用于法律案例檢索的概念框架,該框架采用了一般信息檢索科學中使用的關聯維度類型學,并結合了法律信息檢索的特點,可以按照信息的相關性進行檢索,從而快速準確地查找到所需的案例信息。
1.2 本體論
人工智能領域,本體就是一個概念化的過程,也即是描述世界上的對象、概念、其他實體(或實體的一部分)以及它們之間的聯系[10]。法律本體專注于法律概念及其關系的知識表示,法律本體包含用于表示法律概念和規則的信息[11]。Asunción等[12]提出基于本體的法律檢索方法EgoIR,這種方法是在電子政務環境中使用法律本體論開發的。Cornoiu等[13]提出了一個法律信息檢索模型,該模型利用法律本體的功能,采用從維基百科中提取的法律本體。而一個混合了Eurovoc同義詞表模式本體和法律本體的標簽的模型被用來豐富法律領域的信息檢索能力[14]。Rodrigues [15]等人提出了沿特定維度對法律本體進行分類的方法,進而利用法律本體建立起更高效的信息檢索模型。張妮等人[16]采用ICTCLAS漢語語義識別系統,以醫療糾紛中的精神損害賠償為例,建立了法律案例本體檢索模型。
1.3 自然語言處理技術
在信息檢索發展的過程中,不斷有學者將自然語言處理相應技術應用到檢索研究中[17],自然語言處理技術可以使計算機理解人類語言,并自動提取關鍵信息,從而提高信息檢索的效率和準確性。可以采用自然語言處理技術來提取概念和概念之間的關系,并用于構建法律信息檢索的本體[18]。Merchant等人[19]使用一種稱為潛在語義分析(LSA) 的自然語言處理技術來捕獲單個文本中的概念,該技術可以用于獲得類案檢索的關鍵詞。自然語言處理可提取案情關鍵詞,經過相關詞擴展后,采用LUCENE全文檢索開源框架進行類案信息檢索,從而可以實現由自然語言表述的案情對類案信息的精確檢索[20]。文獻[21]將詞語向量化,采用機器學習方法進行文本分類,并根據法律判例數據庫檢索結果進行律師推薦。
ChatGPT等大模型能夠根據口語化的關鍵詞等信息檢索類案,目前這類大模型的檢索結果貼合度不高,有時會給出錯誤結果[22]。
1.4 機器學習方法
機器學習是人工智能的一個分支學科,可以模擬人類的學習過程,通過建立各種計算機學習模型,使計算機系統在一定程度上獲得識別自然規律的能力。智能檢索將機器學習這樣一種新型的人工智能技術應用于信息檢索系統從而提高其智能性[23]。文獻[24]研究了利用排序支持向量機和卷積神經網絡進行判例信息抽取及信息檢索的方法。Sansone等人[25]分析了法律領域的最新人工智能方法,重點關注基于自然語言處理、機器學習和知識提取技術的法律信息檢索系統。Chalkidis等人[26]研究了深度學習在法律分析中應用,包括文本分類、信息提取和信息檢索,其中語義特征表示是深層學習在自然語言處理中成功應用的關鍵工具,該研究使用Word2vec模型將法律語料庫進行向量化。國內方面,李蘭君等人[27]提出利用層級注意力機制來改進孿生網絡結構中的文檔表示,提出一種引入文檔內容壓縮的兩步驟文檔相似度計算方法,并將該方法用于法律案例檢索。
1.5 知識圖譜
知識圖譜是結構化的語義知識庫,其基本組成單位是“實體-關系-實體”三元組,以及實體及其相關屬性-值對,實體間通過關系相互關聯, 構成網狀的知識結構[28]。知識圖譜是一種語義網絡,是結構化的知識表示方式。近年來,機器學習及自然語言向量化技術被應用于知識圖譜構建與推理[29]。Ercan等人[30]提出的文本檢索方法中,給定一個知識圖譜和一個文本語料庫,檢索給定一組事實的最相關的文本段落。Hanke等人[31]利用文本挖掘技術的潛力從法律文件中提取有價值的信息,將這些信息存儲在圖形數據庫中,從而獲得這些文檔與系統用戶之間的關系,從而實現法律文書檢索。Xiong[32]利用知識圖譜中的實體及其結構化語義,通過豐富的文本表示、定制的語義結構、復雜的排序模型和神經網絡,對文本檢索進行了改進。秦永彬等人[33]提出了基于知識圖譜的司法數據融合方法,構建了“智慧法院”應用中的司法大數據知識圖譜。高翔[34]提出了在民事司法中法律知識圖譜構建的實現路徑。喬鋼柱等人[35]提出了基于本體的盜竊案件法律文書知識圖譜構建方法, 并且設計自定義推理規則, 實現了盜竊案件法律文書知識圖譜在相似量刑類案推送測試功能。
目前,國內外有商業機構或司法部門推出了若干法律信息智能檢索工具。基于 IBM 的Watson 系統的智能檢索工具ROSS利用自然語言處理和機器學習技術可以向律師呈現最相關、最有價值的法律回答及判例[8];LUIMA法律檢索系統包括了搜索引擎和案例數據庫,以詞語匹配進行案例搜索,并根據案例的相似度進行案例重排,以實現相關案例推送[36];LexisNexis則采用了四層元數據進行法律案例文本的語義注解,以實現更加智能的判例檢索[36]。在國內,也出現了“法小陶”“法狗狗”“阿爾法法官”“睿法官”“類型化案件智能審判平臺”等法律智能系統[37]。
人工智能與法律的融合成為新的技術演化趨勢。但是,法律服務的專業化成為社會發展的必然要求,提供高質量的法律服務不僅需要掌握法律知識和技能,還需要專業知識的支持。目前,尚缺乏針對專業領域的類案檢索智能系統,面向特定領域的類案檢索系統將為法律工作的智能化、專業化提供有力的技術支撐。
2 發展趨勢
國內外研究人員在法律信息智能檢索方面進行了一定探索,主要集中于對文本關鍵信息的提取并匹配數據庫信息,以達到精確檢索的目的。
人工智能方面,深度學習及預訓練模型在自然語言處理中取得了良好的效果[38],可以為法律文本解析提供有力支持;另一方面,知識圖譜在實體和關系的提取、數據存儲、知識推理等方面逐漸成熟,而自然語言處理在自動化構建大規模知識圖譜中發揮了重要作用[39],為知識圖譜在多個行業的應用建立了基礎。知識圖譜在司法領域也得到了日益廣泛的應用,采用人工智能技術從法律文本中提取信息并自動化構建知識圖譜成為技術發展趨勢[40-41]。同時,ChatGPT等生成式大模型可以輔助法律信息檢索,從而提高檢索效率和準確性[42]。
人工智能在法律領域的應用將經歷四個階段[37],即:感知智能階段,主要包括語音、視覺及情感識別;認知智能階段,指對知識圖譜和自然語言處理的應用;計算智能階段,要采用高性能計算機處理大數據;決策智能階段,即使用優化算法求解現實問題的數學模型。
法律人工智能將成為把知識圖譜與深度學習相結合建立對法律信息進行處理的技術[43]。法律是一個高度專業化的領域,要實現從自然語言描述的案情到相關案例的精準匹配,除了高質量的結構化數據及先進的算法,還需要專業知識和專家經驗的幫助。將機器學習技術用于法律案例信息檢索,將有助于提高檢索系統的性能[36]。知識圖譜作為一種知識表達方式,在存儲及查詢專業知識方面具有優勢,國內外尚未形成完整的基于垂直領域知識圖譜的類案檢索體系。
另一方面,用于類案檢索的專業知識圖譜對數據、模型的顆粒化程度要求較高,模型的精細度,數據量及對客觀世界描述的詳細程度,都會影響知識圖譜的效果[43]。法律涵蓋了社會生活的方方面面,而知識圖譜的覆蓋面與詳細程度成反比關系,根據專業的特征,在某一領域構建高質量的知識圖譜,利用自然語言處理和機器學習算法是實現法律信息精確高效檢索的有效途徑。
3 人工智能在建設工程領域法律糾紛中的應用
近年來, 我國基本建設投資持續高速增長,而建設工程領域法律糾紛也呈現逐年增加的趨勢。根據中國裁判文書網數據統計,2010~2020年案由為建設工程合同糾紛的一審案件數量見圖1:
工程建設項目的業主和承包人等利益相關者之間的法律關系比較復雜, 針對各方利益沖突引發的糾紛建立科學合理的解決機制,這一問題日益引起法學界、工程管理學界和監管部門的關注。當紛爭超出當事方的掌控時,在法律框架下采取和解、爭端評審、調解及仲裁與訴訟等方式是必然的選擇[44]。
建設工程類糾紛往往具有鮮明的技術特征,法律關系較為復雜,對建設工程法律爭端進行分析,不僅需要較高的法律素養,同時需要對建筑專業知識較為了解,法律服務專業化已經成為建設行業對法律共同體的迫切要求。將人工智能技術運用于工程法律領域可以有效提高類案檢索的質量和效率,有助于滿足社會對高質量法律服務的需要。
以知識圖譜作為專業知識的存儲載體,綜合運用自然語言處理、深度學習、語義搜索等技術手段,使計算機更好地理解自然語言描述的案情,實現精準高效的類案檢索將為解決建設工程法律糾紛提供較大便利。
4 結束語
法律信息檢索在法律事務中占據重要地位,同時,法律人工智能將對司法領域產生深刻的影響,隨著自然語言處理技術的不斷發展,更加智能化的法律信息檢索系統可以提高辦案效率,降低司法成本,在維護社會公平正義、普及法律知識、理性預測法律后果等方面具有積極意義。
另外,通用的法律信息檢索系統在建設工程這樣的具有較強專業性的垂直領域難以很好地理解專業詞匯,缺乏聯想和推理能力,不能夠很好地發揮作用, 開發具備專業知識的法律信息檢索系統將成為法律人工智能的一個新方向。
參考文獻:
[1] 張妮,蒲亦非.計算法學:一門新興學科交叉分支[J].四川大學學報(自然科學版),2019,56(6)1187-1192
[2] 翁曉斌,吳宇琴.人工智能司法運用的技術效應與法理審思[J].自然辯證法通訊,2022,44(8):98-104.
[3] 左衛民.如何通過人工智能實現類案類判[J].中國法律評論,2018(2):25-32.
[4] 高尚.司法類案的判斷標準及其運用[J].法律科學(西北政法大學學報),2020,38(1):24-35.
[5] 張清,張蓉.“人工智能+法律” 發展的兩個面向[J].求是學刊,2018,45(4):97-106.
[6] Prakken H.On the problem of making autonomous vehicles conform to traffic law[J].Artificial Intelligence and Law,2017,25(3):341-363.
[7] Yang M X,Jiang Y Z,Tian Y,et al.Impact of big data on China smart river basin[C]//2014 7th International Conference on Intelligent Computation Technology and Automation.October 25-26,2014,Changsha,China.IEEE,2015:304-307.
[8] 曹建峰.“人工智能+法律” 十大趨勢[J].機器人產業,2017(5):86-96.
[9] van Opijnen M,Santos C.On the concept of relevance in legal information retrieval[J].Artificial Intelligence and Law,2017,25(1):65-87.
[10] 趙忠君.國外法律本體研究綜述[J].情報科學,2012,30(1):149-154.
[11] 邱昭繼.人工智能、法律解析與未來法律實踐[J].政法論叢,2022(4):83-93.
[12] Gómez-Pérez A,Ortiz-Rodriguez F,Villazón-Terrazas B.Ontology-based legal information retrieval to improve the information access in e-government[C]//Proceedings of the 15th international conference on World Wide Web.Edinburgh Scotland.New York,NY,USA:ACM,2006.
[13] Cornoiu S,Valean H.Improving legal information retrieval using the Wikipedia knowledge base,legal ontology and the Eurovoc Thesaurus[C]//2015 19th International Conference on System Theory,Control and Computing (ICSTCC).October 14-16,2015,Cheile Gradistei,Romania.IEEE,2015:111-116.
[14] Cornoiu S,Valean H.New development for legal information retrieval using the Eurovoc Thesaurus and legal ontology[C]//2013 17th International Conference on System Theory,Control and Computing (ICSTCC).October 11-13,2013,Sinaia,Romania.IEEE,2013:152-155.
[15] de Oliveira Rodrigues C M,de Freitas F L G,Barreiros E F S,et al.Legal ontologies over time:a systematic mapping study[J].Expert Systems With Applications,2019,130:12-30.
[16] 張妮,楊遂全,蒲亦非.我國法律本體檢索模型的研究[J].法律方法,2015(2):104-117.
[17] 丁志均,楊青,張會兵,等.基于非結構化文本檢索模型綜述[J].計算機應用研究,2017,34(6):1601-1608,1612.
[18] Lame G.Using NLP techniques to identify legal ontology components:concepts and relations[J].Artificial Intelligence and Law,2004,12(4):379-396.
[19] Merchant K, Pande Y.NLP based latent semantic analysis for legal text summarization [C]//2018 International Conference on Advances in Computing, Communications and Informatics (ICACCI).September 19-22,2018,Bangalore,India.IEEE, 2018:1803-1807.
[20] 楊麗萍.面向自然語言的法律檢索系統的研究與實現[D].南昌:南昌大學,2016.
[21] 王海亮.基于文本挖掘的法律咨詢系統研究和實現[D].北京:北京化工大學,2017.
[22] 張恒.GPT模型下法律人工智能的風險與對策研究[J].西昌學院學報(社會科學版),2023,35(2):87-91.
[23] 楊月華,杜軍平,平源.基于本體的智能信息檢索系統[J].軟件學報,2015,26(7):1675-1687.
[24] Do P-K, Nguyen H-T, Tran C-X, et al. Legal Question Answering Using Ranking SVM and Deep Convolutional Neural Network [arxiv] [J].arXiv,2017:15.
[25] Sansone C,Sperlí G.Legal Information Retrieval systems:state-of-the-art and open issues[J].Information Systems,2022,106:101967.
[26] Chalkidis I,Kampas D.Deep learning in law:early adaptation and legal word embeddings trained on large corpora[J].Artificial Intelligence and Law,2019,27(2):171-198.
[27] 李蘭君,周俊生,顧顏慧,等.基于改進孿生網絡結構的相似法律案例檢索研究[J].北京大學學報(自然科學版),2019,55(1):84-90.
[28] 劉嶠,李楊,段宏,等.知識圖譜構建技術綜述[J].計算機研究與發展,2016,53(3):582-600.
[29] Antoine B, Nicolas U, Alberto G-D, et al. Translating Embeddings for Modeling Multi-relational Data[C]//Proceedings of the 27th Annual Conference on Neural Information Processing Systems, NIPS 2013, December 5, 2013 - December 10, 2013, Lake Tahoe, NV, United states, F, 2013 . Neural Information Processing Systems Foundation.
[30] Ercan G, Elbassuoni S, Hose K. Retrieving Textual Evidence for Knowledge Graph Facts[C]//Proceedings of the 16th International Semantic Web Conference, ESWC 2019, June 2, 2019 - June 6, 2019, Portorož, Slovenia, F, 2019 . Springer Verlag.
[31] Hanke J, Thiesse F. Leveraging Text Mining for the Design of a Legal Knowledge Management System[C]//Proceedings of the 25th European Conference on Information Systems, ECIS 2017,June 5,2017 - June 10,2017,Guimaraes, Portugal, F, 2017.Association for Information Systems.
[32] Xiong C Y.Text representation,retrieval,and understanding with knowledge graphs[J].ACM SIGIR Forum,2019,52(2):180-181.
[33] 秦永彬,馮麗,陳艷平,等.“智慧法院”數據融合分析與集成應用[J].大數據,2019,5(3): 35-46.
[34] 高翔.人工智能民事司法應用的法律知識圖譜構建:以要件事實型民事裁判論為基礎[J].法制與社會發展,2018,24(6):66-80.
[35] 喬鋼柱,馮婷婷,張國晨.基于知識圖譜的盜竊案件法律文書智能推理研究[J].計算機系統應用,2019,28(7):206-213.
[36] [美]凱文·D.阿什利.人工智能與法律解析[M].邱昭繼譯.北京:商務印書館,2020.
[37] 莊志剛.“法律+人工智能”的應用新版圖[J].檢察風云,2018(7):11-13.
[38] 車萬翔,郭江,崔一鳴.自然語言處理:基于預訓練模型的方法[M].北京:電子工業出版社,2021.
[39] 肖仰華,徐波,林欣.知識圖譜:概念與技術[M].北京:電子工業出版社,2020.
[40] 洪文興,胡志強,翁洋,等.面向司法案件的案情知識圖譜自動構建[J].中文信息學報,2020,34(1):34-44.
[41] 張妮,徐靜村.計算法學:法律與人工智能的交叉研究[J].現代法學,2019,41(6):77-90.
[42] 周可婧.自然語言處理模型輔助法律檢索的限度及應對:以ChatGPT為例[J].浙江萬里學院學報,2023,36(3):53-59.
[43] 左衛民.關于法律人工智能在中國運用前景的若干思考[J].清華法學,2018,12(2):108-124.
[44] 譚敬慧.中國工程法律與工程糾紛解決年度觀察[J].建筑經濟,2013,34(12):66-68.
【通聯編輯:李雅琪】