999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

自然語言處理與司法案例

2017-09-15 04:35:10周珊珊
魅力中國 2017年24期

周珊珊

摘要:在本文中,以全國裁判文書網的現有法律文書入手,使用基于自然語言處理技術,提出建模思路,應用“人工智能+法律”解決司法實踐中裁量不均衡問題。步驟主要是:首先建立中文案例語料庫,對文本分詞及句法分析;其次應用機器算法對詞向量學習與訓練;最后在對裁判文書關鍵信息提取后,針對文書相似度的計算而找到判決結果的合理空間,以定量的方法減少司法中同案不同判,裁量標準不統一的問題。一方面為司法實踐提供有效參考,另一方面也為群眾提供了訴訟可行性的參照體系。

關鍵詞:自然語言處理;司法案例;裁判

在我國立法較為模糊的領域,存在一片法官自由裁量權較大的空間。實踐中,網絡服務商侵權賠償是適用共同侵權承擔連帶責任的問題,還是應按間接侵權以適用《侵權責任法》第12條規定承擔按份責任。亦或是,對《侵權責任法》第36條第3款中“知道”的主觀過錯理解上,立法、司法、學界的觀點的差異問題,都存在沖突與矛盾,如何減少網絡服務商法律侵權賠償責任分擔問題上的差異。以下將從現有的裁判文書案例庫入手,從自然語言處理的角度統計探析在具體的某類型案例中減少司法裁量差異的問題。

一、裁判文書中自然語言翻譯的困難性

在基層法院,法官最開始套用模板制作法律文書,模板只是提取系統已經錄入的案件信息。并不能替代法官思維。隨著信息化應用的水平提高,法官開始使用北大法寶輔助案例庫等,通過關鍵字搜索相似案例的方式撰寫法律文書。并提出能自動生成高質量文書的需求,考量對“經審理查明”與“本院認為”后的文本的技術實現。一方面,是法律應用上的強烈需求。另一方面,則是確定法律規則的條件下,智能實現法律判斷、預測和應用的技術難度。如何服務審判,自然語言處理技術為問題的解決提供了很好思路,同時由于自然語言文本的特點,句子句式結構復雜,內容也往往存有歧義。所以現實中也往往不存在完全一樣的案例及描述。在事實和結論認定表達上更是千差萬別,將自然語言翻譯成機器語言,已具有相當技術支持,轉換難度在于解決模擬結果與實踐結論的準確度。

二、語料庫的建立

自然語言處理技術成為解決難題的突破口。所謂自然語言處理就是人與計算機之間用自然語言進行通信的辦法。首先,需建立司法案例庫,做為最基本的數據來源。在此選擇中國裁判文書網的裁判文書,他為提供給機器學習的語料庫具有可靠性和可行性。2013年最高院發布的《關于人民法院在互聯網公布裁判文書的規定》中指出,裁判文書以“上網為原則,不上網為例外”。隨著規定的落實,大量生效文書在網上可查。至2017年8月17日,中國裁判文書網上公開的文書總量為32,298,039萬,且以每日3萬的速度遞增。同時,隨著全國法院系統信息化程度的提高,以公開促公正,上網的生效電子文書數量會越來越多,這不僅為語料提供了不斷動態補充,也為不同案例庫背后的事實與規則的提供定量分析依據。相比于一個通用的語料庫,以案例庫為整體作為語料庫更為合理,原因是考量單獨的網絡服務商侵權不能只在同種案由下的比較,而是以整個案例庫構建的法律體系的全局觀念來分析解決一類案件間裁判的差異。同時,現實生活中侵權行為與犯罪行為交叉,各種主觀過錯認定的錯綜復雜,誰都不是信息的孤島,脫離整體來分析局部。

三、自然語言處理

(一)機器翻譯

所有案例可組成為文本,語料庫說到底就是一大段文本,許多語料庫的設計都要考慮一個或多個文本間的平衡 。首先,確定案例語料庫后,需對整個文本進行分詞,分詞的意思即是將一個句子分成一個一個的詞語,整個文本就變成了詞的集合,導入文本用工具庫里程序方法可直接實現分詞效果。也可直接通過算法,通過統計計算概率,計算一個字還是一個詞的概率,在模型中一組詞語成為一個句子的概率,詞性等都可得出。如前日計算機具有撰寫地震預警新聞稿的能力的技術實現技術基礎也是同一個道理。然后構建詞庫,循環整個語料庫,每次遍歷到新詞,則將之添加到詞庫,通過讀取每一個詞,在詞庫中查找比對,存在則該詞詞頻加1,若不存在,繼續添加,統計詞的頻率再對構建哈夫曼樹進行編碼。

(二)詞向量的自動學習與訓練

根據向量的定義,向量是客觀存在的東西抽象后以數字表達出來,機器能識別的東西。構建詞向量是非常關鍵的一步。而一個詞要成為詞向量,首先對文本進行處理,簡化為在多維的向量空間上的計算,計算有不同種方法,算法已經直接包含在方法內。向量空間上的相似度代表了文本中詞義上的接近度,對于處理好的文件重新用算法構建詞向量,無需手工規則,完全自動機械。而且算法并不依賴語言學上的文法規則,也不需要詞性標注,就像所有星星組合在一起成為星空,向量是星星,而星空即是向量空間,在這個空間上的兩顆星星間的距離計算COS距離即是兩個詞的距離。距離越近,也即兩個詞相似性,詞義相近、相似度越高,距離的計算也是詞間聚合的體現。詞義最相近的詞可以理解為向量空間中也是最接近的,這樣就可以通過顯示詞向量空間中相近的詞組來判斷詞向量構建的好壞。同時通過降低維度,查看詞義分布圖直觀查看詞語的分布。通過統計概率計算機過濾低頻字詞。低頻詞的舍棄一是浪費運算資源,二是由于筆誤的機率較大而參考性過低。去掉高頻詞是因為高頻詞會對聚類準確度有影響。

(三)指導性數據比對

將以上模型適用于真實的案例,對于具體類型案例輔助分析來源,案例庫從總量上來講,現階段也是不夠的。裁判文書網上的所有文書,排除非判決文書,再按照案由等細分案件后,需要進一步通過以人工引導的方式對計算機訓練。計算機工作,在傳統理解上,是根據命令一步步執行,要什么他答什么,在人工智能應用上,則讓計算機自我學習,接受不同的輸入數據,自動運算得出結果。與指令式的運算存在本質的區別,這也是人工智能創新的地方。為了得到接近于法官思維的裁量的輸出,在人工指導下,通過輸入多組數據讓機器自我學習,最終得出正確的數據,找到從量變到質變的區分邊界。立法上,我國現行侵權法采用客觀主義。司法實踐中,法官的裁量更趨向于折中主義的觀點,侵權損害賠償的評價指標包括:侵害的具體方式、地域、網絡服務商賠償能力、受害人的身份、年齡、家庭狀況等,司法判決的執行難易程度也是重要考慮范疇。模型要在統計的基礎上細化和明確法官的裁量評價指標,進而改變具體的輸入值比對評價指標的輸出值計算差異,如賠償責任詞向量的周圍尋找最合理的近似區域。在上文的基礎上,以最高院指導案例為母版,通過正則找出需要的文本,如重點在網絡服務商侵權文書的查明和認定部分,經過一定的語義重修,即有目的性地去除特殊條件或情形,首先進行典型性分析。算出指導案例核心關鍵詞局部的語義空間,進而對基礎案例進行數據模擬,如增加新數據與值大小,改變案例輸入的數據,逐步增加減少案例細節,對結果進行比對,比較其與實際裁量值的差異性,讓輸出值與實際值的誤差越來越小,越來越接近法官的實際判決值。比較案例間評價指標的相對差值,如果得出的的結論正確,給予一定獎勵,繼續對輸入和輸出進行比對,從而達到訓練的目的。學習方法重點不依照法律邏輯的推理理論,也不分類處理如自然人區分、過錯描述、侵害手段、后果、侵權人獲利和侵權人的償債能力等,只是通過輸入數值的累積,讓機器遍歷所有節點,從而獲得一類案例中的詞向量分布。這是一個大數據的應用,通過無限量的數據模擬,完成邊界的訓練。要與模糊區域邊界對應,必須要有大概率的重合才可。最基本的目標底線至少小到一個基層法院,不同法官審理要做到同案同判。只要案例描述盡可能多,鋪設的基礎侵權行為描述語義地圖則會盡可能涵蓋廣泛。最后,法官通過模型輸入關鍵詞,而系統可以在具體的這個類型案例范圍內找出最相符的評價指標的判詞。

法律空間并非對技術完全免疫,2017年7月,《新一代人工智能發展規劃》中,國務院向法律行業釋放了信號;其次,在AlphaGo之后,機器人取代律師的預測報道也時有發生。在這樣的背景下,法律與AI的碰撞,必將對智慧法院建設提出更深層次的要求,法律科技也會乘東風而起,人工智能化的預測與推論機制都參考案件基本事實與案件描述,司法實踐的裁判深受其影響。基于語義網的大數據分析技術為建立平衡的司法裁量標準理論提供了思路。隨著理論的實現及應用推廣普及,一方面會成為輔助辦案良好的工具,大數據司法確保公平正義;另一方面也成為當事人對案件是否起訴,或上訴是否勝訴的有效依據。不久的未來,在以自然語言處理技術的應用上,以人工智能大數據為支撐的科技發展潮流能為司法提供更好服務。

參考文獻

[1]Steven Bird,Ewan Klein & Edward Loper.Natural Language Processing with Python[M].American:Oreilly & Associates Inc;2,2017-3-25.39endprint

主站蜘蛛池模板: 国产精品中文免费福利| 永久成人无码激情视频免费| 夜夜高潮夜夜爽国产伦精品| 国产真实乱人视频| 国产视频大全| 99热亚洲精品6码| 亚洲综合国产一区二区三区| 欧美精品色视频| 精品黑人一区二区三区| 97视频免费看| 国产精品30p| 这里只有精品在线播放| 亚洲AV无码一区二区三区牲色| 欧美啪啪一区| a天堂视频| 亚洲精品国产精品乱码不卞| 欧美乱妇高清无乱码免费| 伊人国产无码高清视频| 日韩无码黄色网站| 一级片免费网站| 精品伊人久久久久7777人| 黄色免费在线网址| 国产欧美在线观看一区| 亚洲久悠悠色悠在线播放| 国产成人精品综合| 在线观看视频99| 日本三级欧美三级| 国产精品自拍合集| 青青网在线国产| 国产在线自乱拍播放| 无码区日韩专区免费系列| 国产精品思思热在线| 亚洲综合色婷婷| 一本色道久久88| 国产精品密蕾丝视频| 精品撒尿视频一区二区三区| 热久久国产| 中文天堂在线视频| 久久黄色小视频| 欧美a级在线| 日韩a在线观看免费观看| 久久中文无码精品| 女人18毛片一级毛片在线 | 色播五月婷婷| 精品一区二区无码av| 久久免费看片| 无码在线激情片| 国产永久在线观看| 国产美女免费| 精品国产毛片| 国模极品一区二区三区| av色爱 天堂网| 日本人妻一区二区三区不卡影院| 国产尤物在线播放| 亚洲伊人电影| 久久无码av一区二区三区| 最新国产精品鲁鲁免费视频| 99re精彩视频| 亚洲高清中文字幕| 亚洲国产成人精品青青草原| 国产视频一二三区| 国产精品视频免费网站| 黄色网在线| 日韩av高清无码一区二区三区| 丁香亚洲综合五月天婷婷| 一级毛片在线播放免费| 亚洲国产精品无码AV| 国产成人1024精品下载| 网友自拍视频精品区| 蜜芽一区二区国产精品| 国产亚洲高清在线精品99| 欧美午夜性视频| 国产精品三级专区| 激情无码字幕综合| 国产香蕉一区二区在线网站| 精品福利网| 国产综合日韩另类一区二区| 麻豆AV网站免费进入| 2024av在线无码中文最新| 99视频免费观看| 欧美有码在线观看| 久久99蜜桃精品久久久久小说|