999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

卷積神經網絡在案件分類上的應用

2019-10-08 06:52:16李昊泉史夢凡陳舒楠
軟件 2019年4期
關鍵詞:優化算法

李昊泉 史夢凡 陳舒楠

摘 ?要: 幾年前,機器學習在司法方面的應用被提出并得到迅速發展。本文通過對判決文書的學習,將訓練出的模型以文本分類的方式,用于協助辦案人員進行罪名預測:1、在權威網站爬取大量判決文書,進行信息預處理后,提煉出較為精煉的文本數據和罪名標簽;2、對文本進行分詞、結構化處理、構成詞匯表并與相應的詞向量進行1對1映射;3、應用谷歌的Tensorflow搭建卷積神經網絡,設置參數,訓練模型并測試;4、反復調整參數后,改進優化算法,使分類效果理想。最終分類準確率在95%以上。

關鍵詞: 卷積神經網絡;文本分類;罪名預測;分詞;優化算法

中圖分類號: TP183 ? ?文獻標識碼: A ? ?DOI:10.3969/j.issn.1003-6970.2019.04.049

本文著錄格式:李昊泉,史夢凡,陳舒楠,等. 卷積神經網絡在案件分類上的應用[J]. 軟件,2019,40(4):222225

【Abstract】: Several years ago, application of machine learning in judicial field was proposed and developed rapidly. Through judgment documents study, the article applies trained model for assisting case handlers in crime prediction with text categorization: 1. collect a large number of judgment documents on authoritative websites, after preprocessing information, extract refined text data and accusation labels; 2. carry on word segmentation and structural processing of texts to form vocabulary, map with corresponding word vectors 1 to 1; 3. construct convolution neural network with Google's Tensorflow, set parameters, train model and test; 4. after adjusting parameters repeatedly, improve and optimize algorithm to make classification effect ideal, and final classification accuracy is over 95%.

【Key words】: Convolutional neural network; Text classification; Crime prediction; Word segmentation; Optimization algorithm

0 ?引言

近年來,機器學習飛速發展,尤其在自然語言處理、文本分類方面,人工智能應用廣泛。其中,卷積神經網絡(CNN)不僅在圖像領域取得了很大的成就,近年來在文本分類方向也大放異彩[1]。

當前對案件的定性普遍由人工進行,使用機器學習搭建經濟類犯罪案件偵查系統后,有利于增強調查者的能力,可以有效縮短偵查程序的過程,從而提高案件處理效率。

我們計劃選取近年來頻發的經濟類案件作為訓練數據,在中國裁判文書網上爬取判決文書作為訓練材料,訓練完成的模型可以對輸入的案件陳述進行快速分類,達到罪名預測的目的。執法機關可以在案件定性時結合相關人員的意見進行快速且準確的判斷。為此,我們將設想付諸實現。

1 ?相關技術介紹

1.1 ?中文分詞

中文分詞在自然語言處理中的重要作用不言而喻,主要包含三個過程:文本預處理、文本特征提取、分類模型構建。判決文書具有嚴謹、準確等特征,因此本項目將重點放在文本預處理上。預處理過程中最重要的是分詞,我們選擇使用基于統計的分詞方法[2-3]。該方法主要統計上下文中字符與字符相鄰出現的概率,兩字符相鄰出現的概率越高,它們聯合起來恰好組成一個詞語的概率也越大。中文中組成詞匯的幾個字常一同出現,由此來達到分詞的效果。

迄今為止,中文分詞已經有許多較為成熟的工具包,如jieba、pynlpir、scseg等。本文選取的jieba工具具有多種分詞模式,對案件文書分詞有良好的效果[4]。

1.2 ?文檔、詞項矩陣

分詞完成后需將數據結構化處理才能進行下一步分析,本項目中所采用的結構化處理方式為文檔、詞項矩陣法,即Document-Term Matrix。以項目中的文檔為例,我們在眾多案件類型中選取信用卡詐騙和合同詐騙兩種類型的案件,文本一[經濟,犯罪,信用卡,詐騙,調查],文本二[經濟,犯罪,合同詐騙,研究],則基于這兩個文本構建出的詞典包含7個不同的特征詞匯,{1:經濟,2:犯罪,3:信用卡,4:詐騙,5:調查,6:合同詐騙。7:研究},經過轉化即可顯示為(1,1,1,1,1,0,0,)和(1,1,0,0,0,1,1),其中向量元素表示對應詞匯出現的次數,兩向量合并則獲得文檔-詞項矩陣。本項目中我們選用的轉化庫為scikit-learn庫。

1.3 ?優化算法

優化是指改變 x 以最小化或最大化某個函數 f(x)的任務。對其進行最小化時,也稱為損失函數。

猜你喜歡
優化算法
淺議小學數學口算教學的有效策略
云計算平臺聯合資源調度優化算法研究
PLC故障檢測優化算法
原子干涉磁力儀信號鑒頻優化算法設計
故障樹計算機輔助分析優化算法研究與應用
科技與創新(2017年1期)2017-02-16 19:36:23
混沌優化算法在TSP問題的應用
基于混沌初始化和高斯擾動的煙花算法
計算機時代(2016年7期)2016-07-15 16:12:30
再制造閉環供應鏈研究現狀分析
二進制數轉十進制優化算法探討
科技與創新(2016年7期)2016-04-20 09:17:04
故障樹計算機輔助分析優化算法的實踐應用
科技傳播(2016年3期)2016-03-25 00:23:31
主站蜘蛛池模板: 一本大道香蕉中文日本不卡高清二区 | 亚洲美女视频一区| 最新亚洲人成网站在线观看| 国产精品无码作爱| 超碰精品无码一区二区| 精品国产成人国产在线| 亚洲AV无码久久精品色欲| 国产在线无码av完整版在线观看| 欧洲成人免费视频| 毛片国产精品完整版| 一本色道久久88亚洲综合| 成年女人a毛片免费视频| 亚洲中文字幕97久久精品少妇| 欧美一级在线| 国产欧美日韩另类精彩视频| 免费人成黄页在线观看国产| 欧美a在线视频| 男女男免费视频网站国产| www.日韩三级| 国产不卡一级毛片视频| 欧美黄网站免费观看| 日本伊人色综合网| 色国产视频| 人妻丰满熟妇av五码区| 天天综合网色| 久久永久免费人妻精品| 在线免费观看AV| a级毛片网| 国产91小视频| 91福利片| 伦精品一区二区三区视频| 亚洲第一极品精品无码| 国产九九精品视频| 久久人午夜亚洲精品无码区| 欧美日韩精品一区二区视频| 国产乱人伦精品一区二区| 国产激情第一页| yjizz国产在线视频网| 亚洲最猛黑人xxxx黑人猛交 | 亚洲综合专区| 99久久精品国产综合婷婷| 色屁屁一区二区三区视频国产| 手机精品视频在线观看免费| 视频一本大道香蕉久在线播放 | 欧美在线精品一区二区三区| 亚洲精品国产成人7777| 无码福利日韩神码福利片| 欧美不卡视频在线| 999精品免费视频| 一本大道香蕉中文日本不卡高清二区| 99久久婷婷国产综合精| 亚洲黄色网站视频| a级毛片免费网站| 操操操综合网| 亚洲嫩模喷白浆| 亚洲欧美国产五月天综合| 自拍偷拍欧美| 狠狠五月天中文字幕| 久久中文字幕2021精品| 99九九成人免费视频精品| 欧美日韩精品综合在线一区| 97免费在线观看视频| 日韩午夜伦| 国产精品夜夜嗨视频免费视频| 老汉色老汉首页a亚洲| 四虎国产成人免费观看| 国产日韩精品欧美一区喷| 少妇被粗大的猛烈进出免费视频| 欧美激情伊人| 色妞永久免费视频| 国产日韩欧美成人| 欧美性天天| 久久精品66| 久久青青草原亚洲av无码| 亚洲av中文无码乱人伦在线r| 野花国产精品入口| 国产成人一区| 欧美成一级| 在线看片中文字幕| 久久永久免费人妻精品| 久久动漫精品| 久久精品亚洲中文字幕乱码|