999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于opencv的手寫數字識別

2017-07-19 01:20:36梁培哲
卷宗 2017年15期
關鍵詞:機器學習

摘 要:隨著科技的不斷發展,在財務、經濟等一系列領域對于使計算機自動識別數字的應用越來越廣泛,同時也不斷推動著更加精確的識別算法的深入研究。本文提出了一種針對手寫數字進行識別的方法,其基本思路是:將opencv開源庫函數與CodeBlocks編譯環境相結合,圖像預處理后再使用SVM(支持向量機)算法與較權威的MNIST數據集結合識別手寫數字。實驗結果表明,相比于參考文獻中的典型常用算法,該方法大大降低了識別錯誤率,在統計量樣本數比較小的情況下也能獲得較為準確的統計規律,該算法可行且有效。

關鍵詞:機器學習;圖像處理;手寫數字識別;SVM分類算法

圖像是人們日常生活和工作中隨時都會碰到的一種客觀的靜態描述,對數字圖像的深入透徹研究大大方便了我們的生活。目前的對于數字識別的算法主要有K鄰近分類算法[1-3]、BP神經網絡算法[4]。K近鄰分類算法本身簡單有效,不需要分類器進行訓練,但其計算量較大,可理解性差;傳統的BP神經網絡收斂速度慢,網絡和學習記憶不穩定。本文使用SVM分類算法結合MNIST數據集進行數字的識別,SVM(support vector machine)即支持向量機是一種分類算法[5],其優點是在統計量樣本數比較小的情況下也能獲得較為準確的統計規律。本文著手于研究機器識別手寫數字,此手寫數字識別實驗主要分為三個部分:圖像采集、圖像預處理、數字識別。

1 圖像預處理

對于攝取到的圖片進行數字預處理是實驗中重要的步驟之一是實驗得出準確結果的前提。采集信號時,周圍環境以及攝取設備對采集后的圖片影響很大,若不進行圖片預處理,往往很難得出正確結果。步驟如下:

1.1 中值濾波

一幅圖像中,噪聲的出現會使噪聲點處的像素值比其周圍的像素值相差非常多??砂褕D像中某一塊的數據中所有像素值按大小順序排列,如此和其他像素值相差很大的噪聲點處的像素就會被排到最前或者最末端,再將排在中間的像素值代替模塊中的中間的目標像素值,便可有效去除噪聲。

1.2 直方圖均衡化

直方圖均衡化著重于圖像灰度級的變換,目的是將圖像灰度增強,它在實際工程中使用比較廣泛。利用直方圖均衡化可以將處理后的圖像實際亮度集中的分布在亮度范圍的中間區域。

1.3 圖像分割

對提取到的圖片進行圖片分割,可將想要得到的數字更清晰的呈現出來。對于最佳閾值的選取,可以采用遍歷像素值[1~254]。

(1)首先人工設置初始閾值Th=Th0將原圖分為兩類;分別計算兩類的類內方差:

(4)

(5)

(6)

(7)

(2)計算兩個區域各自的分布概率

(8)

(9)

(3)像素遍歷選擇選擇最佳閾值,根據以下公式判定

(10)

1.4 形態學濾波

最基本的形態學濾波是腐蝕和膨脹,考慮到手寫數字筆畫可能會很粗不易于后期識別,所以采用膨脹的算法思路。一般膨脹是對二值圖像進行處理,將此放在預處理最后一步。

2 數字識別

得到攝像頭采集并經過處理后的數字圖片后,下一步便是識別。識別數字的方式有很多,本文我們使用支持向量機SVM分類算法來實現手寫數字識別。深度學習一般的解決思路便是將大量實例用于訓練學習,學習后的機器會產生自己的一套識別體系,利用訓練好的系統去識別未知的數字。其中SVM分類算法就是這樣一個基礎的機器學習的思想,在獲得大量樣本進行大量學習形成學習系統之后,機器形成一套自己用來識別手寫數字的規則。隨著樣本數量的增加,算法會學的更加精確,不斷提升自身的準確性。通常對于分類問題,可以將數據集分成三部分:訓練集、測試集、交叉驗證集。用訓練集訓練系統從而生成對數字的學習模型,用后者進行準確性驗證(優化參數)。在ubuntu上,大約運行十分鐘便可以完成訓練和預測測試集的結果。

采用MNIST數據集下載訓練數據和測試文件。要注意,攝像機采集之后,為了增強識別效果,對采集到的數字圖片進行預處理以達到手寫數字圖片庫的數字模式使識別可以更加準確。MNIST數據庫是一個手寫數據庫,它有60000個訓練樣本集,10000個測試樣本集。它是NIST數據庫的一個子集。下載后的文件并不是標準的圖像格式,圖像都保存在二進制文件中,每個樣本圖像的寬高為28*28。在進行編寫匹配程序之前要把其轉換為普通jpg格式的文件。

3 結論

本文從識別手寫數字字符識別入手,通過查閱大量資料得出一套完整的手寫數字識別的方法體系,并且在Windows平臺下,利用計算機視覺庫OpenCv和CodeBlocks環境相結合進行實驗,得出結果準確度高。采用的SVM分類算法與和典型的K鄰近分類算法、BP神經網絡算法相比,識別精度高。但是,在攝取圖片背景復雜、圖片曝光過度或不足、分辨率低的情況下,各算法還需要進一步完善。

參考文獻

[1] 陳振洲,李磊,姚正安. 基于SVM的特征加權KNN算法[J]. 中山大學學報(自然科學版). 2005(01)

[2] 錢曉東,王正歐. 基于改進KNN的文本分類方法[J]. 情報科學. 2005(04)

[3] Yufei Tao,Dimitris Papadias,Nikos Mamoulis,Jun Zhang.An efficient cost model for K-NN search technical report. HKUST . 2001

[4] 王建梅,覃文忠. 基于L-M算法的BP神經網絡分類器[J]. 武漢大學學報(信息科學版). 2005(10)

[5] 奉國和,朱思銘. 基于聚類的大樣本支持向量機研究[J]. 計算機科學. 2006(04)

作者簡介

梁培哲(1997-),女,漢族,鄭州大學物理工程學院電子信息科學與技術專業2014級學生。

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 亚洲国产综合第一精品小说| 欧美日韩资源| P尤物久久99国产综合精品| 国产SUV精品一区二区6| 日本www色视频| 91精品国产自产在线老师啪l| 另类综合视频| 国产乱子伦精品视频| 天天综合网站| 国产高清自拍视频| 国产精品久久久精品三级| 多人乱p欧美在线观看| 综合人妻久久一区二区精品 | 久草视频精品| 少妇精品网站| 中文一区二区视频| 99热在线只有精品| 亚洲人在线| 波多野结衣国产精品| 国产一级特黄aa级特黄裸毛片| 久久国产精品波多野结衣| 亚洲av无码成人专区| 亚洲成a人片77777在线播放| 亚洲无码一区在线观看| 国产白浆视频| 久久黄色免费电影| 2022精品国偷自产免费观看| 狠狠v日韩v欧美v| 91小视频在线观看| 国产毛片不卡| 日本不卡视频在线| 国产精品免费久久久久影院无码| 久久久久国色AV免费观看性色| 日韩精品无码不卡无码| 国产理论精品| 亚洲天堂.com| 亚洲人成网站观看在线观看| 先锋资源久久| 在线免费亚洲无码视频| 日韩国产另类| 午夜啪啪网| 亚洲aaa视频| 性网站在线观看| 国产精品无码AV中文| 激情五月婷婷综合网| 无码国内精品人妻少妇蜜桃视频 | 久久久久久久久18禁秘| 久久无码高潮喷水| 欧美三级不卡在线观看视频| 免费又黄又爽又猛大片午夜| 色悠久久久久久久综合网伊人| 成人综合久久综合| 国产一二视频| 香蕉eeww99国产精选播放| 午夜国产小视频| 精品色综合| 91精品人妻互换| 国产对白刺激真实精品91| 亚洲资源站av无码网址| 99免费视频观看| 全裸无码专区| 男女性色大片免费网站| 久久96热在精品国产高清| 国产在线91在线电影| 欧美区国产区| 亚洲va欧美va国产综合下载| 国产午夜无码专区喷水| 国产成人久久综合一区| 在线看片免费人成视久网下载| 国产精品免费p区| 91精品啪在线观看国产91九色| 国产手机在线观看| 久草美女视频| 欧美国产精品不卡在线观看| 国产成人精品视频一区二区电影| 中文字幕久久精品波多野结| 久久天天躁狠狠躁夜夜躁| 真实国产乱子伦高清| 亚洲国产精品VA在线看黑人| 国产高颜值露脸在线观看| 国产精品久久久久久久久久久久| 亚洲成人福利网站|