999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的光學符號識別模型

2019-10-14 02:08:28杜菲霏郝歐亞王思桐
數字通信世界 2019年9期
關鍵詞:模型

杜菲霏,郝歐亞,王思桐

(1.華北理工大學數學建模創新實驗室,唐山 063210;2.華北理工大學電氣工程學院,唐山 063210)

光學字符識別(Optical Character Recognition,OCR)是指通過電子設備通過字符識別方法將圖片文字抽取為可編輯文本的過程。由于圖像數據往往都包含噪聲,像素模式之間的關系極其復雜,使用計算機完成OCR 的過程很困難。基于此,需要設計一種圖像文字識別算法,以完成光學字符識別任務。

1 機器學習模型概述

用于分類的機器學習模型建立與求解過程,首先訓練集進行預處理,選取合適的方法進行訓練后得到模型,然后使用測試數據對模型進行評測,如果結果較好則證明該模型適合解決該類問題。有多元線性回歸模型、LightGbm 模型和 KNN 模型。

2 模型的建立求解

2.1 數據處理

首先使用Weka 軟件對數據初步進行統計分析,從統計分析數據可以看出,數據集中并未含有異常值與缺失值,大部分在數據在0-15之間,分布較均勻。

統計分析之后,對數據集中的英文字符進行字典編碼處理,首先建立字符字典,例如字典{A:1,B:2,C:3,D:4,E:5},然后進行字符映射,分別將數據集中的字符A,B,C,D,E 使用數字1,2,3,4,5代替,其它字符以次類推。

2.2 特征工程

由于字符在圖像中主要由像素構成,得出字符所在矩形區域的水平、豎直位置、矩形區域的寬度、高度對字符識別作用較小,故將其剔除,后期實驗表明剔除這四組特征后的效果優于原始特征。

2.3 模型求解

(1)多元線性回歸模型。將預處理后的樣本數據代入模型,使用Python 中的sklearn.linear_model.LinearRegression 庫求出權重矩陣,用于光學字符檢測。

(2)LightGbm 模型。將預處理后的樣本數據代入模型,設置boost 類型為gbdt',葉子數為 100,學習率為 0.01,迭代5000次,使用Python 中的lightgbm 庫得出模型,用于光學字符檢測。

(3)KNN 模型。將預處理后的樣本數據代入模型,使Python 中的 sklearn.neighbors 庫得出模型,用于光學字符檢測。

3 模型檢驗

準確率(Accuracy)、查準率(Precision)、召回率(Recall)、F1值都是評價模型好壞的指標,只是評測的側重點不同,且各指標間有一定的關聯。

3.1 Accuracy 值

Accuracy 為預測值中所有正確值的數量/真實值的數量,定義如式(1)。

3.2 F1 值

Precision 是指模型的查準率,定義如式(2)。

Recall 是指模型的召回率,定義如式(3)。

由于Precision 與Recall 是相對的,不能通過單一的Precision或Recall 來評測模型的優劣,F1 值可以用來量化的權衡關系,定義如式(4)。

3.3 評測結果

取70%數據集作為訓練集,其余30%數據集作為測試集,不同模型的在測試結的測試結果如圖1所示。

圖1 模型評測結果對比圖

由于單個模型數據清洗前后的差距較小,對比不明顯,給出模型評測結果對比表。

4 結果分析

由圖1可以看出,KNN 模型的準確率遠遠高于其它兩個模型,在測試集的準確率達到95.3%,所以對于英文字符的識別,具有很好的效果;由于特征數目對于多元線性回歸模型來說過多,所以效果很差;由于改數據集對于LightGbm 模型來說過小,所以效果較差。綜上所述,KNN 模型最適合光學字符識別。

5 結束語

綜上所述,KNN 是一種簡單有效的機器學習分類算法,優點是訓練代價較低、使用訓練集的規模較小、更適合于多分類任務、準確率高、時間復雜度低,缺點是計算量較大、依賴于距離函數與K 值。KNN 模型不僅可以應用于光學字符識別,也可以應用于文本分類、用戶產品推薦、疾病預測等方面。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 91丝袜乱伦| 国产一区二区三区精品久久呦| 国产不卡一级毛片视频| 四虎影视永久在线精品| 一区二区影院| 激情综合婷婷丁香五月尤物| 精品久久久无码专区中文字幕| 欧美日韩精品一区二区在线线| 2022国产91精品久久久久久| 欧美特级AAAAAA视频免费观看| 无码AV高清毛片中国一级毛片| 啦啦啦网站在线观看a毛片 | 在线免费a视频| 伊人久久大香线蕉aⅴ色| 日本精品视频一区二区| 国产打屁股免费区网站| 国产在线精彩视频论坛| 操操操综合网| 久久无码免费束人妻| 在线欧美国产| 香蕉精品在线| 亚洲欧美成人| 性欧美久久| 在线色综合| 国产欧美视频在线| 国产午夜人做人免费视频| 黄色网在线| 国产制服丝袜91在线| 国产玖玖玖精品视频| 好紧太爽了视频免费无码| 久久国语对白| 国产天天射| 精品综合久久久久久97| 一本色道久久88| 久草青青在线视频| 99久久免费精品特色大片| 亚洲制服丝袜第一页| 黄色福利在线| 亚洲欧美色中文字幕| 欧美激情第一欧美在线| 伊人天堂网| 有专无码视频| 天天综合天天综合| 在线观看国产黄色| 亚洲天堂网在线观看视频| 国产成+人+综合+亚洲欧美| 亚洲永久精品ww47国产| 全裸无码专区| 成人亚洲国产| 国产微拍一区二区三区四区| 国内毛片视频| 欧美激情视频二区| 国产啪在线91| 国产女人综合久久精品视| 久久77777| 亚洲激情区| 爱爱影院18禁免费| 欧美在线综合视频| 91无码人妻精品一区| 亚洲欧美极品| 日本人真淫视频一区二区三区| 99热这里都是国产精品| 亚洲天堂视频网站| 亚洲天堂网在线播放| 亚洲三级电影在线播放 | 国产又粗又猛又爽视频| 国产91在线免费视频| 91网址在线播放| 亚洲精品欧美日本中文字幕| 亚洲成av人无码综合在线观看| 91视频首页| 精品无码国产一区二区三区AV| 人人妻人人澡人人爽欧美一区 | 一区二区三区在线不卡免费| 免费国产在线精品一区| 欧美激情视频一区| 亚洲第一中文字幕| 欧美国产成人在线| 女人18毛片一级毛片在线 | 国产精品部在线观看| 亚洲成人精品| 人妻无码中文字幕第一区|