999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺析Android平臺下OCR研究與實現

2015-10-21 17:50:51張芮陳萱瑋李桐
工業設計 2015年4期

張芮 陳萱瑋 李桐

摘要:丟隨著硬件性能的提升和Android平臺的不斷普及,“計算設備移動化”的時代已經到來,同時出現了一些在Android平臺上的圖像處理應用。本文主要介紹了OCR文字處理和識別的工作原理以及TTS技術,開發了一款基于Android的應用軟件。該軟件采用了開源識別引擎Tesseract-OCR,主要分為兩大模塊:文字識別模塊和文字應用模塊。文字識別模塊完成了通過手機攝像頭拍攝文字圖片,Tesseract-OCR識別文字,將圖片文字識別為文本文字;文字應用模塊完成TTS文本朗讀以及社會化分享功能。結果表明,軟件對文字圖片有很好的識別率并且能夠完成文本朗讀及社會化分享功能。

關鍵詞:Android;OCR;TTS;社會化分享

1 系統相關技術分析

1.1 Android系統

Android是運行于Linux kernel之上,但并不是GNU/Linux,廣泛應用于移動設備上。Android的系統架構是采用五層架構,自頂向下分別為:應用程序、應用程序框架、庫、AndroidRuntime以及Linux內核。

1.2 OCR技術與Tesseract

1.2.1 OCR技術原理

OCR(Optical Character Recognition。光學字符識別)是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程。OCR的目的是利用計算機識別文本圖片。讓人從中解放出來,提高生產力。OCR核心過程分為四步:

(1)圖像預處理:對文本圖片進行預處理,濾去干擾、噪聲。主要目的是消除圖像中無關信息,恢復有用的真實信息,增強有關信息的可檢測性和最大程度地簡化數據,從而改進特征抽取、圖像分割、匹配和識別的可靠性。而預處理過程一般有數字化、幾何變化、歸一化、增強和平滑等步驟。

(2)文字分割:對文本圖像進行分割,以定位和分離出帶識別的文字。

(3)特征抽取:在文字分割的基礎上,提取需要的特征,并對某些參數進行計算,輸出特征信息。

(4)文字識別:根據特征信息,加上模式識別的方法確定其文字內容。

1.2.2 Tesse ract

Tesse ract-OCR是開源的識別引擎,最先有HP實驗室于1985年開始研發,但不久就放棄了OCR業務。幾年后,HP將其貢獻給開源軟件業。讓其重新發揮作用。Tesseract算法分為下列幾個步驟:

(1)輪廓分析:文本圖像中含有許多字符,在OCR識別前,首先需要給每個字符標記有效邊界,即:輪廓。它采用了一種嵌套的輪廓搜索算法,不僅搜索輪廓本身,還搜索嵌套輪廓的輪廓。最后將分析所得的輪廓組合成文本塊。

(2)文本塊被行劃分:顧名思義將圖像劃分成若干行,將文本行分割成字符。

(3)特征提取,進行第一次識別,再次識別上次認錯的字符,當識別率達到設定的閾值時進入下一步。

(4)語言分析:利用詞義、詞頻、語法規則或語料庫等語言先驗知識識別結果進行校正,提高識別率。

2 系統實現

2.1 圖片采集

圖片采集有兩種方式:一種是使用移動設備攝像頭進行拍照,另一種是直接從相冊中選取圖片。

2.1.1 拍攝功能實現

首先我們介紹第一種方式,在Android系統可以在拍照按鈕設置監聽器調用攝像頭如下:21 2相冊中選取

接下來是第二種方式,同樣在相應按鈕設置監聽器,方法如下:

2.2 圖片處理

系統使用的是開源識別引擎Tesseract-OCR,所以在建立工程的時候,需要將其配置進去。這樣我們就可以直接調用Tesseract-OCR提供給我們的類TessBaseAPI,對我們選取的圖片區域進行識別,返回識別文本信息。

Android平臺具體演示流程如下:

2.3 TTS文本朗讀功能實現

TTS(TextToSpeech)是將指定的文本轉換成不同語言音頻輸出的技術,TTS引擎依托于當前的Android平臺所支持的幾種語言。由于不是所有的設備都加載了資源。為此,開發時引入了檢測模塊,讓利用這項技術的開發人員可以檢測資源是否存在,下邊給出一個標準的檢測方法:

Intent checkIntent=new Intent():

checkIntent.setAction(TextToSpeech.Engine.ACTlON_CHECK_TTs_DATA):

startActivityForResult(chekIntent,REQ_TTS_STATUS_CHECK);

如果當前系統允許創建一個“And roid speech TTSTextToSpeech”的對象,說明已經提供TTS功能的支持。將檢測返回結果中給出“CHECK VOICE DATA PASS”的標記。根據上邊的介紹,基本實現了TextToSpeech的初始化和參數配置。下面是TTS利用Speak()方法可以直接在應用程序中發揮強大的語音功能。

2.4 社會化分享功能實現

系統在Android移動設備上進行分享是將文本圖片識別的文本進行發布到各個社交平臺(比如:微信,新浪微博等),該功能主要依托于百度社會化服務。百度社會化服務為開發者提供了接入新浪微博、QQ登錄、騰訊微博、開心網等第三方社會化平臺的服務。為開發者提供了社會化登錄組件及社會化分享組件管理控制臺,與此同時還開放了社會化服務REST API及多平臺的SDK供開發者開發使用。系統中使用的是Frontia Android版,采用的是2.0.3版本。

Android平臺具體演示流程如下:

3 結語

本文主要闡述了基于Android平臺的OCR相機的實現,并且淺析了涉及到的相關技術原理。軟件基本滿足了用戶的日常使用。并且還可以進一步擴展,比如可以添加在線翻譯、日程提醒等功能,有一定的市場價值。軟件圖像處理方法仍存在部分缺陷,如處理速度不夠快、識別率有待提高等。因此,繼續完善系統功能、提高文字的識別率及機器自學習是下一步的研究工作重點。

主站蜘蛛池模板: 在线观看国产精品第一区免费| 国产毛片基地| 日韩免费中文字幕| 中文字幕色在线| 欧美日韩久久综合| 国产va在线观看| 91网在线| 精品欧美一区二区三区久久久| 日韩精品资源| 婷婷六月激情综合一区| 黄色网在线| 一本色道久久88| 日韩欧美中文| 久久这里只有精品2| 自拍欧美亚洲| 青青久视频| 2020最新国产精品视频| 亚洲熟女中文字幕男人总站| 91亚洲精品国产自在现线| 在线观看国产黄色| 精品国产自在在线在线观看| 国产精品蜜臀| 中文精品久久久久国产网址| 国产成人精品无码一区二 | 国产欧美日韩一区二区视频在线| 久久久久九九精品影院| 色哟哟色院91精品网站| 99精品欧美一区| 久久国产成人精品国产成人亚洲| 五月婷婷综合在线视频| 97影院午夜在线观看视频| 又大又硬又爽免费视频| 九九九久久国产精品| 亚洲综合色区在线播放2019| 亚洲一区二区视频在线观看| 国产精品一线天| 色噜噜久久| 欧美黄网在线| 免费国产不卡午夜福在线观看| 99热这里只有免费国产精品| 国产成人亚洲欧美激情| 亚洲熟女中文字幕男人总站| 亚洲成人播放| 九九精品在线观看| 国产全黄a一级毛片| 亚洲综合九九| 狠狠色狠狠色综合久久第一次| 曰AV在线无码| 亚洲人成在线精品| 91麻豆精品视频| 国产精品漂亮美女在线观看| 日a本亚洲中文在线观看| 伊人久久精品无码麻豆精品| 热99re99首页精品亚洲五月天| 婷婷色丁香综合激情| 亚洲视频四区| 欧美色亚洲| 亚洲中文字幕日产无码2021 | 国产精品嫩草影院视频| 青草国产在线视频| 亚洲国产黄色| 国产尹人香蕉综合在线电影| A级全黄试看30分钟小视频| 伊人中文网| 国产乱视频网站| 久久精品无码国产一区二区三区| 亚洲天堂在线免费| 高清欧美性猛交XXXX黑人猛交| 欧美丝袜高跟鞋一区二区| 日韩高清无码免费| 成人蜜桃网| 午夜精品久久久久久久无码软件| www.国产福利| 在线亚洲精品福利网址导航| 日韩色图在线观看| 亚洲欧洲自拍拍偷午夜色| 欧洲一区二区三区无码| 在线视频精品一区| 91香蕉视频下载网站| 亚洲首页国产精品丝袜| 538国产视频| 喷潮白浆直流在线播放|