999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于MATLAB的票據(jù)自動(dòng)報(bào)賬系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

2018-11-19 11:44:40趙懿琨馬劼聰陳仰麗余曉佳黃國(guó)偉
現(xiàn)代農(nóng)業(yè)研究 2018年10期
關(guān)鍵詞:自動(dòng)化

趙懿琨 馬劼聰 陳仰麗 余曉佳 黃國(guó)偉

【摘 要】 目前,國(guó)內(nèi)會(huì)計(jì)師仍采用人工方式進(jìn)行票據(jù)數(shù)據(jù)錄入,完成賬目的處理,錯(cuò)誤率高且效率低,針對(duì)該問題,本系統(tǒng)開發(fā)出一款對(duì)發(fā)票實(shí)現(xiàn)自動(dòng)化信息識(shí)別并報(bào)賬的軟件,實(shí)現(xiàn)從數(shù)據(jù)采集到報(bào)賬完成一體的自動(dòng)化服務(wù)。本系統(tǒng)在MATLAB軟件上運(yùn)行,結(jié)合光學(xué)識(shí)別OCR引擎Tesseract軟件實(shí)現(xiàn)功能,基礎(chǔ)功能包括:票據(jù)圖像的無(wú)線收發(fā)、票據(jù)圖像信息提取處理與識(shí)別,自動(dòng)生成財(cái)務(wù)報(bào)表等功能。此外,為了提高系統(tǒng)的可靠性,增加了如多段關(guān)鍵信息截取、圖像的傾斜校正、數(shù)學(xué)形態(tài)學(xué)處理等技術(shù)。

【關(guān)鍵詞】 自動(dòng)化;Tesseract;OCR;MATLAB

[Abstract] At present, domestic accountants still use manual way to input bill data and complete the account processing. The error rate is high and the efficiency is low. Aiming at this problem, this system develops a software to realize automatic information identification and account reporting for invoices, which realizes the automation service from data collection to account reporting. The system runs on MATLAB software and combines with Tesseract software of optical recognition 0C engine to realize the functions. The basic functions include: wireless receipt and dispatch of bills image, information extraction and recognition of bills image, automatic generation of financial statements and other functions. In addition, in order to improve the reliability of the system, such as multi-segment key information interception, Image tilt correction, mathematical morphology processing and other technologies are added.

[Keywords] automation; tesseract ; OCR; MATLAB

1 系統(tǒng)整體概述

本軟件主要在PC 及其兼容機(jī)上運(yùn)行,使用WINDOWS 7以上操作系統(tǒng)。成功安裝軟件并配置相應(yīng)的系統(tǒng)環(huán)境后,在MATLAB上運(yùn)行,利用FTP傳輸協(xié)議接收票據(jù)圖像,根據(jù)用戶需要制作不同票據(jù)圖像模板,自動(dòng)批量準(zhǔn)確提取相關(guān)區(qū)域圖像,對(duì)圖像進(jìn)行預(yù)處理后,結(jié)合光學(xué)識(shí)別引擎Tesseract軟件,對(duì)圖像中的字符信息進(jìn)行識(shí)別,并將結(jié)果制成匯總表格,根據(jù)《小企業(yè)會(huì)計(jì)準(zhǔn)則》和手工報(bào)賬標(biāo)準(zhǔn)生成財(cái)務(wù)報(bào)表。

票據(jù)自動(dòng)報(bào)賬系統(tǒng)軟件利用MATLAB進(jìn)行編程,核心部分包括票據(jù)圖像的無(wú)線收發(fā)、信息提取處理與識(shí)別,自動(dòng)生成財(cái)務(wù)報(bào)表等功能。票據(jù)圖像信息提取處理與識(shí)別部分包括票據(jù)圖像自動(dòng)化分類、圖像的傾斜校正、關(guān)鍵信息的截取、圖像二值化和數(shù)學(xué)形態(tài)學(xué)處理以及對(duì)票據(jù)信息的OCR識(shí)別,并儲(chǔ)存在TXT文件中;自動(dòng)報(bào)賬部分用于完成最后的報(bào)賬任務(wù),遵循《小企業(yè)會(huì)計(jì)準(zhǔn)則》的做賬原則,按一定規(guī)律進(jìn)行報(bào)賬,同時(shí)提供導(dǎo)出功能便于輸出紙質(zhì)報(bào)表和核查財(cái)務(wù)數(shù)據(jù)。項(xiàng)目整體系統(tǒng)框圖如圖1所示。

2 系統(tǒng)實(shí)現(xiàn)部分

2.1 票據(jù)圖像的無(wú)線收發(fā)

2.1.1 圖像輸入讀取 在filezilla軟件的服務(wù)器端開放“download”及“upload”接收、傳送圖像。可以使用imread,dir函數(shù)檢測(cè)指定目錄下圖像的張數(shù),設(shè)置for循環(huán)函數(shù)自動(dòng)讀取完目錄下所有圖像。

在此過程中,需要檢測(cè)圖像是否正向讀取,若不可取,則反饋給圖像輸入模塊,若可取,則進(jìn)行下一步操作。在這個(gè)過程中,當(dāng)圖像不被讀取反饋回去時(shí),下一步操作中將出現(xiàn)圖像空缺,在下一級(jí)讀取圖像時(shí),添加判別出錯(cuò)算法。

2.1.2 圖像初級(jí)處理 基于無(wú)線接收到的圖像可直接根據(jù)MATLAB處理匹配的命名方式進(jìn)行批量命名和文件建立,需要考慮圖像是否可用,接收到的圖像基于以下三種處理方式進(jìn)行觸及處理:

(1)正反面(顛倒):根據(jù)對(duì)發(fā)票右上角的“二維碼”進(jìn)行定位判斷,可通過canny算子提取“二維碼”邊緣,計(jì)算統(tǒng)計(jì)得出灰度值的平均值,可連接起被分隔開的區(qū)域,判斷該區(qū)域是否存在對(duì)應(yīng)寬度信息,以此判斷圖像是正面或顛倒,如果判定結(jié)果為顛倒,可以通過imrotate語(yǔ)句將圖像旋轉(zhuǎn)180度保存以便下一步處理。

(2)里外面:如果發(fā)票的上下方位都檢測(cè)不到“二維碼”區(qū)域,則表明該圖像放置反了,可以反饋回硬件系統(tǒng),提醒翻轉(zhuǎn)。

(3)拍攝模糊:當(dāng)將圖像進(jìn)行二值化、中值濾波后,發(fā)現(xiàn)無(wú)法清晰讀取所提取的“二維碼”,則該圖像拍攝模糊,反饋給硬件系統(tǒng),提醒硬件重拍。

2.1.3 圖像識(shí)別反饋 以帶有“二維碼”的增值稅票據(jù)圖像為例,將左上角的“二維碼”識(shí)別結(jié)果作為判定票據(jù)放置是否正確的依據(jù),利用閾值分割提取出“二維碼”所在區(qū)域,通過掃描得到“二維碼”的邊角坐標(biāo)。

調(diào)用MATLAB中“width”函數(shù)對(duì)100張票據(jù)“二維碼”所在區(qū)域的測(cè)算得到“二維碼”區(qū)域平均寬度值為385像素,定義識(shí)別到圖像中黑色邊角寬度像素區(qū)間位于375~400時(shí),票據(jù)圖像放置正確,圖像質(zhì)量合格,儲(chǔ)存進(jìn)“upload”文件夾,當(dāng)識(shí)別到像素區(qū)間不符合要求時(shí),將該票據(jù)圖像儲(chǔ)存進(jìn)“待反饋文件夾”。

將不合格的票據(jù)圖像序號(hào)通過filezilla無(wú)線傳輸發(fā)送到上一級(jí)的票據(jù)圖像輸入模塊。將“upload”文件夾圖像的序號(hào)儲(chǔ)存成txt文檔,通過filezilla平臺(tái)反饋回上一級(jí)。

2.2 票據(jù)圖像信息提取處理與識(shí)別

2.2.1 票據(jù)圖像信息提取處理 無(wú)線接收票據(jù)圖像后,軟件利用MATLAB批量處理票據(jù),首先截取有效票據(jù)區(qū)域,然后截取票據(jù)中有效數(shù)據(jù)區(qū)域;接著逐漸增加角度調(diào)整函數(shù),自動(dòng)調(diào)整圖片,不同票據(jù)用同一算法實(shí)現(xiàn);再對(duì)截取部分進(jìn)行灰度化,腐蝕膨脹處理,以便于識(shí)別。

2.2.2 識(shí)別 本設(shè)計(jì)通過第三方j(luò)TessBoxEditor工具訓(xùn)練字庫(kù),字符識(shí)別過程中OCR也在進(jìn)行自適應(yīng)學(xué)習(xí),不斷拓展字庫(kù),識(shí)別更多的字符,從而提高識(shí)別率。通過tesseract平臺(tái)上的jTessBoxEditor工具來處理修正字庫(kù),通過不斷識(shí)別更新字庫(kù),積累字庫(kù)的信息。

2.3 自動(dòng)生成財(cái)務(wù)報(bào)表

這一步分為四個(gè)模塊,分別是數(shù)據(jù)導(dǎo)入模塊、數(shù)據(jù)識(shí)別模塊、數(shù)據(jù)判斷模塊和表格生成模塊。

總工作流程:如圖2所示,首先導(dǎo)入存放OCR識(shí)別結(jié)果的txt文本,將這些信息匯總成表格,然后在匯總表的基礎(chǔ)上,加入會(huì)計(jì)科目等類別,對(duì)收集到的信息進(jìn)行分類處理,完善匯總表格成為會(huì)計(jì)信息總表,最后在會(huì)計(jì)信息總表上提取數(shù)據(jù),經(jīng)過統(tǒng)計(jì)歸類,按實(shí)際需求,編制財(cái)務(wù)表格。

數(shù)據(jù)導(dǎo)入模塊設(shè)計(jì):在本模塊中,txt文件分為七類,對(duì)應(yīng)發(fā)票上的七類有效信息。因?yàn)镺CR識(shí)別對(duì)字符和數(shù)字的編碼方式不同,七類txt文件中會(huì)出現(xiàn)兩種編碼格式,一種是ANSI,另一種是utf-8。針對(duì)不同的編碼格式,MATLAB在將txt文件里的內(nèi)容導(dǎo)入到匯總表格時(shí),需要運(yùn)行不同的處理語(yǔ)句,確保txt文件里的內(nèi)容能被正確導(dǎo)入。

數(shù)據(jù)識(shí)別模塊設(shè)計(jì):本模塊的功能是在匯總表上處理錯(cuò)誤的數(shù)據(jù),完成對(duì)匯總表的自動(dòng)修正。完成數(shù)據(jù)的導(dǎo)入后,因?yàn)镺CR識(shí)別可能存在錯(cuò)誤,所以數(shù)據(jù)識(shí)別模塊的工作就是識(shí)別并且定位匯總表格上錯(cuò)誤的數(shù)據(jù)。基于本設(shè)計(jì)對(duì)于報(bào)賬系統(tǒng)自動(dòng)化的目標(biāo),在構(gòu)想處理方案時(shí),希望做到的是發(fā)現(xiàn)錯(cuò)誤并且能夠自動(dòng)改正錯(cuò)誤。因此也引入了相似度算法,對(duì)可能出現(xiàn)的一些錯(cuò)誤實(shí)現(xiàn)自動(dòng)糾正,或者是為使用者手動(dòng)糾正提供參考。

數(shù)據(jù)判斷模塊:在匯總表的基礎(chǔ)上,通過對(duì)表上數(shù)據(jù)的分析判斷得到借貸關(guān)系和會(huì)計(jì)科目。判斷會(huì)計(jì)科目時(shí)額外需要關(guān)系數(shù)據(jù)庫(kù)的輔助。得到這兩項(xiàng)信息后,即完成了由匯總表到會(huì)計(jì)信息總表的過程。

表格生成模塊設(shè)計(jì):在本設(shè)計(jì)中,輸出的財(cái)務(wù)表格有三種,分別是資產(chǎn)負(fù)債表、科目余額表和利潤(rùn)表。在會(huì)計(jì)信息總表的基礎(chǔ)上,對(duì)表格上的金額依照會(huì)計(jì)科目和借貸關(guān)系進(jìn)行統(tǒng)計(jì)和歸類,將統(tǒng)計(jì)歸類后的信息分別輸出到三種財(cái)務(wù)表格的相應(yīng)模板上,完成財(cái)務(wù)表格的編制。如果在以上模塊中識(shí)別出錯(cuò)誤并無(wú)法修正時(shí),則需要人工參與修正。

3 系統(tǒng)測(cè)試部分

3.1 識(shí)別部分測(cè)試結(jié)果

漢字89%、符號(hào)98%、字母98%、數(shù)字96%,通過測(cè)試結(jié)果分析可以看出,數(shù)字的識(shí)別準(zhǔn)確率已比較高,但文字識(shí)別準(zhǔn)確率還有待提高,ocr識(shí)別字庫(kù)需要不斷訓(xùn)練積累,需要一定的時(shí)間,需要不斷擴(kuò)充識(shí)別字庫(kù)來滿足需求。二維碼測(cè)試結(jié)果:發(fā)票二維碼內(nèi)的信息都是符號(hào)和數(shù)字,符號(hào)和數(shù)字識(shí)別率已到達(dá)96%。

識(shí)別速度達(dá)到OCR識(shí)別每張圖片2.1s,二維碼識(shí)別每張圖片1.95s

3.2 票據(jù)提取部分測(cè)試結(jié)果

經(jīng)過測(cè)試發(fā)現(xiàn)并解決問題,測(cè)得本設(shè)計(jì)圖像處理平均時(shí)間為396秒

4 總結(jié)

本課題通過使用Matlab軟件與Tesseract開源OCR引擎進(jìn)行設(shè)計(jì)研究,對(duì)會(huì)計(jì)人員沒有完整的自動(dòng)化發(fā)票單據(jù)報(bào)賬軟件這一問題做出嘗試,通過對(duì)OCR引擎的熟悉與訓(xùn)練,通過使用Matlab軟件進(jìn)行程序的開發(fā),實(shí)現(xiàn)了從發(fā)票單據(jù)的圖片輸入、輸入圖片處理、有效數(shù)據(jù)的截取、數(shù)據(jù)的錄入到通過程序進(jìn)行自動(dòng)報(bào)賬,這樣一系列完整的功能,證明了全流程的自動(dòng)化報(bào)賬軟件實(shí)現(xiàn)是非常有前景的。

參考文獻(xiàn):

[1] 安然.基于OCR技術(shù)的原始憑證電子化管理系統(tǒng)的設(shè)計(jì)與 實(shí)現(xiàn)[D].吉林:吉林大學(xué),2016.

[2] 陳東霞.淺談高校財(cái)務(wù)預(yù)約報(bào)賬系統(tǒng)的構(gòu)建[J].會(huì)計(jì)之友, 2012,(35):127-128.

[3] 陳隆偉,張曉瓊,黃昌勇.會(huì)計(jì)電算化全通用理論與會(huì)計(jì)軟 件的全通用[A].財(cái)會(huì)月刊,2005,(1):5-6.

[4] 鄧?yán)^忠,張?zhí)X.數(shù)字圖像處理技術(shù)[M].廣州:廣東科技出 版社,2005.

[5] 吳狄,張冠偉.基于二維碼識(shí)別技術(shù)的工業(yè)企業(yè)設(shè)備管理 系統(tǒng)的開發(fā)與應(yīng)用[J]].數(shù)字技術(shù)與應(yīng)用,2015,06.

[6] 祝錫萍,企業(yè)財(cái)務(wù)系統(tǒng)[M].杭州:浙江大學(xué)出版社,2009: 2-3.

猜你喜歡
自動(dòng)化
國(guó)內(nèi)焊接設(shè)備市場(chǎng)現(xiàn)狀及發(fā)展趨勢(shì)研究
供電企業(yè)電力自動(dòng)化主站系統(tǒng)研究
錦界煤礦連采膠帶機(jī)集控系統(tǒng)的介紹
供熱站自動(dòng)控制系統(tǒng)中PLC的應(yīng)用
AGV小車在白酒行業(yè)自動(dòng)化立體倉(cāng)庫(kù)中的應(yīng)用
電氣工程及其自動(dòng)化問題與對(duì)策
我國(guó)機(jī)械設(shè)計(jì)制造及其自動(dòng)化的現(xiàn)狀及發(fā)展趨勢(shì)
淺論節(jié)能設(shè)計(jì)理念在機(jī)械制造與自動(dòng)化中的應(yīng)用
簡(jiǎn)析火力發(fā)電廠熱工自動(dòng)化儀表應(yīng)用及故障排除方法
配網(wǎng)自動(dòng)化實(shí)用化模式建設(shè)及系統(tǒng)運(yùn)行
主站蜘蛛池模板: 91 九色视频丝袜| 91青青在线视频| 99热最新在线| 91小视频版在线观看www| 婷婷开心中文字幕| 91在线播放免费不卡无毒| 国产成熟女人性满足视频| 亚洲欧美自拍一区| 国产特级毛片| 欧美 亚洲 日韩 国产| 国产一级二级在线观看| 四虎永久在线精品影院| 亚洲天堂区| 国产成人久久综合一区| 国产成人免费高清AⅤ| 国产成人综合日韩精品无码不卡| julia中文字幕久久亚洲| 日本午夜影院| 日韩无码视频播放| 一级毛片免费观看不卡视频| 欧美亚洲一区二区三区导航| 中文无码日韩精品| 玖玖精品视频在线观看| 国产青青操| 国产99久久亚洲综合精品西瓜tv| 精品无码国产一区二区三区AV| 亚洲三级色| 日本黄色不卡视频| 欧美精品H在线播放| 91色爱欧美精品www| 丝袜美女被出水视频一区| 99在线观看免费视频| a级毛片毛片免费观看久潮| 国产91成人| 国产精品lululu在线观看| 91黄视频在线观看| 免费毛片a| 午夜a级毛片| 亚洲三级影院| 99视频在线看| 国产一区二区免费播放| 亚洲床戏一区| 亚洲国产精品一区二区高清无码久久| 亚洲精品免费网站| 国产精品无码AⅤ在线观看播放| 欧美精品一区在线看| 国产伦片中文免费观看| 免费播放毛片| 亚洲久悠悠色悠在线播放| 国产精品自拍合集| av无码久久精品| 国产视频一二三区| 精品久久久久成人码免费动漫| 久久久久人妻一区精品色奶水| 99久久无色码中文字幕| 亚洲日韩第九十九页| 午夜毛片福利| 91精品网站| 国产美女主播一级成人毛片| 精品精品国产高清A毛片| 国产精品福利尤物youwu| 国产日韩精品欧美一区灰| 国产毛片不卡| 2021国产精品自产拍在线观看 | 欧美 亚洲 日韩 国产| 色偷偷av男人的天堂不卡| 亚洲中文字幕无码爆乳| 麻豆精品在线视频| 中文字幕久久波多野结衣| 国产日产欧美精品| 亚洲国产一区在线观看| AV老司机AV天堂| 欧美在线视频不卡| 色亚洲成人| 国产女人18毛片水真多1| аv天堂最新中文在线| 亚洲最黄视频| 久草视频精品| 国产精选小视频在线观看| 国产成人禁片在线观看| 久久www视频| 国产精品女在线观看|