999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度學習在文字識別領域的應用研究

2022-09-28 10:49:02杜朋軒
科技資訊 2022年19期
關鍵詞:深度信息

杜朋軒

(寧夏職業技術學院 寧夏銀川 750021)

在信息技術法的快速發展背景下,文字信息的數量越來越大,如何做好漢字的識別與保存工作是目前需要解決的問題。信息技術的運用,可以強化漢字的識別效率,為各個領域文字工作開展提供基礎保障。深度學習在文字識別中運用,為文字識別提供技術支持,促使文字識別技術創新與改革。

1 相關的概念

1.1 深度學習

深度學習(Deep Learning,DL),是機器學習領域的一部分,是學習樣本數據的內在規律與表示層次,對學習過程中獲得的信息(文字、聲音、圖像)的解釋有很大的幫助。深度學習的目的是賦予機器人分析學習能力,使其能夠識別文字、聲音等數據[1]。在深度學習被運用多個不同的領域,如機器翻譯、自然語言處理、數據挖掘等,取得較多良好的成果。深度學習主要包含3個方面的內容:第一,以卷積運算為基礎的神經網絡系統;第二,以多層神經元為基礎的自編碼神經網絡;第三,以多層自編碼審計網絡的方式進行預訓練,進而結合鑒別信息進一步優化神經網絡權值的深度置信網絡。

1.2 文字識別

文字識別(Optical Character Recognition,OCR),就是利用計算機自動識別字符的技術,包含文字信息的采集、信息的分析與處理、信息的分類與判別等內容。其中信息采集,就是將紙張中的文字灰度轉變成電信號,傳輸到計算機中。信息分析與處理,就是將收集的電信號進行正規化處理,將文字、標點符號轉變為統一的標準。信息分類判別,就是對轉化成文字的信息進行分類,將此以準確的方式呈現出來。圖1 為該技術手段工作流程。

圖1 文字識別技術工作流程

當前文字識別技術的應用范圍非常廣,不僅在閱讀、翻譯中運用,同時也被運用在征收業務、稿件校對、證件識別等行業。該技術手段的運用,不僅有助于提升文字處理工作的效果,同時還能提升文字識別的準確性。

1.3 文字識別的意義

在互聯網快速發展背景下,各個行業逐漸出現較多的文字信息,如何將文字信息有機的收集、整理、保存好,是文字工作者需要考慮的問題。文字識別技術的運用,能夠減輕相關人員的工作壓力與難度,提升文字信息的收集與管理效果,為各個領域工作開展提供文字信息的支持。文字識別技術發展的意義主要體現在以下方面。

1.3.1 為中文信息錄入工作提供便利

無論是哪個行業的發展,都離不開語言文字的支持[2]。若是采用傳統人工的方式錄入文字,無法保證文字的準確性,同時還會影響行業發展。文字識別技術的運用,將文字信息全部整合在一起,減少文字錄入工作量,提升文字信息收集工作效果。比如:合合信息科技股份有限公司與RPA,聯合推出智能文字識別+RPA,為RPA 機器人安裝智慧的“雙眼”。文字識別與人工智能的結合,可以使機器人可以精準且快速地“閱讀”用戶上傳的各種紙質、電子等材料。在多人使用的場景下,系統可將機器人的響應速度提升到20 s之內,單張圖文資料OCR識別速度在1~2 s之間。

1.3.2 提升辦公效果

在科學技術手段快速發展背景下,國家提倡無紙化、智能化辦公。文字識別技術的運用,提升文字信息的處理效率,為辦公室工作的實施與開展提供技術手段支持。該技術手段的支持,提升辦公室工作效果,促使文字相關工作順利實施。比如:在印刷行業、文印店工作的過程中,部分用戶會有將圖片信息打印成Word文檔的需求。這時工作人員可以利用ocr 文字識別軟件,將識別圖片中的信息,并將此轉化成數字化的形式,通過編輯,將此轉化成Word文檔。

1.3.3 促使文化發展

最近幾年,我國科學技術發展速度十分迅速,為各個行業發展帶來技術支持,促使行業的創新。文字識別技術的運用,反映出我國科學技術的進步與發展速度,為國家技術進一步發展提供動力。我國作為一個多民族國家,大部分少數民族都有自己的語言與文化。若是研究者不了解其他民族的語言,那么研究工作就無法順利實施。針對這一問題,可以借助文字識別技術,掃描識別其他民族的語言文字,將此翻譯成簡寫的漢字,以此了解其他民族的文化發展情況。這樣一來,不僅可以推動我國文化發展,同時能夠豐富中華文化,促使相關工作有秩序開展。

2 深度學習下的文字識別技術應用優勢

在深度學習技術下,衍生出較多的文字識別方法,文字識別方法不同,呈現出的效果也不同。通過對文字識別方法的分析,發現卷積神經網絡應用范圍較廣,大部分文字識別技術都是以卷積神經網絡模式為基礎,將此作為文字識別的主要方法。與傳統技術相比,該模式的運用,可以提升文字信息提取效果,減少文字信息錯誤的問題[3]。深度學習中卷積神經網絡模式(Convolutional Neural Networks,CNN)的工作原理,就是將輸入計算機中圖像內部的特征信息,通過卷積與采樣等操作,將文字信息精確地提取出來。

20 世紀80~90 年代,已經有學者開始研究卷積神經網絡,其中時間延遲網絡與Lenet-5是最早出現的卷積神經網絡。隨著深度學習理論提出與數值計算設備的完善,卷積網絡神經網絡得到快速的發展,并逐漸被運用在多個領域,成為文字識別方法重要組成部分。這一文字識別方法主要具備共享卷積核的優勢,能夠快速處理大量的數據信息。在利用這一方法進行文字識別工作時,不需要操作人員手動選擇特征,只需要通過訓練好權重的方式,即可獲得已經完成分類的文字信息。

3 文字識別方法中存在的問題

文字識別方法雖然得到廣泛的運用,但是在運用中發現一些問題,影響文字識別技術的發展。具體表現為以下幾個方面。

3.1 部分文字識別方法缺乏自主性,過分依賴人工定義特征

為了提升文字識別技術的應用效果,我國學者對文字特征進行相關的研究,雖然獲取一定的成就,但是由于文字的特殊性,所以部分研究內容無法被運用在實際中,無法為文字識別技術的運用提供支持。比如:文字識別的過程中,會因為不同樣式的字體、豎直的文本、特殊的字符等因素出現無法識別的情況,直接影響文字識別的效率與質量。人工定義特征的方式,雖然可以將文字識別工作變得簡化、規范化,但是人工定義特征工作比較復雜,無法將所有的文字信息都整合在一起,為文字識別工作的實施提供支持。

3.2 脫離文本的字符在識別中容易出現歧義

部分文字在識別中,會出現與文本含義不同的情況,影響文字識別的效果。

3.3 簡單文字整體識別難度較大

不同的文字識別方法會呈現不同的效果,以整個單詞識別方法為例,在文字識別的過程中,可以通過圖片、文本等載體提取文字特征,然后利用信息技術進行識別。雖然可以快速獲取不同載體中的文字信息,但是也存在以下問題。

(1)無法實現對無約束情況下文字的識別。部分文本中出現的文字,并不是漢字,而是由字符組成的文字,如驗證碼、商標名稱等。在文字識別的過程中,會因為無文字特征約束,出現無法識別的情況。(2)長串字符識別難度大。在文字識別的過程中,會因為字符的數量出現無法識別的情況。(3)字符定位功能不清晰。文字識別方法運用的過程中,不僅要識別圖像或者文本中的文字,同時還要了解字符在原圖中的位置,并利用字符的識別方法進行識別,確定字符內容與含義。但是由于字符定位不清晰,所以無法為文字準確識別工作開展提供支持,造成漢字識別效果不理想的情況出現。

3.4 訓練樣本制作方式過于復雜

當前文字識別中有很多算法,這些算法的訓練過于依賴訓練樣本中標準結果[4]。也就是說系統錄入什么內容,算法只能識別這一內容,無法識別系統內不具備的信息。訓練樣本的制作只起到輔助作用,且工作人員專業能力有限,無法將所有的文字都體現在訓練樣本中,為文字識別工作實施帶來一些難度。

在文字識別中,識別方法的運用,雖然可以加強文字錄入工作的壓力,但是因為文字識別方法缺陷與不足,所以無法為所有的文字識別工作提供技術支持。在未來漢字識別工作中,需要加強對當前識別方法的研究與分析,結合各個領域的需求,對識別技術與方法進行創新,促使文字識別工作順利進行。

4 深度學習下的文字識別技術應用

在科學技術發展背景下,智能化已經成為各個領域發展的必然趨勢。文字識別技術的運用,不僅可以體現出信息技術的應用價值,同時可以為不同的行業發展助力。通過對當前深度學習文字識別技術運用情況的分析,發現該技術主要被運用在以下方面。

4.1 證件識別

在金融領域、保險、互聯網等多個不同的領域,都需要人們出示證件信息。若是采用人工的方式進行證件信息的收集與保存,會出現信息錄入錯誤或者重要信息泄露的情況。文字保苗技術的運用,為各個行業中的證件識別工作提供技術手段支持[5]。當前有專門識別證件的軟件,可以用于二代身份證、護照、行駛證、駕駛證等20 多種不同證件的識別,具體如圖2 所示。該技術中被運用在證件采集儀、門禁考勤機、人行通道閘機等領域。

圖2 身份證文字識別

4.2 銀行卡識別

銀行卡識別技術,主要是對銀行卡號進行識別。在線上軟件中,用戶若是產生消費需求后,會綁定銀行卡。這時可以直接利用相關的設備,拍攝銀行卡,自動識別銀行卡中的信息,將識別中獲取的信息進行分組分類,保存在軟件系統中。與傳統手工輸入銀行卡號碼的方式相比,該技術的運用,提升數字信息的錄入速度,同時可以減少外界因素的影響,能夠識別市面中凸字銀行卡、平面銀行卡。此外該技術可以保存銀行卡實物影響,不需要紙質復印保存。移動端銀行卡識別SDK、云端銀行卡識別API中都引進的文字識別技術,為銀行與金融領域工作提供便利。

4.3 車牌識別

最近幾年,我國汽車行業發展越來越迅速,交通運輸部門為了提升車輛管理效果,維護社會的穩定,將文字識別技術引進車牌識別中,將此作為管理工作開展的媒介。傳統人工管理的方式,無法及時發展車輛違法行為,且不能為汽車行業的發展提供更多信息的支持。文字識別技術的運用,可以快速了解汽車的車牌號、顏色、類型等重要信息,對移動警務、占道停車、停車場管理、車險等方面工作開展具有促進作用。以車牌識別抓拍相機為例,該設備在文字識別技術的支持下,可以快速抓拍車輛外形、車牌信息,并利用交通運輸相關的數據庫,進行對比,判斷其是否存在違法行為,主要被運用在要是城市道路或高速公路出入口、收費站等重點治安監控地段的全天候實時檢測與記錄收費站、交通或治安檢查站等地點。

4.4 識別營業執照

營業執照的管理十分重要,是維護市場秩序與穩定的桿件。個體經營、企業經營等具有商業性的經營活動,都需要辦理營業執照。由于營業執照信息較多,若是采用手工錄入或者拍攝照片保存的方式,不利于后續的運用[6]。文字識別的運用,將營業執照中信息,如統一社會信用代碼、公司名稱,以統一的方式提出來,為相關工作的實施與開展提供便利。目前我國常用的識別軟件包含移動端營業執照識別SDK、文字識別SDK、掃描識別硬。文字識別技術的運用,提升重要信息的管理效果,為集中管理提供便利。

4.5 票據信息識別

票據管理與我國各個領域工作有著密切的關系,是了解各個行業經濟運行情況的關鍵。文字識別技術與票據管理工作的結合,不僅可以提升票據管理工作效果,同時可以避免出現信息丟失或者不準確的問題[7]。以企業為例,企業經營管理中會產生較多的票據信息,如采購票據、差旅票據、稅務票據等,涉及的信息內容較多。文字識別技術的運用,能夠為票據管理人員提供便利,可以輔助票據管理人員將相關票據信息以標準的方式整合在一起。目前比較常用的票據識別技術有表票識別掃描儀、表票識別SDK。

4.6 文字識別

在我國文字工作領域中,深度學習文字識別技術應用比較廣泛,成為圖書館、報社等行業主要工作手段支持。文字行業涉及的文字信息較多,若是采用人工的方式進行文字信息的收錄審核,不僅無法保證文字信息錄入的準確性,同時需要消耗較多的時間,增加工作成本。文字識別技術的運用,可以輔助文字管理者將紙質信息準確、快速地轉化成數字化信息,存在計算機中[8]。文字掃描儀是目前比較常用的文字識別技術,通過該技術手段的運用,提升文字信息處理效果與質量,解決信息收集與處理效率低下的問題。

以滿文識別通為例,該軟件可將滿文檔案的圖像、信息,通過識別技術轉換成可編輯檢索的文本信息。當前這一系統的滿文行書識別率86.6%,滿文楷書識別率95.1%,其單機識別速度達到625幅/h。該軟件的開發,為圖書館管理工作提供支持,減輕了工作人員是手工識別壓力,提升了檔案信息的翻譯與管理效率。

5 結語

總而言之,在文字識別技術與深度融合技術的運用,提升文字信息的處理與運用效果,為文字相關工作的實施提供便利。此外,可以發揮深度學習的優勢,豐富文字識別技術的功能,將此運用在證件號碼、汽車車牌、票據信息、圖書館等方面,解決當前文字識別技術最紅存在的問題,為各項工作提供便利的同時,展示出現代信息技術優勢與應用價值,為我國全方位發展打下堅實的基礎。

猜你喜歡
深度信息
深度理解一元一次方程
深度觀察
深度觀察
深度觀察
深度觀察
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
提升深度報道量與質
新聞傳播(2015年10期)2015-07-18 11:05:40
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 久久99国产综合精品1| 国产三级国产精品国产普男人 | 国产免费久久精品44| 啪啪免费视频一区二区| 亚洲欧美一区二区三区麻豆| 亚国产欧美在线人成| 欧美另类图片视频无弹跳第一页| 国产美女视频黄a视频全免费网站| 狠狠躁天天躁夜夜躁婷婷| 午夜影院a级片| 激情综合五月网| 国产成人AV综合久久| 国产小视频在线高清播放 | 熟女成人国产精品视频| 91偷拍一区| 一本二本三本不卡无码| www欧美在线观看| 日韩成人午夜| 91伊人国产| 凹凸国产分类在线观看| 天堂在线亚洲| 人人妻人人澡人人爽欧美一区| 在线观看免费国产| 午夜福利无码一区二区| 91探花国产综合在线精品| 亚洲无码精彩视频在线观看| 欧美一区二区三区不卡免费| 亚洲成人播放| 精品无码国产自产野外拍在线| 亚洲国产亚综合在线区| 91小视频在线观看免费版高清| 欧美h在线观看| 熟妇丰满人妻| 国产99精品久久| 日韩毛片基地| 国产不卡在线看| 四虎国产精品永久在线网址| 欧美激情视频二区| 午夜三级在线| 亚洲热线99精品视频| 亚洲AV无码久久精品色欲| 欧美成人二区| 91久久天天躁狠狠躁夜夜| 国产亚洲精久久久久久久91| 欧美19综合中文字幕| 国产精品久久久久久影院| 丰满少妇αⅴ无码区| 在线欧美日韩| 亚洲中文字幕久久无码精品A| 麻豆精品视频在线原创| 91精品国产综合久久香蕉922| 精品一区二区久久久久网站| 第一页亚洲| 亚洲色成人www在线观看| 国产欧美中文字幕| 国产精品99r8在线观看| 免费看美女自慰的网站| 美女免费精品高清毛片在线视| 午夜免费小视频| 国产黑丝一区| 国产人人干| 国产成人精品一区二区免费看京| 91原创视频在线| 国产福利拍拍拍| 国产一区在线观看无码| 99久久国产综合精品女同| 国产在线观看99| 中文字幕在线观| 亚洲最新在线| 精品国产www| 五月婷婷综合在线视频| 国产伦片中文免费观看| 九色视频最新网址 | 国产激情无码一区二区APP | 久久久久久久久18禁秘| 亚洲青涩在线| jijzzizz老师出水喷水喷出| 亚洲精品无码高潮喷水A| 国产精品午夜福利麻豆| 国产小视频免费| 亚洲成AV人手机在线观看网站| 亚洲第一色视频|