左 濤
(1.中煤航測遙感集團有限公司, 陜西 西安 710199)
隨著人工智能、云計算、大數據的興起,特別是OCR(光學字符識別)技術商業化的日益成熟,照片文字識別正確率達95%以上,其自動化錄入文字信息成為可能。本文介紹使用“微信小程序+騰訊云+騰訊OCR”一體結構實現在移動端自動化的數據錄入和采集工作。其工作全部在騰訊系統框架下,微信小程序實現移動端拍照、傳照片工作和數據下載功能,騰訊云實現后臺數據庫的建立、存儲和輸出,騰訊OCR實現圖像文字識別算法。
微信小程序是一種下載安裝即可使用的程序,用戶掃一掃或搜一下即可打開應用。全面開放申請后,主體類型為企業、政府、媒體、其他組織或個人的開發者,均可申請注冊小程序。小程序、訂閱號、服務號、企業號是并行的體系[1]。
光學字符識別最早是應用在輔助盲人閱讀設備上的[2-3],1929 年OCR 的概念正式被Tausheck 提出[3-4]。OCR 是指對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息的過程[2,5]。 在計算機視覺領域,OCR 識別是其很重要的一個分支,屬于模式識別和人工智能。如圖1 所示,圖像輸入、圖像預處理、文字檢測、 文本識別、文本輸出等一系列過程構成了一個完整的OCR 系統[5-7]。其中主要過程有圖像預處理、文本檢測、文字識別、輸出識別文字等。OCR 主要解決了圖像上的文字信息計算機自動識別的問題。

圖1 OCR系統組成
Figure 1 OCR system composition 微 信OCR 識 別 能力是微信團隊推出的一套提升移動端快捷信息錄入的工具,目前支持身份證、銀行卡、行駛證、營業執照和通用OCR 的識別,廣泛適用于政務、醫療、交通、教育、教育、金融等各行各業,涉及到需要用戶輸入身份信息、銀行卡信息、車輛信息場景時,即可通過ODR 快速識別、輸入信息,極大地提高輸入效率,提高用戶體驗[1]。騰訊云文字識別基于騰訊領先的深度學習技術,將圖片上的文字內容智能識別成為可編輯的文本,既支持身份證、發票等卡證類和票據類的印刷體識別,也支持數學算式等手寫體識別,可以有效地代替人工錄入信息、提升數據處理效率。
不動產統一登記工作是十八大之后,中央部署的一項重大的改革事項,是我國產權管理體制機制的重大改革,也是維護社會主義基本經濟制度的重要保障[5]。“不動產登記”數據主要由兩部分組成:一是表示土地、海域、房屋、構筑物、建筑物等不動產單元數據,即不動產單元物理空間數據;二是表示土地、海域、房屋、構筑物、建筑物產權登記屬性的數據,即產權登記數據。物理數據由測繪成果資源提供,權屬數據由登記成果或房地產檔案管理資源提供包括權利人數據、權利數據、登記業務數據等信息[8]。數據海量,分散保存在各級不同部門,資料數字化程度不同,行業之間和行業內不同地區之間的差異較大,數據標準互不銜接,數據格式不統一[9]。不動產登記一項重要的內容是需要登記權利人信息和房產信息,不動產數據量龐大,依靠人工錄入易出錯并且耗時耗力,因此,本文提出了使用騰訊云結合騰訊OCR技術在微信端實現應用小程序,用戶通過手機拍照識別圖像上的文字信息進行整理入庫,實現自動采集人員戶籍等信息。
本系統采用了“微信小程序+騰訊云+騰訊OCR”結構模式,利用騰訊公司提供的OCR API(文字識別技術)并運用了騰訊云作為存儲和上傳下載服務。考慮到數據收集大多在戶外或現場,本文使用微信小程序作為客戶端,實現移動端數據收集工作,因此將系本統設計為C∕S 模式即Client∕Server(客戶移動端∕服務器結構),客戶移動端主要用于用戶界面顯示,服務器端接收數據輸入和下載。C∕S 一般采用兩層結構,如圖2所示。

圖2 C/S兩層結構
系統本系統功能主要過程有:利用手機拍照,使用移動端微信小程序上傳照片,在騰訊云中調用對應的OCR接口函數連接實現提取圖像中的文本信息,使用自定義算法篩取文本信息中有用的數據,其結果返回到手機端的文本窗口中,在手機端文檔可復制、編輯、粘貼等,確定沒有錯誤可以上傳保存或下載,本系統具體實施流程圖如圖3所示。

圖3 系統流程圖
具體微信小程序開發使用JavaScript語言,后臺云開發使用Node.js 調用API,數據在云端處理,微信小程序客戶端負責上傳照片和下載處理數據。
利用OCR函數返回值即識別圖片的文字信息,在騰訊云中使用Node.js函數保存必要信息在騰訊云數據庫中,根據客戶端的設置和要求提取并保存在Excel中進行下載。戶口簿數據處理使用同樣的過程,其值保存在戶籍信息數據庫中等待篩選下載。
本系統參與本單位相關項目的具體實施,在四川、福建、江西等5 個不動產登記項目中進行了測試和應用,本系統效率高、速度快、錯誤率少,取得了較高的經濟效益。基于本文系統架構實現的《農房一體化文字識別系統》移動端部分界面截圖(圖4~7),圖8是圖片識別后下載的身份證信息截圖。

圖4 上傳圖像識別

圖5 識別完成

圖6 單個身份證識別界面

圖7 入戶調查數據采集界面

圖8 文字識別后下載的識別結果文件(局部)
通過微信小程序的界面上傳的身份證和戶口簿照片,在騰訊云后臺服務器調用OCR 函數識別照片文字信息,返回結果通過算法篩選需要的數據進行整理記錄到數據,用戶可以根據設置時間或其他限制條件下載所需要的數據表格(如圖8 制式表格)。
本文通過騰訊云實現移動端文字識別技術在不動產登記等項目中的應用,較好地解決了在項目實施中數據采集整理的自動化智能化問題。基于移動端很好解決了收集資料的碎片化、無序化、及時性的問題,同時基于騰訊云后臺服務解決了數據存儲和數據處理問題,實現了數據采集自動化。OCR 技術應用在數據采集中具有以下特點:①OCR 文字識別技術成熟,識別效率高,使用方便快捷;②解決了大量人工輸入問題;③速度快、準確率高,可以實現批量化處理。本文實現的系統不局限于不動產的數據采集過程,也可以使用在檔案整理、數據入庫、電子信息采集等項目中。