郭光園
想要提取圖片中的文字你是用哪種方法呢?是微信還是一些收費的OCR軟件亦或還是手打?在這里介紹一款免費的、無需聯網的、可以批量提取圖片中文字的軟件Umi-OCR。
Umi-OCR的使用比較簡單,將其下載解壓就可使用,默認狀態只支持簡體中文和英文,下載擴展包后可以支持繁體中文、日文、韓文、德文、法文的識別操作。
打開Umi-OCR主界面,可以看到一個簡單易用的操作界面,用戶只需要點擊“瀏覽”按鈕或者直接拖拽需要識別文字的圖片到Umi-OCR窗口即可導入圖片,然后按下“開始任務”按鈕即可進行圖片提取文字的操作,支持批量圖片識別,無需聯網。
Umi-OCR的識別準確率還是挺不錯的,拍攝得不太清晰的報紙圖片,Umi-OCR也可以正確識別提取大部分的文字。而清晰圖片Umi-OCR的識別率就更高了,基本上提取識別的文字內容無需修改即可使用。
Umi-OCR支持剪貼板讀取功能,在瀏覽網頁時看到的圖片,用戶無需把它保存下來再進行識別操作。直接復制圖片后在Umi-OCR中點擊剪貼板讀取,即可完成識別操作。當然,截圖后也可以直接使用這個功能來進行文字識別。
圖片上有水印,導致識別出來也有水印的文字內容,還要一個一個去刪除,太麻煩了。Umi-OCR貼心地為用戶準備了忽略水印功能,用它就能在識別文字時自動忽略指定區域的文字進行識別了。
要開啟忽略水印功能,先要導入需要識別的圖片,然后在Umi-OCR的設置選項中選擇“添加區域”這時候就會出現一個區域設置,只需要框選水印區域即可忽略該區域進行識別。
Umi-OCR默認使用PPOCR-v3模型庫,除了能準確辨認常規文字,對非常規字形(手寫、藝術字、小字、方向不正、雜亂背景等)也有不錯的識別率。無需聯網上傳圖片進行識別的它,表現還是挺不錯的,有需要的朋友可以試試。