一般來說,網(wǎng)絡上比較火的小說均是制作成圖片給大家閱讀,想要將圖片上的文字轉(zhuǎn)換為TXT文件放在移動設備上閱讀,自己動手敲打文字,似乎不太現(xiàn)實;而不少OCR文字識別軟件只能識別本地磁盤的圖片,且識別率不是想象中的那么高。想要在線識別圖片文字也很簡單,通過Sciweavers網(wǎng)站(www.sciweavers.org/free-online-ocr)就可以在線對圖片進行OCR識別。
登錄網(wǎng)站后,首先在“Language(語言)”選項中選中“Chinese- Simplified”,把文字設置為簡體中文(如圖1),然后在主界面的左下側(cè)的“Image(圖片)”欄中選擇“URL”,再把需要識別的圖片網(wǎng)絡地址輸入欄中。
完畢后,點擊“Convert”按鈕開始對圖片識別。當識別完畢后,在頁面的左側(cè)就顯示出剛識別出的純文本,可隨時復制、編輯,而右側(cè)顯示的是原版圖片供用戶比對(如圖2)。當然,Sciweavers不只支持在線圖片的轉(zhuǎn)換,還能轉(zhuǎn)換本地磁盤中的圖片文件,并且支持TIF、 JPEG、 PNG、 BMP等多種圖片格式。
小貼士:
OCR(光學字符識別)技術(shù),是指電子設備(例如掃描儀或數(shù)碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,對文本資料進行掃描,然后對圖像文件進行分析處理,獲取文字及版面信息。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文