圖片字符也要即選即譯

2015-09-10 07:22:44技術宅

電腦愛好者 2015年15期

技術宅

挑戰題描述

因為工作的原因，我經常需要看一些英文資料。一些文本型的資料，可以輕松使用金山詞霸、必應詞典之類的軟件進行單詞翻譯，或者通過劃譯進行整句甚至整篇文章的翻譯。但是有些資料是圖片形式，雖然翻譯軟件具有OCR識別功能，但只是譯詞，無法像劃詞那樣進行整句翻譯。能否對圖片也進行類似劃詞那樣的整句翻譯？（題號：20151302）

解題思路

因為類似金山詞霸、必應詞典之類的軟件進行工作的時候，它們是通過讀取鼠標選擇的單詞或句子，然后從字庫中提取單詞進行翻譯的。默認圖片上的元素我們無法直接通過鼠標選取，因此要實現上述整句翻譯的效果，我們就需要將圖片轉換為可選擇的文本。下面我們通過“必應詞典”+“捷速OCR文字識別軟件”來實現。

解題方法

首先下載并安裝“必應詞典”，啟動軟件后勾選“劃譯”并取消“取詞”。接著點擊“設置”，在打開的設置頁面的劃譯選項下選擇劃譯方式為“Ctrl+鼠標劃譯”（這樣正常選擇文本的時候不會自動激活翻譯），然后將其最小化到任務托盤（圖1）。

接著啟動捷速OCR文字識別軟件，點擊“讀取”，然后在打開的頁面選擇需要進行整句翻譯的圖片，這樣導入圖片后就可以將其內容識別為文本（圖2）。

圖片導入后軟件會自動選擇文本頁面，如果軟件選擇范圍不精確，可以使用鼠標進行微調（注意：盡量精確確定選擇范圍以提高識別率）。點擊“讀取”，這樣在圖片的右側會自動進行識別掃描。因為識別精度不可能達到100%（對于純字符圖片，軟件基本可以識別95%以上的字符），為了方便必應詞典進行準確翻譯，這里可以依次選中識別錯誤的字符，然后對照原文直接進行更改（圖3）。

完成OCR識別字符的更改后，現在我們就可以像文本劃譯那樣操作了。只要先按下Ctrl鍵，接著使用鼠標在識別文本上進行選擇，此時在選擇文本的上方會出現一個必應詞典的機器翻譯的圖標，點擊后即可自動對選中的句子進行整句翻譯了，具體的使用和文本翻譯是一樣的（圖4）。

當然，捷速OCR文字識別軟件也支持對PDF文件的識別，如果需要識別的圖片較多，建議將多張圖片轉換為一個PDF文件（每張圖片作為一頁正文），這樣導入后軟件可以將每頁文件分別讀取。如果需要翻譯的是下一張圖片，只要在右側窗格選中下一頁文件即可（如果導入的是多張圖片，每張圖片是在新標簽中打開，需要來回切換）。如果需要將文本保存，點擊“Word”，可以直接將識別文本導入Word中打開，非常方便。