技術宅
挑戰題描述
因為工作的原因,我經常需要看一些英文資料。一些文本型的資料,可以輕松使用金山詞霸、必應詞典之類的軟件進行單詞翻譯,或者通過劃譯進行整句甚至整篇文章的翻譯。但是有些資料是圖片形式,雖然翻譯軟件具有OCR識別功能,但只是譯詞,無法像劃詞那樣進行整句翻譯。能否對圖片也進行類似劃詞那樣的整句翻譯?(題號:20151302)
解題思路
因為類似金山詞霸、必應詞典之類的軟件進行工作的時候,它們是通過讀取鼠標選擇的單詞或句子,然后從字庫中提取單詞進行翻譯的。默認圖片上的元素我們無法直接通過鼠標選取,因此要實現上述整句翻譯的效果,我們就需要將圖片轉換為可選擇的文本。下面我們通過“必應詞典”+“捷速OCR文字識別軟件”來實現。
解題方法
首先下載并安裝“必應詞典”,啟動軟件后勾選“劃譯”并取消“取詞”。接著點擊“設置”,在打開的設置頁面的劃譯選項下選擇劃譯方式為“Ctrl+鼠標劃譯”(這樣正常選擇文本的時候不會自動激活翻譯),然后將其最小化到任務托盤(圖1)。

接著啟動捷速OCR文字識別軟件,點擊“讀取”,然后在打開的頁面選擇需要進行整句翻譯的圖片,這樣導入圖片后就可以將其內容識別為文本(圖2)。

圖片導入后軟件會自動選擇文本頁面,如果軟件選擇范圍不精確,可以使用鼠標進行微調(注意:盡量精確確定選擇范圍以提高識別率)。點擊“讀取”,這樣在圖片的右側會自動進行識別掃描。因為識別精度不可能達到100%(對于純字符圖片,軟件基本可以識別95%以上的字符),為了方便必應詞典進行準確翻譯,這里可以依次選中識別錯誤的字符,然后對照原文直接進行更改(圖3)。

完成OCR識別字符的更改后,現在我們就可以像文本劃譯那樣操作了。只要先按下Ctrl鍵,接著使用鼠標在識別文本上進行選擇,此時在選擇文本的上方會出現一個必應詞典的機器翻譯的圖標,點擊后即可自動對選中的句子進行整句翻譯了,具體的使用和文本翻譯是一樣的(圖4)。
當然,捷速OCR文字識別軟件也支持對PDF文件的識別,如果需要識別的圖片較多,建議將多張圖片轉換為一個PDF文件(每張圖片作為一頁正文),這樣導入后軟件可以將每頁文件分別讀取。如果需要翻譯的是下一張圖片,只要在右側窗格選中下一頁文件即可(如果導入的是多張圖片,每張圖片是在新標簽中打開,需要來回切換)。如果需要將文本保存,點擊“Word”,可以直接將識別文本導入Word中打開,非常方便。