胡曉榕



摘 要:隨著機器學習技術的發展,目前翻譯行業也逐漸引入該技術用來提升翻譯效果。文章以實現在線學習為目標,為了學習人員能夠在不斷糾正過程中進行學習,設計了一套端到端平臺,該平臺將機器翻譯服務器集成到專業翻譯人員最常用的用戶界面中,實現在機器不斷從人的選擇中學習并根據特定領域或用戶風格調整模型的同時,節省學習人員后期的編輯工作,提升了在線翻譯過程中的輔助效果。
關鍵詞:機器學習;翻譯行業;端到端平臺;翻譯模型
中圖分類號:TP393
文獻標志碼:A
文章編號:1007-757X(2020)11-0080-02
Abstract:With the development of machine learning technology, the translation industry has gradually introduced this technology to improve translation results. This article aims at online learning. In order that the learner can get progress in the process of continuous correction, an end-to-end platform is designed. This platform integrates the machine translation server into the user interface which is commonly used by professional translators. By continuously learning from human choices and adjusting models according to specific fields or user styles, it saves the editing work of the learners in the later stages and improves the auxiliary effect in the online translation process.
Key words:machine learning;translation industry;end-to-end platform;translation model
0?引言
在翻譯行業中,翻譯的效果至關重要,直接關系著業務人員的工作效率。如今,翻譯行業的高效性需求必須滿足快速的商業需求,為此,需要在較短的時間內為用戶提供準備高質量的翻譯結果。隨著機器學習技術的發展,文獻[1]中提出使用支持向量機(一種監督學習模型)獲得了安德森雜質模型的格林函數,用來實現自學習提升。
機器學習技術的快速發展,為翻譯行業提供了可高效、快捷翻譯結果的途徑,即“人性化”翻譯,稱為后期編輯(PE),該模式目前在翻譯行業中被證明是有效的[2],被稱為是機器翻譯(Machine Translation,MT),隨著MT功能的不斷完善,此工作流程已成為翻譯行業的重要內容。
PE過程本身就在不斷生成新的雙語數據,此數據通常用于創建特定于域的語料庫,可用于將系統從更廣泛的域改編為特定的域客戶端或樣式。在線學習(Online Learning,OL)范式指在PE過程中執行這種調整[3]:每次用戶驗證后期編輯的翻譯時,系統都會在考慮到此數據的情況下進行更新。……