曾妍
摘 要: 針對傳統最優解選擇過程中使用的多目標粒子群選擇方法,具有極大的局限性,最優解選擇貼合性較低問題,提出針對機器英語翻譯中的模糊語義最優解選取方法。建立機器英語翻譯的語義模型,對機器英語翻譯自然語言實現連接處理,使用模型對連接處理后的語義本體進行映射分析,翻譯選定過程使用英語翻譯的語義相似度計算提升語義連貫性。實驗結果表明,改進選取方法選定翻譯英語詞匯特征匹配度較高,并且貼合性強,更適用于機器英語翻譯中最優解選擇。
關鍵詞: 機器英語翻譯; 模糊語義; 語義模型; 語義相似度計算; 最優解選取
中圖分類號: TN911?34; TP311 文獻標識碼: A 文章編號: 1004?373X(2018)02?0156?03
Abstract: As the method of multi?objective particle swarm selection is used in the process of the traditional optimal solution selection, which has great limitations and low fitness to the optimal solution, an optimal solution selection method for fuzzy semantic in English machine translation is puts forward. A semantic model of English machine translation is built. The connection processing for natural language in machine translation of English was achieved. The model is used for mapping analysis of the semantic ontology after the connection treatment. The semantic similarity computation is adopted for English translation in translation selection process to enhance semantic coherence. The experimental results show that the improved selection method has high feature matching rate for the translation of English words and high fitness, and is more suitable for the optimal solution selection in English machine translation.
Keywords: English machine translation; fuzzy semantics; semantic model; semantic similarity computation; optimal solution selection
伴隨著識別技術的不斷更新,使用機器代替人工進行英語翻譯已經逐漸走進人們的視野當中,并且翻譯的精準度不斷的提高。使用機器進行英語翻譯時,首先需要對單詞語義進行翻譯。使用機械智能識別對語義中的連貫用語以及關鍵性用語進行選定,通過構建一定的語言模型進行英語語境的構建以及語義連接,結合翻譯的模糊語義通過甄別比對最終選定最優的翻譯解[1?2]。傳統對模糊語義最優解選擇過程中使用的方法存在一定的局現性,最優解的選擇沒有通過語義建立,也沒有通過關鍵詞進行語境刻畫,造成模糊語義在一定的影響下發生偏移,可能翻譯出的語境缺少貼合性。
針對上述問題,本文提出在機器英語翻譯中的模糊語義最優解選取方法。本文建立機器英語翻譯的語義模型,為保證提出方法的有效性,模擬了應用環境進行對比實驗,通過實驗數據的分析驗證了實驗的有效性。
1 構建英語翻譯的語義模型
1.1 英語翻譯的自然語言處理設計
在構建英語翻譯的語義模型之前,首先需要對英語翻譯過程中的詞性轉換以及詞語變形進行分析[3]。在機器英語翻譯中的自然語言處理過程中,以英語單詞“image”為例,單詞的實際翻譯可以表示一張圖片,它的近義詞還包括“print”以及"picture”,這樣這三個詞語具有一定的語義模糊性[4],英語翻譯過程中同義詞與語義信息相關的可能的語義映射關系描述為:
式中:為英語單詞近似語義;為英語單詞對應語言映射;本文翻譯語言為英語翻譯,映射浮動范圍在之內[5]。通過建立英語語義之間映射關系來解決模糊語義定向。
定義1 設雙向語義為Mountain節點高階替換表達限令值[6]為,S為機器進行英語翻譯過程中的概念語義在通過概念進行匹配后實詞解析集[7]。其中為語義信息的解析判斷集合,通過上述定義本文英語語句解析知識點可以通過函數進行表示:
使用英語翻譯的自然語言進行語義二次定義,公式表示為:
式中:為自然語言中的改換表達系數;為英語的識別改換信息碼;round為翻譯過程中的英語信息取整算子。
1.2 語義本體映射模型建立
假設和為兩個多元英語語義,用機械進行語義翻譯過程中,可在翻譯過程中把翻譯語句中定語翻譯到主句中去[8],在對英語從句進行翻譯選擇時,得一個關于多元英語語義語法本體映射模型,過程為:
1) 在英語語義翻譯過程中,如果,那么≤;
2) 如果,那么就有=,則=;>,則<;<,則>。endprint
2 模糊語義最優解選取實現
本文設計的英語翻譯相似度的比量判斷過程通過一定的基礎參數的比對進行選定,本文通過對語義、語境、語法三者進行關系搭配完成相似度的判斷,(本文用符號“”表示邏輯上的非;符號“”表示邏輯上的與;符號“”表示邏輯上的等價[9]。在不發生矛盾的情況下,“”可以省略)如下:
式中:為翻譯語義相似度較高的翻譯;為翻譯語境相似度較高的翻譯;為翻譯語法相同的翻譯;為翻譯語義的總集合;為隸屬關系中最優選集[10];為不同解的搭配集合。本文通過英語翻譯的語義相似度計算對翻譯過程中的非語境翻譯進行剝離,提升翻譯的質量,最優解的選定以此為根據,最后通過認定最終選擇解。
3 仿真實驗分析
3.1 參數設定
為了保證本文設計模糊語義最優解選取方法的有效性,對參數進行設定,本文設定實驗研究對象分別是不同長度不同語境的短文,使用本文設計的模糊語義最優解選取方法與傳統模糊語義最優解選取方法進行比較。首先介紹了實驗翻譯過程的基本參數,如表1所示。
3.2 翻譯基本代碼調節
為了保證本文設計的模糊語義最優解選取方法的有效性,需要對實驗翻譯過程進行一定的代碼調節,代碼替換調節過程如表2所示。
3.3 結果對比分析
傳統的模糊語義最優解選取方法在翻譯過程容易造成詞語翻譯貼合性較差,分別測試兩種方法對短句翻譯過后的Competeness參數,實驗數據如表3所示。
從表3中的數據分析能夠看出,本文設計的模糊語義最優解選取方法比傳統模糊語義最優解選取方法Competeness參數要高出1倍以上(Competeness參數即翻譯完備性,完備性是衡量翻譯結果準確度及語義表達程度參數)。將翻譯過后的語義與本文使用人工翻譯過后的語義進行對比,并使用For duplicates查重軟件進行重復率查詢,圖1為使用查重軟件結果。
從圖1的對比曲線可以看出,本文糊語義最優解選取方法與人工翻譯結果更加貼合,傳統方法在翻譯結果上重復率較低且幅度較大。
衡量糊語義最優解選取方法最好的標準是對短文的翻譯結果,短文在翻譯過程中需要與語義、語境進行結合,翻譯過程中同樣使用了人工翻譯作為標準樣本。針對兩種方法翻譯效果,本文方法中使用的語義本體模型能夠對語境進行識別概括,傳統方法中無使用相關語境映射模型。對短語進行翻譯過程結果如圖2所示。
從圖2能夠分析出,本文設計的模糊語義最優解選取方法在貼合度所占比例上比傳統模糊語義最優解選取方法要高出將近1倍。
通過與標準語境進行對比發現,本文設計模糊語義最優解選取方法在語境的刻畫程度上明顯要好于傳統模糊語義最優解選取方法。
4 結 語
本文針對機器英語翻譯中的模糊語義最優解選取方法,建立機器英語翻譯的語義模型,能夠對機器英語翻譯的自然語言實現連接處理,使用模型對連接處理后的語義本體進行映射分析,翻譯選定過程使用英語翻譯的語義相似度計算提升語義連貫性,通過模糊語義最優解選取計算完成英語語義翻譯。
參考文獻
[1] 吳良剛,文麗.基于二維二元語義和模糊AHP?TODIM的低碳供應商選擇方法[J].運籌與管理,2017,26(3):7?16.
WU Lianggang, WEN Li. Low carbon supplier selection method based on 2?dimension 2?tuple linguistic information and fuzzy AHP?TODIM [J]. Operations research and management science, 2017, 26(3): 7?16.
[2] 姜芳,李國和,岳翔.基于語義的文檔關鍵詞提取方法[J].計算機應用研究,2015,32(1):142?145.
JIANG Fang, LI Guohe, YUE Xiang. Semantic?based keyword extraction method for document [J]. Application research of computers, 2015, 32(1): 142?145.
[3] YANG Wanchun, ZHANG Chenxi, MU Bin. Optimal QoS?aware service selection approach considering semantics and transactional properties [J]. Journal of computer applications, 2016, 36(8): 2207?2212.
[4] 孫霞,沈韓.機器英語翻譯中的模糊語義最優解選取方法[J].現代電子技術,2017,40(12):31?33.
SUN Xia, SHEN Han. Method of selecting optimal solution of fuzzy semantics in English machine translation [J]. Modern electronics technique, 2017, 40(12): 31?33.
[5] WU Qun, WU Peng, ZHOU Ligang. Interval 2?tuple linguistic fuzzy multiple attributes group decision?making based on connection variables [J]. Journal of Chongqing technology and business (Natural sciences edition), 2016, 33(1): 1?8.endprint
[6] 粟千.弱化語法規則下英文機器翻譯的優化仿真[J].計算機仿真,2016,33(11):414?417.
SU Qian. Weakening grammar rules under the improvement and optimization of simulation of machine translation in English [J]. Computer simulation, 2016, 33(11): 414?417.
[7] SONG Rou, GE Shili. English?Chinese translation unit and translation model for discourse?based machine translation [J]. Journal of Chinese information processing, 2015, 29(5): 125?135.
[8] ZHU Yun, JIN Yaohong. On morphological transformations of complex predicates in Chinese?English patent machine translation [J]. Applied Linguistics, 2015(1): 127?135.
[9] ZHANG Zhenzhong, SUN Le, HAN Xianpei. A translation model based method for query session detection [J]. Journal of Chinese information processing, 2015, 29(4): 95?102.
[10] WANG Shaoshuang. Research on translators′ information literacy in the era of professionalism: demand analysis, conceptual interpretation and model construction [J]. Foreign media, 2017(1): 55?63.endprint