999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能理論的機器自動翻譯系統

2020-12-23 06:57:07霍小靜
微型電腦應用 2020年11期
關鍵詞:人工智能

霍小靜

摘 要:以高精度翻譯多種自然語言的單詞/語句為目標,設計基于人工智能的機器自動翻譯系統。首先設計了機器自動翻譯系統的總體結構,然后重點描述了機器自動翻譯系統的核心模塊,該模塊獲取單詞/語句通過訓練獲取詞向量,初始詞向量并賦予詞性特征,采用對數線性模型實現多種自然語言的單詞/語句的詞向量多特征融合翻譯,最后進行了實例分析與驗證。結果表明,該系統可高精度翻譯自然語言,在不同句型、不同并發用戶量、未登錄詞不同字符數量下,系統翻譯性能較為穩定,能夠滿足實際應用需求。

關鍵詞:人工智能;機器自動翻譯;詞向量;低頻詞

中圖分類號:TP391

文獻標志碼:A

文章編號:1007-757X(2020)11-0077-03

Abstract:In order to translate the words/sentences of many natural languages with high precision, a machine automatic translation system based on artificial intelligence is designed. The overall structure of the MT system is designed firstly, and then the core module of the MT system is described. The module obtains the word vector and the initial word vector, and gives the part of speech features through training. The log linear model is used to realize the word vector multi feature fusion translation of multiple natural languages. Finally, an example is analyzed. The results show that the system can translate natural languages with high accuracy. Under different sentence patterns, different concurrent users and different characters of non-login words, the system has stable translation performance and can meet the practical application requirements.

Key words:artificial intelligence;machine automatic translation;word vector;low frequency word

0?引言

機器翻譯將大數據技術和計算機系統作為運行基礎,可在確保翻譯正確率和實時性的同時,通過人工智能理論不斷優化內部結構,提高翻譯質量[1]。翻譯并非是語言服務的全部,僅是語言服務的一個細化內容。機器翻譯不僅解決了語言服務的初翻譯問題,還可解決語言服務的內容管理、項目管理等內容。當前計算機技術推動機器自動翻譯系統發展,機器自動翻譯系統被很多高校與研究機構使用,進入實用化與商品化階段[2-4]。人工智能技術的出現,使得機器自動翻譯系統的翻譯效果得以提升[5-7]。

本文圍繞人工智能理論,設計了基于人工智能的機器自動翻譯系統,該系統翻譯模塊采用基于多特征融合的神經網絡翻譯模型,不單可以去除語義、詞義中差異,還可以實現多特征融合的機器自動翻譯。

1?人工智能的機器自動翻譯系統

1.1?系統架構設計

人工智能的機器自動翻譯系統架構設計圖,如圖1所示。

系統由用戶應用模塊、翻譯模塊與系統管理模塊構成。用戶應用模塊為用戶提供登錄、翻譯服務,翻譯模塊實現多種自然語言間單詞/語句翻譯,將反饋結果呈現至用戶。系統管理員通過管理模塊進行查詢、修改翻譯規則。

翻譯模塊為人工智能的機器自動翻譯系統的核心,其架構圖如圖2所示。

用戶使用系統時,在翻譯界面輸入翻譯請求后,翻譯模塊將翻譯請求以詞向量的形式傳輸至服務器,服務器使用神經網絡翻譯模型翻譯單詞/語句,能夠設定訪問次數限制,完成并發請求的分配。

1.2?多特征融合的神經網絡翻譯模型

神經網絡是人工智能理論技術中的一種,采用多特征構建翻譯模型,將用戶輸入的單詞/語句通過訓練獲取詞向量。對詞向量融入詞性特征,去除語義、詞義中差異。

1.2.1?詞向量訓練

構建基于連續詞向量學習方法的詞向量訓練模型,詞向量訓練模型,如圖3所示。

1.2.2?低頻詞替換

使用具備詞性特征的詞向量,運算多種自然語言詞和詞之間的近似水平后,把系統知識庫中未登錄詞(低頻詞)通過詞典中和它近似水平最大的詞替換掉,降低未登錄詞的數目[8]。

(1) 將翻譯語句單詞分成高頻詞和低頻詞。

(2) 計算詞向量運算低頻和高頻詞的相似度。

1.2.3?多特征融合

(1) 使用對數線性模型融合多種語言的詞性特征。對數線性模型,如式(5)。

(2) 針對某些語句與其描述內容存在詞不表意情況時,使用文本詞干、詞綴序列依次建模的形式,獲取自然語言A特征,如式(6)、式(7)。

式中,ε、μ依次描述詞綴與詞干特征函數權重;Ω1、Ω2分別為詞綴、詞干序列的特征函數。

1.2.4?模型構建

通過最大似然估計的方法訓練式(5),設置詞向量特征訓練集為(j,φj),多特征融合的神經網絡翻譯結果,如式(8)。

2?實例測試

2.1?語料庫

采用本文系統對CWMT201英漢新聞領域語句進行翻譯,CWMT2017英漢新聞領域語句詳情,如表1所示。

表1中,CWMT2017英漢新聞領域語句訓練集20 000個英漢新聞領域語句,用于訓練本文系統中基于多特征融合的神經網絡翻譯模型;開發集20 000個英漢新聞領域語句,用于優化本文系統中基于多特征融合的神經網絡翻譯模型參數,測試集20 000個英漢新聞領域語句,用于測試本文系統翻譯效果。

2.2?召回率統計

以召回率為判斷指標,本文系統對英漢語句翻譯效果的召回率,如圖4所示。

分析圖4可知,不同語句數量下,本文系統翻譯結果召回率高,翻譯結果有效。

2.3?不同句型下的系統翻譯性能測試

設定需要英漢翻譯的句型依次是簡單陳述句、一般疑問句、并列復合句、從屬復合句、特殊用法句。測試本文系統對不同句型翻譯后,單詞翻譯正確的語句數、結構正確的語句數、語義正確的語句數,如表2所示。

表2中翻譯結果顯示,本文系統翻譯5種存在差異的句型后,單詞翻譯正確的語句數、結構正確的語句數、語義正確的語句數為19 999個,和原始數量相比,缺少1個,原因是特殊用法句不存在通用翻譯模式,但本文系統對簡單陳述句、一般疑問句、并列復合句和從屬復合句翻譯后,語句的單詞翻譯、結構和語義全部正確。

2.4?系統的翻譯耗時和BLEU分數

使用翻譯能力類似的4名學生設成初級翻譯組Q1,使用4名在翻譯單位存在至少4年翻譯經驗的翻譯員設成高級翻譯組Q2,分析兩個翻譯組使用本文系統前后的BLEU分數,BLEU分數是對于一個給定的句子,有標準譯文S1,還有一個本文系統翻譯的結果S2,對于本文系統翻譯S2的所有短語而言,具有多少個短語出現在S1中,此比率即為BLEU的分數。 初級翻譯組、高級翻譯組使用本文系統前后的翻譯耗時與BLEU分數,如表3所示。

分析表3可知,初級翻譯組、高級翻譯組使用本文系統前后的翻譯耗時與BLEU分數差異明顯,使用后的BLEU分數均大于95分,由此可證本文系統能夠提高翻譯速度,優化翻譯效果。

2.5?并發用戶量對本文系統影響

設定并發用戶量依次是150~550個,測試本文系統響應用戶翻譯指令時,系統的響應耗時,如表4所示。

表4中,伴隨并發用戶量增多,本文系統對用戶指令的響應耗時低于1 s,最大值僅有609 ms,原因是本文系統翻譯模塊中,使用解碼器提升了系統的并發處理性能,優化了系統響應速度。

2.6?未登錄詞字符對本文系統翻譯性能影響

提取CWMT201英漢新聞領域語句中未登錄詞字符數分別是50~250個的語句,在此條件下,測試本文系統翻譯結果的BLEU分數,如圖5所示。

當需要翻譯語句的未登錄詞字符數是100個、200個時,本文系統翻譯結果的BLEU分數為97分,當需要翻譯語句的未登錄詞字符數是300個,甚至大于300個時,翻譯結果的BLEU分數為96分,雖存在小幅度變化,但是分值大于95分,較為理想。未登錄詞字符對本文系統翻譯性能不存在顯著影響。

3?總結

為了獲得理想的機器翻譯結果,設計了基于人工智能的機器自動翻譯系統,并以CWMT201英漢新聞領域語句為例,進行翻譯性能測試。結果表明,本文系統翻譯結果,召回率較高,翻譯結果可信;翻譯速度快,具有十分廣泛的應用前景。

參考文獻

[1]?侯強,侯瑞麗.機器翻譯方法研究與發展綜述[J].計算機工程與應用,2019,55(10):30-35.

[2]?哈里旦木·阿布都克里木,劉洋,孫茂松.神經機器自動翻譯系統在維吾爾語-漢語翻譯中的性能對比[J].清華大學學報(自然科學版), 2017, 57(8):878-883.

[3]?蘇依拉,烏尼爾,劉婉婉.基于統計分析的蒙漢自然語言的機器翻譯[J].北京工業大學學報, 2017, 43(1):36-42.

[4]?李強, 黃輝, 周沁,等. 模板驅動的神經機器翻譯[J]. 計算機學報, 2019, 42(3):116-131.

[5]?李北,王強,肖桐, 等.面向神經機器翻譯的集成學習方法分析[J].中文信息學報, 2019, 33(3):42-51.

[6]?葉紹林,郭武.基于句子級BLEU指標挑選數據的半監督神經機器翻譯[J].模式識別與人工智能, 2017,30(10):937-942.

[7]?王亞娟, 李曉, 楊雅婷,等. 基于釋義信息的維漢機器自動翻譯系統融合研究[J]. 計算機工程, 2019, 45(4):294-301.

[8]?朱順樂.融合多特征的漢維神經網絡機器翻譯模型[J].計算機工程與設計, 2019, 40(5):1484-1488.

[9]?劉宇鵬,馬春光,張亞楠.深度遞歸的層次化機器翻譯模型[J]. 計算機學報, 2017, 40(4):861-871.

(收稿日期:2020.04.11)

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
基于人工智能的電力系統自動化控制
人工智能,來了
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
主站蜘蛛池模板: 亚洲精品第五页| 在线精品亚洲国产| 五月丁香在线视频| 青青草原国产精品啪啪视频| 99热这里只有精品国产99| 在线国产91| 国产毛片高清一级国语 | 国产女人综合久久精品视| 中文字幕在线看| 亚洲国产欧美中日韩成人综合视频| 色哟哟精品无码网站在线播放视频| 一级毛片在线免费视频| 中文字幕色站| 99精品热视频这里只有精品7| 粗大猛烈进出高潮视频无码| 91精品专区国产盗摄| 国产精品专区第1页| 亚洲欧美日韩精品专区| 九九热免费在线视频| 国产精品无码AV中文| 在线观看的黄网| 国产v欧美v日韩v综合精品| 中文字幕乱妇无码AV在线| 在线国产三级| 久久一本精品久久久ー99| 在线观看无码av免费不卡网站| 欧美日韩免费观看| 婷婷激情亚洲| 91口爆吞精国产对白第三集| 国产剧情一区二区| 国模视频一区二区| 国产欧美又粗又猛又爽老| 一本大道香蕉中文日本不卡高清二区| 久久女人网| 幺女国产一级毛片| 亚洲成人动漫在线观看| 欧美色伊人| 亚洲国产天堂久久综合| 青青青国产视频手机| 精品亚洲欧美中文字幕在线看| 亚洲一区二区三区在线视频| 国产a网站| 亚洲另类第一页| 亚洲女同欧美在线| 亚洲男人天堂久久| 亚洲综合第一页| 欧美午夜网| 欧美A级V片在线观看| 国产午夜无码片在线观看网站| 亚洲国产一区在线观看| 国产另类视频| 久久精品人妻中文视频| 国产亚洲欧美在线视频| 一本大道在线一本久道| 热re99久久精品国99热| 2020极品精品国产| 五月婷婷导航| 亚洲狠狠婷婷综合久久久久| 成人国产精品网站在线看| 国产在线一二三区| 国产精品永久在线| 久久综合国产乱子免费| 国产美女丝袜高潮| 女人18一级毛片免费观看| 日韩欧美成人高清在线观看| 亚洲 欧美 日韩综合一区| 欧美另类第一页| 国产高颜值露脸在线观看| 91系列在线观看| 色亚洲激情综合精品无码视频 | 99在线观看免费视频| 人妻丰满熟妇av五码区| 欧美三级日韩三级| 久久久久亚洲AV成人网站软件| 午夜老司机永久免费看片 | 久久超级碰| 四虎永久在线视频| 亚洲中字无码AV电影在线观看| 手机成人午夜在线视频| 国产精品第| 狠狠色噜噜狠狠狠狠色综合久| 亚洲第一区欧美国产综合|