999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Transformer的中英機(jī)器翻譯系統(tǒng)的研究與開發(fā)

2022-05-30 07:37:51晁忠濤葉傳奇韓雪磊朱奎源吳明利張留杰
電腦知識與技術(shù) 2022年27期
關(guān)鍵詞:深度學(xué)習(xí)人工智能

晁忠濤 葉傳奇 韓雪磊 朱奎源 吳明利 張留杰

摘要:隨著經(jīng)濟(jì)全球化和信息全球化的不斷發(fā)展,翻譯服務(wù)的重要性也隨之提高,機(jī)器翻譯相較于人工翻譯,成本更低,速度更快,也因此更適應(yīng)當(dāng)今時代的需求。神經(jīng)機(jī)器翻譯技術(shù)使用深度學(xué)習(xí)方法在平行語料上進(jìn)行訓(xùn)練并獲得翻譯模型,已經(jīng)成為當(dāng)前主流的機(jī)器翻譯方法[1]。文章基于Transformer翻譯模型開發(fā)了一款中英文翻譯系統(tǒng)。結(jié)果表明,與其他翻譯模型相比, 文章提出的中英機(jī)器翻譯系統(tǒng)在語句的通順程度和語意的準(zhǔn)確性方面均有提升。

關(guān)鍵詞:人工智能;機(jī)器翻譯;Transformer;深度學(xué)習(xí)

中圖分類號:TP18? ? ?文獻(xiàn)標(biāo)識碼:A

文章編號:1009-3044(2022)27-0016-02

開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):

1 概述

當(dāng)今社會是經(jīng)濟(jì)全球化和信息全球化的社會,智能化的翻譯服務(wù)成為一大研究熱點。現(xiàn)如今社會上出現(xiàn)了各種各樣的中英翻譯軟件,但是普遍存在語句不順、語法錯誤及語意生硬等問題。本文針對這些問題研究并開發(fā)了以Transformer為翻譯模型的中英機(jī)器翻譯系統(tǒng)。

中英機(jī)器翻譯系統(tǒng)主要針對的是日常生活或?qū)W生學(xué)習(xí)過程中出現(xiàn)的中譯英問題,本系統(tǒng)采用的Transformer翻譯模型是一種可以完成機(jī)器翻譯等序列到序列學(xué)習(xí)任務(wù)的一種全新網(wǎng)絡(luò)結(jié)構(gòu),該結(jié)構(gòu)采用Self-Attention注意力機(jī)制實現(xiàn)序列到序列的建模。相較于其他翻譯模型中廣泛應(yīng)用的循環(huán)神經(jīng)網(wǎng)絡(luò),該機(jī)制具有計算復(fù)雜度小、計算并行度高和容易學(xué)習(xí)長距離依賴等優(yōu)勢,因此該翻譯系統(tǒng)具有一定的開發(fā)意義和實用價值。

2 開發(fā)技術(shù)

2.1 機(jī)器翻譯

機(jī)器翻譯,又稱自動翻譯,是利用計算機(jī)程序?qū)⒁环N自然語言(源語言)轉(zhuǎn)換為另一種自然語言(目標(biāo)語言)的過程,它是人工智能的重要研究目標(biāo)之一,具有非常重要的科學(xué)研究價值。同時,機(jī)器翻譯又具有十分重要的實用價值,隨著經(jīng)濟(jì)全球化以及互聯(lián)網(wǎng)的發(fā)展,機(jī)器翻譯技術(shù)在促進(jìn)政治、經(jīng)濟(jì)和文化交流方面起著越來越重要的作用。

機(jī)器翻譯主要分為預(yù)處理、翻譯模型和后處理三個步驟,預(yù)處理是將輸入的語言轉(zhuǎn)變?yōu)闄C(jī)器能夠理解的數(shù)據(jù),翻譯模型是將源語言轉(zhuǎn)化為目標(biāo)語言的過程,后處理是指將翻譯后的結(jié)果進(jìn)行重新拼接、排序等操作得到符合人們閱讀習(xí)慣的翻譯結(jié)果的過程。隨著計算機(jī)計算能力的提升和多語言信息的爆發(fā)式增長,機(jī)器翻譯技術(shù)逐漸走出象牙塔,開始為普通用戶提供實時便捷的翻譯服務(wù)[2]。

3 主要技術(shù)

3.1 Jieba+BPE分詞技術(shù)

數(shù)據(jù)預(yù)處理過程中需要對中文進(jìn)行Jieba+BPE分詞處理,對英文進(jìn)行BPE處理。Jieba分詞是一款非常流行的中文開源分詞包,具有高性能、準(zhǔn)確率、可擴(kuò)展性等特點。Jieba分詞主要通過詞典進(jìn)行分詞,其主要基于有向無環(huán)圖的查找算法,通過動態(tài)規(guī)劃,從后至前使得詞的切割組合聯(lián)合概率最大[3]。下面以“希望能早日擺脫陰霾”為例,假設(shè)詞典如下“‘希望‘能‘早日‘?dāng)[脫‘早日擺脫‘陰霾”,則有向無環(huán)圖如圖1所示。

經(jīng)過Jieba分詞后的語句格式為“希望 能 早日 擺脫 陰霾”。

BPE分詞算法是一種根據(jù)字節(jié)對進(jìn)行編碼的算法,主要目的是數(shù)據(jù)壓縮,在一定程度上緩解了OOC的問題。BPE的算法思想是首先對大量訓(xùn)練語料按字符拆分進(jìn)行組pair,然后對byte pair進(jìn)行統(tǒng)計后按頻率進(jìn)行排名,接下來按照byte pair的頻率大小對輸入的語句進(jìn)行分詞處理,出現(xiàn)頻率高的byte pair將會被組合到一起。Jieba和BPE結(jié)合對數(shù)據(jù)進(jìn)行預(yù)處理用來為之后的翻譯工作創(chuàng)造條件。

3.2 Transformer模型

從宏觀上看,Transformer像是一個黑盒,向其中輸入一種語言,經(jīng)過黑盒測試后會生成另一種語言。這個黑盒主要由編碼器和解碼器組成,輸入中文語句,經(jīng)過編碼器得到對應(yīng)的特征向量,然后再把這些特征向量作為解碼器的輸入,最終生成對應(yīng)的英文語句。宏觀結(jié)構(gòu)如圖2所示。

下面對Transformer模型的各個部分進(jìn)行詳細(xì)介紹:首先,模型需要對輸入的數(shù)據(jù)進(jìn)行一個詞嵌入操作,詞嵌入結(jié)束之后,將結(jié)果輸入到編碼器,其中編碼器包含兩層,一個自注意力層和一個前饋神經(jīng)網(wǎng)絡(luò),并在每一層的網(wǎng)絡(luò)后引入殘差網(wǎng)絡(luò)和歸一化層來防止梯度消失或梯度爆炸,其中自注意力層采用多頭注意力機(jī)制實現(xiàn)當(dāng)前節(jié)點不僅僅只關(guān)注當(dāng)前的詞,從而能獲取到上下文的語義,經(jīng)自注意力層處理完數(shù)據(jù)后把數(shù)據(jù)送給前饋神經(jīng)網(wǎng)絡(luò),前饋神經(jīng)網(wǎng)絡(luò)的計算可以并行,得到的輸出會輸入到下一個編碼器。將編碼器的輸出經(jīng)線性變換后得到的結(jié)果作為解碼器中多頭注意力的輸入,解碼器中除了包含編碼器中的兩層網(wǎng)絡(luò),還在這兩層中間添加了注意力層,用來幫助當(dāng)前節(jié)點獲取到目前需要關(guān)注的重點內(nèi)容。經(jīng)解碼器解碼后的輸出再通過線性變換和softmax得到概率最大的單詞的輸出向量[4]。其模型結(jié)構(gòu)如圖3所示。

通過對不同翻譯模型的對比實驗可以發(fā)現(xiàn),使用Transformer模型進(jìn)行翻譯具有更好的技術(shù)優(yōu)勢。各種翻譯模型效率比較如圖4所示,其中BLEU值是翻譯模型的評價指標(biāo),BLEU值越高說明翻譯模型的精確度越高。圖5是將中文采用Transformer模型翻譯得到的英文。

3.3 Flask框架

Flask是一個基于Python開發(fā)的輕量級Web框架,小巧,靈活,僅憑一個腳本就可以啟動一個Web項目,旨在保持核心功能的簡單而易于擴(kuò)展,一個純粹的Flask框架只擁有Web框架的基本核心功能,至于其他功能就需要開發(fā)者自行擴(kuò)展。與其他同類型框架相比,F(xiàn)lask框架具有更加靈活、輕便等優(yōu)點,用戶可根據(jù)自己的需求添加特定的功能,保證了核心功能簡單的同時實現(xiàn)功能的豐富與擴(kuò)展[5]。

在Web應(yīng)用的開發(fā)過程中,F(xiàn)lask框架不僅可以對后臺功能代碼進(jìn)行封裝,而且可以通過編寫html代碼實現(xiàn)前端頁面的顯示。此外,F(xiàn)lask框架還可以非常簡便地實現(xiàn)前端頁面與后臺功能的交互,既節(jié)省了開發(fā)者的大量時間和精力,同時也為用戶訪問后臺功能提供了友好型界面。

4 中英機(jī)器翻譯系統(tǒng)的實現(xiàn)

首先,通過對Transformer模型進(jìn)行封裝,依賴Flask框架搭建后端服務(wù)器并設(shè)計出面向用戶的友好型界面,然后將前臺頁面和后臺服務(wù)器進(jìn)行連接實現(xiàn)前后臺的交互功能,為用戶提供簡單便捷的翻譯服務(wù)。在使用中英機(jī)器翻譯系統(tǒng)時,用戶可在前臺頁面輸入想要進(jìn)行翻譯的中文文本或直接選擇想要翻譯

的中文txt文本文件,系統(tǒng)將用戶輸入的中文語句或文本文件讀入到后臺的source.ch.txt文本文件中,經(jīng)過數(shù)據(jù)預(yù)處理依次得到source.ch.cut.txt文件和source.ch.BPE分詞文件,之后對分詞文件中的數(shù)據(jù)進(jìn)行線性變?換后傳入到已經(jīng)訓(xùn)練好的模型中進(jìn)行預(yù)測,預(yù)測完成后將翻譯結(jié)果以文本形式返回到前臺頁面進(jìn)行顯示。到此,中英機(jī)器翻譯系統(tǒng)完成翻譯工作。工作流程如圖6所示:

5 結(jié)束語

如今正是經(jīng)濟(jì)全球化和信息全球化的時代,翻譯服務(wù)的重要性不斷提高。為了適應(yīng)社會發(fā)展的需求,本文提出了基于Transformer模型的翻譯模型進(jìn)行中英翻譯。該模型可以對日常生活中或?qū)W生學(xué)習(xí)過程中遇到的中英文語句進(jìn)行翻譯操作。實驗結(jié)果表明,基于Transformer的中英機(jī)器翻譯模型與其他翻譯模型相比,有效提升了單詞的正確率以及語意的通順度。此系統(tǒng)在中英翻譯方面有著先進(jìn)的技術(shù)優(yōu)勢和廣闊的應(yīng)用前景,可以有效減少中英文翻譯帶來的壓力,對未來社會的發(fā)展和進(jìn)步能夠起到一定的推動作用。

參考文獻(xiàn):

[1] 何建樹.基于深度學(xué)習(xí)的神經(jīng)機(jī)器翻譯技術(shù)研究[D].成都:電子科技大學(xué),2021.

[2] 武俊,趙昌彥.機(jī)器翻譯技術(shù)在外文水資源文獻(xiàn)翻譯中的應(yīng)用現(xiàn)狀及展望[J].水資源保護(hù),2022,38(2):204-205.

[3] 石鳳貴.基于jieba中文分詞的中文文本語料預(yù)處理模塊實現(xiàn)[J].電腦知識與技術(shù),2020,16(14):248-251,257.

[4] 高巍,陳子祥,李大舟,等.預(yù)標(biāo)準(zhǔn)化Transformer在烏英機(jī)器翻譯中的實現(xiàn)[J].小型微型計算機(jī)系統(tǒng),2020,41(11):2286-2291.

[5] 王安瑾.基于Flask的金融自動化運維平臺的設(shè)計與實現(xiàn)[D].上海:東華大學(xué),2018.

【通聯(lián)編輯:梁書】

猜你喜歡
深度學(xué)習(xí)人工智能
我校新增“人工智能”本科專業(yè)
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
有體驗的學(xué)習(xí)才是有意義的學(xué)習(xí)
電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實現(xiàn)
軟件工程(2016年8期)2016-10-25 15:47:34
主站蜘蛛池模板: 在线观看国产精美视频| 亚洲日本在线免费观看| 国产成人啪视频一区二区三区| 亚洲丝袜第一页| 亚洲成肉网| 欧美黄网站免费观看| 五月婷婷伊人网| 无遮挡国产高潮视频免费观看| 久久semm亚洲国产| 麻豆精品久久久久久久99蜜桃| 久久96热在精品国产高清| 国产高清自拍视频| 亚洲欧洲国产成人综合不卡| 日韩高清无码免费| 伊人查蕉在线观看国产精品| 999福利激情视频| 久久综合九九亚洲一区| 亚洲天堂.com| 亚洲一区二区三区国产精华液| 亚洲人成网7777777国产| 日韩精品毛片人妻AV不卡| 欧美色亚洲| 亚洲第一视频区| 午夜成人在线视频| 三上悠亚精品二区在线观看| 熟妇丰满人妻av无码区| 最新国产精品第1页| 欧美精品一区二区三区中文字幕| 亚洲人人视频| 久久国语对白| 永久免费无码日韩视频| 亚洲精品片911| 91精品专区| 久久精品最新免费国产成人| 国产精品国产三级国产专业不| 国产一二三区在线| 91网红精品在线观看| 欧美成一级| 亚洲区一区| 动漫精品中文字幕无码| 99热最新网址| 国产精品微拍| 青草视频久久| 亚洲精品va| 40岁成熟女人牲交片免费| 亚洲水蜜桃久久综合网站| 狠狠久久综合伊人不卡| 天天婬欲婬香婬色婬视频播放| 蜜臀AV在线播放| 欧洲欧美人成免费全部视频| 婷婷伊人五月| 色男人的天堂久久综合| 狠狠综合久久| 91精品视频在线播放| 日韩欧美国产成人| 国产黄色片在线看| 97国产精品视频人人做人人爱| 国产精品偷伦在线观看| 青草91视频免费观看| 午夜精品国产自在| 四虎国产在线观看| 91国语视频| 国产天天射| 成人午夜久久| 日本少妇又色又爽又高潮| 亚洲人成亚洲精品| 国产91色在线| 精品亚洲国产成人AV| 亚洲综合二区| 免费观看三级毛片| 四虎影视永久在线精品| 国产乱肥老妇精品视频| 欧美啪啪精品| 四虎综合网| 无码福利日韩神码福利片| 99热这里只有免费国产精品 | 亚洲一级毛片在线观播放| 真人免费一级毛片一区二区 | 亚洲精品国偷自产在线91正片| 日本亚洲成高清一区二区三区| 丁香综合在线| 亚洲欧美成人在线视频|