999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據背景下互聯網翻譯的理念與模式

2022-05-30 10:48:04王東江王穎
電腦知識與技術 2022年16期
關鍵詞:大數據

王東江 王穎

摘要:文章在深入了解互聯網翻譯的發展脈絡基礎上,對現階段大數據背景下互聯網翻譯的理念與模式進行了分析與探討。文章主要通過群眾合作翻譯、云計算平臺翻譯、機器學習翻譯這三大技術角度解析了現階段互聯網翻譯具有的優勢與弱點,并提出了引入專家模式人機結合等人機聯動的改進方案。在此基礎上,人們為了實現讓人和譯文更加的和諧,大數據背景下的互聯網翻譯對機器算法的研究與人機融合正在不斷的加深。因此該文也明確了互聯網翻譯的最終發展方向是讓人們使用更加方便,讓翻譯速度更加迅速,讓翻譯結果更加精確。

關鍵詞:大數據;互聯網翻譯;翻譯理念;翻譯模式

中圖分類號:TP393? ? ? ? 文獻標識碼:A

文章編號:1009-3044(2022)16-0031-02

1 研究意義

翻譯學的研究對人類文明的多元化傳承至關重要,其中針對翻譯學的翻譯理念與模式的研究就對翻譯學本身的蓬勃發展起到了不可估量的作用。自嚴復提出“信、達、雅”之后,又有“忠實、通順和美”“不增不減”“神似”“化”等翻譯理論相繼出現[1]。直至今日,翻譯理論模式主張極多,也各據其理。然而隨著互聯網信息技術的蓬勃發展,現代翻譯學已經搭上了信息時代的快車,其中互聯網翻譯的理念與模式也越來越被翻譯人員所重視。

互聯網翻譯受到人們的青睞主要是因為其有三大特點:迅捷、普適、開源。其中互聯網翻譯的迅捷性體現在只要存在互聯網,人們就可以在互聯網中查詢海量數據資料通過網絡完成對譯文的快速翻譯,而不受地理條件和查詢文獻資料的約束[2]。互聯網翻譯的普適性則體現在大數據背景下,我們往往可以通過機器學習算法給出大眾都較為認可的對譯文的翻譯結果。互聯網翻譯的開源性也使得人們可以使用免費的開源翻譯軟件進行翻譯工作,降低翻譯成本,同時反哺開源軟件提高其翻譯能力[3]。正是因為互聯網翻譯具有以上優良的特性,要想讓互聯網翻譯更好地和諧發展,那么專門針對互聯網翻譯的理念與模式的研究就迫在眉睫。如圖1所示,處在大數據背景下的互聯網翻譯,對其翻譯的理念與模式研究可以讓我們更好地使用互聯網翻譯,并使得互聯網翻譯能夠變得更加準確、快速、靈活。

2 研究背景和發展脈絡

首先讓我們了解什么是互聯網翻譯,互聯網翻譯最初的概念是借助互聯網,翻譯工作者通過網絡從事翻譯任務,進行把某種語言文字的意義用另一種語言文字表達出來的一種創造性的語言活動[4]。

在互聯網誕生之后,人們逐步地通過網絡交換并共享信息資源,隨著互聯網上的各式各樣的資源逐步累積,翻譯工作人員也發現了利用互聯網可以較快地獲取翻譯所需資料,并且獲取的資料內容更加的全面,可以更好地幫助他們完成翻譯工作[5]。如表1所示,互聯網翻譯的發展脈絡主要有三個階段。在互聯網翻譯開始之初,互聯網更多的是被翻譯人員當作一個查詢工具(互聯網上存在著不少常見的詞典數據以及文章著作等科研相關內容)進行使用,利用互聯網上查閱到的資料,翻譯人員人工整合出最后的翻譯成果。再后來,互聯網中的信息資源越來越多,像谷歌、百度等搜索引擎逐步出現,人們已經可以利用相應的網絡查詢能力直接將不同的語言之間進行轉換,即機器翻譯的萌芽[6]。在這個時期的互聯網翻譯,基本能夠實現詞組簡單句之間的簡易替換,但是往往對于語法的嚴謹程度和詞匯的精準程度上仍然不盡如人意。現如今,大數據時代到來,大數據正以數據摩爾定律迅速增長,因此在互聯網上已經存在著對各種語言足夠多的轉換樣本數據,與此同時,互聯網相關業務逐漸更加精細化,對于翻譯業務也一樣,一些專門進行翻譯工作的互聯網軟件也相繼被開發出來,如早期的東方快車、谷歌翻譯等翻譯軟件層出不窮[7]。在大數據背景下,這些翻譯軟件之間實現翻譯功能的理念與模式具有很大的差距。比如有道翻譯實現翻譯的原理是利用搜索引擎進行網絡釋義的,也就是說它所翻譯的詞釋義都是來自網絡。與之有較大不同的騰訊云翻譯則利用了大數據時代應運而生的云計算平臺,雖然其大部分詞匯及文章的翻譯結果仍然來自網絡,但是騰訊云翻譯的數據結果往往是由云計算平臺拆分成多個執行任務之后,再將其交給多個服務器所組成的龐大系統集群,經過搜尋、計算和分析將最終處理結果回傳給用戶[8]。騰訊云翻譯這種互聯網翻譯的原理與模式,利用大數據和云計算的優勢引入大量計算集群,使其具有了很強的數據處理翻譯能力的同時還有規模大、安全性強、可擴展和可以進行按需服務等特點。

我們可以看到現在的互聯網翻譯的理念模式更好地邁向了對相應翻譯軟件平臺的開發和優化。其發展的目的也更加清晰明了,即在更加方便用戶使用的基礎上,更快、更好地為用戶提供翻譯服務。更多系統平臺的翻譯軟件的開發,打破了Web2.0時代的只有網頁應用可以進行互聯網翻譯的局限性,使得能夠使用互聯網翻譯的人員大大增加,擴展了互聯網翻譯的用戶面。與此同時,借助大數據、云計算、虛擬化等現在最新科學技術,使得互聯網翻譯的結果更加準確和高效。

3 互聯網翻譯現階段主要理念和模式

在互聯網翻譯出現之前,翻譯領域的學者們已經建立了一些基于不同理論觀點的翻譯模型,如奈達和貝爾的翻譯理論模型。奈達的翻譯理論模型是基于結構主義語言學理論的,基本沒有涉及譯者在翻譯過程中的思維活動[9]。而貝爾則根據心理語言學和人工智能的研究成果,系統地借用了多門學科的原理,對翻譯過程進行了研究探索,提出了翻譯的心理理論模式[10]。傳統的翻譯理論模型,大都采用規定性的方法,即先確定翻譯需要遵守的原則,再進行原文與譯文的比對工作,主要是探討譯文是否滿足“對等”或者“信、達、雅”。在互聯網翻譯中的理念與模式隨著大數據時代的到來變得不僅僅是滿足規定性,同時也更加的科學和高效。

現如今互聯網翻譯在大數據背景下的理論與模型主要有三個相關模式如表2所示:1)群眾合作翻譯;2)云計算平臺翻譯;3)機器學習翻譯。群眾合作翻譯的最初雛形是從各種網絡論壇中發展而來的,比較著名的有Facebook等Web2.0時代的巨頭,還有國內著名翻譯論壇譯道論壇等都具有一定性質的群眾合作翻譯模式的影子[11]。群眾合作翻譯模式最大的特點就是群策群力,他們利用在論壇或者圈子中能夠調動的資源,共同協力完成對作品的翻譯任務。整個過程的特征就是具有很大的開放性,因為很多翻譯結果的產生經過了很多人的堆砌與共同推敲,這也很好地體現出了互聯網翻譯的開源特性。

目前互聯網翻譯的理論與模式的主體是云計算平臺翻譯和機器學習翻譯。其中云計算平臺翻譯是指通過虛擬化技術,把極多的物理資源組合起來連入互聯網,搭建一個可以通過互聯網隨時操作使用的云計算平臺,最后使用該平臺完成相應的翻譯工作[12]。通常來講云計算平臺往往應用大數據處理技術來完成對數據的操作,翻譯亦不例外。其中的核心思想主要有兩個,一個是“分而治之”,另一個核心思想是“計算向數據靠攏”。所謂“分而治之”比較容易理解,即把一個相對大型的任務劃分成多個比較容易處理的小任務,再把這些小任務分別交給一個處理計算單元去分別完成對應的工作,最后進行所有結果的整合。這如同先把一篇需要翻譯的文章,劃分成很多個小段,交給多個CPU進行在語料庫中進行智能化匹配工作,最后將得到的結果進行整合。這樣一篇譯文就已經出現。可以看到,通過這種方法大大降低了單個CPU的任務量,大大減少了服務器硬件的工作壓力,這也使得在大數據背景下大量的文本的快速翻譯的實現變得可能及高效[13]。 “計算向數據靠攏”,指的是,人們通常對數據的處理思想是把一次計算所需要的數據都放到一臺電腦上,然后利用一個CPU進行這些數據的處理,但是大數據的思想則是在離數據最近的地方找到相應的計算CPU完成數據的處理,這樣做減少了大量數據傳輸時資源的消耗。這個法則同樣適用于互聯網翻譯,類似于騰訊云翻譯就使用了相應的技術,保證在盡可能短的時間里完成翻譯工作[14]。

機器學習翻譯在大數據時代更加專注于對數據的處理,在進行翻譯的過程中不再一味地要求進行簡單的規則對等性翻譯,而是在追求人工智能方面的解決方案,比如提出基于神經網絡的翻譯系統和基于詞頻等統計學的翻譯系統[10]。不同的機器學習算法對翻譯的精確度和速度都有著很大的影響。現在流行的使用神經網絡來架構的機器翻譯主要有兩類,一類是依舊使用統計機器翻譯系統為框架,利用神經網絡來改進其中的取詞對比模塊,而另一類就是直接應用不同的神經網絡來直接將源語言序列映射成目標語言序列。機器學習翻譯有著自己獨特的優勢,對現階段圖片、語音等不規則的非結構化的翻譯任務,機器學習翻譯也有很強的解決能力。

4 互聯網翻譯發展方向

大數據背景下的互聯網翻譯的理念和模式在現階段仍然不斷向前發展,云計算平臺翻譯和機器學習翻譯在演化的過程中,為了追求更快和更準確的翻譯結果,對執行的翻譯匹配算法的要求都極高,但是往往算法也存在著極限,對于不同語境下的同義詞之類的翻譯仍然可能出現翻譯歧義的可能性,某些需要大量聯系上下文的特殊語法和規則即便如今如此成熟的機器學習算法有時也相形見肘。例如現在的一些網紅詞匯就很容易發生歧義性,如“yyds”在常規的翻譯中可能由于統計學等算法會被翻譯成“永遠的神”,但是這種釋義往往是出現在電競圈中,而在一些小眾語境中則可能需要被翻譯成“永遠單身”這種釋義。在發現有這樣難以解決的問題的時候,人們引入了專家模式的理念,即對于部分翻譯要求精準度較高的翻譯任務采用人機混用的方式完成。首先對翻譯任務使用機器翻譯來完成大部分的框架任務,把這部分翻譯半成品按照不同的學科進行技術分類,接下來劃分給相應領域的專家團隊,專家會利用他們的專業知識完成最終的翻譯作品。這樣完成的作品基本上保證了作品的權威性,提高了翻譯作品的質量,也一定程度上減少了神經網絡算法的編寫壓力。

可以看到我們在追求互聯網翻譯自動化的同時也在努力保持著人與機器的平衡。只有這樣才能在大數據時代充分發揮大數據技術先進性的同時也讓翻譯人才發光發熱。

5 總結與展望

無論是傳統的翻譯方式還是互聯網翻譯方式,都在體現人與譯文之間的和諧。在大數據時代互聯網翻譯的理論和模式也在追求這一點,人們未來的研究方向一定是不斷地邁向讓機器更加的智能,像人類一樣更加理性,最終使得翻譯的結果也更加人性化。這就要求我們使用的相應算法越來越精妙,同時也需要把社會中的高端翻譯人才和互聯網翻譯結合起來,只有這樣才能讓翻譯的成果更加的權威可信。最后向著我們所追求的“信、達、雅”不斷地衍生發展,讓翻譯的速度更加的快捷、讓翻譯的結果更加的精準。

參考文獻:

[1] Doherty S.Issues in human and automatic translation quality assessment[J].Human Issues in Translation Technology: The IATIS Yearbook,2016:131-148.

[2] 肖開容.“遭遇”第四范式的浪潮:大數據時代的翻譯研究[J].外語學刊,2018(2):90-95.

[3] 王家義,李德鳳,李麗青.大數據背景下的互聯網翻譯——開源理念與模式創新[J].中國翻譯,2018,39(2):78-82.

[4] 郁青青.大數據背景下計算機輔助翻譯模式的創新與發展研究[J].淮海工學院學報(人文社會科學版),2019,17(12):45-47.

[5] 王少爽,覃江華.大數據背景下譯者技術能力體系建構——《翻譯技術教程》評析[J].外語電化教學,2018(1):90-96.

[6] 詹衛東.大數據時代的漢語語言學研究[J].山西大學學報(哲學社會科學版),2013,36(5):70-77.

[7] 王華樹.大數據時代的翻譯技術發展及其啟示[J].東方翻譯,2016(4):18-20.

[8] 邵曉燕,魏本超.大數據背景下對翻譯認知的再思考[J].海外英語,2018(15):129-130.

[9] Xue T.Using big data technology to assist in analyzing the influence of cultural context on the translation of English and American literature[J].Journal of Physics:Conference Series,2020,1648(3):032058.

[10] Liao J.Research on “precise translation” of commercial advertising based on big data[J].Journal of Physics:Conference Series,2021,1744(3):032121.

[11] Huang J.Using big data technology to assist in analyzing the language differences between English and Chinese cultures and translation capabilities[J].Journal of Physics:Conference Series,2020,1648(2):022113.

[12] Duan H F,Chen Y C.Small study in the big data era:application of network information resources in Japanese learning and translation studies[J].IOP Conference Series:Materials Science and Engineering,2020,750(1):012046.

[13] Lawrence B. A Dozen Ways to Get Lost in Translation: Inherent Challenges in Large-Scale Data Sets[J].International Journal of Communication 2014(8):1727-1744.

[14] Members B D C.The BIG Data Center:from deposition to integration to translation[J].Nucleic Acids Research,2016,45(D1):D18-D24.

【通聯編輯:王力】

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 日本国产精品一区久久久| a毛片在线| 亚洲国产精品不卡在线| 国产va免费精品| 国产日本一线在线观看免费| 国产00高中生在线播放| 好紧好深好大乳无码中文字幕| 国产精品一区二区在线播放| 高清无码不卡视频| 日韩视频免费| 国产一区三区二区中文在线| 日日碰狠狠添天天爽| 成年人视频一区二区| 特级欧美视频aaaaaa| 国产一区二区色淫影院| 天堂成人av| 四虎国产永久在线观看| 亚洲国产日韩在线成人蜜芽| 日韩人妻少妇一区二区| 国产自在自线午夜精品视频| 三区在线视频| 婷婷色狠狠干| av在线人妻熟妇| 99re热精品视频中文字幕不卡| 亚洲黄色高清| 中文字幕天无码久久精品视频免费| 国产欧美另类| 国产欧美日韩91| 九九九久久国产精品| 国产美女叼嘿视频免费看| 亚洲av片在线免费观看| 国产精品久久精品| 国产一级毛片网站| 国产丰满成熟女性性满足视频| 国产网友愉拍精品| 性喷潮久久久久久久久| 国产人成网线在线播放va| 国产精品太粉嫩高中在线观看| 国内精自视频品线一二区| 99伊人精品| 18禁色诱爆乳网站| 91色爱欧美精品www| 999精品在线视频| 中文字幕资源站| 国产麻豆va精品视频| 国产凹凸视频在线观看| 99视频全部免费| 2021国产精品自产拍在线观看| 成人午夜视频在线| 九九九精品视频| 亚洲精品无码久久久久苍井空| 成人免费一区二区三区| 播五月综合| 尤物精品国产福利网站| 日韩a级片视频| 四虎精品国产AV二区| 国产专区综合另类日韩一区| 亚洲人成网7777777国产| 欧美区日韩区| a毛片在线| 婷婷99视频精品全部在线观看| 欧类av怡春院| 视频一本大道香蕉久在线播放| 国产午夜人做人免费视频| 国产va免费精品观看| 毛片在线看网站| 国产丝袜啪啪| 精品福利视频网| 成人中文在线| 无码又爽又刺激的高潮视频| 色悠久久久| 国产精品爽爽va在线无码观看| 国产精品自在在线午夜区app| 麻豆a级片| 国产地址二永久伊甸园| 午夜福利视频一区| 日本免费一级视频| 亚洲中文字幕av无码区| 自拍亚洲欧美精品| 亚洲AV无码久久天堂| 在线亚洲天堂| 欧美不卡视频一区发布|