哈斯葉提·居瑪
摘要:隨著互聯網的興起與發展,不僅僅是帶來一場新技術的革命,同時也是對傳統行業的巨大挑戰,比如翻譯工作。在互聯網時代下人工智能技術和CAT技術的發展與成熟,大家開始擔心機器會逐漸取代傳統人工翻譯。但是漢語言博大精深,不光日常用語、用法不好掌握,就拿極具文化底蘊的詩歌來說,即便是人工翻譯也不能保證完全轉譯,能達到七八分神韻和意味已經是非常接近了,何況是機器翻譯呢。人工翻譯是一個古老的職業,需要具有非常專業的文化、學識水平,新時代的快速發展,并不意味著可以使機器翻譯取代人工翻譯,但是卻對人工翻譯提出了更高的要求,只有緊跟時代的發展并且借助科技力量,與時俱進,才能更好更精準的去翻譯。本文從機器翻譯的原理,人工智能翻譯的發展現狀與前景分析進行論述。
關鍵詞:人工智能翻譯 發展現狀 前景分析
在經濟高速發展的今天,隨著互聯網的深入,人工智能會是社會發展的必然選擇。已有的事實證明機器人通過加強學習,可以勝任很多的職位,尤其是AI智能翻譯,以前我們想南北方地域差異,語言存在一定的理解錯誤,但是現在智能手機可以實時翻譯不再是難事。因此人工智能翻譯需要不斷地學習,提升,包括計算能力、對于科學信息的認知、語言學等等,這也是人工智能翻譯的更高目標,實現更為精準的翻譯。
一、翻譯的本質與定義
翻譯是不同語言之間的轉換,如果要達到精準翻譯就得結合不同地區,不同國家的語言規范以及標準,它的本質是科學性和藝術性的有機統一。黃振定指出,對于翻譯活動而言,其中蘊含著一定的科學以及藝術特性,可以說是兩者的協調統一。王寧對翻譯有著這樣的理解,即:翻譯是一種媒介,通過翻譯可以實現兩種不同語言、形象與語言、符碼與文字等的良好轉換,是一種將不理解的事物轉化為可理解事物的過程。劉宓慶提出,對于翻譯的藝術性以及科學性,兩者都是不可被忽視的,這是由于這項活動既具備科學性質有具備藝術性質。若通過機器進行翻譯,其原理是以語料庫為主要基礎開展相應的翻譯活動,這一翻譯方式雖然具備一定的科學性,不過在藝術性的表現上差強人意,甚至有時無法將其藝術性表現出來,特別是對于文學作品的翻譯,這一問題更為突出,而若想將翻譯活動的藝術性以及科學性都體現出來,往往需要通過人工翻譯的方式。
近年來,科學技術的不斷發展下,人們的閱讀習慣逐漸呈現出多樣化的變化趨勢,翻譯不僅僅只局限于語言間的轉換,而是逐漸向表現形式、字符以及圖像等方向進行延伸。例如,課堂上教師會將文言文轉化為白話文,從而使學生對其內容進行了解;生活中父母會拿著圖畫書為孩子講述其中的故事等等,以上行為均屬于翻譯活動,這種類型的翻譯活動,是無法通過機器實現的。現階段,機器翻譯往往只是語種間的翻譯,沒有辦法實現現代文與古文的互譯,更難以進行圖像、字符、表現形式等人的主觀性要求較高的翻譯材料的翻譯。
二、機器翻譯原理
機器翻譯還被稱為人工智能翻譯,具體是指在機器的深度學習下,將一種抽象的符號系統向符號系統進行轉化的過程,機器的翻譯行為,代表著人工智能與人類的一種深度競爭,其原理共包括兩種:第一種,基于語法規則的機器翻譯;第二種,基于統計的機器翻譯,下文分別做出闡述。
首先,基于語法規則的機器翻譯
大多數機器翻譯都是基于語法規則下進行的,常見的有中間語言法、轉化法以及直接法。對于中間語言法,其是利用無歧義的、通用的中間語言實現過渡。對于轉化法,是將中間表達式置于原語和譯語間,利用中間表達式實現翻譯目的。對于直接法,是將譯文的詞、句通過原文詞、句進行表達,并適當調整詞序。以上方法中,直接法是較為典型的翻譯方式,一直沿用至今。
其次,基于統計的機器翻譯
這種方式是將機器翻譯看作噪音信道問題,語言A通過信道變形為語言B,通過對源語言B的觀察,從而得到目標語言A,通過概率法找到可能性最大的S。
三、機器翻譯發展現狀
機器翻譯是將計算機技術作為主要的技術支撐,將一種自然語言向另一種自然語言進行轉化的過程,作為一種應用工程,其是多種科學的集合,包括語言科學、計算機科學、數理邏輯科學等,屬于邊緣學科或交叉學科領域。早在20世紀50年代,美國就出現了機器翻譯,現今,大多數國家都已經具備機器翻譯的能力。近年來,在計算機技術的不斷發展下,機器翻譯能力也得以增強,逐漸具備了智能聲控翻譯功能,例如,手機具有語音識別能力,可以執行簡單的聲控翻譯了,不懂外語的人只要選擇手機上的相應功能按鈕,就可以通過有聲語言輸入,轉換成所需要的外語,不過這個翻譯技術還處于簡單的語言處理階段。由于機器翻譯速度快,成本低,已經成為翻譯界最受青睞的翻譯工具。在我國,機器翻譯進入百姓生活最早是在20世紀90年代,最初的詞對詞翻譯軟件是金山詞霸,發展至今,機器翻譯已經能夠做到在短短的幾分鐘內,完成大篇幅文章的處理工作,是當前不可缺少的翻譯方式。并且,在機器翻譯的開發上,也逐漸向多元化方向發展,出現了較多的網絡在線翻譯平臺、翻譯軟件等,規模逐漸壯大,較多的開發機構以及軟件也逐漸拓寬了自身發展領域,不僅僅局限于大的公司、企業,而是朝向更為豐富、開闊的方向發展。現階段,全國各大城市,基本上均具有機器翻譯的軟件開發公司,較多的電腦公司也逐漸向機器翻譯的開發市場進發,想要在此開疆拓土,目前,基于語料庫的翻譯漢維互譯實例正成為未來發展的方向,少數民族語言的翻譯也開始初露端倪。
四、AI翻譯的發展前景
一開始,語言服務業一直認為“人工翻譯無法替代”,隨著科學技術的不斷發展,逐漸進行人機結合積極探究新的轉變方向,在這一過程中經歷了種種轉變,從開始的抵觸到恐慌最終達接納。AI的出現,對于人工翻譯而言到底是促進其發展的良機,還是一種不可阻擋的挑戰?是否在未來的某一天,機器翻譯完全取代人工翻譯也是一直以來各界關注的話題,針對這一問題,在人工翻譯真正“被取代”之前,會一直繼續下去。但可以肯定的是,這一天的到來,必定以“機器完全擁有人類智慧”為前提。如果這一設想當真在有朝一日變為現實,那么屆時不只是語言服務行業,而是整個社會的各行各業,人工勞力都將被人工智能所取代。
就目前發展趨勢分析,雖然當前能有利用一些實用的技術讓機器去模擬人的智能活動,模擬人對語義的理解,不過相對于徹底的人工智能以及語義理解,仍然有較大的發展空間。若在未來機器真的可以實現準確的實時翻譯,其角色更應該是輔助相關產業的工作人員更輕松、便捷地開展工作,并不是完全取代人工翻譯。此外,針對上文分析到的問題,在人工智能的神經網絡翻譯技術領域,有一些解決方案可以作為比較高效的補充,或許在未來,這些會成為神經網絡翻譯企業接下來的重點發展方向。
第一,引進NMT以外的人工智能技術:近年來,在其他人工智能領域機器翻譯技術實現了新的突破。例如,注意力模型的出現,是始于Deepmind在機器視覺領域的技術構想。由此可見,將其他領域的算法與模型引入翻譯領域,或許可以取得意想不到的收獲。
第二,建立機器學習使用的用戶數據庫,激發互動:在機器學習的原理當中,往往通過對錯誤樣本糾錯能夠起到較好的學習效果,不過,通常情況下,企業很難完成翻譯上的糾錯行為。調動用戶主動糾錯翻譯結果,同時,將其作為主要依據進行數據庫的建立,或許是非常便捷的辦法。現今,存在的大多機器翻譯平臺都會具備糾錯功能,不過有些用戶的參與熱情以及參與方式會直接影響到實際的應用效果。
第三,建立完善和深度的學習架構,是為了讓翻譯系統不斷地進行自我優化,從而解決很多“不知所述、莫名其妙”的翻譯結果。其實就是嘗試優質訓練資料下的弱監督學習,歸根結底是個有監督學習過程,也許是個解決方案。
第四,利用專業的系統領域去解決一些專業方面的翻譯,比如文言文的漢維翻譯,這些沒有特別的方法,擁有強大的垂直領域數據庫是硬實力,當然好的數據抽調模型會事半功倍。