摘?要:近年來,神經網絡機器翻譯的應用極大提升了翻譯效率,開啟了機器翻譯的人工智能時代。技術的進步促使我們在人工智能時代下重新反思機譯與人譯的關系。一方面,機譯與人譯呈現出充滿張力的博弈關系,技術全面參與的翻譯環境型塑行業圖景,但歸根結底機譯的發展仍有局限、人譯把握著主體性;另一方面,機譯與人譯的未來期待更平衡的自由關系,翻譯技術應當在注重實用、商用的同時,兼顧對自然語言本質的探索,譯者則應該在保有自己主體性和價值感的同時,將技術作為一種通向真理的方法,進而實現人與技術之間良性的互動。
關鍵詞:人工智能;機器翻譯;機譯與人譯
中圖分類號:H059?文獻標識碼:A
古往今來,翻譯之于文化交流與文明發展有著重要的意義。近年來,隨著計算機深度學習的廣泛應用,機器翻譯技術也嘗試與人工智能相結合,出現了以神經網絡機器翻譯(Neural Machine Translation)為代表的新模型。人工智能為機器翻譯技術帶來了全新的躍進,揭開了人工智能翻譯的新時代。技術的飛躍似在預言機器翻譯的大好前景,但技術擠占的空間需要傳統來讓渡,技術的發展也需要人去適應,翻譯行業中復雜的人機關系值得關注。在這樣的背景下,關于機譯與人譯、技術與人的思考再一次被推至眼前。
一、機譯的發展:人工智能翻譯新時代
回望機器翻譯的線性歷程,機譯的發展可以簡單地劃分為兩個階段:第一階段是20世紀40年代至90年代,以基于語義規則(Rule-based)的早期機器翻譯為代表;第二階段是90年代后廣泛運用統計數據(Statistics-based)的近期機器翻譯。而如果將近年來,以谷歌團隊為首所實現的神經網絡翻譯技術視為全新的突破,那么現在可說是機器翻譯的最新階段。
在機器翻譯構想之初,尋求語言學上的“語言規則”是普遍的思路與方法。早在17世紀就有人提出可以通過制作“機器詞典”來實現不同語言之間的互譯。[1]這種希望借助機器以類似“查詞典”的方式來實現翻譯的嘗試,都屬于基于語言規則的機譯。在早期的研究中,機器翻譯由語言學家共同參與,他們與工程師和設計人員共同合作,基于自然語言表述的規律,尤其是通過總結主流語言之間的規則,形成一套類似“中間語”或“通用語”的規則,最后交由計算機執行完成翻譯。在這之后,從一開始的詞對詞翻譯,機譯逐漸發展至注重源語言和目標語言之間句法結構關系的翻譯,最后再到實現語義上的互譯。可見在這一研發過程中,機譯的研發逐步深入語言的內部,漸次涵蓋更為復雜的語言關系,機器技術與語言知識的探索是共同進步的。
然而,盡管“句法、詞法和語義等深層次自然語言特性”得到充分挖掘,但語言之間的通用規則畢竟難以把握,這直接導致了“程序開發難度大、人工成本高”[2]等問題。普通語言學的艱深探索不及技術開發的要求和速度,因而隨著計算機運算能力的提升,把握語義規則的方法逐漸被統計計算替代。
2003年,時任南加州大學工程學院信息科學研究所研究員的弗蘭茨·約瑟夫·奧赫(Franz Josef Och)利用統計的模型改進了傳統機譯方法,其研發的統計機譯系統在美國商業部國家標準與技術研究所的測試中取得了最高的成績。賽后,奧赫效仿阿基米德的口吻表示:“只要給我充分的并行語言數據,那么對于任何的兩種語言,我就可以在幾小時之內給你構造出一個機器翻譯系統。”[3]正如奧赫所說,統計技術堪比克服語言翻譯障礙中的“力學杠桿”。統計的翻譯方法不再完全致力于尋找語言規律,而是設法建立數學模型,通過導入大量的多語言文本數據庫來訓練機器提高翻譯的準確度。計算機經由上百億次復雜的數學公式運算,通過統計概率最大化的方法得到語言之間的對應規律,得出翻譯結果。統計的方法既使翻譯效率大幅提升,又回避了對自然語言的深層開掘,可說是輕松繞過了通用語言規律的“巴別塔”,憑借計算機和數學的“捷徑”,實現了不同語言之間的互譯。
而神經網絡機器翻譯的原理又是什么,其突破在哪里?如果說統計的應用使機器擺脫了對人工編寫語言規則的依賴,人們無須“告訴”計算機如何翻譯,而是讓它自己弄清楚,那么人工神經網絡技術就是讓機器翻譯的這種自主性更進一步。人工神經網絡是一種仿生物神經網絡結構的數學模型,在機器學習及認知科學領域有著廣泛的研究與應用,其最主要的特點在于它通過眾多人工神經元的聯結模擬大腦神經結構,從而實現機器的自主學習。神經網絡機器翻譯就是通過建立編碼器與解碼器的模型框架,借助模擬遞歸神經網絡來實現翻譯的自動化。這是一種端到端的翻譯技術,也就是說機器翻譯的中間過程被弱化了,乃至于“人類的語言知識已經被大規模的語言數據替代了,語言規則的作用已經不那么明顯了”。[3]
人工智能的運用使得翻譯機器能像人一樣直接面對完整的句子,因此較之于統計方法,這種技術極有效率地實現了機器翻譯的智能化。2016年谷歌關于神經網絡機器翻譯的實驗結果表明,比起以前基于短語的翻譯系統,神經網絡模型的錯誤率平均下降了60%,其質量超過了現今所有已發表的成果。[4]有著如此卓越表現的神經網絡翻譯技術,因其開發周期短、人工成本低、效率高等種種優點,一經開發便迅速“取代了統計機器翻譯成為谷歌、微軟、百度、搜狗等商用在線機器翻譯的核心技術”。[5]目前以谷歌為例,其線上翻譯系統已經支持超過100種語言的通用翻譯,而微軟、百度、搜狗、騰訊等多家互聯網公司也競相在神經網絡方向上積極研發,翻譯效率大幅提升,機譯進入人工智能時代。
二、人機博弈:人工智能與技術焦慮
今天不借助機器的翻譯已是不可想象,而翻譯這項原本的譯者事業,也在全球化翻譯需求激增、機譯與人譯的交互下,發展出人機共存的新圖景。但發展與隱憂并存,機譯極具沖擊力的新發展引起了更多關于人工翻譯何去何從的思考,甚至有學者預言,翻譯的未來或許會由譯后編輯來取代現在大多數的翻譯工作。[6]那么,人工智能助力下機譯與人譯的關系為何?效率大增、應用極廣的機譯能否有朝一日替代人的工作呢?
從人機共生的翻譯圖景來看,在強大技術的影響下,翻譯這一古老的行當已經有了全新面貌,機譯環境極大影響著翻譯實踐。翻譯行業除了傳統的人工翻譯外,逐漸發展出機器輔助翻譯、譯后編輯等人機交互的模式。如今大多數的翻譯需求已經可由機器來完成初稿,甚至部分文本可由機器獨立地完成翻譯工作。由于翻譯需求量和信息實效性要求的提升,機譯已經能夠獨立承擔起那些交付時間短、翻譯質量要求相對較低的內容翻譯,如天氣預報、網頁翻譯等。而機器輔助翻譯和譯后編輯這類“機助人譯”和“人助機譯”的類型,也在市場上廣泛應用。因而,如今“以翻譯技術為核心的計算機輔助翻譯、機器翻譯和翻譯管理系統集成在一起,構成譯者的集成翻譯環境”。[7]技術的便捷、高效,既滿足了需求也創造了更多的需求,塑造了今天人機交互的集合環境。
另一方面,技術的蔓延并非漫無邊際,機譯尚有其局限,人譯仍把握著主體性。就技術而言,目前神經網絡機器翻譯屬于“弱人工智能”范疇。何為弱人工智能?人工智能的強弱之爭是該領域的重要問題,持“強人工智能”觀念者認為“由數字計算機操作的二進制數字串能代表任何東西”,[8]人工智能能夠思維、能夠自主行動;相信“弱人工智能”者則認為“心是語義的,人心不僅僅是一個形式結構,它是有內容的”,[9]人思維的本質是無法被形式、運算所涵蓋的,不能為程序所設定。而類神經網絡確實使機器具備了自主學習能力,但仍必須借助人所預先設定的程序與目標進行工作。而且,目前的人工智能翻譯“要依靠成百萬的現成翻譯文本作為參照分析的基礎”,[10]且這些文本大多來自于標準化的機構、取用主流的語言,因而使得翻譯趨于標準化的表達,適用范圍有限,也無法滿足多元創造的表達需求。
最為重要的是,翻譯本身的創造性要求構成了機譯的根本局限。翻譯活動從來都不能被簡單地視作是一項從“源預言”到“目標語言”的轉化工作,盡管譯者的實際工作確實是語言間的互譯,但譯者翻譯的初衷、創造性的譯法,以及譯本在流通閱讀中的流變等,都是極為復雜的過程。在翻譯理論中,不乏類似“創譯”“異化”或“歸化”等理論,無不是在強調作為“中介”的翻譯實際上是譯者的再創造。正如本雅明所說,“譯者的任務就是用自己的語言去釋放藏于另一種語言表達之下的純語言,用自己的再創作解放原先作品中被束縛的語言。”[11]這種“釋放”與“束縛”不僅僅指翻譯過程中因文化差異而產生的表達困難,更暗示了把握“純語言”、對“純語言”進行再表述是翻譯之要務。
創造性也意味著翻譯本身是一項“不可為”的任務。因為兩種語言的互譯并不存在絕對正確、完美的答案,這一點恰恰與追求準確率的機器翻譯背道而馳。再創造的能力是預先設定好翻譯目標、依賴現有語料數據庫的機器所不能企及的。我們并不是希望通過翻譯得到完美、精準的對應文本,而是為了在翻譯的過程中完成深層的文化互動。這是機譯和人譯之間的根本不同,也是人機關系之中人占主體地位的原因。
三、反思構建:機譯與人譯的平衡
在人工智能助力機器翻譯的時代下,人機共存、共生將是可以預見的未來。在這樣的背景之下,如何平衡人譯與機譯二者的關系成為重要的命題。
反思技術的本質。隨著技術的發展,現代社會中關于技術理性的話語漸占上風,技術至上也漸趨主流。這在翻譯的研究中也是如此。翻譯研究中的“技術轉向”已成共識,[12]但更值得注意的是,為了應對技術討論維度的過度膨脹,翻譯技術研究對人與社會的問題有了更多的關注,形成了一個關于人的轉向。[13]這種轉向的背后是對技術與社會的深刻反思。不輕視機譯的發展、不否認機譯產生的積極意義,但也不任由技術無限膨脹,進而喪失人的主體意義。把握機譯與人譯的平衡,首先需要對技術本質進行有時代性地反思。
海德格爾曾以《技術的追問》為題,用哲學的方式追問現代技術的本質。盡管海德格爾對現代技術總體上持批判態度,但他也認為,技術的本質中蘊含著積極的因素。他認為技術是人的一種工具性手段,其本質是一種“解蔽”[14]。
機器翻譯也是如此,其“解蔽”的本質在于更好地認識理解語言、交流文化。但機器翻譯從基于語義規則,到依賴統計數據,再到人工智能,技術研究者們的研發思路發生了轉向,從最開始把握自然語言本質規則,轉向了基于經驗實例的數據運算和統計,再到如今的類神經網絡技術,技術漸長而離語言的本質越遠。機譯本身的表現也能說明這樣的問題。機器在處理“信息型”文本時的效率,要遠高于其他“表情型”和“操作型”,參考孫瑾《基于文本類型理論的機器翻譯研究》一文中對德國翻譯家卡塔琳娜·賴斯(Katharine Reiss)所提出的文本類型三分理論:信息型(informative)、表情型(expressive)、操作型(operative)。其中,信息型文本指自然科學、工商經濟、科技類文書文本;表情型文本以詩歌、小說等文學作品為代表;操作型文本以廣告、宣傳手冊為主,多用于商業活動的文本,這是因為機器翻譯的“語言技術的研究已滯后于計算機技術”,[15]在隱喻、歧義、感染力、文化內涵及其他等創造性方面的問題存在極大的技術門檻和開發不足的問題。
在現代機器翻譯中,語言本身被預置為語料庫、編碼器和解碼器、一串串并行數據。語言的問題不再被關心,如何通過技術實現語言互譯的準確性則喧賓奪主。當翻譯變得標準,譯者的能動性順從于不斷擴大的翻譯需求,其存在感也被不斷解構。面對不斷發展的翻譯技術,譯者的社會認同和自我認同逐步降低。在譯后編輯等機器輔助翻譯的模式下,譯者的工作更是呈現了“去技術化”的趨勢。[16]
翻譯的任務不是為了消滅語言之間的障礙,翻譯是一項具有生命性的活動,它不應該作為一種模板而存在,而是應該隨著時代語境的變化而改變,因主體創造性的活力呈現出不同的色彩。標準化不應該是翻譯的未來,機器應當成為“解蔽”而非“蒙蔽”的工具。
擺正人的主體創造性。在海德格爾看來,面對技術,人并沒有被“囚禁于一種昏沉的強制性中”[14]。在技術的時代下,唯有不斷地追問“我們被帶向何方”了,才能獲得人與技術的自由關系。這一切的前提,便是人的主體性。在把握機譯與人譯的平衡時,擺正譯者的主體地位,提高譯者在翻譯工作中的主體意識是關鍵。
首先,面對去技術化與邊緣化的主體危機,譯者應當正確理解機譯的工具意義。當人處于困惑之時,自然會轉向工具,就像遠古時代早期人類借助燧石生產生活一樣。而燧石等一系列工具也正如海德格爾所說的,最終實現了人類文明的“解蔽”。機譯同樣也是這樣一種解蔽工具。機譯自誕生之初便是為了追趕、模仿人類的翻譯,二者在實際任務上具有一致性。機譯借助大數據、數學邏輯、信息技術實現了對內涵較直白的信息型文本的互譯,既滿足了全球化的翻譯需求,也創造出了更多的交流互動,這是機器翻譯的積極意義。因此,譯者應當將其視之為一種可利用的方法,既不是一種危險,也不代表權威,無須焦慮但也要警惕機譯標準化的翻譯傾向,以人為主體創造性地把握技術的意義。
其次,主體意識要求譯者應當更積極地適應技術集成的語言環境,在其中創造主體價值。學者王佐良認為,除非讓“機器人充滿文化意識”,否則機譯將始終無法取代人工的翻譯,因為“譯者必須是一個真正意義的文化人”。[17]譯者的主體性價值正是體現于文化意識與創造精神,人的能動性便是適應現實環境乃至于為現實賦予意義。因此,譯者既需要去適應技術語言環境的現實,又要能“借助機器尋找意義”[18],超越技術去深入理解語言文化的復雜性,發揮譯者主體的創造價值,從而實現人工與機器的共存共生。
參考文獻:
[1]馮志偉.機器翻譯——從夢想到現實[J].中國翻譯,1999(4):37-40.
[2]高明虎.神經機器翻譯綜述[J].云南民族大學學報(自然科學版),2018(1):72-76.
[3]馮志偉.機器翻譯與人工智能的平行發展[J].外國語,2018(6):35-48.
[4]Wu Y,Schuster M,Chen Z,et al.Google's Neural Machine Translation System:Bridging the Gap between Human and Machine Translation[J].arXiv preprint arXiv:1609.08144,2016.
[5]劉洋.神經機器翻譯前沿進展[J].計算機研究與發展,2017(6):1145-1149.
[6]多蘿西·肯尼.譯者與機器[J].東方翻譯,2017(2):18-21.
[7]崔啟亮.論機器翻譯的譯后編輯[J].中國翻譯,2014(6):68-73.
[8]瑪格麗特·博登編.人工智能哲學[M].劉西瑞,王漢琦,譯.上海:上海譯文出版社,2001:418.
[9]約翰·塞爾.心、腦與科學[M].楊音萊,譯.上海:上海譯文出版社,1991:23.
[10]葉子南.又想起了斯坦納——寫在新版“谷歌翻譯”誕生之際[J].中國翻譯,2017(1):89-91.
[11]Walter Benjamin.The Task of the Translator.Lawrence Venuti ed.The Translation Studies Reader[M].London and New York:Routledge.2000:22.
[12]張霄軍,賀軍.翻譯的技術轉向——第20屆世界翻譯大會側記[J].中國翻譯,2014(6):74-77.
[13]李晗佶,陳海慶.翻譯技術研究現狀、問題與展望[J].北京科技大學學報(社會科學版),2019(4):112-118.
[14]馬丁·海德格爾.演講與論文集[M].孫周興,譯.北京:生活·讀書·新知三聯書店,2005.
[15]張政.機器翻譯芻議[J].中國科技翻譯,2004(1):23-28.
[16]李晗佶,陳海慶.翻譯技術時代譯者的身份認同探析[J].上海翻譯,2020(6):35-39.
[17]王佐良.翻譯中的文化比較[J].中國翻譯,1984(1):4.
[18]杜磊,劉和平.“優秀的譯者應借助機器尋找意義”——劉和平教授訪談[J].東方翻譯,2020(6):48-57.
作者簡介:王希銘(1997—?),女,浙江溫州人,上海師范大學人文學院都市文化研究中心碩士研究生,研究方向:都市文化學、中外文化比較。