關鍵詞:ChatGPT模型;人機對話;神經機器翻譯;啟示
中圖分類號:H319.3 文獻標識碼:A 文章編號:1009-895X(2025)02-0118-10
DOI: 10.13256/j.cnki.jusst.sse.230918456
AStudy on ChatGPT's Human-MachineInteractive Translation Performance
LI Mei,KONG Delu (School ofForeign Languages, Tongji University, Shanghai 20oo92, China)
Abstract: The current research explores ChatGPT's human-machine interactive translation performance in machine translation in comparison with neural machine translation (NMT) systems represented by Google Translate in English-Chinese translation. Case analyses show that ChatGPT overrides NMT systems in that it is able to provide multiple translations, produce translations of various styles,and adjust translations based on the meta information of the source text.In contrast, Google Translate does a beter job than ChatGPT in terms of accuracy, adequacy, and consistency. In short, ChatGPT’ s human-machine translation performance presents implications for translators, students, and software developers.
Keywords: ChatGPT;human-machine interaction; neural machine translation; implications
近年來,翻譯界對于技術的沖擊已不再陌生,諸多“機器翻譯替代人工翻譯”的話題已是老生常談[1-3]。自2014年神經網絡機器翻譯(NMT)模型推出以來,尤其是百度和谷歌等公司相繼推出大規模在線NMT翻譯系統后,機器翻譯質量顯著提升,機器翻譯譯后編輯已然成為翻譯新模式[4-6]。ChatGPT于2022年底橫空出世,儼然成為“翻譯工作流程上的‘游戲規則改變者’”[7]。該工具不僅能實現如寫詩、作曲等即時文本生成,而且通過人機對話,在語言翻譯方面也表現出不凡的實力。在此背景下,本研究聚焦ChatGPT人機對話式翻譯實踐,結合英漢翻譯案例,通過將Chat-GPT生成的譯文與以谷歌翻譯為代表的NMT譯文進行深度對比分析,從多重譯文、風格復現等方面,揭示ChatGPT與以往所有機器翻譯引擎大相徑庭的翻譯實現手段和特征。同時,研究表明ChatGPT在翻譯質量上與NMT引擎相比仍存在一定的差距。本研究能夠幫助人們拓寬對機器翻譯技術的認識,掌握ChatGPT在實際翻譯場景中人機對話式翻譯模式的特色和亮點,同時認識到ChatGPT在翻譯過程中可能存在的問題和挑戰,從而將之靈活運用于翻譯實踐和教學之中,改善翻譯質量,提高翻譯準度。
一、ChatGPT工作機制及特點
ChatGPT的呈現方式為問答式窗口①。用戶在對話框內通過語音或者鍵入指令(prompt)點擊回車鍵后,ChatGPT將給出相應回答。如圖1所示,用戶鍵入指令后,ChatGPT即刻給出相應回答。用戶還可以根據ChatGPT的回答繼續提問,進行交互。最后,用戶可將所有指令和回答復制到文檔中進行儲存或編輯。從圖1中的回答可見,ChatGPT并不是“胡言亂語”,而是具有較高的邏輯性和流暢度。
ChatGPT的核心算法是大規模預訓練語言模型(largelanguagemodel,LLM),通常使用深度學習去處理海量的文本數據,以學習和模擬自然語言中的模式和知識。研究表明,LLM在一系列自然語言處理任務中取得了巨大突破,例如文本摘要生成、文本分類、機器翻譯以及人機問答等[8]。OpenAI公司開發的GPT模型同屬LLM技術,于2018年推出GPT-1。當時該模型的語言理解能力已達到較高水平[]。GPT經多次迭代在GPT-3.5模型基礎上推出了ChatGPT。與NMT相比,GPT模型有所不同,為方便讀者快速了解,我們將其與翻譯相關的特點概述如下②
(一)語言模型龐大
GPT模型是迄今為止最大的LLM模型之一,其內部參數量超過1750億,采用多樣化互聯網文本數據集(約45TB)進行訓練,內容包括各類書籍、文章和網站等,涵蓋多種文本類型。Chat-GPT從龐大的多語言混合訓練數據中學習,與NMT翻譯引擎相比,能夠翻譯的語言對只多不少。研究顯示,在德語、英語、羅馬尼亞語3種語言之間,ChatGPT可以自由翻譯,但騰訊旗下的Tran-Smart囿于數據的原因,暫時無法實現羅馬尼亞語的翻譯[1°]。當然,建立如此巨大的模型,花費也是龐大的,該模型訓練一次的費用保守估計是460萬美元,總訓練成本估計達到了1200萬美元[]可以說,龐大的預訓練數據使得ChatGPT能夠發揮出高質量的機器翻譯能力。
(二)實現一專多能
以往自然語言處理(natural languageprocessing,NLP)任務在研發階段,數據和算法往往具有唯一性。如,機器翻譯研發所采用的平行數據集專門為機器翻譯任務搜集制作,放在其他NLP任務當中較難通用。然而,ChatGPT實現了所謂的“一專多能”。“一?!敝傅氖菍υ捜蝿?,ChatGPT專門針對會話任務進行微調[12],自然語言理解和生成能力達到質的突破。“多能”表現在能處理多個NLP任務,這歸功于訓練階段的多任務學習以及應用階段的微調過程,前者能夠讓模型同時學到多任務的特征和規律,后者則可根據具體任務選擇不同輸入和輸出層,調整模型參數,達到更好的性能。這種一專多能的特點賦予了ChatGPT在進行翻譯任務時的人機交互能力,能夠滿足譯者不同的需求。
(三)人工強化學習
ChatGPT之所以能說人話,主要是采取了人工反饋強化學習的調優策略。與傳統的強化學習方法不同,該技術不依賴于預先設定的獎勵函數,而是利用人類專家的經驗和反饋來指導模型的學習過程,從而顯著提高學習效率和性能[12]。這種方法在OpenAI公司較早推出的InstructGPT模型中就已經采用,并不斷對該模型進行迭代升級。

由此可見,ChatGPT的翻譯能力會隨著模型的更新迭代得以不斷進化,能夠更快速地產出準確的譯文。
由此可見,ChatGPT在運行機制上與谷歌翻譯所采用的NMT引擎有所不同。ChatGPT在具體翻譯中表現如何?與NMT翻譯引擎相比翻譯質量如何?下面通過英漢翻譯實例進行深入探討。
二、ChatGPT非比尋常的翻譯實現方式
本節探討ChatGPT英漢翻譯實現方式,并通過案例分析展示其完成翻譯任務時呈現出哪些別具一格的特點。本研究英文語料選自英文主流報刊媒體的10篇文章,每篇約900單詞。同時,為凸顯ChatGPT的翻譯特性,我們選取全球市場上技術領先且應用廣泛的谷歌翻譯作為NMT代表與之進行對比分析。
(一)一種原文、多種譯文
ChatGPT通過人機對話方式可為譯者提供多種譯文選擇。在問答框內點擊“重新生成回答(regenerateresponse)”,或鍵入“換一種譯法”提示語,ChatGPT就會給出另一種譯文,并對連接詞、語序等結構進行微調。譯者可以要求Chat-GPT不斷生成新的譯文,直到自己滿意為止。譯者也可以在第一次提問時就要求其“提供n種不同的翻譯”,并在得到不同譯文后進行甄選。例1展示了ChatGPT生成不同譯文的過程。
例1人工指令(以下簡稱問)翻譯成漢語, 提供4種不同譯法:Thecharismaticcorporate climber isa common target for resentment in office life.
ChatGPT回答(以下簡稱答)
(1)有號召力的公司職場攀登者是辦公室生活中的常見怨恨目標。(2)個性魅力的企業晉升者在職場生活中往往是惹人嫉妒的對象。(3)集人氣的企業攀升者在辦公室中常常成為被怨恨的對象。(4)魅力獨具的企業扶梯者在工作場所中是常見的被人們怨恨的目標。
谷歌翻譯富有魅力的企業攀登者是辦公室生活中常見的怨恨目標。
在上例中,ChatGPT應人工要求為“corporateclimber”提供了4種不同譯文。其中,“職場攀登者、企業晉升者”有參考價值,而“企業扶梯者”不正確。譯者可在ChatGPT的多重譯文中或直接采用,或譯后編輯,或獲取靈感直至得到滿意的譯文。而谷歌翻譯的譯文僅給出一種譯法,且“企業攀登者”較為生硬,譯者也無法從其他譯法中獲得參考,很可能先入為主地保留NMT譯文,從而讓讀者困惑。
例2問翻譯成漢語,提供3種不同譯法, 進行適當的詞匯、語序變換:Manytotemicbosses of the age,from bankers to tech founders, come with big egos, showy antics and volatile tempers.
答(1)銀行家和科技創新者等時代的權威人物,個個自負、喜歡炫耀、情緒不穩,中 +成為了圖騰老板。(2)時代的許多重要人物,從銀行家到科技創始人,個個都是自信心爆棚、行為張揚、情緒多變的圖騰老板。(3)無論是銀行家還是科技創新者,當今時代的許多重量級領導人都表現出了高度的自我意識、喜歡表演的傾向和情緒反復無常的特點,成為了時代的重要人物。
谷歌翻譯這個時代的許多圖騰老板,從銀行家到科技創始人,都非常自負、愛炫耀和脾氣暴躁。
例2中的英文原文的難點首先在于對“tote-micboss”的理解,以及句子最后一系列的修飾成分。在ChatGPT的回答中,所有譯句都針對“to-temicboss”做出了額外的闡釋,如“權威人物、企業大佬”等,讓讀者一目了然,明白“圖騰老板”的引申意義。同時對于句末一系列的修飾成分,ChatGPT的回答既有譯句1中的連續3個四字詞語的使用,符合漢語的行文特征,也有譯句3中對每個修飾成分深入細致的闡釋。譯者可以權衡ChatGPT給出的不同譯句,考量原文中的疑點難點,得到合適的譯文。更為重要的是,ChatGPT得益于強大的交互能力,能夠根據譯者個性化的指令調整輸出的譯文,如例2指明需進行詞匯、語序變換。如此一來,ChatGPT可以根據譯者導向提供準確的譯文,給譯者留出抉擇的余地。而谷歌翻譯僅給出了一種譯法,一方面沒有對“圖騰老板”的概念進一步闡釋,另一方面在修飾成分的處理上也略顯平庸、不出彩,譯后編輯可能會花費更多時間,且譯者有時不知如何修改。
NMT較難提供多種譯文主要因為其受制于較為固定的交互體系和運作機制。神經網絡是一種基于序列到序列模型(sequence-to-sequence)的方法,完全采用神經網絡完成源語言到目標語言的翻譯過程[5.13]。除非針對原文進行微調,否則 NMT給出的譯文往往較為相似。其次,雖然NMT較以往而言在質量和效率上有了顯著提升,但NMT產出的譯文是基于訓練數據的“二度模仿”,同時受制于已有的固定的算法架構,譯文具有一定的“機械性”。如例1中只是機械地譯出“企業攀登者”,沒能譯出“晉升”的含義,以及例2中沒能針對“圖騰老板”做出更深的闡釋。而Chat-GPT的譯文多樣性既避免了NMT機器譯文的“機械性”,也為譯者提供了選擇的便捷。
(二)多種譯文、不同風格
文本風格通常被認為產生于對常規的變異,翻譯文本風格則是在對原語風格意義進行分析的基礎上獲得譯文風格對原文風格的“適應性”[14]。也就是說,譯文風格的理想狀態是符合原文風格。人工翻譯固然可以實現,但機器翻譯處理風格仍舊較為困難。從宏觀來看,文本風格在不同類型或領域之間的差異很大,比如新聞文本簡明直接,學術文本正式嚴謹;從微觀上講,不同寫作主體在創作時會呈現較為一貫的文本風格,比如文學中的魯迅文體、海明威風格等。與NMT相比,ChatGPT在文本類型風格層面表現較為出色,見例3。
例3問翻譯成漢語,分別以新聞風格、口 語風格進行翻譯:“Despite the company's repeated assurances that its products are safe, recent investiga tions have uncovered numerous instances of potentiallyharmfulchemicalsandundisclosed ingredientsin their manufacturing process, raising serious concerns among regulators and consumers alike.”
答新聞風格:盡管該公司多次保證其產品安全,但最近的調查發現其生產過程中存在大量潛在有害化學物質和未披露成分,這引起了監管機構和消費者的嚴重關注
口語風格:盡管這家公司一再保證他們的產品是安全的,但是最近的調查發現他們的制造過程中存在許多潛在有害的化學物質和未披露的成分,這讓監管機構和消費者都感到非常擔心。
例3顯示ChatGPT人機對話式翻譯能夠為譯者提供針對同一句話的不同文本風格的譯文。新聞風格用詞簡潔正式,對關鍵信息翻譯到位;口語風格則在詞匯上有所改動,添加了日常用語中多見的“的”,同時降低詞匯難度,將“raisingseriousconcerns”譯為“非常擔心”,而不是“嚴重關切”。
例4問翻譯成漢語,分別用魯迅的散文和 李白的古詩風格進行翻譯:“Theireyesmetina sudden,electricmoment thatleft themboth breathless.\"
答魯迅散文式:電光火石間,他們的目光交匯,頓時令他們倆駭然不已。
李白古詩式:兩眼相觸間,電火飛舞忙。驚魂乍現處,氣餒俱踟躇。
例4中,ChatGPT雖不能完全理解所謂的“魯迅風格”,但給出的回答還算差強人意,至少在詞匯上進行了一定的模仿,如運用多個四字詞語,體現出些許魯迅白話文的色彩。相比之下,在李白古詩風格上,ChatGPT處理得較好。譯文形式為五言詩,在正確傳達原意的同時,讀起來也頗具意境和韻味,幾可以假亂真。早前,國內研發團隊已經發布了AI作詩工具,引發廣泛關注④但在機器翻譯任務中,將原文以如此正確且仿真的形式翻譯成古詩,ChatGPT已然成為行業翹楚。
針對例3和例4,谷歌翻譯均只能提供一種譯文(囿于文本篇幅,在此不再展示),因此也就不存在所謂的風格差異。從宏觀上來說,針對不同文本類型的原文,NMT引擎需要從訓練數據和算法調優兩方面入手,對文本類型進行風格上的調整,僅有少部分廠商提供細分文本領域的機器翻譯服務;同時,NMT引擎的算法和數據往往針對通用翻譯任務,很難實現某位作者風格的定制化,因此目前也無法在微觀上再現不同作家的風格。對于譯者而言,掌握原文風格并在譯文中充分復現是一項較為重要且困難的能力。借助Chat-GPT,譯者能夠對原文風格進行快速響應;而NMT給出的風格信息極為有限,很難幫助譯者處理原文的風格要素。
(三)文本標記、輕松識別
元文本標記通常是指用于描述或解釋文本內容的元數據或信息,往往是附加在文本之外的文字或標記,可以提供關于文本的背景、結構、作者等方面的信息。在網站開發中,元文本標記通常需要保留原文,如果被翻譯成漢語,則無法發揮標記功能。因此,翻譯含有元文本標記的句子,對NMT和ChatGPT提出了挑戰,見例5。
例5問“進行英譯漢翻譯任務,第一遍識別元文本標記,說明是哪種標記類型,并按照元文本標記的風格進行翻譯,第二遍保留標記并翻譯:
America's jobs boom rolls on, fuellingfears of sustained inflation. lt;1 titlegt;\"
答第一遍識別標記并翻譯:這是HTML標記語言中的
標記,用于定義標題。按照標題風格翻譯為:美國就業激增引發持續通貨膨脹擔憂。
第二遍保留標記并翻譯:
美國就業激增引發持續通貨膨脹擔憂。 <!-- title-->
谷歌翻譯
美國的就業熱潮不斷,加劇了對持續通脹的擔憂。 <!-- 標題-->
從例5可知,ChatGPT能夠識別元文本信息“
”,并針對不同的元文本信息功能對原文的譯法進行調整。例5指令中明確要在第一遍翻譯中識別元文本標記,得到的譯文首先指明這是超文本語言中的文章標題標記,在譯法中對應新聞標題那種簡短精悍、突出要點、一目了然的特點。其次,譯者也可以提出保留元信息的要求,ChatGPT一樣能夠識別,如例5中第二遍翻譯。這樣一來,網站開發者可以直接用ChatGPT得到的句子進行網頁設計,不再需要轉寫。
NMT在翻譯詞匯時能夠做到較為正確,但卻缺乏專業背景知識,不能理解和處理元文本標記這個概念,可能會將元文本標記中的詞匯翻譯出來,反而破壞其功能。同樣是例5中的英文,谷歌翻譯無法識別“”的元文本標記功用,而是簡單將其對待為一個單詞去翻譯,這樣的句子就無法使用,必須將“ lt;1 標題 gt; ”再還原成“”才能用于網站開發。
總而言之,ChatGPT作為大語言模型訓練和人工強化學習的產物,在翻譯任務中確有讓人眼前一亮的表現。與NMT相比,ChatGPT發揮了其自身人機對話的特點:可以針對同一原文產生多種譯文,為譯者提供選擇的便利;能夠實現多種風格的處理,甚至可以模仿不同作者的寫作風格;產生的譯文也可以識別原文中的元文本標記,并根據譯者的需求對譯文進行靈活調整。然而,研究表明,ChatGPT在對NMT構成嚴峻挑戰的同時,仍存在一定的不足之處。
三、ChatGPT有待提高的翻譯質量
與傳統的機器翻譯工作機制形成鮮明對比的ChatGPT,雖然在多重譯文、風格復現、文本標記的處理上呈現出不同凡響之特征,但目前在翻譯質量上仍有較大的提升空間。下文將從完整性、準確性、一致性等方面展示ChatGPT相較于以谷歌翻譯為代表的NMT所存在的局限。
(一)信息漏譯、文不完整
翻譯首先要忠實于原文的語義表達,信息漏譯會導致重要的信息被省略或遺漏,從而使譯文的完整性大打折扣,嚴重影響譯文質量,也會導致譯文讀者對原文中的信息產生誤解。在本研究中,ChatGPT出現了幾次關鍵信息漏譯現象,見例6、例7。
例6原文 Giventhe importanceofsolarto India'sambitions,this was ominous.
ChatGPT對印度雄心勃勃的野心而言,這是不祥之兆。
谷歌翻譯 鑒于太陽能對印度雄心壯志的重要性,這是不祥之兆。
例6中,我們發現ChatGPT漏譯了原句中較為關鍵的solar一詞,直接導致譯句意義的轉變。原句意思是太陽能資源對于印度的宏偉藍圖是非常重要的,但如果漏掉了solar這個關鍵詞,就變成了印度本身野心勃勃。這顯然會造成理解錯誤。這種翻譯一旦發生在外交等重要場合,就會釀成大錯。而谷歌翻譯對原句的處理較好,甚至都不需要譯后編輯。
例7原文But the main impact of the visit was symbolic,comingasit did justfourdaysbeforethe first anniversary of the full-scale invasion on February 24th.
ChatGPT但是,此次訪問的主要影響是象征性的,因為它是在全面入侵第一周年之前的四天。
谷歌翻譯但這次訪問的主要影響是象征性的,就在2月24日全面入侵一周年的前四天。
例7中,同樣的問題發生在日期的漏譯上。ChatGPT給出的譯文漏掉了原文中的日期,這會給讀者帶來不便,不清楚原文中所謂一周年的起止時間,而谷歌翻譯不存在漏譯的問題。
(二)詞不達意、佶屈聱牙
評測機器翻譯性能的重要指標是機器譯文的質量,翻譯錯誤會大大降低機器翻譯的準確性,增加譯后編輯人員的工作負荷[15]。請看以下例句中ChatGPT與NMT譯文的對比。
例8原文That statistical difference contributed toan unusually steep fall in British national income compared with its peers during the pandemic; other economies may still be flattered by the comparison asa result.
ChatGPT這種統計差異導致英國國民收人在大流行期間與其同行相比出現異常的急劇下降;其他經濟體可能會通過這種比較而受益。
谷歌翻譯在大流行期間,與其他國家相比,這種統計差異導致英國國民收人異常急劇下降;因此,其他經濟體可能仍因這種比較而受寵若驚。
例8在詞匯處理上,ChatGPT并沒能超越以谷歌翻譯為代表的NMT。ChatGPT將“peers”譯為“同行”乍看似乎正確,但卻忽略了上下文,誤置了對比對象。這里對比的是國家之間的經濟狀況,因此谷歌翻譯的“其他國家”更為準確。
例9原文Far from admitting their error, they doubled downand declared him fit for service.
ChatGPT遠離承認他們的錯誤,他們強化聲明,宣稱他適合服務。
谷歌翻譯 他們非但沒有承認錯誤,反而加倍努力,宣布他適合服役。
例9中的“farfrom”是一個經常使用的短語,放在句首表示“非但沒有…,還…”的意思。此處,ChatGPT單純翻譯出了字面含義,譯成“遠離”,這與原文想要表達的意思相去甚遠,造成了意義上的翻譯錯誤。
在句式表達上,由于中文和英文存在差異,譯者需要根據具體情況對譯文句式進行調整。以往的統計機器翻譯多基于平行語料庫和概率算法進行翻譯,常會在英譯漢過程中造成譯文句式上的成分錯位或過于西化等問題[16]。而在目前的NMT系統中,這種現象得到了明顯改善。
例10原文Not every one of these trendswill last.
ChatGPT不是每一個這些趨勢都會持久。
谷歌翻譯并非所有這些趨勢都會持續下去。例10中,原文存在一個較長的主語,且noteveryone表示部分否定的意思,應當譯為“并非所有”。因此,ChatGPT的譯文直接分別翻譯了not和everyone的意思,沒有經過句式上的調整,讀起來顯得佶屈聱牙,過于西化,相比之下,谷歌翻譯表現更好。
(三)專有名詞、前后不一
譯文前后一致性關乎整體譯文的質量,人名或術語等專有名詞的翻譯前后不一致是較為明顯的錯誤之一,會直接導致讀者錯誤領會上下譯文的意思。研究發現,ChatGPT在執行機器翻譯時,對于人名或術語翻譯的前后一致性表現較為遜色舉例見表1。

人名的處理需要遵循一致性原則。雖然人名翻譯并無確定唯一的譯法,如“Mary”可被譯為“瑪麗”或者“瑪莉”,但為避免混淆,應在上下文統一使用選定的譯法。在本研究中,如表1左側所示,人名如“Dr.Buck”在原文上下文中出現了3次,ChatGPT譯文對應出現了3種不同的譯法“Buck”“布克博士”“桶博士”,如不進行譯后編輯,讀者很容易誤認為這是3個不同的人,更不用說第三種譯法直接將人名當作一個普通名詞來譯,這是錯誤的;而谷歌翻譯的譯文統一保留了原文,譯成“Buck”,雖然沒音譯成漢語讀者多見的“巴克”,但至少做到了上下文統一,不會產生歧義。
術語翻譯同樣需要保證前后一致,確保譯文連貫和準確。尤其在翻譯大型文檔或專業文件時,保持術語一致應貫穿整個項目始終。本研究發現,ChatGPT在同一專有名詞的翻譯上的前后一致性略遜于NMT(見表1)。比如術語“silentsyna-pses”,指未激活的神經突觸,醫學專用術語稱之為“沉默突觸”。ChatGPT在上下文中出現了3種不同的譯法:“沉默突觸”“無聲突觸”“靜默突觸”。雖然“沉默、無聲、靜默”都是“silent”的正確意思,但術語需保持前后一致性才不會讓讀者產生困惑。這一點谷歌翻譯做到了。Chat-GPT對同一原文給出不同的譯文表達,的確增加了譯文靈活性,但反之也降低了譯文一致性,增加了譯后編輯工作量,造成額外時間損耗。在這一點上,NMT引擎做得較好,如若額外添加術語表的功能,就能在確保術語前后一致的同時,做到更為地道的目標語轉換
綜上,我們發現,與NMT引擎相比,Chat-GPT確實存在一定的局限性,如:在譯文準確性上,會出現誤譯和句式直譯問題,造成事實性錯誤;在信息完整性上,譯文中存在漏譯現象,影響原文意義表達;在術語一致性上,專有名詞的前后一致性較弱,造成讀者誤解。值得一提的是,以上提及的各種翻譯錯誤在ChatGPT中并未頻繁出現,我們只是選取了較為典型的案例。通過具體翻譯實踐,譯者能夠對ChatGPT和NMT的實際表現有較為深入的了解,也能夠在后續使用ChatGPT進行翻譯任務時采取相應的翻譯或譯后編輯策略。
四、人機對話翻譯帶來的啟示
人工智能技術的出現如同一個快速迭代、學科融合、注重實踐的大浪潮,避而驅之絕不可行,偃旗息鼓亦不可為。在翻譯實踐、翻譯學習、技術研發中,ChatGPT和未來的諸多人機對話式AI產品給我們提供了一定的啟示。
(一)翻譯從業者:正視挑戰、為我所用
ChatGPT雖在執行翻譯任務上表現優異,但并不是完美無瑕、毫無破綻的超級機器。通過本研究的案例,能夠看出ChatGPT在翻譯中仍會產生較多錯誤。這說明對機器譯文的人工介人仍是必不可少的,“人工智能取代譯者”的論調還言之尚早。不管是對于常規語言還是陌生化語言,機器譯文目前還很難做到一步到位,必須有譯后編輯參與[,譯者仍需不斷提高翻譯和譯后編輯技能,及時發現機器譯文當中的錯誤。
研究發現,ChatGPT和NMT在翻譯實踐中各有利弊,譯者應該了解兩種技術之間存在的異同,在翻譯過程中靈活運用不同的機器翻譯工具,充分發揮其各自的特點,以達到良好的翻譯效果。例如:在翻譯文學、散文等風格變化較大的文本時,譯者可選擇ChatGPT并參考本文例1至例4中的指令,利用模型能夠適應不同文體風格譯文的特點,助力特定文本類型的翻譯;而在翻譯精度要求高、數據繁多、術語數量大的文本時,為避免ChatGPT靈活性過大而導致的誤譯、漏譯或一致性差等問題,應選用結合術語表或垂直領域的NMT引擎,并進行適當的譯后編輯。
另外,ChatGPT最大的特點是人機對話、交互性強,其回答質量與譯者的指令息息相關,給出的譯文也不具有復現性。這就需要譯者不斷訓練模型,在提高“搜商”的同時,還要提高“問商”,從而提高人機交互效率,得到更加準確的譯文。此外,譯者還要探索NMT和ChatGPT二者潛在的交互性,后者可為NMT譯文提供修改建議并改善整體翻譯的流暢性和連貫性,從而幫助譯員加快譯后編輯過程、提高譯文整體質量。在此過程中,譯者也要強化在數據采集、處理、分析、共享、保護和利用等方面的能力,提高個人數據權益和數據倫理意識[18]
最后,ChatGPT絕對不是最終的劃時代人工智能產品,未來隨著科技發展,還會出現更多、更新、更強的產品,譯者需要做到在態度上擁抱技術、在學習中享受技術、在頭腦中思考技術。一味地抵觸和“擺爛”實際上都無濟于事。顯然,技術的車輪滾滾而來,“順之者昌、逆之者亡”“優秀的譯者應借助機器尋找意義”[19],要爭取利用技術不斷去挖掘新的資源,而不是被技術裹挾,變成技術的附庸。
(二)翻譯學習者:學而用之、勿入歧途
如今,隨著學界和產業界對翻譯技術關注的不斷升溫,各大高校開始充分利用高校特色跟進和更新針對MTI的翻譯技術課程教育[20-21],建立翻譯技術人才能力培養框架和模型[22-23]。這一系列努力有助于培養翻譯學習者正確對待和使用人工智能的意識和能力。因此有學者稱,在人工智能時代,翻譯技術教學大有可為[24]
對于翻譯學習者來說,ChatGPT能夠讓其跳出課堂教育的框架,可以隨時隨地進行“泛在學習”[25]。同時,ChatGPT能夠提供翻譯練習、譯文打分、意見反饋,還能提供學習資源和工具等。可見,人工智能已經從感知智能進人了認知智能,并帶領我們進人了一個人機合作的新時代[2。在此背景下,翻譯學習者的自學能力將是成功的關鍵,要時刻考慮這幾個問題:用不用、何時用、怎么用。翻譯學習者應在專業技術技能上打好基礎,充分利用人工智能技術和資源,實現所謂的“彎道超車”。
值得一提的是,翻譯學習者在享受ChatGPT帶來的快捷和便利的同時,要樹立正確的“技術觀”,適當借助技術進行翻譯學習和實踐,把握技術和人文之間的平衡。這在學習階段尤為重要。一方面,我們不能過分強調技術,完全依賴技術。過分依賴不但會造成“人工翻譯無用論”思想,還會導致“譯者身份異化”,帶來思維模式化、單一化、機械化的不良影響[2]。譯者要充分認清ChatGPT在翻譯中表現出的劣勢,提高給機器挑錯的能力,要既能改正較為明顯的譯文不準確現象,也能及時發現較為隱蔽的信息不完整、前后不一致等問題。另一方面,過度排斥技術同樣不可取。翻譯不再是過去依賴紙筆的時代,語言服務企業追求效率和利益,需要翻譯技術的加持。對于學習者而言,從計算機輔助翻譯,到NMT引擎,再到如今的ChatGPT,技術的更新迭代極其迅速?!耙徊礁簧?,步步跟不上?!敝挥蟹e極擁抱技術、學習技術,樹立人機耦合的意識,構建人機交互、人機協同、人機共生的學習理念[2],才能不落后于時代。
(三)技術開發者:迭代更新、以人為本
通過實踐,我們發現將ChatGPT應用于機器翻譯任務,在以下兩個方面仍有待提升。一方面,雖然在人工反饋強化學習模式下,ChatGPT會自動規避生成一些有悖道德、常識、意識形態方面的錯誤或有害信息,但由于“語言污染”或數據偏差,無法完全避免存在偏見或道德倫理方面不正確的信息,這對機器翻譯倫理的忠實和忠誠原則提出了挑戰[29]。如果在譯文中出現此類差錯,不僅增加了譯者進行譯后編輯的工作負荷,而且一旦漏改就會對譯文質量帶來嚴重的影響。
另一方面,ChatGPT在集成翻譯平臺(如CAT工具)上的效果較差,這對當前CAT工具的開發提出了挑戰,即如何在編輯器界面融入ChatGPT的交互式功能?,F如今的CAT工具(Trados、memoQ等)多將機器翻譯作為插件集成加入編輯器,機器翻譯提供“答案”,用戶進行“批改”,NMT的“答案”通常是唯一、固定的,而Chat-GPT具有交互性,可根據原文特征提供多樣靈活的“答案”,并接受用戶反饋和再交互。這要求開發者針對ChatGPT的特點進行改進,從人機工效學的角度調整編輯器交互界面,充分結合ChatGPT的交互功能和多語言處理能力,真正做到“以人為本”,讓技術更好地服務于譯者。
五、結語
本文通過案例分析得出,ChatGPT與谷歌翻譯相比在譯文多樣性、風格變化和標記識別方面表現出潛力,但在準確性、完整性和一致性方面還有待提高。ChatGPT已經打開了“潘多拉魔盒”,不論是翻譯從業者、學習者,還是技術開發者,都要適應變化、及時調整,充分利用人工智能發展紅利,進一步為翻譯實踐和翻譯教學增添新的動力。
參考文獻:
[1] 胡開寶,李翼.機器翻譯特征及其與人工翻譯關系的研究[J].中國翻譯,2016,37(5):10-14.
[2] 嚴辰松.機器翻譯取代人工翻譯還只是愿景—機譯英譯漢實例點評[J].翻譯教學與研究,2021(2):1-12.
[3] 馮志偉,張燈柯.機器翻譯與人工翻譯相輔相成[J].外國語,2022,45(6): 77-87.
[4] 劉洋.神經機器翻譯前沿進展[J].計算機研究與發展,2017,54(6): 1144-1149.
[5] 宗成慶.人類語言技術展望[J].中國人工智能學會通訊,2020,10(1):2-3.
[6] 李梅.機器翻譯譯后編輯過程中原文對譯員影響研究[J].外語教學,2021,42(4):93-99.
[7] PEDERSEN F.EasyTranslate raises Eur 3m to scaleChatGPT content generation tool [EB/OL]. (2023-02-01)[2023-10-26].https://slator.com/easytranslate-raises-3m-build-chatgpt-content-generation-tool.
[8] MIN B,ROSS H, SULEM E, et al. Recent advances innatural language processing via large pre-trainedlanguage models: a survey[J]. ACM Computing Sur-veys,2023,56(1): 1-12.
[9] RADFORD A,NARASIMHAN K, SALIMANS T, etal. Improving language understanding by generativepre-training[J/OL].[2023-10-26] htps://www.cs.ubc.ca/\~amuham01/LING530/papers/radford2018improving.pdf.
[10]JIAO W X,WANG W X,HUANG J T,et al. IsChatGPT a good translator? Yes with GPT-4 as theengine [EB/OL]. (2023-11-02)[2023-10-26].https:/arxiv.org/abs/2301.08745.
[11]BROWN T B,MANN B,RYDER N,et al. Languagemodels are few-shot learmers[C]//Proceedings of the34th International Conference on Neural InformationProcessingSystems. Vancouver: Curran AssciatesInc.,2020:1877-1901.
[12]OUYANG L, WU J, JIANG X,et al. Training languagemodels to follow instructions with human feed-back[C]//Proceedings of the 36th Conference on NeuralInformationProcessingSystems.NewOrleans:NeurIPS,2022.
[13] 李亞超,熊德意,張民.神經機器翻譯綜述[J].計算機學報,2018,41(12):2734-2755.
[14] 劉宓慶.翻譯的風格論(上)[J].外國語,1990(1):3-7; 41.
[15] JIAY F,ZHENG B H.The interaction effect betweensource text complexity and machine translation qualityonthe task difficultyofNMTpost-editing fromEnglishto Chinese: a multi-method study[J]. Across Languagesand Cultures,2022,23(1):36-55.
[16] 李梅,朱錫明.英漢機譯錯誤分類及數據統計分析[J].上海理工大學學報(社會科學版),2013,35(3):201-207.
[17] 楊文地,范梓銳.科技語篇機器翻譯的譯后編輯例析[J].上海翻譯,2021(6):54-59.
[18] 王華樹,劉世界.新文科背景下翻譯技術核心課程教學模式探索[J].外語教學,2022,43(6):57-62.
[19] 杜磊,劉和平.“優秀的譯者應借助機器尋找意義”——劉和平教授訪談[J].東方翻譯,2020(6):48-57.
[20] 李梅.信息時代的“項目 + 技術”二輪驅動特色翻譯教學[J].外國語,2017,40(5):99-101.
[21]王華樹,劉世界.大數據時代翻譯數據倫理研究:概念、問題與建議[J].上海翻譯,2022(2):12-17.
[22] 馮全功,劉明.譯后編輯能力三維模型構建[J].外語界,2018(3):55-61.
[23] 崔啟亮.AI時代的譯者技術應用能力研究[J].外國語言與文化,2020,4(1):104-110.
[24] 陶友蘭.中國翻譯技術教學研究三十年(1990—2020)[J].上海翻譯,2023(2):49-54.
[25]劉芹.泛在學習視域下的理工科學術英語動態評估模型構建[J].上海理工大學學報(社會科學版),2021,43(1):8-15.
[26]馮志偉,張燈柯,饒高琦.從圖靈測試到Chat-GPT——人機對話的里程碑及啟示[J].語言戰略研究,2023,8(2):20-24.
[27] 王贊,張政.數字化時代機器翻譯的風險審視及控制研究[J].中國翻譯,2022,43(2):109-115.
[28] 秦穎.人機共生場景下的外語教學方法探索——以ChatGPT為例[J].外語電化教學,2023(2):24-29.
[29] 任文.機器翻譯倫理的挑戰與導向[J].上海翻譯,2019(5): 46-52.
[30] 顧春輝,溫昌斌.聯合國術語庫建設及其對中國術語庫建設的啟示[J].中國科技術語,2017,19(3):5-9;34.
[31]劉力力,朱建平,高新顏.論中醫藥英文術語規范的同一性原則[J].中國科技術語,2013,15(1):38-40;45.
[32]馬蓮.“術語”“名詞”“名詞術語”辨析[J].新聞與傳播研究,2016(9):119-125.
(責編:朱渭波)