摘要:傳統(tǒng)的口譯術(shù)語管理方式存在信息孤島凸顯、及時響應(yīng)滯后、管理效率低下、智能功能較弱等問題。大語言模型 (LLMs) 的出現(xiàn)為口譯術(shù)語管理帶來了新機(jī)遇。它具備強(qiáng)大的文本處理能力,能夠自動提取術(shù)語、提供術(shù)語翻譯、分析術(shù)語使用情況等,可提升術(shù)語翻譯質(zhì)量、提高術(shù)語管理效率、促進(jìn)口譯員的專業(yè)化發(fā)展。盡管如此,大語言模型在口譯術(shù)語管理中的應(yīng)用仍面臨模型訓(xùn)練數(shù)據(jù)偏差、數(shù)據(jù)隱私安全堪憂、訓(xùn)練維護(hù)成本較高等諸多問題,未來研究需要進(jìn)一步探索大語言模型在口譯術(shù)語管理中的應(yīng)用場景,優(yōu)化算法與模型,提升其準(zhǔn)確性與可靠性,并開發(fā)更加人性化和智能化的口譯術(shù)語管理工具。
關(guān)鍵詞:口譯;術(shù)語管理;大語言模型;人工智能
中圖分類號:H083;G20DOI:10.12339/j.issn.1673-8578.2025.02.015
The Application of Large Language Models in Terminology Management for Interpreting//WANG Huashu, BAI Hua
Abstract: Traditional methods of terminology management in interpreting have some problems, including information isolated island, realtime insufficiency, low efficiency, and intelligence insufficiency. Thanks to the powerful text processing capabilities, large language models (LLMs) offer new opportunities for terminology management in interpreting. LLMs can automatically extract terms, provide term translations, analyze term usage, thus improving translation quality, increasing management efficiency, and supporting the professional development of interpreters. However, the application of LLMs in terminology management for interpreting still faces challenges such as bias in training data, concerns over data privacy and security, and high costs for training an maintenance. Future research should further explore the application scenarios of LLMs in terminology management for interpreting, optimize algorithms and models to improve accuracy and reliability, and develop more userfriendly and intelligent terminology management tools.
Keywords: interpreting; terminology management; large language models; artificial intelligence
0引言
隨著經(jīng)濟(jì)全球化和信息技術(shù)的快速發(fā)展,口譯在國際交流中扮演著越來越重要的角色,對口譯質(zhì)量的要求也越來越高。口譯員作為跨文化溝通的橋梁,需要具備高超的語言轉(zhuǎn)換能力和廣博的專業(yè)知識,而準(zhǔn)確理解和運(yùn)用專業(yè)術(shù)語是確保口譯質(zhì)量的關(guān)鍵。口譯中的術(shù)語是指特定專業(yè)領(lǐng)域中具有特殊含義或用法的詞匯單位,包含詞匯形式和概念內(nèi)容兩個方面,而譯員在進(jìn)行術(shù)語準(zhǔn)備時不能僅局限于術(shù)語,還需包括與口譯內(nèi)容密切相關(guān)的普通詞匯[1]。術(shù)語管理是現(xiàn)代譯者能力體系的重要組成部分,關(guān)乎翻譯質(zhì)量與服務(wù)能力[2]。在國際交流日益豐富的今天,口譯術(shù)語管理對于提升口譯質(zhì)量與效率具有重要意義。
目前,國內(nèi)學(xué)者大多只關(guān)注到筆譯術(shù)語管理,對于口譯術(shù)語管理的關(guān)注相對較少。口譯術(shù)語管理是指為了滿足特定的口譯活動需要而對術(shù)語資源進(jìn)行管理的實踐活動,包括術(shù)語收集、描述、處理、存儲、編輯、呈現(xiàn)、維護(hù)和分享等,這是口譯人員職業(yè)翻譯行為的主要表現(xiàn)[3]。傳統(tǒng)的口譯術(shù)語管理主要依靠人工收集、整理和翻譯術(shù)語,例如通過查閱專業(yè)詞典、術(shù)語庫等方式,存在效率低下、一致性差等問題。這些方式難以應(yīng)對現(xiàn)代翻譯項目任務(wù)量大、語種多、交付周期短的特點。
近年來,大語言模型(Large Language Models, LLMs)的興起為口譯術(shù)語管理帶來了新機(jī)遇。大語言模型是一類基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的自然語言處理(Natural Language Processing, NLP)模型[4],通常具有生成式、交互式和多功能等特征:生成式是指大語言模型能夠生成連貫的普通文本和多模態(tài)文本,交互式是指用戶可以使用人類語言與大模型進(jìn)行交互,多功能是指大語言模型可以完成多種任務(wù)[5]。因此,大語言模型能夠基于其自身優(yōu)勢處理海量語言數(shù)據(jù),具備強(qiáng)大的文本生成、翻譯和分析能力,同時還能與口譯員實時交互,為口譯術(shù)語管理賦能,輔助譯員自動從文本中提取術(shù)語、提供術(shù)語翻譯、分析術(shù)語使用情況等,從而提升術(shù)語翻譯質(zhì)量,提高術(shù)語管理效率,促進(jìn)口譯員的專業(yè)化發(fā)展。
1口譯術(shù)語管理研究現(xiàn)狀
口譯作為一種實時性、專業(yè)性極強(qiáng)的語言活動,對術(shù)語的準(zhǔn)確性和熟練程度要求較高。然而,目前國內(nèi)外對口譯術(shù)語管理的研究相對滯后,與筆譯項目中的術(shù)語管理相比,口譯術(shù)語管理研究成果較少,口譯員對術(shù)語管理的意識和實踐大多局限于紙質(zhì)記錄和簡單的Excel術(shù)語表。MoserMercer[6]是較早關(guān)注到口譯術(shù)語管理的學(xué)者,其研究通過向國際會議口譯協(xié)會(AIIC)成員發(fā)出調(diào)查問卷,發(fā)現(xiàn)了會議口譯員的術(shù)語需求,提出針對會議口譯市場的軟件開發(fā)人員必須提供滿足口譯員特定需求的工具。之后不少學(xué)者便開始對口譯術(shù)語管理的相關(guān)方面進(jìn)行研究,研究主要集中在以下四個方面:
(1)口譯術(shù)語管理工具:目前,關(guān)于口譯術(shù)語管理工具的研究主要分為以下兩個方面。一是對口譯術(shù)語管理工具的描述與評估。有學(xué)者從口譯員需求角度對口譯術(shù)語管理工具進(jìn)行描述和評估,并根據(jù)評估結(jié)果提出改進(jìn)意見和展望[7-10],Antón[11]雖然也做了類似的研究,但是關(guān)注到了更加細(xì)化的口譯類型——社區(qū)口譯。二是口譯術(shù)語管理工具的設(shè)計與應(yīng)用。部分學(xué)者結(jié)合時代背景,分析口譯術(shù)語管理的現(xiàn)狀,針對目前存在的問題及需求,對口譯術(shù)語管理的相關(guān)研究、工具設(shè)計和應(yīng)用等提出了建議[3,12-13]。少量學(xué)者還根據(jù)不同領(lǐng)域分析口譯術(shù)語管理面臨的問題,設(shè)計出針對不同領(lǐng)域特點的術(shù)語庫,如方紫鈺、劉芹[14]聚焦于國際傳播角度設(shè)計中國特色話語口譯術(shù)語庫模型,司顯柱、朱珊、謝洪[15]則關(guān)注到醫(yī)學(xué)口譯術(shù)語的問題,提出結(jié)合術(shù)語技術(shù)建立醫(yī)學(xué)同義詞術(shù)語庫。
(2)口譯術(shù)語管理對口譯質(zhì)量影響的研究:不少學(xué)者通過實驗、焦點小組等方式證明了術(shù)語管理工具能夠幫助口譯員進(jìn)行譯前準(zhǔn)備,提升翻譯質(zhì)量。Biagini[16]和Gacek[17]發(fā)現(xiàn)InterpretBank可以幫助口譯員提升術(shù)語翻譯質(zhì)量,有助于提升整體翻譯質(zhì)量,徐然[18-20]基于語料庫發(fā)現(xiàn)了術(shù)語自動提取工具能夠提高口譯員的口譯準(zhǔn)確度。
(3)口譯術(shù)語準(zhǔn)備方式研究:Gorjanc[21]提出使用WebBootCaT工具進(jìn)行術(shù)語準(zhǔn)備,Will[22]從知識管理的角度,針對同傳術(shù)語準(zhǔn)備的管理模型及方法進(jìn)行了探索。有些學(xué)者還對不同的術(shù)語準(zhǔn)備方式進(jìn)行對比評估:Fantinuoli[23]分別評估了自動和手動建立的術(shù)語庫,對兩者的提取結(jié)果進(jìn)行分析,提出半自動方式建立的術(shù)語庫效率最優(yōu);Pignataro[24]對比了醫(yī)學(xué)領(lǐng)域同聲傳譯中手動創(chuàng)建的術(shù)語表與WordSmith支持下創(chuàng)建的術(shù)語表功能。此外,Xu和Sharoff[25]使用了可比語料庫評估譯前準(zhǔn)備時的術(shù)語提取方法。
(4)口譯術(shù)語認(rèn)知與記憶研究:目前國外有少數(shù)學(xué)者利用實驗心理學(xué)等方法,通過實驗研究口譯術(shù)語管理中的術(shù)語認(rèn)知與記憶。例如,Prandi[26]運(yùn)用同聲傳譯認(rèn)知負(fù)荷模型,研究了口譯術(shù)語管理工具對同聲傳譯認(rèn)知過程的影響。
然而,現(xiàn)有的口譯術(shù)語管理研究存在一些局限性:系統(tǒng)性不足,缺乏系統(tǒng)的理論框架和實踐指南;研究深度不足,大部分研究僅停留在描述口譯術(shù)語管理工具層面,缺乏深入的理論分析和實證研究;針對性不足,缺乏專門針對口譯以及不同領(lǐng)域口譯特點的術(shù)語管理理論、方法和實證研究;時代性不足,尤其是在大語言模型快速發(fā)展的背景下,將大語言模型應(yīng)用于口譯術(shù)語管理的研究目前仍舊較少。
大語言模型的出現(xiàn)為口譯術(shù)語管理帶來了新的可能性,其強(qiáng)大的文本處理能力和智能化輔助功能可以有效應(yīng)對傳統(tǒng)術(shù)語管理面臨的挑戰(zhàn)。未來的研究需要關(guān)注大語言模型的應(yīng)用,探索如何利用大語言模型提升口譯術(shù)語管理的效率和智能化水平,如大語言模型驅(qū)動的術(shù)語提取和構(gòu)建、大語言模型輔助的術(shù)語學(xué)習(xí)和記憶、大語言模型支持的實時術(shù)語查詢和建議以及大語言模型驅(qū)動的術(shù)語分析和總結(jié)等。
2傳統(tǒng)口譯術(shù)語管理面臨的主要挑戰(zhàn)
傳統(tǒng)口譯術(shù)語管理方法主要依靠人工操作,效率低下且缺乏智能化輔助,難以滿足口譯員日益提升的需求,信息孤島現(xiàn)象也阻礙了術(shù)語資源的有效共享和利用,制約了口譯行業(yè)的整體發(fā)展。隨著信息技術(shù)的快速發(fā)展,口譯行業(yè)的專業(yè)化程度不斷提高,傳統(tǒng)的術(shù)語管理方法暴露出越來越多的不足。這些挑戰(zhàn)不僅影響了口譯員的工作效率和質(zhì)量,也阻礙了口譯行業(yè)的整體發(fā)展。
2.1信息孤島凸顯
在大型翻譯項目中,專有名詞、專業(yè)術(shù)語、特色表達(dá)等都有其特定的專業(yè)背景或語言風(fēng)格,且規(guī)模一般較大,參與人員多,這對術(shù)語的翻譯和管理提出了更高的要求[27]。口譯員獲取術(shù)語資源的渠道有限,往往只能依靠個人經(jīng)驗從有限的渠道獲取術(shù)語。由于缺乏統(tǒng)一的術(shù)語管理平臺,即使找到相關(guān)術(shù)語,也難以判斷其專業(yè)性和準(zhǔn)確性,因而難以保證術(shù)語的準(zhǔn)確性和一致性。此外,口譯員之間缺乏有效的術(shù)語共享機(jī)制,每個譯員都各自維護(hù)自己的術(shù)語庫,無法有效溝通與協(xié)作,導(dǎo)致重復(fù)勞動和信息孤島現(xiàn)象產(chǎn)生,也導(dǎo)致了相同術(shù)語在翻譯和解釋時可能存在差異,影響口譯的質(zhì)量和效率。這種信息孤島現(xiàn)象不僅存在于口譯員之間,也存在于不同的機(jī)構(gòu)和組織(包括服務(wù)方和客戶方)之間。各個機(jī)構(gòu)各自為政,建立自己的術(shù)語庫,缺乏跨機(jī)構(gòu)的術(shù)語資源共享和交流機(jī)制(比如客戶方有相關(guān)的術(shù)語資源,但是未能提供給服務(wù)方),導(dǎo)致術(shù)語資源的浪費和重復(fù)建設(shè),也阻礙了術(shù)語標(biāo)準(zhǔn)化的進(jìn)程。客戶方往往不了解術(shù)語管理的重要性,也不愿意投入資源進(jìn)行術(shù)語整理和維護(hù),口譯服務(wù)提供方很難獲取到準(zhǔn)確、一致的術(shù)語信息。
2.2及時響應(yīng)滯后
口譯過程的實時性要求口譯員能夠快速準(zhǔn)確地獲取和運(yùn)用術(shù)語,并且能在口譯過程中實時進(jìn)行術(shù)語管理,而傳統(tǒng)術(shù)語管理方法難以滿足這一需求。在同聲傳譯等需要快速反應(yīng)的場景中,譯員很難及時查閱紙質(zhì)詞典或搜索網(wǎng)絡(luò)資源,即使事先準(zhǔn)備了術(shù)語表,也難以應(yīng)對口譯過程中出現(xiàn)的各種突發(fā)情況。在大型會議的同聲傳譯中,譯員可能需要面對大量專業(yè)術(shù)語和新詞匯,如果僅依靠傳統(tǒng)紙質(zhì)詞典或簡單的電子詞典,很難快速找到所需術(shù)語,更無法及時了解術(shù)語的最新解釋和用法。并且在口譯過程中,譯員需要快速反應(yīng),根據(jù)語境選擇最合適的術(shù)語翻譯,而傳統(tǒng)的術(shù)語管理工具無法提供實時查詢和建議,限制了譯員的反應(yīng)速度和準(zhǔn)確性,難以滿足口譯過程的實時性要求。與此同時,現(xiàn)在大多數(shù)軟件還未融合其他智能口譯技術(shù),如語音識別、實時翻譯,因此譯員無法在口譯過程中實時提取術(shù)語,給譯員實時協(xié)作及后續(xù)口譯管理帶來了不便[13]。
2.3管理效率低下
由于技術(shù)局限,最早用于存儲術(shù)語資源、輔助專業(yè)翻譯的工具是紙質(zhì)的雙語術(shù)語詞典,但紙質(zhì)術(shù)語詞典在為用戶提供便利的同時,其弊端也日益顯現(xiàn):詞典編纂主要依賴人力編排,過程周折,出版周期長,容量有限,更新速度慢;使用紙質(zhì)術(shù)語詞典查閱術(shù)語信息,耗時費力,影響工作時效[28]。即便現(xiàn)今有術(shù)語庫及相關(guān)術(shù)語管理系統(tǒng),但口譯術(shù)語管理效率仍然低下。王華樹、張靜[3]曾針對口譯人員術(shù)語管理情況進(jìn)行了調(diào)查,調(diào)查發(fā)現(xiàn),采用“Excel表格”和“紙質(zhì)筆記”方式的口譯員達(dá)到調(diào)查總?cè)藬?shù)的71%,僅有3%的譯員使用術(shù)語管理系統(tǒng)。因此,口譯員需要花費大量時間查閱紙質(zhì)詞典、專業(yè)書籍、網(wǎng)絡(luò)資源等,搜集項目相關(guān)術(shù)語,并手動整理、記錄和構(gòu)建術(shù)語庫。這種方式不僅效率低下,容易出錯,還難以應(yīng)對口譯項目中不斷出現(xiàn)的新術(shù)語。由此可見,傳統(tǒng)口譯術(shù)語管理主要依靠人工操作,管理效率低下且缺乏智能化輔助,這使得術(shù)語的版本控制、更新和維護(hù)都十分困難,容易造成術(shù)語庫的混亂和錯誤累積。隨著口譯項目規(guī)模的擴(kuò)大和專業(yè)化程度的提高,人工管理術(shù)語的局限性愈發(fā)明顯,難以滿足快速增長的口譯術(shù)語管理需求。
2.4智能功能較弱
雖然目前已有一些術(shù)語管理工具,但這些傳統(tǒng)的術(shù)語管理工具功能單一,缺乏智能化輔助功能,難以滿足口譯員對術(shù)語學(xué)習(xí)、記憶和應(yīng)用的個性化需求。盡管大多數(shù)軟件支持術(shù)語注釋功能,但其相關(guān)內(nèi)容無法被搜索,導(dǎo)致譯員無法通過高頻記錄的上位詞、近義詞、縮寫等更好地捕捉到需要的術(shù)語[13]26。而且傳統(tǒng)術(shù)語管理軟件通常僅提供簡單的術(shù)語查詢和存儲功能,無法提供術(shù)語的例句、語境、相關(guān)圖片、音頻或視頻等多模態(tài)信息,也無法根據(jù)譯員的專業(yè)領(lǐng)域、項目需求和學(xué)習(xí)習(xí)慣提供個性化的學(xué)習(xí)方案和術(shù)語建議。傳統(tǒng)的術(shù)語管理工具還缺乏智能化的術(shù)語提取、術(shù)語分析和術(shù)語資源推薦功能,無法自動識別和提取文本中的術(shù)語,也很難根據(jù)譯員的術(shù)語使用情況提供針對性的學(xué)習(xí)建議。同時,多數(shù)軟件交互性較弱,無法滿足譯員自由管理界面布局、自定義術(shù)語呈現(xiàn)等個性化需求[13]。
3大語言模型在口譯術(shù)語管理中的應(yīng)用場景
傳統(tǒng)口譯術(shù)語管理面臨諸多挑戰(zhàn),例如人工構(gòu)建術(shù)語庫效率低下,術(shù)語更新速度難以跟上行業(yè)發(fā)展,大型項目中難以有效共享和管理術(shù)語等。大語言模型的出現(xiàn)為解決這些問題提供了新的可能。它能夠自動提取術(shù)語、構(gòu)建術(shù)語庫、提供個性化學(xué)習(xí)方案,并與口譯設(shè)備集成,為譯前、譯中、譯后提供全方位的支持。隨著人工智能技術(shù)的快速發(fā)展,口譯行業(yè)也需要更加智能化的術(shù)語管理工具。例如,Cymo Note利用智能算法可以匹配和提醒實時語音中的術(shù)語,并根據(jù)上下文語境提供準(zhǔn)確的翻譯建議,還可以根據(jù)譯員的個人習(xí)慣、項目或客戶進(jìn)行術(shù)語歸類管理,幫助譯員更高效地掌握和運(yùn)用專業(yè)術(shù)語以及保持會議術(shù)語的一致性。
3.1譯前
3.1.1術(shù)語提取與術(shù)語庫構(gòu)建
大語言模型可以根據(jù)口譯員的不同需求,在短時間內(nèi)自動從海量文本數(shù)據(jù)中提取相關(guān)術(shù)語并構(gòu)建結(jié)構(gòu)化、標(biāo)準(zhǔn)化、個性化定制的專業(yè)術(shù)語庫。在大型口譯項目中,由于大語言模型具備強(qiáng)大的文本生成能力,能夠識別不同語言的術(shù)語,譯員可以利用其優(yōu)勢從項目相關(guān)的文件、網(wǎng)站、數(shù)據(jù)庫中提取并自動生成術(shù)語列表,根據(jù)預(yù)設(shè)的模板構(gòu)建包括術(shù)語及其定義、翻譯、例句等信息在內(nèi)的術(shù)語庫,并以多種格式導(dǎo)出,方便在不同平臺使用,可節(jié)省大量時間和精力。譯員還可根據(jù)客戶的具體翻譯要求下達(dá)指令,定制出符合不同口譯情境的術(shù)語庫。龍昱瓊、周小玲[27]已在實驗中證實ChatGPT在術(shù)語翻譯時能有效提供專業(yè)知識、近義詞辨析、背景信息及翻譯建議。
3.1.2術(shù)語學(xué)習(xí)與強(qiáng)化記憶
在術(shù)語學(xué)習(xí)與強(qiáng)化記憶方面,大語言模型能發(fā)揮重要作用。它首先能為譯員系統(tǒng)整理術(shù)語的全方位知識,涵蓋術(shù)語定義、相關(guān)文獻(xiàn)以及相似術(shù)語等平行語料,并輔以詳盡的參考鏈接,從而幫助譯員快速精準(zhǔn)地掌握口譯術(shù)語的實質(zhì)含義。除此之外,大語言模型能夠基于譯員個人的學(xué)習(xí)習(xí)慣與記憶特點,量身定制術(shù)語學(xué)習(xí)和記憶策略,包括但不限于創(chuàng)建術(shù)語卡片、設(shè)計術(shù)語測試等,旨在通過個性化的方式提升譯員的學(xué)習(xí)效果。大語言模型還具備智能分析功能,其通過深度解析譯員的學(xué)習(xí)記錄和記憶曲線,能夠精準(zhǔn)判斷譯員的學(xué)習(xí)狀態(tài),進(jìn)而智能調(diào)整學(xué)習(xí)內(nèi)容和測試難度。基于譯員的學(xué)習(xí)進(jìn)度和成果反饋,模型還能動態(tài)調(diào)整測試難度和練習(xí)內(nèi)容,助力譯員鞏固記憶,深化理解,從而在專業(yè)領(lǐng)域?qū)崿F(xiàn)更高效、更精準(zhǔn)的術(shù)語應(yīng)用。這種個性化的學(xué)習(xí)路徑不僅確保譯員能夠高效掌握專業(yè)術(shù)語,還極大地提升了學(xué)習(xí)效率。
3.1.3術(shù)語匹配和快速推薦
大語言模型可以根據(jù)口譯員的專業(yè)領(lǐng)域和項目需求,自動匹配和推薦相關(guān)度最高的術(shù)語資源,如專業(yè)術(shù)語庫、術(shù)語詞典等,在整合多個專業(yè)領(lǐng)域的術(shù)語資源的同時,提供多語言的術(shù)語解釋和例句,幫助譯員快速理解和掌握專業(yè)術(shù)語。例如,在醫(yī)藥領(lǐng)域的口譯項目中,大語言模型可以自動推薦相關(guān)的醫(yī)藥術(shù)語庫,并根據(jù)項目需求提供特定疾病或藥物的術(shù)語解釋。
3.2" 譯中
3.2.1實時術(shù)語查詢
大語言模型可通過臺式計算機(jī)、筆記本電腦、平板電腦等與口譯設(shè)備集成,為口譯員提供實時的術(shù)語查詢服務(wù)。基于上下文語境,助力口譯員迅速且精確地檢索到所需術(shù)語,并自動呈現(xiàn)與之最相關(guān)的術(shù)語解釋和翻譯。如需進(jìn)一步了解術(shù)語使用的上下文,大語言模型還可通過高亮、加粗等文本處理手段,協(xié)助譯員迅速定位術(shù)語所在位置,從而確保口譯過程中的信息獲取效率。以同聲傳譯為例,在這一應(yīng)用場景下,譯員可利用大語言模型多語種語音或文字輸入的能力查詢特定術(shù)語,即時獲得術(shù)語的翻譯、定義、例句等詳細(xì)信息,進(jìn)而更準(zhǔn)確地理解和傳達(dá)原文含義。這不僅極大地豐富了口譯過程中的信息支持手段,還能夠提升口譯的準(zhǔn)確性和效率。
3.2.2實時術(shù)語建議
除了能夠依據(jù)口譯的上下文語境,為口譯員提供精準(zhǔn)的術(shù)語建議,并對這些術(shù)語提供詳盡的多語種解釋,從而協(xié)助口譯員深入理解并恰當(dāng)運(yùn)用術(shù)語,大語言模型還能深入分析口譯過程中的語義和語法結(jié)構(gòu),結(jié)合譯員的表達(dá)習(xí)慣,提供個性化的術(shù)語推薦,使譯員的表達(dá)更為流暢,進(jìn)而提高整體口譯質(zhì)量。以土木工程研討會為例,當(dāng)遇到專業(yè)術(shù)語如posttensioned concrete slab with unbonded tendons時,大語言模型能夠迅速根據(jù)語境給出“無黏結(jié)預(yù)應(yīng)力混凝土板”這一貼切且準(zhǔn)確的術(shù)語建議,并將最優(yōu)的翻譯結(jié)果置于首位,同時還提供多種其他目標(biāo)語言的翻譯版本,幫助譯員在跨語言交流中選取最恰當(dāng)?shù)姆g,確保信息傳遞的準(zhǔn)確和高效。
3.2.3譯員協(xié)同合作
如果有多個口譯員協(xié)作,為同一會議提供交傳、同傳服務(wù),大語言模型可與口譯設(shè)備集成,通過語音識別等方式,在口譯過程中實時將譯員所翻譯的術(shù)語整理上傳,以便為在場其他譯員及今后其他口譯員提供參考,或是對前面翻譯有誤的地方及時修正,分擔(dān)其余口譯員的工作量,減輕其認(rèn)知及記憶負(fù)擔(dān),使口譯員將精力集中在提升整體口譯的準(zhǔn)確性及質(zhì)量上。
3.3譯后
3.3.1術(shù)語整理和分類
大語言模型可以通過語音識別技術(shù)整理出源語文本,在原有術(shù)語表的基礎(chǔ)上補(bǔ)充事先未準(zhǔn)備到位的術(shù)語,并對口譯過程中使用的術(shù)語進(jìn)行自動整理和分類,輔助建立口譯員的個人術(shù)語庫,并按照主題、領(lǐng)域、詞性等進(jìn)行分類,將該領(lǐng)域知識的概念系統(tǒng)化、規(guī)范化,使其具有規(guī)范詞典的形式,方便口譯員進(jìn)行術(shù)語回顧和總結(jié),這大大減輕了口譯員手動整理和提取術(shù)語的工作量。譯員還能夠根據(jù)自身偏好設(shè)置術(shù)語管理,自定義術(shù)語分類規(guī)則并使用多種格式導(dǎo)出,方便進(jìn)行后續(xù)的整理與分析。
3.3.2術(shù)語分析和總結(jié)
大語言模型可以總結(jié)每場口譯服務(wù)的術(shù)語使用情況,分析口譯員在多個項目中使用的術(shù)語及其頻率、類別、準(zhǔn)確性等情況,識別常用術(shù)語與難點術(shù)語,提供術(shù)語可視化分析報告與相關(guān)學(xué)習(xí)資料和練習(xí),提供針對性的學(xué)習(xí)建議,并預(yù)測術(shù)語發(fā)展趨勢,幫助譯員了解自身優(yōu)勢與不足,為口譯員的術(shù)語學(xué)習(xí)和實踐提供參考,促進(jìn)譯員提升專業(yè)能力與專業(yè)化發(fā)展。
3.3.3術(shù)語報告與知識沉淀
大語言模型可以根據(jù)口譯項目整理的術(shù)語生成專業(yè)的術(shù)語報告,包括術(shù)語列表、定義、翻譯、例句等,還可根據(jù)不同的項目需求生成不同類型的術(shù)語報告,并支持多種格式導(dǎo)出。這些報告可以作為項目的一部分提交給客戶,也可作為譯員的個人知識庫方便日后查閱與學(xué)習(xí),促進(jìn)翻譯行業(yè)的知識積累和發(fā)展。
大語言模型在口譯術(shù)語管理中具有廣闊的應(yīng)用前景。它不但可以有效解決人工構(gòu)建術(shù)語庫效率低下、術(shù)語更新速度慢、術(shù)語共享和管理困難等問題,彌補(bǔ)現(xiàn)有不同口譯術(shù)語管理工具的不足,還可以自動提取術(shù)語、構(gòu)建術(shù)語庫、提供個性化學(xué)習(xí)方案、進(jìn)行實時術(shù)語查詢和建議、整理和分析術(shù)語使用情況、生成專業(yè)的術(shù)語報告等,為口譯員提供全方位支持,提高口譯的效率和質(zhì)量,最終幫助建立起覆蓋口譯員工作全流程的大型口譯術(shù)語管理系統(tǒng)。
4大語言模型應(yīng)用于口譯術(shù)語管理的主要問題
盡管大語言模型在自然語言處理領(lǐng)域取得了顯著進(jìn)展,并在機(jī)器翻譯、信息檢索等方面展現(xiàn)出巨大潛力,但將其應(yīng)用于口譯術(shù)語管理仍然面臨諸多挑戰(zhàn)。除了可能由網(wǎng)絡(luò)擁堵、崩潰、不穩(wěn)定等原因?qū)е麓竽P蜔o法使用外,由于口譯工作的特殊性,大語言模型的應(yīng)用效果受到諸多因素的影響,如存在模型訓(xùn)練數(shù)據(jù)偏差、專業(yè)領(lǐng)域理解不足、數(shù)據(jù)安全和隱私問題以及訓(xùn)練和維護(hù)成本高等。這些問題都需要我們認(rèn)真思考和應(yīng)對,才能更好地發(fā)揮大語言模型的優(yōu)勢。
4.1模型訓(xùn)練數(shù)據(jù)偏差
由于訓(xùn)練數(shù)據(jù)量不足、數(shù)據(jù)質(zhì)量不高、模型設(shè)計和參數(shù)設(shè)置存在缺陷等問題,大語言模型提供的術(shù)語、文本等信息可能會存在偏差,甚至?xí)峁┨摷傩畔ⅰ⒛笤鞌?shù)據(jù),影響口譯質(zhì)量。某些類型的語言數(shù)據(jù)(如小語種或者專業(yè)語料)在互聯(lián)網(wǎng)上相對較少,也可能導(dǎo)致模型在處理這些語言時準(zhǔn)確性不足,無法提供可靠的術(shù)語參考,這在進(jìn)行冷門行業(yè)或?qū)I(yè)領(lǐng)域的口譯工作時尤為明顯。如在一次生物醫(yī)藥技術(shù)的商務(wù)談判口譯中,有一個名為“嵌合抗原受體T細(xì)胞免疫療法” (CART) 的新型療法,這種療法屬于比較前沿的生物醫(yī)藥技術(shù),相關(guān)的中文術(shù)語和表達(dá)方式在互聯(lián)網(wǎng)上相對較少,大語言模型很可能無法提供準(zhǔn)確的翻譯或解釋,譯員若在此時完全依賴大語言模型就可能會出現(xiàn)翻譯錯誤,影響會議內(nèi)容的準(zhǔn)確性與會議的專業(yè)性。大語言模型在處理語境信息方面也有待提高,因為口譯過程中的術(shù)語使用需要考慮語境因素,例如說話者的意圖、受眾的背景等,若譯員使用大語言模型可能會生成不符合語境的術(shù)語表達(dá)。
從訓(xùn)練數(shù)據(jù)來源看,大語言模型的訓(xùn)練數(shù)據(jù)主要來自通用領(lǐng)域,模型對特定專業(yè)領(lǐng)域的知識缺乏深入理解,這可能會導(dǎo)致其對口譯術(shù)語的理解程度不深。雖然模型可以生成看似專業(yè)的術(shù)語翻譯,但這些翻譯可能不夠準(zhǔn)確或者不符合該領(lǐng)域的專業(yè)規(guī)范,在實際口譯過程中可能會導(dǎo)致譯者出現(xiàn)誤譯或錯譯,最終影響口譯結(jié)果與質(zhì)量。
從數(shù)據(jù)本身看,互聯(lián)網(wǎng)上的數(shù)據(jù)自身也可能存在偏見,包括性別歧視、種族歧視等,這些偏見可能會被模型學(xué)習(xí)并反映在輸出結(jié)果中,導(dǎo)致在口譯過程中出現(xiàn)不公平或不準(zhǔn)確的術(shù)語翻譯,影響口譯的專業(yè)性和準(zhǔn)確性。就大型會議中的常見術(shù)語“主席”一詞來說,大語言模型可能直接將其翻譯為 chairman,但在許多語境下可以譯為性別中立的chairperson。如果在強(qiáng)調(diào)董事會主席等特定情況下,譯員可能更傾向于使用chairman來強(qiáng)調(diào)其權(quán)威性,可如果大語言模型的訓(xùn)練數(shù)據(jù)中存在性別偏見,模型可能會忽略了chairperson這個更加性別中立的表達(dá),這種翻譯則可能會被認(rèn)為帶有性別偏見,影響會議的專業(yè)性和嚴(yán)肅性。
4.2數(shù)據(jù)隱私安全堪憂
大語言模型的訓(xùn)練和應(yīng)用需要處理大量的語言數(shù)據(jù),其中可能包含敏感信息,如個人隱私、商業(yè)機(jī)密或涉及知識產(chǎn)權(quán)等問題,數(shù)據(jù)安全無法保障。在口譯實踐中,譯員經(jīng)常會接觸到包含敏感信息的文本或語音,如果利用大語言模型進(jìn)行輔助翻譯,這些數(shù)據(jù)沒有得到妥善保護(hù),就可能存在泄露風(fēng)險,給客戶帶來損失,影響譯員的職業(yè)聲譽(yù)。許多譯員會為涉及高度保密的商業(yè)談判提供口譯服務(wù),需特別警惕談判內(nèi)容中可能包含的未公開商業(yè)計劃及敏感財務(wù)數(shù)據(jù),若譯員在翻譯過程中依賴基于大語言模型的輔助翻譯工具,這些高度敏感的信息將面臨極大的泄露風(fēng)險。由于此類信息的披露可能對公司造成不可估量的經(jīng)濟(jì)損失,甚至引發(fā)市場動蕩,所以譯員的這種行為不僅會使企業(yè)蒙受重大損害,而且可能觸犯法律,其職業(yè)道德也會受到嚴(yán)厲譴責(zé)。考慮到這一方面,譯員在提供這類口譯服務(wù)時必須嚴(yán)格遵循保密協(xié)議,確保翻譯過程中敏感信息的安全使用。
大語言模型的應(yīng)用也可能涉及用戶隱私問題,如用戶搜索記錄、翻譯內(nèi)容等。一些譯員可能會使用大語言模型來記錄和整理自己的翻譯經(jīng)驗,包括翻譯過的文本、選擇的術(shù)語等。如果大語言模型的隱私保護(hù)措施不到位,客戶數(shù)據(jù)等信息就有可能被泄露給第三方甚至被用于其他商業(yè)目的,侵犯譯員與客戶的隱私。
4.3訓(xùn)練維護(hù)成本較高
大語言模型的訓(xùn)練和部署需要大量計算資源和技術(shù)支持,這對于個體譯者和小型翻譯服務(wù)商來說可能是一筆不小的開銷。個體譯者收集和整理專業(yè)領(lǐng)域的術(shù)語數(shù)據(jù)需要投入大量的時間和精力,且由于口譯實踐中不同領(lǐng)域和行業(yè)的術(shù)語差異很大,這對于資源有限的個體譯者來說是一個挑戰(zhàn)。就大型翻譯項目而言,構(gòu)建一個涵蓋所有專業(yè)領(lǐng)域的術(shù)語庫也幾乎是不可能的,因為每個領(lǐng)域的術(shù)語都在不斷更新和變化,即便是某一特定領(lǐng)域的術(shù)語庫也需要投入大量的人力與時間去維護(hù)和更新。
譯者和翻譯服務(wù)商也需要投入時間及精力來學(xué)習(xí)大語言模型在口譯術(shù)語管理中的技術(shù)知識與操作技能,包括學(xué)習(xí)如何使用大語言模型的API、如何調(diào)整模型參數(shù)以及如何評估模型的翻譯質(zhì)量等,對于一些不熟悉計算機(jī)技術(shù)的譯者來說,可能是一個挑戰(zhàn)。同時也需考慮到大語言模型的更新?lián)Q代速度非常快,譯者如果不及時學(xué)習(xí)新的技術(shù)與方法,就無法跟上技術(shù)的發(fā)展步伐,而大語言模型本身也需要不斷更新與維護(hù)來保證其性能和準(zhǔn)確性,這也需要一定的成本投入。
5大語言模型應(yīng)用于口譯術(shù)語管理的啟發(fā)與建議
綜合來看,大語言模型在輔助口譯員進(jìn)行術(shù)語管理的同時,還會帶來風(fēng)險與挑戰(zhàn)。針對以上大語言模型應(yīng)用于口譯術(shù)語管理時存在的不足,現(xiàn)從協(xié)會、企業(yè)、個人三個層面提出解決方案。
5.1協(xié)會層面
為規(guī)范大語言模型在口譯行業(yè)的應(yīng)用,協(xié)會應(yīng)肩負(fù)起制定行業(yè)標(biāo)準(zhǔn)和規(guī)范的責(zé)任。首先,制定關(guān)于大語言模型在口譯術(shù)語管理中應(yīng)用的政策、標(biāo)準(zhǔn)及規(guī)范,明確數(shù)據(jù)安全、隱私保護(hù)、知識產(chǎn)權(quán)等方面的責(zé)任和義務(wù),確保技術(shù)的合規(guī)性與安全性,為行業(yè)發(fā)展保駕護(hù)航。其次,建立專門的監(jiān)管機(jī)構(gòu)或委員會以負(fù)責(zé)監(jiān)管企業(yè)對大語言模型的開發(fā)、使用與評估,定期開展監(jiān)督檢查,確保技術(shù)的合理使用。與此同時,協(xié)會還需加大對相關(guān)技術(shù)研發(fā)的資金支持力度,鼓勵高校、科研機(jī)構(gòu)與企業(yè)共同研發(fā)針對口譯專業(yè)領(lǐng)域的大語言模型,協(xié)助其定期更新語料庫以提高模型對專業(yè)術(shù)語和知識的理解能力,推動技術(shù)更好地服務(wù)于口譯實踐。協(xié)會還可考慮搭建開放共享的口譯術(shù)語資源平臺,促進(jìn)優(yōu)質(zhì)術(shù)語資源的共享和交流,避免重復(fù)建設(shè)。
5.2企業(yè)層面
企業(yè)作為大語言模型應(yīng)用于口譯術(shù)語管理的開發(fā)者和服務(wù)提供者,需要不斷提升技術(shù)水平,優(yōu)化產(chǎn)品和服務(wù),以滿足口譯員的實際需求。首先,企業(yè)要加強(qiáng)對訓(xùn)練語料的質(zhì)量控制,建立嚴(yán)格的數(shù)據(jù)審核機(jī)制,避免數(shù)據(jù)偏見,提高術(shù)語質(zhì)量及時效性。其次,企業(yè)要針對口譯的特點,不斷優(yōu)化模型設(shè)計與參數(shù),例如針對不同的口譯場景(如商務(wù)談判、會議同傳等)開發(fā)專門的模型,或者在模型訓(xùn)練過程中加入語境信息,以提高模型對語境的理解能力,提升術(shù)語的真實性和準(zhǔn)確性。再次,企業(yè)還需加強(qiáng)與口譯員、術(shù)語專家等領(lǐng)域?qū)<业暮献鳎占瘜I(yè)意見和建議,針對不同領(lǐng)域、不同情境下的口譯術(shù)語模型進(jìn)行定制和優(yōu)化,提高模型的專業(yè)性和適用性。最后,企業(yè)要建立用戶反饋機(jī)制,收集口譯員在使用過程中的意見和建議,及時解決問題,不斷改進(jìn)產(chǎn)品和服務(wù),提升用戶體驗。
5.3譯者層面
面對大語言模型帶來的機(jī)遇和挑戰(zhàn),口譯員自身也需要積極應(yīng)對,不斷提升自身素質(zhì)和能力,才能在未來的競爭中立于不敗之地。首先,口譯員要緊跟時代步伐,不斷提升技術(shù)水平,學(xué)習(xí)使用專業(yè)的術(shù)語管理軟件和工具,了解大語言模型的原理和應(yīng)用方法,并積極參與相關(guān)培訓(xùn)和交流活動。其次,口譯員要夯實自身的口譯專業(yè)能力,不斷更新知識,積累不同專業(yè)領(lǐng)域的知識和經(jīng)驗,不盲目依賴大語言模型,對模型提供的術(shù)語進(jìn)行查證,保證術(shù)語使用的準(zhǔn)確性。在大數(shù)據(jù)時代,口譯員更需關(guān)注培養(yǎng)自身的批判性思維,不盲目相信大語言模型的輸出結(jié)果,學(xué)會辨別信息真?zhèn)危岣擢毩⑺伎己团袛嗟哪芰ΑW詈螅谧g員要增強(qiáng)數(shù)據(jù)安全和隱私保護(hù)意識,學(xué)會妥善處理客戶信息和數(shù)據(jù),在使用大語言模型進(jìn)行術(shù)語管理時,提前告知客戶,保障客戶的知情權(quán)。
6結(jié)語
大語言模型的出現(xiàn)為口譯術(shù)語管理帶來了新機(jī)遇,為應(yīng)對傳統(tǒng)口譯術(shù)語管理的挑戰(zhàn)提供了新思路與新方法。大語言模型可以幫助譯員在大型項目中設(shè)計合理的術(shù)語管理流程,在翻譯過程中有效控制術(shù)語質(zhì)量,在多人協(xié)作中確保術(shù)語一致性,在提高術(shù)語管理質(zhì)量及效率的同時促進(jìn)口譯員的專業(yè)化發(fā)展。但我們也要認(rèn)識到一點,大語言模型只是一個輔助工具,不能完全取代譯員的專業(yè)判斷與創(chuàng)造性思維,譯員仍需在實踐中不斷學(xué)習(xí)與探索,將大語言模型與自身的專業(yè)知識和經(jīng)驗相結(jié)合,才能更好地結(jié)合模型的優(yōu)勢以提升口譯質(zhì)量及效率。
隨著大語言模型技術(shù)的不斷發(fā)展,其準(zhǔn)確性和可靠性將不斷提高,能夠處理更加復(fù)雜和專業(yè)的術(shù)語翻譯任務(wù),這將推動口譯行業(yè)向更加高效和智能化的方向發(fā)展。屆時,更多面向口譯員的智能化術(shù)語管理工具將會出現(xiàn),為譯員提供更加便捷、高效和個性化的術(shù)語管理服務(wù)。未來研究中,可進(jìn)一步探索大語言模型在復(fù)雜口譯活動中的術(shù)語管理,思考優(yōu)化大語言模型的算法和模型來提升其準(zhǔn)確性和可靠性,并探討研發(fā)更加人性化和智能化的口譯術(shù)語管理系統(tǒng)。
參考文獻(xiàn)
[1] 李瀾.口譯術(shù)語管理:概念、現(xiàn)狀和未來[J].中國科技術(shù)語, 2021, 23(2): 55-62.
[2] 李偉,顏海峰.術(shù)語管理實踐的行業(yè)模式探索:《術(shù)語管理指南》述評[J].中國科技術(shù)語,2020,22(3):40-43.
[3] 王華樹,張靜.信息化時代口譯術(shù)語管理及其技術(shù)應(yīng)用研究[J]. 外文研究, 2017, 5(4): 72-77,105-106.
[4] 王華樹,謝斐.大語言模型技術(shù)驅(qū)動下翻譯教育實踐模式創(chuàng)新研究[J].中國翻譯,2024,45(2):70-78.
[5] 胡開寶,李曉倩.大語言模型背景下翻譯研究的發(fā)展:問題與前景[J].中國翻譯,2023,44(6):64-73,192.
[6] MOSERMERCER B. Banking on terminology conference interpreters in the electronic age[J]. Meta, 1992, 37(3): 507-522.
[7] COSTA H, PASTOR G C, MUOZ I. D. A Comparative User Evaluation of Terminology Management Tools for Interpreters[C]//Proceedings of the 4th international workshop on computational terminology (Computerm). 2014: 68-76.
[8] COSTA H, PASTOR G C, MUOZ I D. Assessing terminology management systems for interpreters[C]//PASTOR G C, DURáNMUOZ I (ed.). Trends in Etools and resources for translators and interpreters. Leiden: Brill,57–84.
[9] FANTINUOLI C. InterpretBank: Redefining computerassisted interpreting tools[C]//Proceedings of Translating and the Computer 38. Geneva: Editions Tradulex,2016.
[10] RüTTEN A. Terminology management tools for conference interpreters–current tools and how they address the specific needs of interpreters[C]//Proceedings of the 39th Conference Translating and the Computer. London,2017: 98-103.
[11] ANTóN M T O. Community Interpreting–oriented Terminology Management Tools[J]. International Journal of Language, Translation and Intercultural Communication, 2016(5): 107-115.
[12] BILGEN B. Investigating terminology management for conference interpreters[D]. Ottawa: University of Ottawa, 2009.
[13] 王華樹, 李敏鈴. 口譯術(shù)語管理技術(shù): 需求、問題與方案[J]. 中國科技翻譯, 2021, 34(4): 24-27.
[14] 方紫鈺,劉芹. 中國特色話語口譯術(shù)語庫建設(shè)研究:現(xiàn)狀與展望[J].中國科技翻譯, 2023, 36(2): 26-28,65.
[15] 司顯柱,朱珊,謝洪.術(shù)語技術(shù)在醫(yī)學(xué)口譯中的應(yīng)用研究[J].河南工業(yè)大學(xué)學(xué)報(社會科學(xué)版), 2022, 38(5): 1-8.
[16] BIAGINI G. Glossario cartaceo e glossario elettronico durante l’interpretazione simultanea: uno studio comparativo[D]. Triste: Università di Trieste, 2015.
[17] GACEK M. Softwarelsungen für DolmetscherInnen[D]. Vienna: University of Vienna, 2015.
[18] XU R. Terminology preparation for simultaneous interpreters[D]. Leeds: University of Leeds, 2015.
[19] 徐然.基于語料庫技術(shù)的口譯譯前準(zhǔn)備模式建構(gòu)[J].中國翻譯, 2018, 39(3): 53-59.
[20] 徐然.術(shù)語自動提取工具在口譯譯前準(zhǔn)備中的應(yīng)用與效果研究[J].上海翻譯, 2020(3): 56-61.
[21] GORJANC V. Terminology resources and terminological data management for medical interpreters[C]//Proceeding from an ideal state of terminology resources. München: Meidenbauer, 2006: 173.
[22] WILL M. Terminology work for simultaneous interpreters in LSP conferences: Model and method[C]//Proceedings of the EUHighLevel Scientific Conference Series. MuTra, 2007: 65-99.
[23] FANTINUOLI C. Specialized corpora from the Web and term extraction for simultaneous interpreters[J]. Wacky, 2006: 173-190.
[24] PIGNATARO C. Terminology and interpreting in LSP conferences: A computeraided vs. empiricalbased approach[C]//CYNTHIA J,KELLETT B (ed.). Interpreting across Genres: Multiple Research Perspectives. Trieste: EUT Edizioni Università di Trieste, 2012: 125-140.
[25] XU R, SHAROFF S. Evaluating term extraction methods for interpreters[C]//Proceedings of the 4th international workshop on computational terminology (Computerm). 2014: 86-93.
[26] PRANDI B. Designing a multimethod study on the use of CAI tools during simultaneous interpreting[J]. Translating and the Computer 39. London, 2017: 76-113.
[27] 龍昱瓊,周小玲.技術(shù)賦能下的術(shù)語翻譯與術(shù)語管理:以中華學(xué)術(shù)外譯項目《論中國鄉(xiāng)村變遷》的英譯為例[J].中國科技術(shù)語,2024,26(2):49-58.
[28] 苗菊,吳聰聰.數(shù)字認(rèn)知與傳播中的多語言多模態(tài)術(shù)語知識庫:社會應(yīng)用與價值實現(xiàn)[J].中國科技術(shù)語,2023,25(4):12-20.