劉妍萌
(西北工業大學外國語學院,陜西西安 710072)
健康旅游是以醫藥文化、療法、藥品等作為旅游 資源開展的旅游活動,其目的是實現游客身心及精神狀態的提升[1]。自新冠疫情暴發以來,中醫藥的價值在全球范圍內逐步凸顯,得到了全世界的進一步認可和重視。后疫情時代,我國入境旅游政策逐步放開,中醫藥健康旅游業也將吸引越來越多的海內外游客。中醫藥資源的引入給旅游行業帶來了新的增長點和更廣闊的發展空間。同時,以多元化的旅游活動為載體,向世界傳播中醫藥文化,也拓寬了中國文化“走出去”及 “講好中國故事,傳播好中國聲音”的實現途徑。
翻譯既是中醫藥健康旅游發展的關鍵一環,也是一大挑戰。對外翻譯有助于吸引海外游客、開拓海外市場,實現中醫藥健康旅游產品及旅游活動的跨語言、跨文化交流,促使全世界更好地了解中華優秀傳統文化。但是由于人工譯員培養成本高、周期長,僅依靠人工譯員完成中醫藥健康旅游翻譯的方式必然會局限中醫藥健康旅游的國際化發展。以機器翻譯工具和語料庫分析工具為代表的計算機技術進步為解決中醫藥健康旅游翻譯所面臨的問題提供新思路。本文使用機器翻譯工具翻譯中醫藥健康旅游宣傳文本,并利用語料庫方法探索中醫藥健康旅游宣傳文本的機器翻譯結果能否被海外游客接受的問題,旨在提升中醫藥健康旅游服務質量,增強中醫藥文化國際認同,推動中國文化海外傳播。
中醫藥翻譯長久以來一直是學術界的一大研究熱點和難點,吸引了大批學者深入探索。有關中醫藥文化外譯的研究主要集中在以下3 個方面:部分學者從微觀視角探索中醫藥專業術語翻譯[2];部分則在翻譯學、傳播學等學科理論指導下,開展翻譯方法研究[3-4];還有一部分學者通過調研讀者評價,以此判斷中醫藥文化海外傳播情況[5-6]。此類研究推動了中醫藥文化外譯研究發展,但在本研究背景下,尚存在以下不足:
一是針對旅游業情境下的中醫藥健康旅游外譯研究較少。旅游業情境下的翻譯有其獨特的翻譯特點和目的。一般來說,旅游翻譯的讀者為入境游客。其特點在于中醫專業知識水平參差不齊,對翻譯的要求偏向于簡單易懂,可讀性高。而現有研究對中醫藥健康旅游翻譯特點的考慮較為欠缺。
二是現存研究多依賴研究者對個案的主觀解讀和判斷,缺乏大量客觀依據支撐,一定程度上限制了研究結果的可重復性和推廣落地。研究者運用多學科理論知識解讀中醫藥外譯問題,在一定程度上加深了學科交叉,但研究基本屬于理論思索,缺少大量實證支撐。
三是較少考慮到機器翻譯技術在翻譯中的應用。將機器翻譯引入翻譯實踐和翻譯研究已成為必然趨勢[7],利用機器翻譯工具促進中醫藥健康旅游翻譯也是大勢所趨。開展該領域研究不僅有助于提高中醫藥健康旅游的翻譯效率,還可為機器翻譯工具的不斷優化提供借鑒,以更好地適應中醫藥健康旅游翻譯需求。
除上述研究外,值得關注的是,近年來隨著計算機技術的成熟和大規模翻譯語料的產生,基于語料庫的翻譯研究逐漸興起,并發展成為一種翻譯研究范式。在大量語料庫數據的基礎上,研究者可觀察翻譯語言表達的特征和規律,為解決實際問題提供借鑒[8]。由于語料庫可代表某類特定文本的語言特征,因此在本研究中,英文母語文本可被認為是英語母語人群所能接受的語言表達,翻譯可接受度則是翻譯文本和英語母語文本之間的同異程度[9]。二者差異越大,說明翻譯文本與英語母語讀者的語言習慣差異越大,故譯本的接受度越小。
綜上,針對目前研究的積累和不足,本文在語料庫語言學的指導下,結合當前機器翻譯技術,通過語料庫資源和語言數據分析,比較中醫藥健康旅游翻譯與英語母語文本之間的差異,探索機器翻譯可接受度的提升之道。
本文建設了中醫藥健康旅游翻譯語料庫(175 889 字),下設5 個子庫。
漢語源語語料庫。陜西省旅游資源豐富,中醫藥文化歷史悠久,省會西安始終是海外游客來華旅游的首選城市。因此,本文選取了100 篇西安市中醫藥健康旅游宣傳文本,形成漢語源語語料庫(A 庫;48 275 字)。
英語譯語語料庫。本文使用谷歌翻譯、DeepL、Chat GPT3.5 這3 個主流機器翻譯工具,分別將漢語源語翻譯成英語譯語各100 篇,形成谷歌翻譯譯語語料庫(B 庫;30 919 字),DeepL 譯語語料庫(C 庫;32 651 字),Chat GPT3.5 譯語語料庫(D 庫;31 254字)。
英語母語語料庫。本文選取了100 篇澳大利亞官方發布的健康旅游宣傳材料,作為研究的英語母語語料(E 庫;32 790 字)。選取樣本的原因有二:一是所選語料與中醫藥健康旅游譯本均為健康旅游文本且樣本體量一致,在體裁(genre)和庫容(size)上確保了二者的可比性;二是澳大利亞健康旅游業發達,接待游客數量也位居世界前列。所選語料具備易被游客所接受的文本特點,代表了健康旅游業的英語表達較高水平,保障了語料的代表性和質量。
為了深入了解機器翻譯結果的可接受度情況,本文對B、C、D、E 庫進行詞匯層面的語言特征標注。具體包括平均詞長(AWL)、連詞(CC)、指示代詞(DEMP)、限定詞(DT)、外語詞(FW)、動名詞(GER)、介詞(IN)、形容詞(JJ)、情態動詞(MD)、名詞(NN)、名詞化(NOMZ)、介詞短語(PIN)、代詞it(PIT)、所有格(POS)、副詞(RB)、不定式(TO)、動詞(VB)、動詞過去時(VBD)、過去分詞(VBN)、動詞現在時(VPRT)20 個詞匯特征。這些特征通過Multidimensional Analysis Tagger 1.0[10]標注和計算,并用Excel 統計和整合特征數據。
完成初步的數據統計后,本文使用SPSS 27 對語言數據進行了分析。首先,檢驗了B、C、D、E 庫中每一個語言特征數據的分布情況,確認樣本數據不符合正態分布。隨后,使用非參數檢驗法Mann-Whitney U Test 分別比較E 庫與B 庫、E 庫與C 庫、E 庫與D 庫在各語言特征數據上的差異。如果詞匯特征在對比中表現出顯著性(P<0.05),則說明譯本庫與母語庫在該詞匯特征上存在較大差異,而減少譯本與母語文本之間的差異將有助于提升譯本的可接受度。
經對比(表1)發現,3 個機器翻譯語料庫均與英語母語語料庫之間存在不同程度的差異。谷歌翻譯與英語母語在15 個詞匯特征數據上顯示了顯著性差異(P<0.05);DeepL 翻譯與英語母語對比,16 個詞匯特征表現出顯著性差別(P<0.05);13 個詞匯特征在Chat GPT 3.5 和英語母語對比中的差異具有顯著性(P<0.05)。由于篇幅限制,該文表1 只展示了具有顯著性差異的詞匯特征數據。這些差異說明,3 個機器翻譯工具在中醫藥健康旅游翻譯方面具有一定潛力,但也存在較大的提升空間。就具有顯著差異的詞匯特征數量而言,Chat GPT 3.5 譯本相對其他二者與英語母語文本較為相似,即在詞匯層面,Chat GPT 3.5 在翻譯中醫藥健康旅游宣傳材料時具有較好的可接受度,谷歌翻譯次之,DeepL 最差。

表1 語言特征數據在各語料庫中的差異
3 組對比結果還體現提升機器翻譯可接受度需要面對的共性問題。從表1 可知,在3 個機器翻譯譯本和英語母語文本的對比中,表現出顯著性差異的詞匯特征有12 個是重合的。從英語語法角度可將這12 個詞匯語言特征歸納為3 個維度——詞匯復雜度(平均詞長、名詞化)、表達豐富度(指示代詞、介詞、代詞it、副詞、動詞、動詞現在時、形容詞、動詞過去時)和邏輯顯化度(連詞、所有格)。
平均詞長和名詞化均體現了文本所使用詞匯的復雜程度。一般來說,平均詞長越長,詞匯復雜程度越高,文本所使用的難詞越多。名詞化是指將形容詞、動詞、副詞等轉化成名詞的語言現象。例如,動詞act—名詞action,形容詞normal—名詞normalization,副詞happily—名詞happiness。一般名詞化是通過添加詞綴實現,且所形成的名詞多具有抽象意義和引申意義。如例1a 句中(平均詞長6.72)使用名詞化establishment,exhibition 來翻譯原文。相比之下,例1b 句的英語母語健康旅游宣傳文本在描述類似情況時則使用動詞established,平均詞長降低至5.19。
例1:
a.中文原文(摘自A 庫):
第四部分中醫藥碑刻(室外)主要展示自建館以來收藏的各種古代醫藥碑刻。
谷歌翻譯譯文(摘自B 庫):
The fourth part, the Traditional Chinese Medicine Stone Inscriptions(outdoor), showcases various ancient stone inscriptions related to medicine collected since the establishment of the exhibition.(AWL:6.72)
b.英文原文參考內容(摘自E 庫):
Charles and Pip Woodward realised that the oncology services were just one step in improving local cancer services and realised their vision for a cancer wellness centre to be established in Cairns.(AWL:5.19)
表1 中,3 個機器翻譯譯本的平均詞長和名詞化均高于英語母語文本。說明機器翻譯應通過減少難詞比例,增加簡單詞匯的使用,減少名詞化現象等方式來降低詞匯復雜度,使其在翻譯中醫藥健康旅游文本時更接近英語母語健康旅游宣傳文本,提升譯本接受度。
表1 中,3 個機器譯本的指示代詞、介詞、代詞it、副詞、動詞、動詞現在時的使用頻率均低于英語母語健康旅游文本,而形容詞、動詞過去時的使用頻率高于英語母語健康旅游文本。這說明整體上,機器翻譯在處理中醫藥健康旅游文本時,更傾向于集中使用形容詞和動詞過去時來翻譯,而對其他詞類的使用較少,導致表達方式較為單一,詞匯表達豐富度較低。如例2a 句所示,機器翻譯譯本多局限于 “形容詞—名詞”的表達方式。相對于例2b 句的英文母語表達,機器翻譯缺乏更豐富的表達方式,較少使用多種語法和詞性,如介詞、副詞、動詞等。
例2:
a.中文原文(摘自A 庫):
西安蓮湖天頤堂中醫醫院中醫科是以內治、外治、中醫心理輔導、健康理念疏導、中醫養生保健、藥膳食療等各種角度進行綜合治療和輔導。
Chat GPT 3.5 譯文(摘自D 庫):
The Traditional Chinese Medicine Department of Xi'an Lianhu Tian yi Tang Traditional Chinese Medicine Hospital provides comprehensive treatment and counselling from various perspectives, including internal medicine, external therapy, traditional Chinese medicine psychological counselling, health concept guidance, traditional Chinese medicine health preservation, and dietary therapy.
b.英文原文參考內容(摘自E 庫):
Bush tucker experts explain the sound principles of healthy and sustainable eating—and generously share a couple of recipes that you can try at home.
因此,語言表達豐富度低也是提升機器翻譯可接受度需要關注的一個關鍵點。機器翻譯工具可通過適當提高多種語法和詞性的使用,提升表達方式的豐富程度,以此縮小中醫藥健康旅游機器翻譯譯本和英語母語健康旅游文本的差異,從而增強譯本的可接受度。
連詞和所有格均與文本的邏輯顯化度相關。連詞是連接兩個或兩個以上并列成分的詞,可用于表達順接、轉折、因果等邏輯關系。所有格可用于表示所屬關系,如“This dog's colour is white.”。當連詞和所有格的使用頻率較高時,則表示文本的邏輯關系更多地使用上述表達方式,而非靠語法結構隱性地表達。3 個機器翻譯譯本中此類詞匯特征的使用頻率低于英語母語健康旅游文本,呈現較低的邏輯顯化程度。如例3a 句的中文中,“現代人”和 “脊柱肌肉、韌帶、骨骼”是從屬關系;“現代人……久坐不動”和“脊柱……損傷”是因果關系;“脊柱……放松和鍛煉”和“慢慢……損傷”是順承關系。例3b 中文原文前后呈并列關系,但該邏輯關系并未明顯地體現在英文譯文中。而例3c 句中的英語母語健康旅游文本則善于使用所有格和連詞來顯化句子中各部分的邏輯關系。
例3:
a.中文原文(摘自A 庫):
現代人由于長時間使用手機、電腦,一天有十幾個小時坐著學習或工作,久坐不運動,脊柱肌肉、韌帶、骨骼得不到充分的放松和鍛煉,慢慢就出現損傷。
谷歌翻譯譯文(摘自B 庫):
Modern people due to long-term use of mobile phones, computers, more than ten hours a day to sit to study or work, sedentary without exercise, spinal muscles, ligaments, bones can not be fully relaxed and exercised, slowly appear damage.
b.DeepL 譯文(摘自C 庫)):
Keeping the right way to fix the foundation, innovation determines the future.(中文原文:守正方可固本,創新決定未來。)
c.英文原文參考內容(摘自E 庫):
They are Australia's first astronomers, interpreting the southern sky to navigate the land and tell stories of Earth’s creation.
通過適當增加連詞和所有格的使用,提高邏輯顯化程度,減少機器翻譯和英語母語之間的差距,是完善中醫藥健康旅游機器翻譯可接受度的有效途徑,有助于機器翻譯工具在中醫藥健康旅游翻譯領域的應用和推廣。
綜上所述,本文利用語料庫數據對比分析了3個機器翻譯工具在翻譯中醫藥健康旅游文本時的可接受度情況,認為將機器翻譯工具應用于中醫藥健康旅游翻譯時,需在詞匯復雜度、表達豐富度和邏輯顯化度3 個維度上完善機器翻譯工具,以提升讀者對譯文的接受程度。此外,本文還存在一定的不足,建議后續研究進一步擴大樣本數量,研究視角從翻譯可接受度擴展到翻譯準確度等不同角度,分析方法不拘泥于單一的數據分析方法。大范圍、多角度、深層次地挖掘語言數據在中醫藥健康旅游研究中的價值,服務中醫藥文化更好、更快地走向世界。