王宗英,郭高攀
(東華理工大學外國語學院,江西南昌 330013)
據國家旅游局2017年上半年旅游統計數據報告,國內旅游增速超預期,入境旅游穩步增長。旅游經濟已成為國民經濟發展的重要組成部分,越來越多的國家和地區高度重視旅游經濟的發展。而游客是否選擇某一旅游景區、旅游服務或旅游產品取決于他們對此旅游景點及服務是否了解及了解的程度。由此可見,旅游景區、旅游服務或旅游產品的宣傳工作異常重要,旅游文化外譯是擴大當地旅游文化特色及旅游服務國際知名度的重要手段。旅游文化的外譯包含自然景區、人文景觀、民俗風情、旅游服務及旅游產品等的外譯工作。本研究旅游文化外譯特指漢語譯成英語的工作。
江西作為中國十大旅游省份之一,具有豐富獨特的旅游資源,然而入境旅游經濟收入相比其他旅游大省還有很大的差距。經調查發現其中一個重要的原因就是旅游外譯工作相對滯后,了解江西獨特旅游文化尤其是具備紅色文化相關背景知識的專業外語人才緊缺。因此,為服務地方旅游經濟發展,本研究試圖創建江西旅游文化漢英平行語料庫,并將其應用于旅游翻譯、旅游文化翻譯教學與研究及導游人才的培養中,為江西旅游文化外宣工作提供支持。
過去30年基于語料庫的翻譯研究取得了飛速發展。1995年,曼徹斯特大學建立了世界上第一個翻譯語料庫(TEC),而后用于翻譯研究的語料庫應運而生。目前,用于翻譯的語料庫主要有:譯文語料庫、類比語料庫和對比/平行語料庫,這三類語料庫多以文學文本為主,針對某一領域專門研制的
雙語語料庫相對較少。旅游文化語料庫是一種專門用途語料庫,然而目前國內外已創建的單語或雙語旅游語料庫數量較少。
縱觀國內外相關文獻,我們發現目前國內外研制的旅游類語料庫主要以下三類:1.單語旅游語料庫的研制,如Michael Wilkinson于2005創建的公67萬詞的英語旅游語料庫,主要用于指導學生將芬蘭語譯為英語時提供參考[1];Carlota Alcantar收集了旅游部門、酒店、旅行社及語言培訓學校相關文本于2007年創建了約3.8萬詞的英語旅游文本語料庫并總結出旅游文本中常用的421個詞匯和短語,用于指導旅游學院教師有效的教授旅游詞匯[2];2.類比旅游語料庫的研制,如康寧創建了基于中美英網站旅游文本的可比語料庫,旨在系統地描述和對比分中、英、美網站英語旅游文本中評價意義構建的特點,找出中國旅游網站英語旅游文本評價性語言所存在的問題和不足[3];3.雙語平行語料庫的創建;如李德超,王克非(2010)創建的以香港地區旅游文本為主的中英雙語旅游語料庫,文章介紹了該語料庫設計的理念及操作程序[4];熊兵(2016)創建了旅游文本漢英平行語料庫,語料來自旅游景點介紹(如故宮介紹、湖北旅游、西安旅游等等)[5],旨在探究旅游文本的譯文詞匯特征及翻譯;其它的諸如內蒙古漢英平語料庫、云南省漢日平行語料庫、泉州旅游文本漢英平行語料庫等地域性的雙語平行語料庫研制也取得一定的進展。
綜上所述,國內旅游雙語平行語料庫的研制已經取得了一定的進展,但是數量還不夠,還有待進一步深化。一是目前國內旅游語料庫規模較小、地域有限,由于各種原因已建的旅游語料庫并未對外開放。二是各地旅游資源迥異,把它省或它地區的旅游語料庫用于當地的旅游外宣、導游培養、旅游翻譯與教學有一定的局限性。在“一帶一路”戰略下,提高旅游文化譯文質量是打造江西旅游樞紐區的重要一步,研制江西旅游文化漢英平行語料庫有助于提高旅游文化譯文質量,促進江西旅游經濟發展。
江西省是旅游大省,有著豐富的自然景觀和人文景觀,截止2017年2月江西省共有10個旅游景點被評為5A級景區。悠遠的人文景觀、秀麗的自然風采及濃郁的紅色文化使江西成為海內外游客的主要目的地之一。近年來,江西的旅游環境不斷改善,國際形象和知名度大幅提升,國際游客的數量逐年穩步增長。據江西省統計局2016年1月公布的2014年入境游總人數為54.92萬人,實現旅游總收入5.7億美元。相比日趨完善的旅游激勵政策和硬件設施,江西旅游文化外宣翻譯則相對滯后。
經筆者調查發現,在國外訪問量較大的中國日報英文版網頁上,多省開通了英文頻道(http://www.chinadaily.com.cn/regional/),未見江西省英文頻道,中國日報英文版網頁上關于江西省承辦的國際性會議及論壇英譯文數量也較少。江西旅游官網未見相應的英文介紹,江西省人民政府、南昌市政府、九江市政府等及部分旅游景區及酒店官網開通了相應的英文網頁,但是關于景點、酒店及相關旅游服務的介紹比較簡單,有的譯文存在誤譯及不地道的表達法。研制規范的江西旅游文化漢英平行語料庫,不僅能直接用于政府部門及企業的外宣及推廣,也可以為旅游文化翻譯者提供一定參考,同時也可以為旅游英語教學及翻譯提供真實素材,從而提高江西省旅游文化譯文質量,營造優質的旅游環境,提升江西旅游形象品牌,吸引更多的外國游客,促進當地旅游經濟發展。
本研究構建的江西旅游文化漢英平行語料庫是一個開放性的具有地方旅游文化特色的專門語料庫,其庫容隨著旅游外宣及研究的深入不斷進行擴充。本語料庫主要根據王克非教授撰寫的《雙語平行語料庫研究與應用》及李德超等創建的平行語料庫所采用的設計理念及思路進行該語料庫的設計[4],創建過程包括語料的收集、整理、標注、對齊等。
語料的選擇主要借鑒Maia的標準[6],依據社會語域(如分為景點介紹、景點公示語、旅游配套設施介紹等若干類),將分層抽樣、均衡抽樣和比例抽樣有機結合使用,以確保入庫語料的代表性。江西省旅游文化漢英平行語料庫主要涵蓋以下幾個方面:經典山水(比如廬山、明月山、鄱陽湖等)、紅色文化(如八一紀念館、瑞金共和國搖籃、井岡山等)、民俗風情(如景德鎮古窯民俗博覽區)及酒店、餐飲業及相關旅游服務的介紹。語料主要來源為出版社及各級政府部門出版發行的書籍(圖書、論文及音像資料DVD等)、各景區的景點介紹及景區標識語及宣傳手冊、各個景區的網絡資料,重點收集了部分景區官網、政府官網、部分旅行社網頁有關上述三類景區的雙語介紹性文本。在語料收集的過程中,我們將各類雙語語料存放在同一個文檔中(檢索時只要檢索出原文或譯文的詞句,其對應的詞句就會自動出現),按照預先規劃的三個字庫存入相應的文件夾。
因為語料的來源眾多、形式多樣,在語料收集完成之后,需對語料進行進一步的整理。對購買的書籍及其它出版物進行掃描然后用文字識別軟件進行識別,再進行人工校對;拍攝的圖片需進行人工輸入;網絡下載的資源如PDF及CAJ格式需轉換,拷貝的網頁文件須刪除圖片、鏈接,最終所有的電子文檔存為統一的格式.txt格式。我們將采集到的語料進行篩選,排除一部分譯文低劣不可修改的原始文本,選取譯文質量較高并且具有代表性的語料,然后人工校對是否有錯別字、語法錯誤、亂碼雜質等,刪除冗余信息。同時對初步篩選過的語料進行查漏補缺,對有問題的譯文進行修正,對缺少對應英譯資料的文本提前進行一些英譯工作,充實漢英對譯文本。最后組織翻譯專家團隊和外籍教師對譯文進行校審并修改,確保譯文的質量。
對修正過的生語料,本研究使用風林文本整理器進行清潔。風林文本整理器是一款綠色文本清潔軟件,可以整理空格、段落和空行、轉換代碼、合并文檔等,支持批量整理多個文本文件。整理過的文本在自動詞性賦碼時就不會出現亂碼。
平行語料庫的標注雖然不是一個必要的步驟,但是進行了句法和詞法標注的語料庫會更加便于研究與學習[7]。語料標注影響到語料庫建成后的應用范圍,也是實現原始語料機讀化的重要環節。本研究中的標注分為兩個類別:篇頭和文內標注以及詞性標注。語料在轉換為.txt形式存檔后,原語料中的很多信息都會被去除。通過篇頭和文內標注,這些原始信息可以在處理后的文檔中得以體現。參照通用漢英對應語料庫的標注方法,并結合本研究的目的和特點,本語料庫語料標注分為篇頭標注和文內標注,目的是使原語料中的相關信息能夠在處理后的文檔中得以體現。篇頭標注可包含:標題、景區所在地、譯者信息、時間、出版信息等;文內標注可利用語料庫詞匯切分和詞性賦碼軟件工具分別對漢語和英語語料進行詞性標注。英語文本使用德國斯圖加特大學Helmut Schmid開發的詞性標注工具軟件Tree Tagger,對英文語料進行詞性賦碼;漢語文本使用中國科學院計算技術研究所開發的漢語分詞及標注工具ICTCLAS進行分詞及詞性標注。對標注之后的中英文語料需再次進行人工校對,查看并糾正錯誤。
整理過的語料需作對齊處理,即將原文與譯文建立起段落、句子或短語層面的對應。語料對齊是平行語料庫建設的核心部分。雖然很多學者認為,對齊單位越小,所提供的語言信息就越多,因而應用的價值也就越大。但也有專家指出,“由于漢、英分屬不同語系,它們在語序、句子結構和邏輯語義的表達等方面都存在著明顯的差異,語詞的逐一對應在整個語料庫是不可能做到的,語句層級上的對應難度也相當大。”[4]在各級對齊研究中,最為重要且成熟的自動對齊技術是句子對齊。因此,在本語料庫的構建過程中,我們進行句子層面的對齊,輔以段落對齊的方式。本語料庫先使用Paraconc軟件以句為單位粗略對齊,完成后進行人工校對。語料本身并不能實現什么,只有與語料庫工具結合才能對語言現象進行研究[8]。檢索工具選用的軟件要根據平行語料庫語料存儲的不同形式來選定。對于語料被存放于同一文檔的平行語料庫,使用普通的檢索工具如AntConc,Concordancer進行檢索并輸出結果,可以進行基本的統計和分析。
不同于單語語料庫及可比語料庫,雙語平行語料庫既含有原文又有譯文,信息豐富,能從不同層面探究雙語之間不同層面的對應關系,雙語平行語料庫可以為翻譯研究、雙語教學、機器翻譯、教材編寫等提供有效的資源平臺[7]。江西省旅游文化漢英平行語料庫作為地域性的專門語料庫,有其專門的針對性和實用價值,主要包括以下方面:
第一,豐富江西旅游文化雙語語料,服務江西旅游文化資源外宣工作,推動江西旅游經濟的發展。由于入庫的語料經過翻譯專家團隊及外籍教師的審核與研究人員的修訂,建成后的江西旅游文化漢英平行語料庫可以直接用來補充和完善現有的政府及景區網頁上旅游資源的英譯文,提高旅游外宣文本的翻譯質量,提升旅游景點檔次。同時,研究人員正在對收集整理的江西經典山水、紅色旅游文化及江西民俗風情等雙語語料,進行編輯及撰寫,正在籌備出版發行江西旅游文化雙語指南。以上這些做法無疑將有效提升江西省游資源品牌,擴大江西省特色旅游文化的國際知名度,有效吸引潛在的國內外游客,推動江西旅游快速發展。
第二,江西旅游文化漢英平行語語料庫還可應用于本地高校的翻譯教學,有助于培養高素質的翻譯人才。旅游文本的翻譯是翻譯實踐的一部分,建成的旅游文化雙語語料庫能夠為學生提供豐富真實的譯文實例,學生通過比較不同的翻譯文本,研究旅游文本翻譯的具體方法,進而形成自己的翻譯策略。教師可以利用翻譯工作坊的教學形式,讓學生通過語料庫關鍵詞的檢索,獲得準確的雙語詞匯和句型表達方式。一方面可以激發學生翻譯實踐的熱情;同時有利于培養學生自主翻譯實踐的能力。這種教學模式可以促進旅游翻譯教學的轉變[9],從而進一步提高翻譯課的教學效率,培養高素質的翻譯人才。
第三,建成的江西旅游文化漢英平行語平行語料庫可以為漢英旅游文本詞匯、語用、語體研究等提供一定的參考。該語料庫可直接為漢英旅游詞典,紅色旅游文化詞典編纂提供大量可靠的語言實例。該語料庫還可為旅游學院教師的教學提高豐富的素材,同時也為出版江西省旅游文化漢英雙語教材和各類旅游參考書籍提供豐富的資源,從而可以更好地培養江西特色旅游文化英語導游者人才。
建成的江西旅游文化漢英平行語料庫有助于旅游宣傳單位和譯者實現資源共享,提高江西外宣譯文質量和翻譯效率,從而有助于促進江西旅游經濟的發展。同時,本語料庫的語料也可以為廣大翻譯研究者、譯者和旅游學院教師和學生提供豐富的研究和教學素材,該語料庫的構建具體過程也可以為其了解平行語料庫、研制語料庫以及使用平行語料庫方面提供有益的參考。
[1]Wilkinson,M.Discovering Translation Equivalents in Tour?ism Corpus by Means of Fuzzy Searching[J].Translation Jour?nal,2005(9).
[2]Alcantar,C.Construction of Special Corpus to Extract the Most Frequent Words in a Particular Field[J].Essex Gradu?ate Student Papers in Language&Linguistics,2007(9).
[3]康寧.基于類比語料庫的中國網站英語旅游文本語言分析[J].青島科技大學學報(社會科學版),2012(4).
[4]李德超,王克非.新型旅游語料庫的研制和應用[J].現代外語,2010(1).
[5]熊兵.基于語料庫的旅游文本英譯文詞匯特征及翻譯研究[J].華中師范大學學報(人文社會科學版),2016(5).
[6]Maia,B.“Some languages are more equal than others”:Train?ing translators in terminology and information retrieval using comparable and parallel corpora[A].In F.Zanettin,S.Bernardi?ni&D.Stewart(eds.).Corpora in Translator Education[C].Man?chester:St.Jerome,2003.
[7]馮敏萱.漢英平行語料庫的平行處理[M].北京:世界圖書出版公司,2011.
[8]Susan,H.Corpora in Applied Linguistics[M].Cambridge:Cambridge University Press,2002.
[9]李德超,王克非.基于雙語旅游語料庫的DDL翻譯教學[J].外語電化教學,2011(1).