肖庚生 陳 欣
(南華大學 外國語學院,湖南 衡陽 421001)
旅游漢英雙語平行語料庫的建設與應用
肖庚生 陳 欣
(南華大學 外國語學院,湖南 衡陽 421001)
文章在綜述現有旅游語料庫的基礎上,介紹了自建的衡陽旅游漢英平行語料庫的建庫步驟,即語料的取樣、英譯、標注與對齊,并闡述了該庫在旅游文本語言特征、旅游翻譯、旅游英語及旅游翻譯教學研究中的應用價值。該庫的建設與應用既能充分滿足研究需要,亦能促進導游、翻譯等英語人才的培養,進而推動當地旅游產業的發展及跨文化傳播。
旅游語料庫;雙語平行語料庫;旅游英語
近30年來,語料庫及語料庫語言學從無到有、蓬勃發展。基于語料庫的語言學及應用語言學研究應運而生,語料庫這一研究工具與方法業已廣泛應用于詞匯、句法、語義、語言對比、詞典編撰、二語習得、翻譯等領域的研究之中, 并取得了累累碩果。[1]為了研究或應用的需要,國內外先后創建了跨學科、多語言、內容迥異、庫容不一的眾多語料庫。近年來,雙語平行語料庫由于其獨特的優勢備受關注,其建設與應用正如火如荼地進行。不過,迄今為止,國內外高校與研究機構所研制的平行語料庫主要是通用型的雙語平行語料庫以及文學翻譯類型的平行語料庫,以某一專門用途為導向的平行語料庫仍較為鮮見。此外,基于平行語料庫的相關研究主要側重于對個別語言或翻譯現象的探討。鑒于這一研究現狀,我們擬以課題研究為契機,建設衡陽旅游漢英雙語平行語料庫,在此基礎上,力圖摸索其在漢語與英語的旅游文本語言特征、旅游漢英翻譯、旅游英語與旅游翻譯教學研究中的應用。
雙語語料庫最早創建于上世紀90年代中后期,迄今為止國內外業已建立多種類型的雙語平行語料庫。早在 1995年,曼徹斯特大學研制了世界上首個翻譯語料庫,主要收集從各國語言翻譯成為英文的文本,如今庫容已達千萬詞。但是它并非嚴格意義上的雙語平行語料庫,因為它并沒有實現雙語對齊,只能稱其為對比語料庫。目前國際上比較知名的平行語料庫有挪威的“英語-挪威語平行語料庫”、英國的“德語-英語文學文本平行語料庫”等等。而由北京外國語大學中國外語教育研究中心于2004年啟動創建的“新型雙語對應語料庫”(含漢英、漢日兩個雙語平行語料庫),庫容為3000萬詞次。其中,漢英雙語平行語料庫的文本類型主要涵蓋人文類、社科類和科技類。該語料庫的建設得到了國家社科基金重大規劃課題的資助,目前正為1億詞次的超大庫容做進一步的擴容努力。此外,國內比較知名的雙語平行語料庫還包括:李德俊以漢英詞典研編為主要目的,主持建設2000萬詞次的英漢平行語料庫;衛乃興以研究探討英漢對等表達為目的,主持建設900萬詞次的英漢平行語料庫;哈爾濱工業大學所創建的庫容為40萬對的英漢雙語平行語料庫;紹興文理學院創建的中國古典文學英譯雙語平行語料庫等等。上述雙語平行語料庫多數以文學文本為主,抑或以收集百科文本(含文學與非文學作品)為特色,而針對某一特定文類或某一地域特色而專門建構的專門用途雙語平行語料庫仍較為鮮見。
近年來,隨著交通與通訊技術的日新月異,世界各地人們之間的科技、文化、商務交流、合作與往來日益頻繁。更為重要的是,各國人們紛紛走出國門,暢游世界,體驗世界各地的異域風情,許多國家的旅游產業獲得了飛速發展。為更好地發展旅游產業、傳播旅游資訊、吸引外國游客,同時亦為了滿足語言學及應用語言學研究需要,旅游專門語料庫應運而生。
到目前為止,國內外最知名的旅游語料庫有如下四庫:一是芬蘭薩翁林納翻譯研究學院語言教師 Michael Wilkinson所創建的庫容為67萬詞的英語旅游文本語料庫,旨在為芬蘭學生在將芬蘭旅游文本英譯時提供參考標準;二是英國埃塞克斯大學研究生Carlota Alcantar于2007年創建的庫容為 37,795詞的英語旅游文本語料庫,其內容包括旅游行政機構的介紹、酒店及旅行社信息等,旨在為旅游英語教學總結旅游寫作常用的詞匯與短語;三是日本大學Kiyomi等人于2006年所構建的“京都旅游語料庫”。該庫為英語單語語料庫,收集的材料均為用英文撰寫的有關京都旅游介紹的文本,共885篇,建庫目的在于總結適合于日本旅游市場(尤其是京都地區)常用旅游英語詞匯,為旅游英語課程提供教學參考;四是香港理工大學中文及雙語學系所創建的新型雙語平行旅游語料庫,是中國第一個較大庫容的英漢/漢英旅游語料庫,它由一個雙語旅游翻譯對應語料庫與一個雙語旅游翻譯類比語料庫組成,庫容為各 100萬字/詞。旨在促進香港旅游翻譯研究以及旅游英語教學。
盡管世界各地的旅游語料庫建設工作取得了豐碩的成果,但鑒于各地有著各自獨特的自然與人文景觀,各地旅游資源迥異,因此旅游語料庫的本土化至關重要。為了對衡陽旅游資源進行跨文化傳播,并滿足語言學與應用語言學研究需要,促進在衡高校旅游英語及旅游英漢互譯教學,我們自建了衡陽旅游漢英雙語平行語料庫(Hengyang Tourism Chinese & English Bilingual Parallel Corpus,HTCEBPC)。
HTCEBPC是一個開放式的語料庫,也就是說,其庫容將會隨著旅游宣傳或研究需要不斷得到擴充。HTCEBPC的內容主要涵蓋以下幾個方面:衡陽自然景觀、人文景觀的介紹;介紹衡陽旅游資源的觀光小冊子;衡陽本土酒店、旅館、餐飲業及娛樂場所與設施的介紹;與衡陽旅游業相關的其它行業的文本,如交通運輸、導游服務、旅行社業務、貨幣兌換、投訴處理、景區公示語及旅游管理部門的宣傳等相關的文本。HTCEBPC的建庫工程主要包括以下三個步驟:
首先是對漢語語料的取樣。語料的選擇主要借鑒Maia[2]的標準,依據社會語域(如分為景點介紹、觀光介紹、景點公示語、旅游配套設施介紹等若干類),將分層抽樣、均衡抽樣和比例抽樣有機結合使用,以確保入庫語料的代表性。語料來源既包括正式出版物(圖書、論文、音像制品等),非出版物(網頁、各類旅游宣傳材料如酒店介紹、旅行社介紹、景點旅游宣傳冊等)。我們在建庫過程中充分利用衡陽市旅游局與衡陽市旅游協會的官方網站-衡陽旅游網(www..hyly.com)以及南岳衡山官方網站(www.nanyue.net.cn/)等權威網站的網頁內容。此外,我們亦深入5A級景點南岳衡山以及回雁峰、石鼓書院、王船山故居、蔡侯祠等著名景點進行實地考察,獲取關于景點介紹、景區標識語等信息的第一手語料,并進行錄入。同樣,我們亦通過利用網絡資源與實地調研相結合的方式獲取有關衡陽林隱假日酒店、神龍大酒店等旅游配套設施的相關語料。實現衡陽旅游漢語文本的數字化,建成衡陽旅游漢語語料庫(Hengyang Tourism Chinese Corpus, HTCC)。
接著我們在完成漢語語料的取樣基礎上對衡陽旅游漢語文本進行英譯。筆者曾于2009年參加了南岳衡山申遺活動中的口、筆譯工作,發現當前南岳景區建設中明顯滯后的一個環節就是其英譯工作,景區中許多景點介紹、標識牌等缺乏中英對照文本,即使有,也是錯誤百出。其他景區的旅游英譯則更是一塊未曾開墾的處女地。我們以Verschueren[3]所提出的順應論為翻譯實踐的理論指導,將旅游文本英譯的全過程視為一個不斷順應和選擇的過程。我們在理解原文的階段,運用順應理論,可以通過認知語境進行推理和探究,找出原語中的心理因素和文化特質,從而加深對旅游文本交際意圖的理解。與此同時,在用譯語進行重新編碼時,運用動態順應的原理,在眾多的語言選擇中,找出最能讓譯語讀者接受的語項,從而順利地完成滿足譯語讀者需求的翻譯任務。盡管對旅游文本的漢譯英是一項艱巨浩大的工程,但慶幸的是,筆者所在的課題組其組員普遍英語技能較高、翻譯能力較強、理論功底扎實,他們發揚精誠合作的精神,順利完成相關語料的漢譯英工作,建成衡陽旅游英語語料庫(Hengyang Tourism English Corpus,HTEC)。
最后則實現語料的標注、對齊。語料標注分為詞性標注與修辭標注兩類。HTCC的詞性標注將通過運用SVMTool得以實現,SVMTool在中文詞性標注中具有較高的準確率。而HTEC的標注則以CLAWS7來得以實現,它的標注準確率已達到96%以上。而修辭標注則無現成的電腦軟件進行輔助,完全需要人工進行。HTCEBPC中、英文語料都首先啟用Paraconc 軟件以句為單位進行粗略對齊,輔之以人工校對,以備concordancer 檢索所用。而中文語料還通過利用中科院計算所研制的“漢語詞匯分析系統”(ICTCLAS)進行切分。不過需指出的是,我們在順應論的指導下,對旅游文本的翻譯并非完全按照句對句的原則,我們靈活采納摘譯、擴譯或省譯等翻譯策略。故軟件在某些地方難以實現一對一的對應。我們便在運用concordancer檢索相關的句子時,設定同時出現相對應的句子的相鄰的幾個句子,通過提供詳盡的語境,能較為準確地了解是哪一不奮斗原文被改動。在語料實現對齊后,文本轉換為XML格式,這樣就能讓語料庫以多種語言格式編碼,以便傳播與檢索。
目前,本旅游語料庫只是初步建成,今后將會逐步增加語料擴充庫容,并考慮將語料庫上網或制作為可供檢索的光盤。同時,我們還將不斷完善對語料庫的標注,依據教學與研究需要,進行語義與句法方面的標注,最大限度地挖掘語料庫的應用潛能。我們業已或將要在以下幾個方面開展基于HTCEBPC的研究,以實現其應用價值。
首先,旅游文本語言特征研究。旅游雙語平行語料庫的構建為我們提供了鮮活、真實、海量的有關景點介紹、景區公示語、酒店文宣等內容的語料。對這些旅游文本的分析有助于揭示漢英兩種語言旅游文本在詞匯、句法、語篇以及文體上的語言特征的共性和差異。借助于語料庫定量數據分析,我們可以得到旅游文本標準化類符/型符比,平均詞長、平均句長、詞類的出現頻次與頻率、詞塊的出現頻次與頻率等定量數據信息。我們已初步發現,英語旅游文本通常具有用詞平易、豐富、通俗易懂,注重語篇銜接,強調呼喚功能等特點,而漢語旅游文本則表現為數量表達使用過于頻繁,慣于堆徹華麗辭藻,常用隱性語篇銜接手段。這種基于語料庫的實證研究,可以避免傳統語言學研究中思辨法或內省法過于經驗主義的缺陷,具有較高的信度。
其次,旅游翻譯研究。基于旅游平行語料庫的翻譯研究涵蓋微觀與宏觀兩個層面。從微觀層面來講,主要側重于旅游文本翻譯過程中詞法和句法層面的轉化規律與機制,前者如詞類轉換情況,后者如各種句式的轉換情況。從宏觀層面來講,通過實證與量化的方式對旅游文本翻譯的文體、風格、翻譯共性進行研究,依據海量語料對譯者個人偏好的語言表達形式加以分析,從中發現更有說服力的翻譯文體/風格表征及其表現手段。這種基于雙語平行語料庫的研究方法能直觀地揭示漢英兩種語言旅游文本從詞匯到語篇各個語言層面的共性與差異,有助于提煉旅游文本獨特的漢英互譯策略。李德超、王克非[4]曾基于漢英平行語料庫,分析與歸納中英文酒店文宣材料在文本慣例上所呈現的不同特點,并提出切實可行的酒店文宣翻譯策略,旨在實現譯文與目標語平行文本間的“文本內連貫”。基于平行語料庫的旅游文本翻譯研究其成果有助于解決當前許多地方景點名稱、景點介紹、景區公示語、酒店文宣等文本翻譯中存在的語言不規范、譯名混亂、譯文可接受性差等諸多問題,為衡陽本地乃至全國旅游翻譯實踐提供富于價值的參考。[5]
最后,旅游英語以及旅游翻譯教學研究。該庫的建設為旅游英語以及旅游翻譯教學提供了非常真實、鮮活、直觀而且豐富的教學素材,通過引導學習者檢索與考察語料庫內容,促進學習者對漢英旅游文本的微觀層面(字、詞)到宏觀層面(句子間聯系、語篇結構以及修辭特點)的理解,鼓勵他們閱讀與討論漢英平行語料間語言特征的異同并歸納切實可行的翻譯策略。[6]基于漢英雙語平行語料庫的旅游英語以及旅游翻譯教學其形式由傳統的單純由教師講授轉變為學生主動發現、學習與總結輔之以教師點評這種多樣化形式,這一新型教學模式有助于引導學習者開展“歸納式學習”(inductive learning),促進學生在自主學習中積極挖掘與批判性思考,能有效活躍課堂氣氛、充分激發學生的學習興趣。[7]此外,值得一提的是,衡陽旅游漢英雙語平行語料庫具有鮮明的本土特色,其語料主要來源于衡陽地區景點介紹、景區公示語、酒店文宣及其他旅游配套相關文本,因此,在當地高校旅游英語或旅游翻譯教學中,這些教學素材的應用無疑有助于提升學習者對本土歷史、地理、文化的了解,亦有助于增強學習者跨文化交際能力。因此,該庫的建設與應用對培養立足衡陽、面向世界的導游、翻譯人才具有極大的推動作用。
綜上所述,我們通過語料取樣、文本英譯、語料標注、文本對齊等步驟初步創制衡陽旅游漢英雙語平行語料庫,并將其應用于旅游文本語言特征、旅游翻譯、旅游英語及旅游翻譯教學研究之中。該庫的建設與應用既能充分滿足語言學及應用語言學研究需要,而且被初步證明有助于推動培養兼具本土化與國際化特點的英語人才,進而促進當地旅游文化產業發展和跨文化傳播。
[1]梁茂成,李文中,許家金.語料庫應用教程[M].北京:外語教學與研究出版社,2010.
[2]Maia,B.“Some languages are more equal than others”:Training translators in terminology and information retrieval using comparable and parallel corpora[A].In F.Zanettin,S.Bernardini&D.Stewart(eds.).Corpora in Translator Education[C].Manchester:St.Jerome,2003.
[3]Verschueren,J.Understanding Pragmatics[M].London:Edward Arnold,1999.
[4]李德超,王克非.平行文本比較模式與旅游文本的英譯[J].中國翻譯,2009,(4):54-58.
[5]烏永志.文化遺產類旅游景點名稱漢英翻譯規范研究[J].外語教學,2012,(2):93-97.
[6]余軍,王朝暉.基于比較翻譯教學法的教學型語料庫構建與應用[J].中國翻譯,2010,(5):57-62.
[7]李德超,王克非.基于雙語旅游語料庫的DDL翻譯教學[J].外語電化教學,2011,(1):20-26.
H030
A
1673-2219(2012)10-0163-03
2012-08-26
衡陽市社科基金項目“順應論視閾下衡陽旅游漢英雙語平行語料庫的建設與應用研究”(項目編號2011C011);全國教育科學規劃課題“基于語料庫的大學英語教學平臺建設與研究”(項目編號GPA105029)階段性成果。
肖庚生(1980-),男,湖南衡陽人,講師,應用語言學博士生,主要研究方向為語料庫語言學。陳欣(1983-),女,湖南郴州人,講師,語言學碩士,主要研究方向為翻譯理論與實踐。
(責任編校:王晚霞)