李中英
(山西旅游職業(yè)學(xué)院 旅游外語系, 山西 太原 030031)
隨著中外日益漸多的學(xué)者涉足探究多模態(tài)話語以及多模態(tài)話語分析對(duì)于語料庫(kù)的發(fā)展和建設(shè)所起的作用及影響, 有關(guān)語料庫(kù)的研究范圍越來越廣, 研究對(duì)象也越發(fā)多樣化。然而, 在國(guó)際文旅融合的背景下, 有關(guān)多模態(tài)旅游翻譯語料庫(kù)的構(gòu)建研究卻少之又少。為提升中華文化的國(guó)際影響力和傳播力, 本研究以多模態(tài)與語料庫(kù)相關(guān)研究為理論基礎(chǔ), 探尋多模態(tài)旅游翻譯語料庫(kù)的建構(gòu)方法與路徑, 以高視角為旅游業(yè)及其對(duì)外公共基礎(chǔ)設(shè)施提供更完善、 更準(zhǔn)確、 更全面的翻譯資料, 為傳揚(yáng)中華文化提供更權(quán)威的保障。
根據(jù)CNKI 文獻(xiàn)收錄統(tǒng)計(jì), “模態(tài)”一詞在國(guó)內(nèi)學(xué)術(shù)界的應(yīng)用已有半個(gè)多世紀(jì)。收錄文獻(xiàn)最早記載于1957 年, 莫紹揆在其《具有有窮個(gè)模態(tài)辭的模態(tài)系統(tǒng)》中將模態(tài)用于對(duì)數(shù)理系統(tǒng)的表達(dá)[1]。隨后, “模態(tài)”也陸續(xù)出現(xiàn)在力學(xué)、 氣象學(xué)、 海洋學(xué)、工業(yè)、 工程、 計(jì)算機(jī)以及語言文字的研究當(dāng)中。故此, 基于模態(tài)的多學(xué)科融合交叉研究有著極強(qiáng)的資源優(yōu)勢(shì)和價(jià)值意義。
模態(tài)與語言學(xué)的融合研究相對(duì)其他領(lǐng)域起步較晚。然而, 正因?yàn)椤澳B(tài)”的多學(xué)科特點(diǎn), 學(xué)界對(duì)其并沒有形成統(tǒng)一的概念界定。早期是由美國(guó)著名邏輯學(xué)家Richard Montague 在研究遞歸函數(shù)論、模態(tài)邏輯和內(nèi)含邏輯后轉(zhuǎn)向研究自然語言, 為多模態(tài)理論下的語言分析及研究提供了更多更充分的邏輯學(xué)理論基礎(chǔ)[2]。2007 年, 朱永生在其相關(guān)研究中表示“模態(tài)”是人們彼此之間溝通交流所選用的途徑或是載體, 主要包括語言、 技術(shù)、 圖像、 顏色和音樂等符號(hào)系統(tǒng)[3]。2015 年, 顧曰國(guó)在其《多模態(tài)感官系統(tǒng)與語言研究》中認(rèn)為, “模態(tài)”可以被理解為人類自己借助視覺、 聽覺、 觸覺、 嗅覺等感官系統(tǒng)與外界事物及環(huán)境進(jìn)行交流互動(dòng)的模式方法[4]。多模態(tài)話語分析代表Kress G. 和Van Leeuwen 表示, “模態(tài)”是人與人彼此之間溝通交流的符號(hào), 是用于表示意圖和交流意義的社會(huì)文化資源,包括使用工具和各種物質(zhì)[5]。然而, 隨著時(shí)代的不斷發(fā)展, 單模態(tài)或是單個(gè)媒介已經(jīng)不滿足人與人之間的交流[6]。模態(tài)的研究為多模態(tài)研究打好了基礎(chǔ), 同時(shí)也為多模態(tài)的應(yīng)用研究做好了鋪墊。
“多模態(tài)”則一般表達(dá)融合了兩種或兩種以上具有象征意義的語言符號(hào)。顧曰國(guó)指出, “多模態(tài)”是人類在某種具體交流場(chǎng)景中使用多種模態(tài)的情況, 所使用的模態(tài)形式主要包含專業(yè)術(shù)語、 日常用語等, 關(guān)鍵是判別到底有幾種感官參與[4]。“多模態(tài)話語分析”則是多模態(tài)在語言領(lǐng)域的發(fā)展應(yīng)用。
“多模態(tài)話語分析”的理論方法是張德祿提出的, 他師從世界著名語言大師韓禮德(Halliday), 將系統(tǒng)功能語言學(xué)進(jìn)一步深入挖潛, 拓寬研究視角,并在系統(tǒng)功能語言學(xué)的基礎(chǔ)上提出了多模態(tài)話語分析[7]。他表示, “多模態(tài)話語分析”是指人借助感官系統(tǒng)跟外部事物或者環(huán)境交流互動(dòng)的途徑, 是人利用感官系統(tǒng)和輔助工具進(jìn)行社交活動(dòng)的情形[8]。張德祿的系統(tǒng)理論研究為學(xué)者們開啟更深入的語言分析研究, 促使語言分析更全面、 更精準(zhǔn)、 更實(shí)用打下了扎實(shí)的基底。
目前, 越來越多的學(xué)者將多模態(tài)、 多模態(tài)話語、 多模態(tài)話語分析等理論學(xué)說應(yīng)用于語言翻譯相關(guān)的研究和實(shí)踐中, 如充分借助網(wǎng)絡(luò)技術(shù)創(chuàng)設(shè)翻譯資料庫(kù)、 構(gòu)建使用者的資源共享平臺(tái)、 運(yùn)用數(shù)字化多媒體技術(shù)展示文字等, 為充分調(diào)動(dòng)參與者多個(gè)感官系統(tǒng)參與交流互動(dòng)提供了多樣化的路徑選擇。
語料庫(kù)也即語言詞匯數(shù)據(jù)庫(kù), 是將人類在交流互動(dòng)過程中所使用的一切語言詞匯按照既定的目標(biāo)或用意進(jìn)行搜集、 整合、 對(duì)齊、 應(yīng)用所構(gòu)建的大型語言詞匯電子數(shù)據(jù)庫(kù)。語料庫(kù)的研究常采用定量分析和定性分析相結(jié)合的方法, 其中, 定量分析主要建立在大量數(shù)據(jù)收集的基礎(chǔ)上, 定性分析則是對(duì)收集數(shù)據(jù)的進(jìn)一步分析和研究[9]68-72。依據(jù)語料庫(kù)所包含的語言種類或數(shù)目, 語料庫(kù)可劃分為單語語料庫(kù)、 雙語語料庫(kù)、 多語語料庫(kù)。依照語料庫(kù)所表達(dá)的內(nèi)容, 又可劃分為通用語料庫(kù)和專門語料庫(kù)。旅游翻譯語料庫(kù)屬于專門語料庫(kù)的一種, 且是基于語料庫(kù)翻譯學(xué)的研究基礎(chǔ)而逐漸展開探究和構(gòu)建的。
國(guó)內(nèi)有關(guān)語料庫(kù)翻譯學(xué)的研究?jī)H數(shù)十年的時(shí)間, 學(xué)者主要基于語料庫(kù)的研究思路和方法, 將其應(yīng)用于翻譯學(xué)研究, 擴(kuò)展了依附語料庫(kù)建立而存在的大量結(jié)合翻譯的語料研究維度, 潛藏著語料庫(kù)翻譯研究的重要意義和廣泛的應(yīng)用前景。
朱永生在《多模態(tài)話語分析的理論基礎(chǔ)與研究方法》中對(duì)多模態(tài)話語分析做了非常全面的論述。首先,他溯源了多模態(tài)話語分析的理論基礎(chǔ), 指出其研究還處于起步階段, 仍停留在文本語言和語法結(jié)構(gòu)的淺層次探索中。其次, 他闡述了多模態(tài)話語分析的概念、研究?jī)?nèi)容、 研究方法和價(jià)值, 提出多模態(tài)語言分析需要與其他學(xué)科學(xué)者共同研究, 提倡多學(xué)科交叉研究,才能使多模態(tài)語言分析更全面更有價(jià)值[3]。
國(guó)內(nèi)關(guān)于多模態(tài)的翻譯研究可以分為萌芽期、發(fā)展期、 成熟期三個(gè)階段。在研究上也取得了一定成果, 如話語分析、 影視翻譯、 翻譯教學(xué)較為完善,口譯研究較為深入等, 但也存在一些不足。第一,缺乏系統(tǒng)性、 綱領(lǐng)性研究; 第二, 跨學(xué)科研究有待跟進(jìn), 特別是與信息技術(shù)、 機(jī)器翻譯、 人工智能的融合、 與行業(yè)產(chǎn)業(yè)接軌不足; 第三, 研究質(zhì)量不高;第四, 實(shí)用性研究領(lǐng)域尚待拓展和完善。今后, 深入研究不僅需要深化加強(qiáng)多模態(tài)翻譯的理論構(gòu)建、國(guó)內(nèi)外多模態(tài)翻譯比對(duì)研究、 實(shí)證經(jīng)驗(yàn)研究等, 更需要加快擴(kuò)展跨學(xué)科的交叉研究, 把多模態(tài)翻譯與機(jī)器翻譯、 翻譯技術(shù)、 信息技術(shù)、 行業(yè)產(chǎn)業(yè)需求結(jié)合起來, 使研究既具有理論價(jià)值, 又具備社會(huì)、 經(jīng)濟(jì)、 文化價(jià)值[10]。
2.2.1 語料庫(kù)的研究現(xiàn)狀
自20 世紀(jì)80 年代伊始, 相當(dāng)多的語言學(xué)家對(duì)“語料庫(kù)”展開了一輪又一輪的深入探討。最初的語料庫(kù)研究基本都是結(jié)合計(jì)算機(jī)、 互聯(lián)網(wǎng)的建立和應(yīng)用展開的(見圖1)①數(shù)據(jù)來源于知網(wǎng)數(shù)據(jù)統(tǒng)計(jì)分析,下同。。

圖1 語料庫(kù)研究的學(xué)科分布
根據(jù)文獻(xiàn)統(tǒng)計(jì), 語料庫(kù)與語言的結(jié)合研究始于1985 年, 白水在《言語統(tǒng)計(jì)和語料庫(kù)》中論述了言語統(tǒng)計(jì)和語料庫(kù)的關(guān)系[11]。言語統(tǒng)計(jì)主要是利用計(jì)算機(jī)建立語言數(shù)據(jù)庫(kù), 語料庫(kù)則是語言統(tǒng)計(jì)的基礎(chǔ)。語料庫(kù)同時(shí)又作為語言統(tǒng)計(jì)的副產(chǎn)品, 通過搜集素材, 并將原材料合理組織, 便形成語料庫(kù), 實(shí)現(xiàn)應(yīng)用價(jià)值。因此, 語料庫(kù)的相關(guān)研究越來越豐富, 也幾乎成為所有語言學(xué)者們科研的必備課題。
語料庫(kù)的合理構(gòu)建是語料庫(kù)廣泛應(yīng)用的關(guān)鍵所在。學(xué)者們除了對(duì)語料庫(kù)元話語的研究外, 對(duì)建立語料庫(kù)的輔助工具、 建立路徑均有深入研究。目前, 使用率較高的語料庫(kù)技術(shù)工具, 如Ant conc、Sketch Engine、 BNC、 COCA 等, 適用于通用語料庫(kù)、 專業(yè)語料庫(kù)。語料庫(kù)的構(gòu)建研究主要包括語言詞匯資料的搜集、 整理、 優(yōu)化、 管理等。
語料庫(kù)除了語料庫(kù)語言本體研究, 學(xué)者們近年來不斷提倡語料庫(kù)相關(guān)研究的跨學(xué)科屬性, 如結(jié)合心理語言學(xué)及構(gòu)式語法等認(rèn)知科學(xué), 借助功能語言學(xué)、 社會(huì)語言學(xué)、 (批評(píng))話語分析等關(guān)注社會(huì)現(xiàn)實(shí)的學(xué)科進(jìn)行研究(見圖2)。 同時(shí), 注重語料庫(kù)的應(yīng)用研究, 除關(guān)注語料庫(kù)在語言教育與學(xué)習(xí)中的應(yīng)用之外, 還關(guān)注現(xiàn)實(shí)社會(huì)問題, 使語料庫(kù)的研究不再局限于語言本體[12]。

圖2 語料庫(kù)相關(guān)研究主題
2.2.2 旅游翻譯語料庫(kù)的研究現(xiàn)狀
語料庫(kù)翻譯學(xué)正是伴隨著語料庫(kù)研究戰(zhàn)略轉(zhuǎn)移的重要時(shí)期應(yīng)運(yùn)而生。語料庫(kù)翻譯學(xué)是基于語料庫(kù)研究與翻譯研究相結(jié)合的研究成果, 以大量的翻譯對(duì)象為研究本體, 通過詞根、 語境的多向?qū)Ρ认嘟Y(jié)合, 挖潛翻譯的本質(zhì)[13]。在研究方法上采用實(shí)證性研究和理論綜述結(jié)合的定量與定性分析方法。但是定量研究還處于初級(jí)階段, 廣度深度仍有很大空間, 需要從單純的文本翻譯轉(zhuǎn)向多因子影響下的環(huán)境語義翻譯。
旅游翻譯語料庫(kù)的相關(guān)研究文獻(xiàn)數(shù)量屈指可數(shù)(見圖3)。發(fā)文量最多的2017 年也僅有13 篇(見圖4), 近年來研究量減縮明顯, 與國(guó)家提倡文旅融合的戰(zhàn)略背景形成反差。

圖3 旅游翻譯語料庫(kù)主要主題年度交叉統(tǒng)計(jì)

圖4 旅游翻譯語料庫(kù)主要主題年度發(fā)文量統(tǒng)計(jì)
現(xiàn)有旅游翻譯語料庫(kù)研究多是在現(xiàn)有語料庫(kù)的基礎(chǔ)上, 將旅游相關(guān)的語料收集、 加工、 處理,進(jìn)而開發(fā)應(yīng)用。但是研究并未擺脫前人所建立的語料庫(kù)所具有的某些限制因素。因而, 旅游翻譯語料庫(kù)的研究并未形成系統(tǒng)性的研究成果, 未對(duì)旅游文化的傳播與發(fā)展產(chǎn)生較好的影響。這也在一定程度上表明旅游翻譯語料庫(kù)構(gòu)建的受重視程度非常低, 或者并未意識(shí)到旅游翻譯語料庫(kù)建立對(duì)于旅游行業(yè)、 國(guó)家經(jīng)濟(jì)、 文化傳播的重要性和價(jià)值性。
隨著現(xiàn)代化信息技術(shù)的更新迭代, “大數(shù)據(jù)”為我們提供了無窮的信息和技術(shù), 但是如何利用好資源, 是解決問題的關(guān)鍵因素。面對(duì)龐大的自然語言數(shù)據(jù)庫(kù), 享受其帶來便捷使用的同時(shí), 我們需要不斷研究克服其所存在的巨大漏洞, 提高語料庫(kù)的使用性能。合理的語料庫(kù)構(gòu)建是翻譯語料庫(kù)研究效益性和使用廣泛性的關(guān)鍵。語料庫(kù)構(gòu)建一般包括數(shù)據(jù)的收集與輸入、 數(shù)據(jù)整理、 語料庫(kù)標(biāo)注、 語料庫(kù)對(duì)齊、 語料庫(kù)的優(yōu)化與管理五個(gè)步驟, 下面主要從以上幾個(gè)方面探究基于多模態(tài)話語分析的旅游翻譯語料庫(kù)構(gòu)建及其影響因素。
構(gòu)建語料庫(kù), 首先是語料數(shù)據(jù)和文本的收集。數(shù)據(jù)和文本的內(nèi)容主要以當(dāng)?shù)芈糜喂俜骄W(wǎng)站上顯示的原文為主。大多數(shù)學(xué)者收集數(shù)據(jù)和文本主要通過維基百科、 孤獨(dú)星球和英國(guó)百科全書等知名網(wǎng)站獲得資源, 同時(shí), 還使用You Tube 視頻和旅游雜志來收集和組織材料。語料來源的多途徑、 多維度既保證了語料的多樣性, 又保證了語料的可靠性,為旅游翻譯語料庫(kù)的構(gòu)建發(fā)展提供了有力保障。
基于國(guó)家旅游官方網(wǎng)站、 省級(jí)旅游官方網(wǎng)站、出版社出版的旅游圖書及知名旅游網(wǎng)站信息搜索,以國(guó)家文化和旅游部統(tǒng)計(jì)的318 家5A 級(jí)旅游景點(diǎn)文本為主, 可以看出, 國(guó)內(nèi)旅游資源非常豐富, 相應(yīng)的旅游文本和翻譯資料也極其豐富, 但是旅游文本的內(nèi)容相對(duì)比較簡(jiǎn)單, 甚至有些內(nèi)容完全缺失。例如, 山西省八路軍太行紀(jì)念館, 館內(nèi)每個(gè)分區(qū)均設(shè)置了陳列墻, 為游客說明館內(nèi)主要陳列內(nèi)容及其歷史淵源, 但遺憾的是只有中文, 缺少同步英文翻譯, 無法實(shí)現(xiàn)對(duì)外文化展示和輸出[14]。其根本的影響因素是國(guó)內(nèi)旅游景區(qū)普遍缺乏全球化的視野, 而且這種現(xiàn)象越是地域偏遠(yuǎn)越明顯, 越經(jīng)濟(jì)欠發(fā)展越突出, 不重視旅游產(chǎn)業(yè)的長(zhǎng)遠(yuǎn)發(fā)展。另外, 缺少專業(yè)化的旅游翻譯資料, 帶著與其翻譯不準(zhǔn)確, 不如不翻譯, 或許根本不會(huì)有國(guó)外旅行者的心態(tài), 導(dǎo)致旅游翻譯不到位的現(xiàn)狀越來越突出。
旅游翻譯語料庫(kù)在建設(shè)過程中, 由于語料的數(shù)量非常龐大, 語料在進(jìn)入語料庫(kù)后必然會(huì)導(dǎo)致錯(cuò)置、 亂碼、 符號(hào)錯(cuò)誤等現(xiàn)象, 因此, 需要對(duì)所收錄語料進(jìn)行數(shù)據(jù)整理。例如, 學(xué)者岳嬌慧團(tuán)隊(duì)建立的山西平遙對(duì)外宣傳語料庫(kù), 詞匯高達(dá)40 016 詞[16]。語料數(shù)據(jù)整理主要分為文本數(shù)字化和文本組織兩個(gè)部分。文本數(shù)字化對(duì)于語料庫(kù)的建設(shè)至關(guān)重要,因?yàn)檎Z料庫(kù)中的文本格式關(guān)系到程序的成功與否。此外, 由于構(gòu)建語料庫(kù)的文本來源多樣, 語料大多以TXT 格式保存。因此, 需要將PDF 格式和HTML 格式的語料文本通過金山格式轉(zhuǎn)換器轉(zhuǎn)換成Word 文檔, 然后統(tǒng)一保存為TXT 格式。還有一些采集到質(zhì)量比較高的旅游視頻因?yàn)槿鄙偻獠孔帜唬?導(dǎo)致其視頻參數(shù)無法提取, 所以需要對(duì)AVI 格式和WAV 格式的字幕進(jìn)行手動(dòng)提取。由于文件轉(zhuǎn)換均需要人工完成, 整理工作難度系數(shù)非常大, 且效率較低。
雖然目前的軟件應(yīng)用已經(jīng)相當(dāng)成熟, 可以刪除所有空行、 批量添加第一行字符、 處理特殊字符等, 對(duì)文本組織有很好的輔助作用, 但還不能達(dá)到100%的準(zhǔn)確率, 尤其針對(duì)文字的轉(zhuǎn)換和識(shí)別。因此, 經(jīng)過軟件轉(zhuǎn)換后的文本仍然會(huì)包含亂碼字符、錯(cuò)位和空行, 所以, 軟件操作完成后, 為了保證其高潔凈度, 需要對(duì)文本進(jìn)行人工檢查和處理遺漏、詞匯拼寫等機(jī)器無法識(shí)別的錯(cuò)誤。
人工整理和校核的海量詞匯語言數(shù)據(jù)庫(kù)只是解決了機(jī)器處理遺留的簡(jiǎn)單問題, 并沒有解決旅游語料本身存在的文化內(nèi)涵缺失、 文字音譯等最核心問題。例如, 位于山西省太原市的晉祠博物館, 其景區(qū)中的“文昌宮”被直接音譯為“Wen Chang Temple”,“勝瀛樓”被譯為“Sheng Ying Building”等。在太原市天龍山的景區(qū)導(dǎo)覽圖中, “禪堂院”被直譯為“Chan Tang Yard”。類似的情況在各大景區(qū)比比皆是, 地名的翻譯沒有一個(gè)統(tǒng)一的標(biāo)準(zhǔn), 有些采用意譯, 有些直接采用漢語拼音, 其翻譯內(nèi)容并沒有表達(dá)出詞義本身的文化內(nèi)涵。
語料庫(kù)標(biāo)注是指對(duì)語料的結(jié)構(gòu)組成進(jìn)一步歸類, 達(dá)到高級(jí)別的檢索需求和更深入研究的過程。標(biāo)注方法一般采用部分-整體關(guān)系-語音標(biāo)注。由于目前關(guān)于翻譯語料庫(kù)的研究基本都基于平行雙語語料庫(kù), 因此, 針對(duì)不同語言的標(biāo)注方法存在差異[16]。在對(duì)英語語料進(jìn)行標(biāo)注時(shí), 主要基于BNC 對(duì)語料詞性的劃分和縮寫對(duì)文本進(jìn)行標(biāo)注,但由于機(jī)器標(biāo)注無法達(dá)到100%的準(zhǔn)確率, 仍需要人工驗(yàn)證, 再次增加了國(guó)內(nèi)研究者難度系數(shù)。
與一般文本相比, 旅游文本是一種針對(duì)特定人群的文學(xué)形式。其語法、 詞匯、 句法和表意都具有一定的人文或自然特色。因此, 在對(duì)旅游文本進(jìn)行標(biāo)注時(shí), 首先將語料按照傳統(tǒng)的詞性標(biāo)注方式在ICTCLAS 平臺(tái)上標(biāo)注詞性(包括名詞、 動(dòng)詞、 介詞、 字符串等)。然后, 考察旅游文本中特有的表達(dá)方式, 并在語料庫(kù)上進(jìn)行標(biāo)注。由于沒有現(xiàn)成的軟件來完成這樣的標(biāo)注, 同樣需要人工完成。在人工審讀的過程中, 需要研究旅游文本中的語音、 詞匯、 語法特征、 蘊(yùn)含的修辭特征等, 對(duì)不同的修辭手段進(jìn)行特定的標(biāo)記。
語料庫(kù)對(duì)齊主要是對(duì)句子劃分和句子編碼。一般需要先完成中英文句子劃分, 然后將文本導(dǎo)入Tmxmall 和ABBYY 在線對(duì)齊。然而, 由于旅游文本的翻譯往往不完全符合逐句翻譯的原則。因此,軟件并不能完全對(duì)應(yīng)這種情況。研究者需要在英語和漢語中分配代碼, 即在句子的開頭和結(jié)尾分別添加 , 這樣才能準(zhǔn)確地形成相應(yīng)的文本, 才能保證文本對(duì)齊準(zhǔn)確率。
由于旅游翻譯的特殊性, 缺乏對(duì)旅游地點(diǎn)歷史、 人文、 景觀等方面的深入探析, 且缺少規(guī)范標(biāo)準(zhǔn)參考。對(duì)于大篇幅文本來說, 人工編碼是一個(gè)龐大的工程, 不僅需要標(biāo)注大量的漢英詞性, 更難的是標(biāo)注修辭用法。很多學(xué)者耗費(fèi)大量精力所構(gòu)建的旅游翻譯語料庫(kù)卻應(yīng)用性極低, 資源極度浪費(fèi)。
語料庫(kù)的優(yōu)化和管理是在語料數(shù)據(jù)收集、 整理、 標(biāo)記、 對(duì)齊、 導(dǎo)入、 加工完成后的完善和應(yīng)用階段, 對(duì)于翻譯語料庫(kù)的廣泛使用尤為重要。
由于漢英平行翻譯語料庫(kù)的數(shù)據(jù)庫(kù)具有可移植性, 可分布式操作, 這給數(shù)據(jù)庫(kù)管理帶來了新的問題。語料庫(kù)處理的數(shù)據(jù)量巨大, 通常有很多人同時(shí)處理數(shù)據(jù)。由于(數(shù)百萬條記錄)數(shù)據(jù)量巨大, 數(shù)據(jù)維護(hù)層次多, 數(shù)據(jù)并發(fā)處理能力突出, 應(yīng)建立適合數(shù)據(jù)維護(hù)的管理機(jī)制。該過程主要包括: 第一,創(chuàng)建數(shù)據(jù)維護(hù)日志, 記錄語料處理時(shí)間等操作信息; 第二, 語料庫(kù)數(shù)據(jù)的備份存儲(chǔ)與完全恢復(fù)。為避免軟、 硬件崩潰造成的數(shù)據(jù)丟失, 同時(shí), 將數(shù)據(jù)備份到臨時(shí)服務(wù)器并及時(shí)恢復(fù); 第三, 利用數(shù)據(jù)庫(kù)本身在數(shù)據(jù)系統(tǒng)安全方面設(shè)置功能。為了避免網(wǎng)絡(luò)攻擊, 保證信息安全和數(shù)據(jù)不丟失, 必須對(duì)用戶操作進(jìn)行加密; 第四, 當(dāng)數(shù)據(jù)不能在一臺(tái)計(jì)算機(jī)上操作和執(zhí)行時(shí), 采用工作組機(jī)制和分布式操作。
系統(tǒng)硬件故障、 軟件故障、 病毒以及誤操作都會(huì)使語料庫(kù)遭到破壞。語料庫(kù)管理程序必須保證數(shù)據(jù)能夠被恢復(fù)。因此, 必要的數(shù)據(jù)備份必不可少, 語料庫(kù)管理程序應(yīng)提供數(shù)據(jù)備份功能。這就需要多學(xué)科交叉融合研究, 語料庫(kù)的完善必須借助計(jì)算機(jī)應(yīng)用, 實(shí)現(xiàn)其功能和價(jià)值。
隨著我國(guó)綜合實(shí)力的不斷增強(qiáng), 國(guó)際影響力的不斷提升, 旅游業(yè)發(fā)展日益蓬勃。根據(jù)《中國(guó)入境旅游發(fā)展年度報(bào)告2020》, 我國(guó)在2019 年接待入境游客達(dá)1.45 億人次, 同比增長(zhǎng)2.9%[17]。入境游客與日俱增, 但是與旅游業(yè)相關(guān)的基礎(chǔ)配套設(shè)施及服務(wù)卻跟不上, 尤其在景區(qū)標(biāo)識(shí)語、 景點(diǎn)概況、 展品介紹等方面的英文翻譯存在巨大的問題。例如, 我國(guó)陜西省西安市作為國(guó)家乃至世界聞名的歷史文化名城, 曾在其著名的大雁塔旅游景點(diǎn)中對(duì)古代“藥王”孫思邈的英文簡(jiǎn)介中使用了“drug king”。雖然drug 的語義為藥物, 但是還有麻醉、 毒品等語義。以CNKI 檢索為例, 在專業(yè)詞典《漢英社會(huì)科學(xué)大詞典》中釋義為“毒品”[18], 因此, 從社會(huì)角度來看, 普遍理解為毒品。如果“藥王”被解讀成“毒王”, 豈不成笑話。雖然該景區(qū)緊急將譯文撤下,但還是在網(wǎng)絡(luò)上引起了不少的輿論。此外, 還有語法問題、 語用習(xí)慣、 文化差異等造成的翻譯亂象,進(jìn)而對(duì)旅游宣傳、 歷史要素、 人文情懷、 景觀環(huán)境等翻譯不準(zhǔn)確、 表達(dá)不到位, 對(duì)我國(guó)文化輸出和國(guó)際文化交流形成巨大的阻礙。
因此, 全力引導(dǎo)旅游翻譯語料庫(kù)的構(gòu)建, 可以為旅游及相關(guān)行業(yè)提供翻譯依據(jù), 從而使旅游翻譯語料成為國(guó)際通識(shí)。
導(dǎo)游人員作為旅游活動(dòng)的直接輸出者, 極大程度影響了參觀游覽者對(duì)景區(qū)及其文化的理解和感受, 進(jìn)而對(duì)中國(guó)文化的輸出也起到了很大的影響。目前, 我國(guó)涉外導(dǎo)游員的語言水平參差不齊, 大部分外語導(dǎo)游只能夠?qū)皡^(qū)的各個(gè)景點(diǎn)做翻譯式的講解, 而涉及專業(yè)領(lǐng)域如歷史背景、 建筑結(jié)構(gòu)等方面的介紹就顯得力不從心。究其原因, 主要是因?yàn)樵诼糜畏g領(lǐng)域沒有統(tǒng)一的翻譯標(biāo)準(zhǔn), 能夠借鑒的語言材料也僅僅來源于景區(qū)的英文介紹、 現(xiàn)有相關(guān)出版物及導(dǎo)游之間的口口相傳和經(jīng)驗(yàn)總結(jié)。例如,在山西省旅游類院校講授山西英文導(dǎo)游詞所使用的教材和大部分參加山西省導(dǎo)游員資格考試的英語口試所使用的參考書目均為2014 年由旅游教育出版社出版的《山西英語導(dǎo)游》。該書作者張杰、 郝從容兩位老師在各自專業(yè)領(lǐng)域, 通過理論結(jié)合實(shí)踐, 將多年實(shí)際帶團(tuán)中使用到的語言結(jié)合專業(yè)理論而形成的較權(quán)威的山西景點(diǎn)英文介紹, 在山西省內(nèi)使用率非常高。但是, 該書中仍然存在部分專有名詞前后翻譯不一致, 與景區(qū)的官方翻譯存在差異等問題。
因此, 在目前的旅游翻譯教學(xué)中, 急需通過專業(yè)的、 標(biāo)準(zhǔn)的、 統(tǒng)一的旅游翻譯語料庫(kù)平臺(tái)輔助教學(xué), 對(duì)教師教學(xué)、 學(xué)生自學(xué)、 學(xué)者研究均具有極大的參考價(jià)值, 有助于提升語料庫(kù)的應(yīng)用效率。
在科技不斷進(jìn)步的背景下, 旅游與科技的融合已成為趨勢(shì)。虛擬現(xiàn)實(shí)、 人工智能等新技術(shù)的發(fā)展, 為旅游業(yè)創(chuàng)造了更多具有互動(dòng)性和沉浸感的旅游體驗(yàn)。目前, 已有許多國(guó)家加強(qiáng)旅游業(yè)數(shù)字化建設(shè), 將景點(diǎn)或展品放到網(wǎng)上, 為游客提供更為豐富的旅游互動(dòng)體驗(yàn)和智能化服務(wù)。我國(guó)在這方面也一直穩(wěn)步前進(jìn), 例如, 我國(guó)許多5A 級(jí)景區(qū)的官方主頁(yè), 都提供數(shù)字化游覽的專欄。但是, 縱觀各類網(wǎng)站雖有語言的轉(zhuǎn)換, 但在切換到英文界面后, 大多數(shù)網(wǎng)站只是對(duì)景區(qū)概況、 網(wǎng)頁(yè)副標(biāo)題等內(nèi)容做了翻譯, 而對(duì)于具體景點(diǎn)和展品的英文介紹卻屈指可數(shù)或者沒有呈現(xiàn)。
以數(shù)字化建設(shè)走在國(guó)內(nèi)最前列的故宮博物院為例, 英文版的網(wǎng)站界面已經(jīng)做到非常詳實(shí), 在參觀導(dǎo)覽、 展品介紹、 文化活動(dòng)等方面的內(nèi)容都基本和中文界面相匹配。但是, 在數(shù)字文物庫(kù)的英文界面下只是將一些功能區(qū)域進(jìn)行了翻譯, 而對(duì)于展品的名稱卻沒有做翻譯。展品名稱翻譯的缺失, 必定會(huì)降低外國(guó)客人游覽網(wǎng)站的體驗(yàn)感, 同時(shí), 對(duì)于我國(guó)文化的輸出也產(chǎn)生了一定的阻礙性。展品英文名字的缺失, 一方面是因?yàn)檎蛊窋?shù)量巨大(搜索結(jié)果為8 萬多件展品)而阻礙了相應(yīng)的翻譯工作, 另一方面是對(duì)于各類展品的具體翻譯術(shù)語是否有標(biāo)準(zhǔn)可依, 翻譯是否準(zhǔn)確所帶來的翻譯不確定性而造成的結(jié)果。由此可見, 旅游翻譯語料庫(kù)的建設(shè)可以為旅游業(yè)的數(shù)字化建設(shè)提供有效的制度保障。
由于語言研究的復(fù)雜性和超難度, 政府、 企業(yè)、 教育、 相關(guān)行業(yè)協(xié)會(huì)需要多主體合力, 形成頂層設(shè)計(jì)框架體系, 通過具體的政策、 方針展開布局, 承上啟下引導(dǎo)旅游這一特色類、 專門性翻譯語料的全面開展[19]。雖然建構(gòu)旅游翻譯語料庫(kù)存在體系龐大、 內(nèi)容龐雜, 實(shí)操困難等問題, 但是“千里之行始于足下”, 在科技信息大爆炸時(shí)代, 使旅游翻譯有據(jù)可依, 為旅游翻譯提供信息化、 制度化的保障, 對(duì)于旅游業(yè)的發(fā)展和文化傳播具有重大且深遠(yuǎn)的意義和價(jià)值[20]。
綜上所述, 旅游翻譯語料庫(kù)的構(gòu)建, 特別是在多模態(tài)話語分析的框架下, 對(duì)于傳播中華文化具有重要的意義。雖然旅游翻譯在連接不同文化和推廣旅游業(yè)方面發(fā)揮著關(guān)鍵作用, 但目前的翻譯實(shí)踐卻存在不一致和不規(guī)范的問題。因此, 建立一個(gè)更加科學(xué)和標(biāo)準(zhǔn)化的旅游翻譯語料庫(kù)就顯得極為迫切。構(gòu)建旅游翻譯語料庫(kù)的關(guān)鍵步驟, 包括數(shù)據(jù)的收集、 整理、 標(biāo)注和管理, 還要考慮到文化內(nèi)涵的準(zhǔn)確傳達(dá)和語言的地域特色。此外, 這種語料庫(kù)在實(shí)際應(yīng)用中還具有一定的潛力, 如為旅游業(yè)提供準(zhǔn)確的翻譯參考, 為翻譯教學(xué)提供豐富的資源, 以及促進(jìn)文化的有效傳播。總之, 通過跨學(xué)科合作和社會(huì)各界的共同努力, 旅游翻譯語料庫(kù)的不斷完善可以顯著提升旅游翻譯的質(zhì)量, 進(jìn)而增強(qiáng)中華文化在國(guó)際舞臺(tái)上的影響力。