(江西理工大學外國語學院,江西 贛州 341000)
自20 世紀90 年代以來,以語料庫語言學和描寫性譯學為基礎,語料庫翻譯學作為一種新的研究范式在譯學界興起。而后,國內外相繼建立不同規模和語種的語料庫,產出大量研究成果。本文梳理語料庫翻譯學形成之前學界的實踐和理論成果,回顧語料庫同翻譯學相結合的發展基礎,以增進對語料庫翻譯學的理解。
語料庫是真實語言材料的集合。在形式上,語料庫經歷了不同時代背景下的變化。在計算機技術飛速發展之前,語料文字以卡片形式記載于紙質實體。制作過程繁瑣,占用空間大,查詢速度慢,襯托出后來計算機語料庫占用空間小、存儲容量大、檢索語料便捷的優勢。
計算機語料庫的優勢促成它在語言教學、詞典編纂、語言特征研究等領域的重要角色。20世紀60年代,美國布朗大學建立Brown Corpus,庫容百萬詞,語料由1961 年各類出版物中的美式英語構成,該庫后來被用于計算語言學研究。20 世紀70 年代,以Brown 語料庫為參照,LOB 語料庫的創建在英國啟動。與美式英語Brown 語料庫相對應,LOB 語料庫以英國英語語料為來源,語料規模和題材類別同Brown 語料庫大體一致,涵蓋15 個文本類型的材料,兩庫區別在于編碼系統不同。LOB 語料庫以英國英語為特色,它與Brown 語料庫構成英語兩大變體語料的龐大資源庫,使得英美式英語間更深層次的研究成為可能。
此外,語料庫龐大的真實語料資源,提升了詞典的編纂質量。1980 年,英國伯明翰大學啟動一項詞典編纂項目,在詞典市場激烈的競爭環境下,語料庫幫助他們開辟一條新路。最初計劃建立700 萬詞的語料庫,后來擴充到2000 萬詞。詞典編者放棄傳統的人工翻閱、自編例句的方法,轉而從庫中快速檢索語言材料提取例句,分析詞匯搭配、文篇句法、語用特點等規律,在詞條釋義中增補語境、色彩等信息。另外,該庫語料多取自當時英國出版的暢銷書、BBC 錄音材料等,客觀真實地反映了當代英語的使用現象,這些因素促成詞典的成功編纂。1987 年,經伯明翰大學和柯林斯出版公司共同努力,柯林斯(Collins)詞典出版,獲得語言學界和語言學習者的認可。
計算機語料庫的誕生讓語言學家、詞典編者有了得力工具,不僅提高了研究工作效率,也極大擴展了研究工作的創新空間。
在信息和知識爆炸的時代,大量涌現的信息流讓人們意識到傳統語言處理工具和方法的局限性,借助計算機處理大規模語言文字的方式應運而生,自動分詞、詞性標注、話語分析相繼實現。
計算語言學的發展催生了語料庫語言學的形成,語言學界開始研究建立語料庫,對大規模語料進行加工、檢索、分析。一般認為,語料規模越大,詞句數量越多,基于這些材料統計出來的數據越能排除偶然性,說服力越高。隨著計算機技術進步和研究熱點不斷出現,已建和在建的語料庫容量越來越大。20 世紀60、70 年代建立的Brown 語料庫和LOB 語料庫僅有100 萬詞的規模,現今分別收錄美國英語和英國英語的COCA 語料庫和BNC 語料庫容量達到10 億詞和1 億詞。
用于語言研究的語料必須通過加工,附加上語言特征信息,才能對后續的研究統計提供數據支撐。通過詞性賦碼、句法分析,原始語料具備更高研究價值。針對英語語料的加工,英國Lancaster 大學在20 世紀80 年代組建研究中心UCREL,開發CLAWS 詞性賦碼系統及句法分析系統。80 年代,上海交通大學建立庫容百萬詞的JDEST 科技英語語料庫,對英語國家科技出版物中的英語語言特點進行探索。
通過詞性賦碼和句法分析為原始文本補充詞性、語用等信息,結合語料檢索軟件的檢索、統計功能,可以得到詞頻表、平均句長等數據,基于這些數據可以從語料中總結出語言規律和特征,如近義詞對比研究、語體研究、搭配結構研究等,這些研究成果顯著擴展了語言學理論,助推了語言學發展。
經近些年發展,除主流的英語語料庫,其他語言語料庫的建設不斷進行。國內建設的漢語語料庫,比如北京語言大學語料庫中心建設的BCC 語料庫,和北京大學中國語言學研究中心建設的CCL 現代漢語語料庫。大型漢語語料庫的建設將為基于語料庫的漢語語言學的發展奠定物質基礎。
語料庫在語言學領域大顯身手,而它與翻譯學的結合則歸功于翻譯描寫學派。在描寫翻譯學誕生之前,規定性翻譯研究一直占據著譯學界的指導性地位,但因其自我禁錮在語言的單一范疇內,而受到了后來的描寫學派的解構。
20 世紀50 年代,描寫翻譯學派的思想開始萌芽。麥克法蘭(MacFarlane)發表論文認為,同一部作品,沒有唯一正確的翻譯,從不同角度理解源文造就了多樣的譯文,我們應該接受這些譯文,并尋找一種方法研究它們。規定性翻譯理論把翻譯看作語言的藝術,通過預設翻譯技巧、原則,把翻譯這一活動圍在語言的圈子里。然而,翻譯活動是復雜的,翻譯現象也是復雜的,現實中存在著規定性譯論無法解釋的現象。描寫學派把研究翻譯的視角從單一的語言上脫離開,將翻譯置于歷史文化語境下,探討某個翻譯為何產生、翻譯文本在譯語社會環境中產生何種影響等問題。而后,在翻譯描寫學派中出現文化轉向(culture turn),研究話題涉及權力、女性主義、后殖民主義等。
到了80 年代,以色列翻譯理論家圖里(Toury)積極推動描寫翻譯研究向前發展,他繼承霍爾姆斯的譯學構想,發揚其中“描寫翻譯研究”的觀點,并以佐哈爾的“多元系統理論”為支撐,提出一套翻譯描寫模式。讓“描寫研究”不再流于理論的泛泛而談,而是成為了有具體操作步驟可以參考的方法論。在“分析—對比—概括”這一描寫模式中,對比是將源文本和譯語文本中匹配對進行比較,考察源語變換成譯語時出現何種偏離或變異,把這些偏離歸納總結,概括出蘊含在此種現象之下的翻譯理念,作出進一步的研究。此外,圖里認為描寫翻譯研究的功能不僅在于翻譯現象的描寫、解釋,同時在于利用描寫可以檢測理論上的假說是否成立,是驗證假說的一種方式。
圖里提出的翻譯描寫模式是翻譯學的重要進展,提高了描寫翻譯研究的可操作性,后學在遵循這一模式下,產出眾多研究成果。然而,描寫研究涉及大量源語文本和譯語文本的語言對比,這一龐大的工作量給翻譯學者的研究工作帶來不小挑戰。
語料庫在語言學研究中表現出色,同時,描寫翻譯研究又提出處理大量翻譯相關語言文本的需求,兩者共同促成語料庫翻譯學的誕生。20 世紀90 年代初,以Mona Baker 發表Corpus Linguistics and Translation Studies:Implication and Applications 一文為標志,語料庫翻譯研究范式開始建立。利用計算機存儲和高效運算,對語料進行組織和賦碼,借助統計工具對詞匯、句段、篇章中非直觀的語言數據統計分析,把隱含在語言背后的翻譯決策、翻譯偏好,以數字等直觀的形式呈現出來,相比較傳統的內省式、誘導式的研究方法,語料庫方法提高了研究過程和結果的客觀性與科學性。
經數十年的發展,語料庫翻譯學研究課題不斷擴展,研究工具不斷更新升級。學者先后提出了翻譯共性假說、翻譯文體學等理論。正如圖里的觀點所言,翻譯描寫研究的功能不僅在于描述、分析翻譯現象,還在于檢測理論假設,驗證假說是否成立。隨著語料庫技術的不斷成熟,相繼有學者主持、參與建設了專門的大型語料庫,對普遍性假說進行驗證。如胡開寶(2009)利用莎士比亞戲劇英漢平行語料庫,對梁實秋、朱生豪、方平三位大家的莎劇中文譯本進行對比,研究不同譯者在翻譯同一部原作時表現出來何種獨特的譯者語言風格。
此外,語料庫翻譯學的研究課題還擴展到翻譯實踐研究、翻譯教學研究、口譯研究等領域。根據New directions in corpus-based translation studies 一書,國際語料庫翻譯學研究出現新趨勢:1) 過程研究與產品研究結合;2) 雙語轉向三語/多語;3) 研究視角轉向多元。借鑒國際新趨勢,語料庫翻譯學者將會呈現更多創造性研究成果。
回顧語料庫翻譯學誕生歷程,它是語料庫語言學和描寫翻譯研究兩個研究學科的結合。通過大規模源語和譯語語料的對比、分析,突破傳統語言視角,以更加客觀的結果呈現翻譯在歷史文化大環境下的樣貌,拓展了翻譯研究理論,作為一種研究范式將不斷發展。