任敬輝
(吉林建筑大學城建學院,吉林長春130111)
20世紀90年代以來,伴隨著計算機和語料庫技術的蓬勃發展,以語料庫為基礎的科學研究方法引入翻譯研究,使其突破了單一學科的界限,進入了多元化發展時期。英國的語料庫翻譯研究先驅Baker(1993)認識到這種以理性數據為基礎的翻譯實證研究有別于傳統的主觀分析,具有很強的科學性與客觀性。在她的影響下,越來越多的國外翻譯學者將語料庫技術應用于翻譯考察,使基于語料庫的翻譯研究逐漸興起。相比之下,國內的語料庫翻譯研究于90年代末才逐漸興起,起步相對較晚,研究方法模糊,且探索性研究居多。直到2007年,國內學者王克非、黃立波明確提出“基于語料庫的翻譯研究,亦可稱為語料庫翻譯學,它以語言理論和翻譯理論為研究上的指導,以概率和統計為手段,以大規模雙語真實語料為對象,采用語內對比與語際對比相結合的方法,對翻譯現象進行歷時和共時的描寫和解釋”。至此國內對于基于語料庫的研究方法才有了更明確的認識。
近年來,隨著計算機技術的發展和語料庫知識的普及,基于語料庫的實證研究炙手可熱,相關研究成果逐年增加。為了更好地把握近幾年國內語料庫翻譯研究發展的整體脈絡,厘清該領域研究的熱點問題,洞察和探索語料庫翻譯學的前沿,筆者對國內基于語料庫的翻譯研究進行了系統梳理,考察了2007-2013年相關領域的研究成果,以期對今后的相關研究提供借鑒和參考。
本研究主要通過中國期刊全文數據庫(CNKI)進行數據搜索,文獻來源主要包括2007-2013年陸續發表的國內期刊論文、碩博論文、會議論文三大類文獻。筆者首先以“基于語料庫”作為關鍵詞進行初步搜索,在初步獲得的文獻中再以“翻譯”作為研究主題進行二次篩選,在此基礎上通過排除重復文獻,共計得到文獻664篇。
圖1 2007-2013年語料庫翻譯研究相關文獻統計
在近7年間,語料庫翻譯研究發展起伏不均,大致呈現前期發展迅猛、中后期走低、后期平穩增長的趨勢(圖1)。首先,2007-2010年相關研究逐年遞增,由最初不足百篇上升到2010年的152篇,突出反映了語料庫翻譯研究從20世紀90年代末進入中國后經歷了將近10年的發展探索,逐漸被國內學者接受,并日漸成為研究熱點。2010年后,隨著前期語料庫技術的普及,語料庫翻譯學科從研究的角度和深度上對國內學者提出了更高的要求,這也說明國內相關研究已經度過了前期科普性的狂熱發展時期,進入到深入探索階段,這無疑昭示著國內該領域在未來幾年的縱深發展潛力。
為了保證數據質量,筆者又對數據來源進行再次定位,統計出核心期刊論文發表數量。由圖2可見,核心期刊論文發表數量大致與圖1所示的語料庫翻譯研究文獻統計走勢趨于一致。此外,國內相關碩博論文成果近3年來逐漸上升。
圖2 歷年數據來源統計
高一虹等(2000)將語言學研究方法歸類為量化研究、質化研究和非材料性研究,前兩者統稱材料性研究。材料性研究即以系統的、有計劃的材料采集和分析為特點的實證研究;非材料性研究指不以系統采集的材料為基礎的研究(宋洪波等,2013)。基于此,為歷時考察語料庫翻譯研究方法的變化趨勢,筆者借鑒前人的分類標準,對相關文獻按照研究方法進行統計梳理(圖3)。
圖3 研究方法統計
總體上,非材料性研究數量多于材料性研究,材料性研究數量逐年顯著增長。此結論與高一虹等對國內語言學研究方法的調查結果趨于一致,即非材料性研究歷來占據絕對優勢,但是隨著材料性研究逐年上升,兩者差距逐漸縮小。語料庫翻譯學作為新興學科,理論介紹、方法論探索、綜述研究等歷來占據著該學科的研究熱點,所以非材料性研究長期占據較大比重,這種模式呈持續發展趨勢。
圖4 基于語料庫的翻譯研究話題核心期刊文獻統計
筆者就核心期刊相關領域論文進一步檢索,發現基于語料庫的翻譯研究在翻譯教學、翻譯綜述、語料庫建設等方面都取得了顯著的成果(圖4)。其中,語料庫翻譯學在教學領域里的研究成果最為突出。此外,口譯語料庫研究、機器翻譯等領域也日益占據著研究熱點。下面將對基于語料庫的翻譯研究在各個領域的研究現狀分別進行探討。
綜合來看,國內基于語料庫的翻譯教學研究相較之前數量少、宏觀論述居多的特點已經在理論與實踐應用上都取得了一定的突破。研究領域主要涉及語料庫建設與翻譯教學實踐、基于語料庫構建翻譯教學理論框架以及基于語料庫的翻譯教材建設等。
如何使語料庫技術更好地服務于翻譯教學活動,一直以來都是學者們研究的熱點之一。根據語料庫建設的不同類型,國內目前的相關研究大致可分為3個層次:雙語對應語料庫的建設、單語語料庫與翻譯教學的結合以及自建學習者翻譯語料庫。王克非(2009)從技術角度闡述了服務于翻譯教學的雙語對應語料庫的加工與處理。李德超等(2011)進一步將雙語對應語料庫研究與具體的翻譯教學活動相結合,提出了可供參考的教學方案。劉澤權等(2009)自建學習者譯本語料庫,并建立了一套基于語料庫的翻譯教學模式與譯作評析體系,有助于學生掌握翻譯技巧、實現學習目標。此外,基于語料庫的翻譯教學理論探索也被學者廣泛關注。黎士望(2007)從文本的話語功能出發,詳細闡述了基于語料庫的翻譯教學模式在現行教學模式中所具有的實際意義,并提出了可行的教學方案。
考察近7年核心期刊論文,基于語料庫的概述類研究主要涉及3個方面:書評、理論綜述、研究現狀調查。2007年之前,該領域焦點主要集中于書評和會議綜述。隨著基于語料庫的翻譯研究數量增多,理論探索和研究現狀的概述逐漸興起。
語料庫翻譯理論的研究是語料庫翻譯學發展的基礎。劉澤權(2008)從顯化假說、顯化定義、顯化類別等多個角度對國內外基于語料庫的顯化研究成果進行了全面的介紹。王克非(2012)綜合評價了國外雙語語料庫的研制與應用情況,指出了其發展的局限性,為國內雙語語料庫研究提供了新思路。基于語料庫的翻譯現狀調查研究可歸納為兩個層次:會議綜述和文獻綜述。胡開寶(2010)在2007年語料庫與譯學研究國際學術研討會上總結了語料庫與譯學研究的趨勢與問題,指出應加強譯學的跨學科研究特性。在文獻綜述方面,國內學者主要考察了2010年以前的國內語料庫翻譯的研究現狀,但是對口譯語料庫的研究甚少。書評方面主要還是以概述內容、歸納主導思想為導向。
近7年來,國內相關領域研究按照語料庫類型,大致可以分為專門語料庫和通用語料庫的建設,此外英漢雙語平行語料庫的建設仍然是研究熱點之一。專門語料庫根據應用類型囊括了戲劇、小說、教學、詞匯等范疇。胡開寶(2009)等詳細闡述了莎士比亞戲劇英漢平行語料庫前期語料搜集和語料預處理的建設過程,并從譯者風格比較、譯本共性研究、虛擬語氣等多個角度分析了該平行語料庫的應用情況。黃立波(2013)介紹了中國現當代小說漢英平行語料庫的設計理念和原則、語料特點以及基于此語料庫的翻譯文體學應用研究情況。在通用語料庫的建設上,國內學者對語料的標記、加工等預處理環節著墨頗多。李文中(2012)介紹了中國英語語料庫建設的三大模塊,總結了遇到的難題及解決方案,并對語料標注的爭議觀點進行了概述,為語料庫標注與標記系統提供了可選擇方案。
結合王斌華(2012)和張威(2013)對基于語料庫的口譯研究梳理以及對近7年相關核心期刊論文進行的文獻統計,筆者重新梳理了口譯語料庫話題研究的分類,將口譯策略相關研究歸類為基于語料庫的研究方法。此外,因對口譯語言特征的研究主要涉及翻譯共性的成因探討,故將口譯語言特征與翻譯共性研究歸為一類。基于語料庫的口譯教學研究涉及口譯教材的建設以及口譯教學策略方面的探討。陶友蘭(2010)通過對全國口譯教學現狀調查,總結了當今的口譯教材編寫模式缺乏客觀的科學依據、作者主觀經驗接入居多等缺陷,并構想了一個口譯教學體系,為口譯人員的培養提供了新視角。陳振東(2009)等結合網絡資源和語料庫對口譯教學的輔助作用,提出了基于網絡語料庫的口譯教學模式,增強了師生之間的交流與溝通。目前口譯語言特征的研究主要基于胡開寶等人建立的漢英會議口譯平行語料庫(CECIC)進行,研究焦點針對語篇的翻譯共性特征,旨在提高口譯語料庫的應用空間。CECIC以新聞發布會為主要語料來源,包括新聞發布會英語原創語料、新聞發布會漢英平行語料及政府工作報告漢英平行語料3個子庫(胡開寶,2010)。在基于口譯語料庫的研究方法探索上,理論研究與實證研究平分秋色。張威(2013)詳細探討了口譯語料庫的主要原則,辨析了口譯語料庫的3個設計方案和可采用的統計方法,客觀地評價了口譯語料庫研究方法存在的缺陷,對今后進一步完善語料庫技術和研究策略具有重要意義。
翻譯共性亦稱翻譯普遍性,“即指翻譯語言作為一種客觀存在的語言變體,相對于目標語原創語言,在整體上表現出來的一些規律特征。”(吳昂等,2006)。目前對于翻譯共性具體包含的內容尚沒有統一意見,但相關研究基本傾向于將翻譯共性歸納為簡化、顯化和范化3個方面。吳昂等(2006)曾將翻譯共性研究劃分為前語料庫時期和基于語料庫兩個時期分別進行評述。本文借鑒此研究方法,通過對近7年相關文獻進行考察,發現國內翻譯共性研究基本從屬于基于語料庫時期,內容主要是對顯化特征在各種平行語料庫中的實證檢驗。牛桂玲(2013)借助雙語平行語料庫和單語類比語料庫的研究模式,探討了中國學術期刊論文漢譯英摘要顯化的特點。應當指出,目前基于語料庫的翻譯共性研究還是局限于平行對比和可比類比兩種模式,且顯化研究依賴于具體語料,部分個案研究的結果并不具有共性特征。
基于語料庫的機器翻譯是以語料庫應用為核心,將原文通過既定模型轉換為譯文的解碼過程。對近7年相關文獻進行歷時考察,發現機器翻譯經歷了最初的理論綜述階段后逐步深入到自動化翻譯評估及提高譯文質量的探索階段。肖維青(2007)結合平行語料庫技術在機器翻譯領域的應用研究成果,對語料庫應用翻譯研究進行了綜述介紹,拓寬了國內翻譯研究的視野。羅季美等(2012)基于汽車文獻翻譯語料庫,從詞匯、句法和符號等層面對機器翻譯的典型錯誤進行了描述分析,為提高英漢機器翻譯質量、提升翻譯效率提供了理論基礎。
語料庫翻譯學自20世紀90年代逐步在中國興起,經過數10年的探索,國內基于語料庫的翻譯研究在近7年間呈現了新的發展趨勢。總體上,研究數量逐年上升,并逐漸進入平穩發展時期,向深層次探索邁進;在研究方法上,雖然非材料研究依舊占據主體,但與材料性實證研究的數量差距正逐步縮小;研究方向呈現多樣化勢頭,傳統的譯學研究領域如翻譯教學、譯者風格、翻譯共性等領域的研究熱度不減,但語料庫技術開發、口譯語料庫建設及機器翻譯等新興領域亦逐漸嶄露頭角。不容忽視的是,取得豐碩成果的同時,國內基于語料庫的翻譯研究仍然存在以下亟需解決的問題。
第一,技術有待提高。語料庫的建設尤其是雙語平行語料庫的建設具有較高的難度,將耗費大量的人力、物力,需要專業的研究團隊及科研資金作支持。相比國外雙語庫建設的多樣化,國內已建成的大規模平行語料庫,主要有王克非負責開發的通用漢語對應語料庫、胡開寶主持研制的莎士比亞戲劇英漢平行語料庫及漢英會議口譯平行語料庫、黃立波負責的中國現當代小說漢英平行語料庫等。而且這些語料尚未能實現資源共享,大大地阻礙了語料庫翻譯學的發展。此外,目前的語料庫軟件還不能完全滿足語料的標注、加工等預處理環節的需求;語料庫軟件的詞語索引功能只能呈現出具體詞匯在短語或句法層面下的語境共現,對于篇章范疇的語境分析還不能實現。
第二,基于語料庫的翻譯研究在研究的廣度和深度上有待突破。總結近幾年的研究方向不難看出,語料庫翻譯學的研究廣度有限,主要集中于翻譯教學、語料庫建設、譯者風格及翻譯共性等傳統譯學研究領域,而口譯研究、機器翻譯、翻譯文體學等領域雖取得了一定成果,但仍然落后于其他研究領域,不能滿足語料庫翻譯學發展的需求。諸如基于語料庫的口譯研究在口譯教學策略、口譯語料庫建設、口譯語言評估等問題上的探索缺乏系統性,遠遠落后于筆譯研究;結合文體學視角與語料庫語言學進行的翻譯描寫研究在文本選擇上仍然多局限于文學作品,其他體裁如商務、科技、法律等應用文體的研究鮮有涉足,并且語料規模較小,缺乏代表性與真實性。此外,對具體語言特征的研究還不夠深入,多停留于詞匯、句法、篇章等幾個范疇的數據描寫分析,從文化、認知等深層次內因的解讀還十分匱乏。
第三,基于語料庫的翻譯研究在研究方法上有待創新。目前,國內基于語料庫的翻譯研究存在定量分析描寫為主、定性分析解釋不深入的缺陷。Croft(1990)將語言的共性研究歸納為3個層次:(1)以平行語料庫為基礎的描寫層面;(2)基于單語類比語料庫從語言內部及跨語言角度進行的內部歸納;(3)外部解釋層面,即從社會學、文化、認知心理等學科角度對語言現象進行更高層次的解釋。國內目前相關語言現象研究基本停滯于第二個層面,更多的還是遵循可比和類比兩個研究模式,對語料進行描寫和歸納,但語言外部解釋,諸如從認知、社會等角度對語言現象根源的探索還不夠深入。
經過多年的發展,國內語料庫翻譯學展現出方興未艾的發展勢頭,新興的語料庫技術為傳統的翻譯研究賦予了生命力,使譯學研究實現了跨學科的融合和拓展,并在翻譯教學、口譯等多個領域的研究取得了碩果。但是,不容忽視的是,現階段基于語料庫的翻譯研究仍然存在一些局限性,如在技術層面有待提高、研究的廣度和深度亟待突破、研究方法有待創新等。未來語料庫翻譯學科的進一步發展還需要依靠語料庫技術的提升和語料庫建設規模的擴大,相信基于語料庫的翻譯研究體系必將逐步完善,蓬勃發展。
[1]Baker,M.Corpus Linguistics and Translation Studies:Implications and Applications[C]//In M,Baker,G.Francis and E.Tognini- Bonelli(eds.).Text and Technology:In Honour of John Sinclair.Philadelphia and Amsterdam:John Benjamins,1993:233-250.
[2]Croft,W.Typology and Universals[M].Cambridge:CUP,1990.
[3]陳振東,李瀾.基于網絡和語料庫的口譯教學策略探索[J].外語電化教學,2009(1):9-13.
[4]高一虹,吳紅亮.關于外語教學研究方法的調查[J].外國語,2000(1):65-71.
[5]黃立波.基于英漢/漢英平行語料庫的翻譯共性研究[M].上海:復旦大學出版社,2007.
[6]黃立波.中國現當代小說漢英平行語料庫:研制與應用[J].外語教學,2013(6):104-109.
[7]胡開寶,鄒頌兵.莎士比亞戲劇英漢平行語料庫的創建與應用[J].外語研究,2009(5):64-71.
[8]胡開寶,陶慶.漢英會議口譯語料庫的創建與應用研究[J].中國翻譯,2010(5):49-56.
[9]李德超,王克非.基于雙語旅游語料庫的DDL翻譯教學[J].外語電化教學,2011(1):20-26.
[10]黎士望.語料庫與翻譯教學[J].中國科技翻譯,2007(3):46-49.
[11]李文中.語料庫標記與標注:以中國英語語料庫為例[J].外語教學與研究,2012(3):336-345.
[12]劉澤權,侯羽.國內外顯化研究現狀概述[J].中國翻譯,2008(5):55-58.
[13]劉澤權,劉鼎甲.多媒體計算機技術與語料庫方法運用于翻譯教學改革的嘗試[J].外語與外語教學,2009(8):27-30.
[14]羅季美,李梅.機器翻譯譯文分析[J].中國翻譯,2012(5):84-89.
[15]牛桂玲.基于語料庫的中國學術期刊論文摘要漢英翻譯顯化特點分析[J].西安外國語大學學報,2013(2):110-116.
[16]宋洪波,王雪利.近十年國內語料庫語言學研究綜述[J].山東外語教學,2013(3):41-47.
[17]陶友蘭.基于語料庫的翻譯專業口譯教材建設[J].外語界,2010(4):2-8.
[18]王斌華.語料庫口譯研究——口譯產品研究方法的突破[J].中國外語,2012(3):93-99.
[19]王克非,熊文新.用于翻譯教學與研究的英漢對應語料庫加工處理[J].外語電化教學,2009(6):3-9.
[20]王克非.語料庫翻譯學探索[M].上海:上海交通大學出版社,2012.
[21]吳昂,黃立波.關于翻譯共性的研究[J].外語教學與研究:外國語文雙月刊,2006(5):296-302.
[22]肖維青.平行語料庫與應用翻譯研究[J].中國科技翻譯,2007(3):25-28.
[23]許明武.口語教學語料的難度甄別:功能語篇分析視角[J].中國翻譯,2013(6):29-33.
[24]張威.口譯語料庫研究的原則與方法[J].外語電化教學,2013(1):63-68.