齊金鑫
中山大學
語料庫與翻譯研究的結合始于20 世紀80 年代中期,時至今日已經取得長足的發展,業已成為翻譯學中的一個重要研究范式。國內、國外已出版多套語料庫翻譯研究叢書。如上海交通大學出版社推出的語料庫翻譯學文庫代表了國內該領域研究的最新成就,話題涵蓋翻譯共性、譯者風格、翻譯問題研究、搭配及翻譯教學等。Routledge 出版社出版的Routledge Advances in Corpus Linguistics和Routledge Studies in Empirical Translation系列從書中都有論及語料庫翻譯的專著。
量化分析和質化分析相結合是語料庫翻譯研究的一個重要特點。如果每個方法都得出了不同的結論,那么單個方法則不能反映某一現象的全部特征,因此多種研究方法需要結合起來,實現“多元互證”(triangulation)?!岸嘣プC”最初應用于社會學研究,可以分為:數據互證、調查者互證、理論互證和方法互證(Denzin,1978:295)。
語料庫翻譯研究雖然認識到綜合多種研究方法對得出的數據或結果進行多元互證的重要性,但是以此為基礎,不同類型語料庫數據和不同方法相結合的研究鳳毛麟角?!稊祿c方法多元互證在語料庫翻譯研究中的應用》(Corpus Triangulation: Combining Data and Methods in Corpus-Based Translation Studies)一書應運而生,作者馬拉馬蒂(Sofia Malamatidou)系英國伯明翰大學翻譯研究講師,發表論文多篇,涉及基于可比語料庫的翻譯研究(Malamatidou,2013)以及翻譯與語言接觸的關系(Malamatidou,2016、2017a)。
該書結合各類型語料庫(平行語料庫、可比語料庫、歷時語料庫以及共時語料庫等)數據與不同的量化方法、質化方法,研究與翻譯相關的現象,作者稱其為“語料庫多元互證模式”(corpus triangulation)。
該書在結構上分為兩大部分,每個部分為四個章節。第一部分主要為理論及模式構建,介紹了語料庫翻譯研究中多元互證模式的框架。第二部分為實證研究,作者基于上述框架,分析了翻譯語言的特點以及翻譯和語言變化之間的關系。
第一部分包括第一章至第四章。第一章簡要回顧了語料庫翻譯研究中多元互證的使用現狀及存在的不足,多元互證方法在翻譯研究中也有所論及(如Hansen, 2010; Saldanha & O’Brien, 2014)。但是這些研究并非真正的“多元互證”,而是不同數據和方法的臨時性結合,有諸多缺點與不足。作者認為現有翻譯研究中的多元互證可以分為兩類:一類是將各類型語料庫中所獲得的數據相結合,另一類是量化分析和質化分析相結合。
第二章對多元互證研究法進行了定義,并介紹了如何將其應用于語料庫翻譯研究。多元互證法來源于社會科學研究,現已被越來越多的學科所采用,包括社會學、醫學、教育學以及應用語言學和翻譯學。多元互證應該避免漫無目的地為了互證而互證,采用前應對該方法給研究帶來的好處有清楚的認識。多元互證不等于不同方法和視角的簡單疊加,其重要特征就是“融合”(integration),不同類型語料庫所獲數據的融合、不同方法的融合,這也是多元互證的目的所在。不同方法的融合并不意味著各自失去本身的特點,為的是解決同一個研究問題。這與現有很多研究存在差異:雖然使用了不同的方法,但每個方法解決的并非是同一研究問題,不同結論也鮮有討論,遮蔽了結論間相互沖突和不一致的地方。作者將這些概念引入到語料庫翻譯研究中,提出了“語料庫多元互證模式”,并將其分為兩類:語料庫數據互證和語料庫方法互證。當不同來源的數據有著同樣的研究焦點時,這些數據可以融合在一起,以獲得對同一現象的不同觀點,實現數據互證。數據互證可以進一步劃分為三類:時間、空間和人。研究結論取決于獲得數據的時間、場景以及過程中涉及的人。數據互證不僅是為了尋求數據的一致,更重要的是尋求數據所展現出的差異。數據互證的目的是為了理解數據所呈現出的差異并提出合理的解釋。方法互證則指的是用不同方法分析同樣的數據,每一個方法可以揭示研究對象的不同方面和維度。方法互證中需要一個占主導地位的研究方法,以確保研究結論的合理性,其他方法應該是進一步強化該研究。作者指出語料庫翻譯研究中的方法互證,量化研究應該是占主導地位的研究方法。研究問題在多元互證中起著中心的作用,研究問題的提出方式決定了語料庫的類型、如何設計語料庫以及如何展開分析。使用語料庫多元互證時,需要對要研究的語言特征有一個清晰的工作定義,否則從語料庫中獲得的數據可能會大相徑庭。特別是使用不同類型的語料庫時,相同的語言特征在不同的語言中可能會有不同的表現形式。與使用單一語料庫或方法相比,語料庫多元互證可以提供詳盡的數據,可以減少偏見,提高研究者對于結論的信心。但是需要注意的是,信心的提高并非意味著數據的萬無一失,而是因為多元互證法會產生豐富的數據信息。多元互證所帶來的可能的數據沖突需要研究者對結果更加深入的解釋。
第三章詳細介紹了各種語料庫類型和數據。作者在總結了語料庫翻譯研究中所使用的語料庫類型后,提出了“變量—值—屬性語料庫”(variables, values and attributes topology,即VVA)。所謂變量(variables)指的是語料庫類型、語言或時間等泛稱。變量可以被進一步賦予具體的值(values),比如可將語料庫類型細分為平行、可比語料庫等,語言可細分為單語、雙語等,時間可細分為歷時、共時。值也可以進一步被劃分為具體的屬性(attributes),比如具體的語言、具體的時間。按照此類型,如果一個語料庫被稱作comparable German-Russian corpus,出于完整和清晰的考慮,應該稱之為comparable bilingual (German-Russian) corpus,屬性可以放到括號里面,又如parallel bilingual (Italian-English) synchronic (2002-2003) corpus (news articles)。因此語料庫數據的互證可以通過將多種值和(或)多種屬性相結合來得已實現。這是一種全新的語料庫類型,既覆蓋全面,又具有很大靈活性,可以實現多種不同的組合,同時又能讓人對該語料庫的性質有直觀感受,是語料庫多元互證的基礎。語料庫翻譯研究如采用多元互證,研究質量和嚴謹性都會提升,結論的準確性和客觀性都會有所保證。
第四章詳細討論了語料庫研究方法多元互證,該方法可劃分為方法內多元互證(within-method)和方法間多元互證(between-method)。方法內多元互證指的是同一研究范式內部不同方法的結合,如不同的量化研究方法相結合或不同的質化研究方法相結合。方法間多元互證指的是不同研究范式的組合,如量化研究和質化研究相結合。語料庫翻譯研究中量化方法和質化方法相結合是慣例,因為在語料庫研究中,不可能只有質化方法。不同的量化方法在語料庫翻譯研究中鮮有結合,因此作者著重分析了量化方法如何在研究中相互補充。通過使用不同的統計方法詳細分析語料庫數據,可以實現語料庫方法的多元互證。語料庫數據的分析可以分為兩類:描述性數據分析(descriptive statistical analyses)和推斷性數據分析(inferential statistical analyses)。描述性數據是語料庫分析的基本部分,比如詞頻表、形符類符比等。推斷性數據則更進一步,可以檢驗不同數據的差異以及差異的顯著性。推斷性數據對于不同語料庫之間的相互對比是至關重要的。語料庫多元互證的一個重要特點就是兩種多元互證方法并不彼此排斥,方法內多元互證加上質化分析即可實現兩種方法的結合。
第二部分包括第五章至第八章。第五章、第六章是作者運用語料庫多元互證模式所進行的第一個實證研究。該研究使用900 萬詞的俄語原創文本、俄語翻譯文本和英語原創文本語料庫,基于語料庫多元互證模式考查了翻譯語言,特別是影響翻譯中轉折連接詞分布的因素,包括文本的體裁(小說、兒童小說和非小說),面向的讀者群(成人、兒童),目的語語言規范的影響以及來自原文的影響。第五章介紹了研究背景,考查了轉折連接詞在英語以及俄語中的使用情況。第六章介紹了語料庫的設計以及研究方法,重點討論了在研究中如何應用多元互證模式以及研究的發現。該研究首先將不同類型語料庫所獲數據相結合,實現語料庫數據的多元互證。其次詳細介紹了該研究中所使用的分析方法,以及如何將這些方法結合以實現語料庫方法的多元互證。研究結果表明,轉折連接詞的使用是一系列因素相互作用的結果,這些因素包括:目的語語言規范、原語干擾,以及基于文本體裁所作出的考量。
第七章、第八章是運用語料庫多元互證模式所進行的第二個實證研究,考查了翻譯與語言變化之間存在的關系。所使用的語料庫為80 萬詞的希臘語原創科普文本和英語原創科普文本語料庫,以及希臘語翻譯科普文本和其對應的英語原語文本語料庫。作者試圖厘清希臘語文本中分裂式(cleft)和假擬分裂式(pseudo-cleft)的使用頻率和模式的變化,是否受到翻譯英語文本的影響。第七章總結了選取分裂式和假擬分裂式結構的原因、研究目的,以及它們在希臘語和英語中的主要特征。前人有關翻譯和語言接觸關系的研究結果往往前后矛盾,影響了這些研究的可復制性(replicability)和可比性(comparability)。第八章介紹了語料庫的設計、研究方法和主要發現。使用的語料庫既有平行語料庫、可比語料庫和參照語料庫,又有歷時語料庫和共時語料庫,實現了語料庫數據來源的多元互證。通過使用Wordsmith Tools 7.0 版本獲得描述性數據,如關鍵詞表、句子數、頻率等。對于推斷性數據,差異顯著性檢驗使用的是對數似然比檢驗(log-likelihood test),其檢驗結果可以確認差異是否屬于偶然現象。效應量(effect size)檢驗使用對數似然比效應量檢驗(effect size for loglikelihood test)。效應量是指由于因素引起的差別,是衡量處理效應大小的指標。與顯著性檢驗不同,這些指標不受樣本容量影響。它表示不同處理下的總體均值之間差異的大小,可以在不同研究之間進行比較。通過計算貝葉斯因子(Bayes Factor),可以檢驗差異屬于偶然現象的概率。通過以上分析方法的結合即實現了方法內多元互證。量化分析用來檢驗變化的頻率以及顯著性,質化分析則用來觀察使用模式的變化以及解釋影響差異的因素,因此量化、質化分析相結合實現方法間多元互證,共同構筑起多元互證模式。研究結果表明,原創希臘語科普文本中分裂式、假擬分裂式的使用頻率并沒有因為受到英語的影響而增高。研究結果也未發現英語和希臘語在使用該句式上存在顯著差異,翻譯希臘語科普文本跟英語原文文本和希臘語原創文本在該句式的使用上也無顯著差異。但是通過質化分析作者發現,希臘語中分裂式、假擬分裂式的使用模式發生了歷時性的變化,這些變化是由于跟英語的接觸,即通過翻譯而產生的。
總體而言,該書具有以下特點。
第一,多元互證模式的提出為語料庫翻譯研究提供了新的研究視角。多元互證運用于翻譯研究早已有之,Triangulating Translation(Alves, 2003)一書主要對翻譯過程研究采用了多元互證法,通過將有聲思維、按鍵記錄等數據收集方法相結合,增強研究結果的可信度。多元互證在語料庫語言學中也得以應用。Triangulating Methodological Approaches in Corpus-Linguistic Research(Baker & Jesse, 2016)一書主要討論不同語料庫方法之間的多元互證,不同學者分別采用不同的方法,如多維度分析、主題詞分析、多因素分析等,就同一問題展開研究,然后對研究結果進行對比分析,并對研究結果不一致之處進行可能的解釋。而多元互證模式應用于語料庫翻譯研究尚不多見。書中所提出的模式可以調查不同的翻譯現象,回答翻譯研究中業已存在的問題和新出現的問題,推動翻譯研究的發展,為未來翻譯文本以及翻譯語言和源語關系的研究提供了一個全新的方法。
第二,該書既有理論構建,又有實證研究,理論與實踐有機結合,更為重要的是該研究模式具有可復制性,可以應用于其他諸多研究領域。該書作者提出了全新的語料庫類型(VVA),融合了可比語料庫、平行語料庫、參照語料庫和共時語料庫、歷時語料庫,并且可以任意組合,不再局限于單一類型語料庫。黃立波、王克非(2011:920)在談到語料庫翻譯研究趨勢時指出,未來的研究“從單語類比或單語類比加雙語平行的綜合研究模式,轉變為根據實際研究需要建立多重的復合對比模式,并由對比模式向過程和因果模式過渡”,而這正是該書作者所提出的論述。作者對該模式的創建及使用提出了清晰的指導原則,為有志于采用該模式的研究者提供了明確的框架,保證了該模式的可復制性。
第三,研究方法與結論更加可靠。多元互證模式按照一定的原則建立,實現了語料庫不同數據、不同方法的融合。該模式中的多元互證既有同一研究范式內不同方法的互證,又有不同研究范式間方法的互證,保證了研究過程的科學性,使得研究結果更加具有可靠性和說服力。語料庫方法的多元互證以及描述性、推斷性數據分析的使用,可以同時得出相同或相反的結論,對研究結果的描述分析會更加全面。如果研究中所得的數據相一致,則研究結果的可靠性進一步提高;如果研究中所得數據相沖突,則需要對不一致的原因進行深入的解釋,因此該模式可以對同一現象進行不同角度的認識。只有將數據和方法的多元互證模式相結合,才能真正檢驗各種因素是如何相互作用的。一方面,語料庫數據多元互證可以確定每個分析階段需要考查的語料庫。另一方面,語料庫方法多元互證可以明確每個因素所起的作用。
然而本書也有以下不足。
第一,所用語料庫規模過小,影響了結論的有效性。語料庫多元互證模式的使用,受語料庫庫容、代表性和平衡性的影響。特別是第二個實證研究,所用語料庫大小為80 萬詞,雖然語料庫研究的規模取決于研究問題,并沒有一個明確的規定,但是對于調查希臘語文本中分裂式和假擬分裂式使用頻率和模式的變化是否受到英語句子的影響這樣的問題,涉及某一語言對另外一個語言的接觸及影響問題,顯然庫容過小。如國內學者在翻譯與現代漢語互動研究中所使用的英漢翻譯歷時平行語料庫和漢語原創可比文本庫庫容分別為1000 多萬字/詞和370 萬詞(秦洪武、夏云,2017),而且使用的語料僅僅局限于科普文章,這使得結論缺少說服力。
第二,過多強調多種量化分析方法的結合,而與質化分析的結合不夠。雖然該書副標題為數據與方法互證,但是對于獲得的不同數據、不同的方法所得出的結果,結合其他語言學、社會學、文化學等理論進行質化分析,實現理論多元互證,應該同樣占有重要的位置。但是該書的質化分析,特別是對于相互沖突的數據和結論的分析,顯得有些薄弱。
語料庫翻譯研究雖然聲稱量化研究應與質化研究相結合,但大部分結合缺少清晰的邏輯及理論基礎,鮮少談及結合的目的及益處,不同的量化方法也鮮有結合。多元互證模式可以應用于翻譯研究,特別是語料庫翻譯研究。多元互證在翻譯研究中的重要性已毋庸贅述。薩爾達尼亞和奧布賴恩(Saldanha & O’Brien,2014:5)提到“方法上的多元互證應該是可靠的和高質量研究的支柱”。胡開寶、毛鵬飛(2012:391)認為,“語料庫翻譯學研究應運用復雜的量化分析,如卡方檢驗和統計量測試等,以切實提高譯學研究的科學性”。本書作者采用了相對復雜的量化分析,如對數似然比效應量檢驗、貝葉斯因子等方法相互驗證,使得結果更具科學性,但是還應加強語料庫翻譯研究和其他研究領域的合作,實現真正的量化分析和質化分析的結合。語料庫翻譯研究的跨學科屬性要求其應該與其他語言學理論、文化研究、話語分析等領域相結合,切實提高研究的深度。