999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于平行語料庫的翻譯研究述評

2009-01-01 00:00:00
理論月刊 2009年5期

摘要:基于語料庫的實證研究克服了以往規范性研究的主觀性和局限性,可充分地觀察和發現更多的語言事實,從而充分地描寫和解釋。本文探討了平行語料庫的概念及其特點,介紹了目前世界上幾個用于翻譯研究的重要平行語料庫,最后對平行語料庫和基于平行語料庫的翻譯研究進行了述評。

關鍵詞:平行語料庫; 譯文; 翻譯過程; 翻譯研究

中圖分類號:H159 文獻標識碼:A 文章編號:1004-0544(2009)05-0137-04

一、 前言

語料庫語言學在20世紀90年代再次興起和描述性翻譯研究的發展使得這種基于語料庫的翻譯研究作為一種新的研究范式受世人矚目。基于語料庫的實證研究克服了以往規范性研究中的個人主觀性和局限性,可以充分地觀察和發現更多的語言事實,從而充分地描寫和解釋。用于翻譯研究的語料庫有三種:平行語料庫、多語語料庫和可比語料庫。本文專門討論平行語料庫和基于平行語料庫的翻譯研究。

二、 平行語料庫的概念及其特點

何謂平行語料庫?語法學家眾說紛紜,莫衷一是。John Sinclair(1996)認為,平行語料庫是一組文本,每種文本除其自身外還有一種或一種以上的譯語文本,最簡單的平行語料庫涉及兩種語言文本——原文和譯文。有些語料庫存在幾種語言文本,翻譯方向也不固定,有些文本從甲語譯為乙語,或從乙語譯為甲語,翻譯方向并不清楚。Olohan(2004:24)指出平行語料庫是指在語料庫里含有一種語言的一組文本及其另一種語言的譯文。可是,Johansson(1998)對此不與茍同,他認為這與其說是“平行語料庫”,倒不如稱之為“翻譯語料庫”,因為平行語料庫通常用來指那種可比的一組雙語文本而非譯文。然而,目前大家普遍認可的觀點是,平行語料庫有單/雙向、雙語/多語之分,單向是含有指甲語的原文與乙語的譯文;雙向是指含有甲語的原文與乙語的譯文和乙語的原文與甲語的譯文。后者的構成表明語料庫含有可比語料庫的成分。同時,平行語料庫既可以是雙語的,也可以是多語的,即甲語的原文與乙、丙、丁語的譯文(Olohan,2004:24-25)。

三、 用于翻譯研究的幾個重要平行語料庫特征解析

英語-挪威語平行語料庫(ENPC)作為監控語料庫含有可比語料,該庫不僅含有英語原文及其挪威語譯文,而且含有挪威語原文及其英語譯文。其庫容為260萬詞次,文本為小說和非小說體裁。按照TEI標準對文本的參考文獻信息和文本類型、文本章節、段落和句子邊界的劃分等進行了標注。原文和譯文都經過句子自動對齊,然后進行人工糾錯。英語文本采用POS標注,然而由于缺乏挪威語標記系統,挪威語文本沒有經過POS標注(Olohan,2004:56-57)。

Zanettin(2000:108-109)提到英語-意大利語翻譯語料庫(CEXI)是以ENPC為藍本建成的,含有已出版的書面語書籍及其譯文,該語料庫屬于雙語雙向語料庫,含有意大利語原文及其譯文和英語原文及其意大利語譯文,這表明它含有可比語料庫的成分。其收錄的書籍文本可細分為:小說和非小說兩種類型,兩者都不含兒童文學,其庫容為400萬詞次。

德語-英語文學文本平行語料庫(GEPCOLT)設計建造的主要目的是調查翻譯中的標準化(normalization)和創造性(creativity)。盡管研究人員在分析中用到了德語和英語參考語料庫,但是它并不包含可比語料庫的成分。由于在文本作者性別、小說類型等平衡方面難度較大,所以GEPCOLT含有女性作家的原文而譯者大多是男性。該語料庫含有翻譯英語語料庫(TEC)中以文本附加信息(header files)方式存儲的有關文本出版和翻譯過程的語外信息(Olohan,2004:58-59)。

英語-瑞典語平行語料庫(ESPC)以ENPC為藍本,兼有可比語料庫和翻譯語料庫的特點,即既有英語源文及其瑞典語譯文,也有瑞典語源文及其英語譯文。兩種語言的源文在文本類型、主題、目的和語域等四個方面相匹配。目前,現版本的ESPC含有64個英語文本及其瑞典語譯文,72個瑞典語文本及其英語譯文。文本范疇為小說和非小說。文本本身的標注同ENPC一樣遵循TEI的標碼規則,文本的語外信息采用文本附加信息方式標注(Olohan,2004:57)。

巴比英語-漢語平行語料庫(The Babel English-Chinese Parallel Corpus)是由英國Lancaster大學的語言學家建造的單向平行語料庫,該庫含有327篇英語源文及其漢語譯文,庫容為544,095詞次。英語和漢語文本都作了詞性標注,語料庫對齊采用句子對齊方式,先利用電腦軟件進行自動對齊,然后進行人工糾錯。通過基于網絡的對齊索性軟件用戶可從網上免費登陸該語料庫。

北京大學計算語言學研究所開發了巴比漢英平行語料庫(Babel Chinese-English Parallel Corpus)。其文本類型包括科技文獻、小說、劇本、詩歌、雜文、圣經、神話、口語語料等。語料的收集工作仍在繼續,柏曉靜等(2002)認為新加入的語料將有助于改善這個雙語庫的平衡性。2002年底,該庫達到11萬句對的規模。現階段的應用目標是一個多引擎結構的漢英機器翻譯系統,運用它可為基于存儲的引擎提供翻譯實例,并從中挖掘學習各種細粒度翻譯知識,供其他翻譯引擎使用。

北京外國語大學平行語料庫含漢英和漢日兩個分庫,前者設計為4個子庫:百科語料庫、翻譯文本庫、雙語語句庫和專科語料庫,語料已基本做到句級對齊,可進行詞語、詞頻、短語、搭配、句型等多種檢索。后者語料分文學與非文學、漢譯日和日譯漢存放,做到段級對齊,應用研制的檢索工具可對漢日語料做各種詞語、短語、句型和搭配上的檢索。該庫可分可合:分開可開展單項研究;合則可在大規模語料基礎上進行詞頻、搭配、對應詞、句型、語體、文體等方面研究。

陳瑞清(Wallace Chen)的英漢平行語料庫(ECPC)收錄有十三本科普書籍,有三個子庫:英語原文、臺灣出版的繁體漢譯本、以及大陸出版的簡體漢譯本,可進行原文與譯文、不同版本譯文之間的比較。文本范疇為大眾科學和信息技術。漢語部分的語料用臺灣中研院開發的軟件CKIP進行詞的切分和詞類標記。其總庫容接近180萬詞次。利用該語料庫進行研究時可以把臺灣中研院平衡語料庫作為參考語料庫使用(Chen,2003)。

葡萄牙-英語平行語料庫(COMPARA)含有葡萄牙語原文及其英語譯文和英語原文及其葡萄牙語譯文,屬于開放式雙向平行語料庫,目前庫容達100多萬詞次。它采用目前最為先進的語料對齊方式,對原文-譯文進行一對一或一對多的句子對齊。該語料庫的標記也較為獨特,對翻譯中的合并、拆分、添加和重組等語篇變化等進行了標記。該語料庫用途較廣。

四、 基于平行語料庫的翻譯研究回顧

基于平行語料庫的翻譯研究可以深入到許多宏觀和微觀方面的翻譯現象,由于篇幅限制,本文僅回顧一下有代表性的基于平行語料庫的翻譯研究。

1. 翻譯對等詞的研究。Schmied (1998:255-256)對英語和德語這兩個語種有密切關系的翻譯對等詞感興趣,他在語料庫里重點研究英語中的with與德語中mit的翻譯問題。在許多情況下會有許多不同詞語可供選擇,而棄用典型對等詞mit通常意味著譯者有意識地去選擇另一個詞。他想探究譯成德語時譯者根據with的不同語義內容選擇具體譯詞的原因。Schmied意識到這其中涉及到許多因素,包括搭配、上下文語境、文本類型和文體等因素。為此,他得出結論:像平行語料庫這樣的雙語詞匯資源能克服普通單/雙語詞典有局限性的缺陷。

2. 詞語的創造性研究。Kenny (2001)使用GEPCOLT來研究詞語的創造性(lexical creativity),她選擇語料庫里常見詞為節點詞(node),檢查其搭配詞(collocates),找出那些創造性搭配。帶有具體作者特點的詞語形式和搭配都當作是創造性搭配。(Olohan,2004:31-32)Kenny (2001:142-188)的研究表明:在新創詞翻譯中呈現標準化的趨勢。這樣,通過對創造性搭配的分析揭示出譯者綜合了語言學創造和標準化的方法。

3. 詞語結構差異研究。Ebeling (1998)利用平行語料庫來研究語言之間的差異,把翻譯對等的概念當作對比分析的方法。她利用ENPC來考察英語源語表示存在意義的“there結構”及其挪威語源語對等結構det-、挪威語源語det-對等結構det-及其英語翻譯的“陳述”行為,她發現在英語源語中,be及其變化形式在這些結構中是最常用的動詞,而在挪威語結構中,動詞變化較多,有些用于被動形式(Laviosa,2004)。

4. 多義詞語的功能性歧義現象研究。Geoffroy-Skuce (1997)分析了adverse effect 中的多義法律英語形容詞adverse 的功能性歧義現象。她的平行語料庫含有250萬詞次的加拿大英語的原始法院記錄及其加拿大法語譯文。她對于含有adverse從句的分析是基于韓禮德提出的意念功能的理論框架之上的,從詞匯-語法角度考察每個摘錄及其對應翻譯對等詞語的搭配語境得知:adverse的詞義隨著功能的差異而有所區別。她指出:研究中涉及到那些語義復雜、功能多樣、常用法律形容詞在雙語法律詞典里的搭配并不準確,而且,在法律語篇里,英語形容詞的概念中心和隱喻的運用具有專業特點(Laviosa,2004)。

5. 跨多語種的詞語用法研究。Johansson(1997)使用經過增容且含有英語原文、德語和挪威語譯文的單向平行語料庫ENPC對英語的one、德語的man和挪威語的man等概指人的主語形式進行了三向(three-way)定量和定性比較分析。研究表明:與挪威語man相比,英語one用得較少,德語man使用較多。英語中的one和you在挪威語里常譯成man。而譯成德語man的英語詞比較多樣化,即除了one,you 和不定式結構外,還有祈使、被動或無靈主動主語(inanimate active subjects)。在這些形式的使用差異方面,德語man從文體上說是中性的,并且與英語中正式的one和非正式的you對應。英語常用you來指稱一般人,挪威語則用man和單數第二人稱代詞du(Laviosa,2004)。

6. 句子結構差異研究。柯飛(2003)利用北外平行語料庫對“把”字句的使用作了一個初步調查,其調查的特點在于不僅考察漢語原創語料和翻譯語料,而且還考察文學和非文學語料。調查結果表明:翻譯的漢語作品比原創作品使用更多的“把”字句,而且文學類作品比非文學類作品使用更多的“把”字句,從而進一步證實了“把”字句適用于表達復雜和細微的意思。

7. 原文和譯文的指示現象對比研究。Mason Serban (forthcoming)使用由羅馬尼亞語小說和短篇故事及其英語譯文組成的語料庫來調查原文和譯文的指示現象(deixis),她們想搞清楚以下幾個問題:從系統性的指示到一次性(one-off)的指示轉換引起怎樣的差異?在原文和譯文相關的問題上,讀者擺在怎樣的位置?其研究重點是分析語料庫里11篇文本及其譯文中部分文本的方向和方位指示代詞的轉換。她們發現譯文中有距離化的傾向,即很大程度上從原文的方向(proximal)變為譯文的距離(distancing),并且這種傾向在所選文本中前后是一致的(Olohan,2004:32)。

8. 譯者聲音和翻譯風格研究。Bosseaux (2001) 在研究中借用了Hermans的“譯者聲音”(translator’s voice)概念和Mona Baker的“翻譯風格”(translation style)定義,她的語料庫含有小說《波浪》英語原文和兩個法語譯文文本。她采用了Kitt van Leuven-Zuart (1989,1990) 的轉換分析法,通過對比兩份不同法語譯文來找出譯者聲音的證據,比較兩種譯文的異同點,分析了平均句長和類符/形符比率。研究結果表明:兩位法語譯者采用了明顯不同的翻譯策略。Bosseaux認為這種分析有利于為兩個不同譯文的譯者聲音提供佐證(Olohan,2004:33)。

9. 語義韻研究。Munday (2002)研究的原文是一篇用西班牙語寫的論文。故事梗概是古巴男孩Elián González在逃往去美國的途中被人從大海里救了出來,他在邁阿密的親戚希望他留下來,而他的父親卻通過不斷努力想把他弄回哈瓦那去。論文譯成英語后,登在《衛報》和《紐約時報》上。Munday的語料庫只有一篇原文和三篇不同譯文,他借助一些語料庫分析方法如句長、類符/形符比率、詞頻表等來集中分析語篇的各個方面情況,隨后他把這些同語篇的元功能聯系起來。如此一來,Munday就能辨認出翻譯過程中的顯著轉換,并且提供了必要的詮釋(Olohan,2004:87-90)。Munday發現了一個有趣的現象:考慮到《紐約時報》的讀者群體,原文中的反美情緒在譯文中被大量地刪除了。

10. 意合轉形合的潛在明朗化研究。陳瑞清(2004)從180萬詞次的ECPC中檢索出翻譯文本里使用頻率最高的三十個Cbb類中文關聯連詞的使用情況(中研院平衡語料庫的Cb類關聯連詞又分為兩小類:Cba與Cbb。前者只包括“的話”和“起見”這兩個用于句尾的關聯連詞,其他主要的關聯連詞則一律歸類為Cbb),并與中研院平衡語料庫的原創漢語文本進行質與量的比較,以了解近幾十年來漢譯文本由意合轉為形合的潛在明朗化趨勢。針對語料分析的結果,他還探討了造成漢譯文本趨向形合的幾個可能因素,包括原文影響、出版社編輯策略、翻譯的潛在規律行為等。

五、 基于平行語料庫的翻譯研究評價

從上可以看出,平行語料庫對齊原文和譯文讓人們能認識翻譯的本質,把它用于翻譯研究的優勢是不言而喻的。最常見的是我們可以通過考察原文和譯文中的關鍵詞和詞語搭配尋找翻譯對等詞。在翻譯研究中,由于它還能為譯者的聲音、在翻譯過程中采取的意合轉形合的明朗化、調整語義韻等翻譯策略提供證據,這是可比語料庫或傳統的研究工具無法比擬的。

不過,由于平行語料庫存在語料復雜、帶有“翻譯體”、語料的平衡和代表性缺陷,我們應該清醒地認識到基于平行語料庫的翻譯研究還會存在一些問題。Kenny (1999:60)認為,語料庫的設計和編寫關系重大,因為這涉及到基于某個語料庫研究的有效性和可靠性。在設計專門用于翻譯研究過程和譯文的雙向平行語料庫時,Zanettin(2000:105)建議要充分考慮文本的代表性問題,然而,選擇有代表性的文本可能導致語料成分缺乏可比性。當然,這些缺陷和問題是可以克服和解決的。Johansson(1998:6)認為平行語料庫的缺陷可以通過結合平行語料庫和可比語料庫的方法來解決,因此,他建議使用翻譯語料庫進行語言對比研究,收入雙向譯文就可起到中和“翻譯體”的效果。其次,盡管利用平行語料庫進行原文與譯文的對比語言學研究天生存在一些缺陷,但是這些缺陷可以通過收入可比文本做成監控語料庫的途徑來克服,這樣就帶有可比語料庫性質。此外,如果過分強調語料庫的平衡而采用文本摘錄方式導致文本本身內容缺乏連貫性,Johansson(ibid.:11)提議:如果沒有實際限制的話,較大的語料庫最好采用全文收錄的方式。

目前,標注平行語料庫的數量本來就不多,有的即使進行了標注,文本類型卻很有限,如進行了標注的加拿大國會議事錄語料庫,含有法語和英語的平行文本,但是它只涵蓋有限的文本類型——加拿大議會的會議記錄。況且,與多語語料庫相比,雙語平行語料庫似乎更多一些,這就制約了多語種之間的翻譯對比研究。曹大峰(2006:225)預測“雙語平行語料庫正在向多語平行語料庫發展”,“多語對譯語料庫的建設、加工和應用研究將是今后翻譯研究的一個重要方向”。令人感到欣慰的是,兩個歐盟資助項目CRATER和MULTEXT把目標定在建設真正多語平行語料庫上,前者涉及到往150萬詞次的法語-英語平行科技語料庫添加第三種語言西班牙語的文本,后者包括建立20萬詞次的英語-法語雙語語料庫。(Izwaini,2004:17)由此可以看出,基于語料庫的翻譯研究將成為今后翻譯研究發展的主要方向,而翻譯用語料庫功能的改進和多用途語料庫的建設將會成為今后工作的重中之重,這對于我們從事基于語料庫翻譯研究的人來說任重而道遠。

參考文獻:

[1]Bosseaux, C. A Study of the Translator’s Voice and Style in the French Translations of Virginia Woolf’s The Waves[J]. CTIS Occasional Papers, 2001(1):55-75.

[2]Chen, W. Investigating Explicitation of Conjunctions in Translated Chinese: A Corpus-based Study[R]. Paper presented at the Corpus-based Translation Studies Conference: Research and Applications 21-25 July 2003. Pretoria, South Africa.

[3]Izwaini, S. Building Specialized Corpora for Translation Studies[A/OL]. [2004-12-06] http://www.coli.uni-sb.de/muco03/izwaini.pdf. 2004.

[4]Johansson, S. On the Role of Corpora in Cross-linguistics Research[A]. In Johansson S. S. Oksefjell (ed.) Corpora and Cross-linguistic Research[C]. Amsterdam: Rodopi. 1998. 3-24.

[5]Kenny, D. The German-English Parallel Corpus of Literary Texts (GEPCOLT): A Resource for Translation Scholars[J]. Teanga, 1999(18):25-42.

[6]Kenny, D. Lexis and Creativity in Translation: A Corpus-based Study[M]. Manchester: St Jerome. 2001.

[7]Mason, I. A. Serban. Deixis as An Interactive Feature in Literary Translations from Romanian into English[J]. Target. forthcoming.

[8]Munday, J. Introducing Translation Studies: Theories and Application [M]. London and New York: Routledge. 2001.

[9]Munday, J. Systems in Translation: A Systemic Model for Descriptive Translation Studies[A]. In Hermans T. (ed) Cross-cultural Transgressions. Research Models in Translation Studies II: Historical and Ideological Issues[C]. Manchester: St Jerome. 2002. 76-92.

[10]Olohan, M. Introducing Corpora in Translation Studies[M]. London/New York: Routledge. 2004.

[11]Schmied, J. Differences and Similarities of Close Cognates: English with and German mit[A]. In Johansson S. Oksefjell S. (ed) Corpora and Cross-linguistic Research[C]. Amsterdam: Rodopi. 1998. 255-275.

[12]Zanettin, F. Parallel Corpora in Translation Studies: Issues in Corpus Design[A]. In Olohan M. (ed) Intercultural Faultlines. Research Methods in Translation Studies I: Textual and Cognitive Aspects[C].Manchester: St Jerome. 2000. 105-118.

[13]曹大峰.漢日平行語料庫與翻譯研究[J]. 外語教學與研究,2006,(3).

[14]陳瑞清. 漢譯文本的形合趨勢:以語料庫為本的翻譯學研究[A].第九屆口筆譯教學研討會論文集[C].臺南:長榮大學翻譯學系研究所. 2004.

[15]柏曉靜,常寶寶,詹衛東.構建大規模的漢英雙語平行

語料庫[A/OL]. 2004-12-06.http://icl.pku.edu.cn/icl-groups/parallel/reference/construct-large-CE-parallel-corpus.pdf. 2002.

[16]柯飛. 漢語“把”字句特點、分布及英譯研究[J]. 外語與外語教學,2003,(12).

責任編輯張國強

主站蜘蛛池模板: 国产成人午夜福利免费无码r| 成人韩免费网站| 2022国产无码在线| 熟妇丰满人妻av无码区| 亚洲欧美成人影院| 国产又色又刺激高潮免费看| 亚洲欧美日韩中文字幕一区二区三区| 动漫精品啪啪一区二区三区| 亚洲天堂免费| 91免费精品国偷自产在线在线| 色老二精品视频在线观看| 国产午夜精品一区二区三| 欧美色伊人| 亚洲欧美日韩成人高清在线一区| 性视频久久| 91在线日韩在线播放| 国产精品私拍在线爆乳| 国产一级在线观看www色| 久青草国产高清在线视频| yjizz国产在线视频网| 沈阳少妇高潮在线| 日韩在线永久免费播放| 国产福利观看| 亚洲国产成人无码AV在线影院L| 波多野结衣一区二区三区四区视频| 亚洲欧州色色免费AV| 亚洲欧美一区二区三区蜜芽| 午夜在线不卡| 亚洲人成网站日本片| 凹凸国产熟女精品视频| 欧美三级不卡在线观看视频| 五月婷婷丁香综合| 成人国产免费| 亚洲熟女偷拍| 国产成人h在线观看网站站| 蜜芽一区二区国产精品| 婷婷色一二三区波多野衣 | aⅴ免费在线观看| 精品成人一区二区三区电影| 国产小视频a在线观看| а∨天堂一区中文字幕| 在线观看亚洲天堂| 自慰网址在线观看| 99在线免费播放| 福利在线一区| 国产真实乱子伦视频播放| 亚洲欧美另类专区| 91久久偷偷做嫩草影院电| 欧美乱妇高清无乱码免费| 内射人妻无码色AV天堂| 黄色网页在线观看| 日韩久草视频| 米奇精品一区二区三区| 91免费片| 国产亚洲欧美日韩在线一区| 99精品这里只有精品高清视频| 91无码视频在线观看| 欧美精品v欧洲精品| 欧美亚洲国产一区| 国产精品尤物在线| 天天干天天色综合网| 老司机午夜精品网站在线观看| 久久婷婷六月| 精品无码国产自产野外拍在线| 综合五月天网| 青青久视频| 欧美有码在线| 国产人妖视频一区在线观看| 最新加勒比隔壁人妻| 免费观看亚洲人成网站| 亚洲综合日韩精品| 少妇精品久久久一区二区三区| 免费无码又爽又刺激高| 国产自产视频一区二区三区| 在线观看国产小视频| 国产欧美日韩一区二区视频在线| 亚洲精品国产精品乱码不卞| 一级一级一片免费| 国产女人综合久久精品视| 亚洲成aⅴ人片在线影院八| 91久久偷偷做嫩草影院精品| 黄色网页在线观看|