張麗娟
摘要:本文以《道德經》兩個最具代表性的英譯本為例,自建《道德經》漢英平行語料庫,介紹語料庫的建設過程,包括語料的收集、除噪、切分、標注和對齊,通過語料庫軟件的檢索方法,定量分析兩個英譯本的類形符比、平均句長,詞匯密度等方面的不同,為《道德經》的英譯研究提供新的解釋和描述視角。
關鍵詞:《道德經》;語料庫;創建和應用
隨著計算機技術和翻譯研究的不斷發展和深入,語料庫不斷應用到翻譯的各個方面。這些研究主要分為兩類,一是基于語料庫的翻譯研究,一是翻譯語料庫的介紹與創建。本文以《道德經》兩個最具代表性的英譯本為例,自建《道德經》漢英平行語料庫,介紹語料庫的建設過程,包括語料的收集、除噪、切分、標注和對齊,通過語料庫的研究方法,定量分析兩個英譯本的譯者風格,為《道德經》的英譯研究提供新的解釋和描述視角。
一、《道德經》英譯研究綜述
老子是道家的創始人,他的思想對中國哲學的發展影響深刻,所著《老子》又稱《道德經》,全書五千多字,共81章,前37章卷上為《道經》,后44章卷下為《德經》。它是中國歷史上第一步具有完整體系的哲學著作,老子的《道德經》全球發行量和翻譯語言的數量都僅次于《圣經》。《道德經》早在公元7世紀唐朝就由玄奘翻譯成梵文(張文莉,2017),世傳《道德經》英譯最早是在1868年由傳教士湛約翰翻譯的,姚達兌(2017)發現更早的英譯手稿在1859年由裨治文翻譯,而第一個中國人自己翻譯的《老子道德經》是在1936年胡子霖完成的(吳心海,2012),截止2010年《道德經》西譯本達到643種,英譯本有200種(張文莉,2017)。河南社科院副研究員丁巍(2004)在《老學典籍考:二千五百年來世界老學文獻總目》中,將二千五百年來的中外老學典籍文獻匯聚成總括性專題書目。《總目》共5編102萬字,內收中國語言系2048個文種、東方語言系503個文種、西方語言系618個文種以及老學論文4297篇。《道德經》英譯之早,版本之多,研究之眾,足見其歷史之悠久,影響之深遠。《道德經》的歷史地位、思想價值和現實意義都值得進一步研究和傳承。
《道德經》英譯的研究很多,但是通過語料庫研究的卻不多。筆者以1988年為起點,2018年6月20日為終點,從中國知網學術期刊總庫以“《道德經》英譯”為關鍵詞進行搜索,結果有180篇,而用語料庫進行的研究卻只有12篇,其中有4篇是自建語料庫,還有2篇是通過語料庫分析《道德經》哲學術語翻譯和《道德經》譯文顯化研究。本研究計劃收集有代表性的《道德經》漢語源本和英譯本,建立更加系統、更加全面、更加專業的語料庫,并對這些語料進行標記。接著借助語料庫工具對代表性英譯本進行對比分析,通過對其主要參數包括形符與類符、詞頻排列、詞長、句長、句數、句型和漢英句對模式進行統計描述,對各譯本的語言風格和翻譯技巧進行詳細的研究。通過譯本的對比,找到并總結譯文中出現的錯誤,再加以改進。更好的描述翻譯現象,再現翻譯過程,揭示翻譯規律。
二、《道德經》漢英平行語料庫的創建
語料庫的創建流程包括:原文和譯文版本的選擇和語料收集、對收集文本進行清潔處理,經過除噪、校對,然后保存成txt文本,接著對語料進行切分、標注并校對,最后將語料對齊,就可以運用語料庫的軟件進行語料檢索、獲取參數、分析數據了。
(一)收集語料
源本和英譯本的選擇涉及到其典型性,盡量將有代表性的都全面收錄。《道德經》的源本版本繁多,僅世傳《道德經》就有356種,1973年長沙馬王堆漢墓出土的帛書《道德經》也有甲乙兩種抄本,1993年湖北荊州郭店楚墓出土的竹簡《道德經》是現存最早的版本(陳國華,2002)。《道德經》英譯的版本普遍認為有一百三十多種。本研究選取英國漢學家阿瑟·威利和中國作家林語堂翻譯的兩篇譯文。兩個譯本的譯者屬于中英兩個國籍,且處于不同的時期,所以具有一定的代表性。本研究的原始語料為紙質版,通過OSR掃描識別為圖片保存,經過ABBYY Fine Reader將圖片轉化成txt文本,人工校對后將文本存儲為UTF-8編碼格式。
(二)語料處理
通過軟件EditPlus將文本中的拼寫錯誤、多余的空格和空行、多余的硬回車和軟回車、多余的橫線處理掉,這里清潔文本不改變文本原來的結構。《道德經》英文部分來自書本,部分來自網站,這些語料都需要進一步處理,對漢語的文本加工包括分詞、標注和對齊,對英文譯本的處理包括語料整理、標注和對齊。對于中文語料的分詞處理,可采用中國科學院計算機技術研究所開發的漢語詞法分析軟件ICTCLAS3.0進行自動分詞處理。但是由于是古漢語,需要人工輔助分詞,加以校對,提高準確率。對于英文語料的標記,本項目采用文本編碼計劃模式(TEI)對篇頭和篇章作注,信息標注包括題目、出版社、出版時間、致謝、版本情況、前言、后記、序跋、參考文獻等,篇章注包括段落標注、語句標注、語法和語義標注等,并加以適當的評述。軟件“文本處理器”可以同時處理成百上千個文件,確保英文文本由半角字符構成,詞句之間留有空格,題目和段落之間有回車符。最后本研究使用中國傳媒大學自主研發的CUC ParaConc軟件,來實現句與句、段與段和篇章與篇章的對齊。
(三)語料切分標注
語料標注分為語言信息標注和非語言信息標注,語言信息標注包括詞性標注和語法標注,非語言信息包括作者、譯者和出版信息等。研究者也可以根據研究的需要設計標注體系。本研使用軟件TreeTaggerMultilingual對英文文本進行詞性標注,漢語文本沒有詞的界限,使用軟件CorpusWordParser進行標注的同時進行詞的切分。
(四)語料對齊
文本對齊有不同層次的對齊,篇章對齊比較容易,句級對齊則需要加上人工校正。本研究使用TMXmall在線工具將文本對齊,再導出文本就建成了雙語平行語料庫。
三、《道德經》語料庫的應用
本研究利用創建的《道德經》平行語料庫對兩個有代表性的譯本進行基本的統計描述,包括詞頻、平均句長、類符/形符比、平均詞長、詞匯密度等。Wordsmith軟件統計結果可以看出,威利譯本共有9533個字,比林譯本多1521個字,說明威利更傾向于意譯,解釋更多。而林譯本的類符/形符比為21%,略高于威利的譯本19%,則說明林譯本的詞匯變化性更大,使用不同的詞匯更多,從而閱讀難度相差不大。
高頻詞匯的檢索可以了解譯文主題信息內容,AntConc軟件可以列出兩個語料庫的高頻詞匯。威利譯本從高到低的前五個高頻詞為the,is,to,of,and,其中“the”和“of”的詞頻較高說明句子結構的復雜性,威利譯本中達到6.23%。林譯本前五個高頻詞匯the,is,of,and,to,“the”基本相同,“the”的使用達到了7.06%,略高于威利譯本,這說明兩譯本的句子結構復雜程度相當。
詞匯密度主要指的是實詞所占的比重,詞匯密度越大說明實詞使用越多,信息密度越大。威利譯本詞匯密度為57%,遠遠大于林譯本37%的詞匯密度,因而閱讀難度也比較大。總詞數威利譯本比林譯本多近1500多詞,說明威利譯本對原文的解釋說明較多,顯化特征更加明顯。
兩譯本的高頻實詞占比都超過了60%,如關鍵詞“道”的翻譯,林譯本傾向于音譯翻成“Tao”,出現了71次,而威利譯本并未出現“Tao”,威利傾向于意譯翻成“way”,這表明林采用了音譯的翻譯方法,而威利采取了意譯的翻譯策略。再如“天下”的翻譯,林譯本翻成“world”,威利譯本翻成“empire”,這說明兩譯本的主題和譯者對原文的理解相差較大,這個跟兩位譯者的背景關聯很大,林語堂是中國著名的作家,對中國文化的理解更透徹,而威利是英國有名的漢學家,更多考慮西方讀者的接受程度。
四、結語
本研究存在三個難點,第一個難點是源本和譯本的選擇。《道德經》的源本版本繁多,僅世傳《道德經》就有356種,英譯本有兩百多種,源本和英譯本的選擇涉及到其典型性,盡量將有代表性的都全面收錄。不同歷史時期,不同國別,不同性別,不同的社會功能,不同的翻譯風格都要照顧到。第二個難點是簡體字和繁體字的使用,目前的《道德經》的源本中,二十世紀八十年代以后才開始使用簡體字,大部分源本仍然保留著繁體字,在建庫的時候最好配上簡體字,以方便不熟悉繁體字的讀者。第三個難點是古漢語標點的問題。古漢語都不斷句,“五四”運動之后才出現了帶通行標點符號的古書。這些在以后的研究中都可以進一步改進。
另外,本研究除了建設《道德經》雙語平行語料庫之外,還將通過語料庫分析它的不同譯本風格,以后還可以進一步研究譯本共性,發現譯誤,改進譯文,總結翻譯策略,從而為譯員提出典籍翻譯的原則,為廣大讀者提供更好的譯本,更好的描述翻譯現象,再現翻譯過程,揭示翻譯規律。
參考文獻:
[1]馮曉黎.帛書本《老子》四英譯本的三維審視[D].上海外國語大學,2007.
[2]汪定明,李清源.《老子》漢英翻譯平行語料庫建設[J].上海翻譯,2013 (04):60-64.
[3]文軍,羅張.《道德經》英譯研究在中國[J].上海翻譯,2012 (01):19-23.
[4]溫軍超.華人《道德經》中英平行語料庫的構建分析[J].淮北師范大學學報(哲學社會科學版),2017,38 (01):115-119.
[5]辛紅娟,高圣兵.追尋老子的蹤跡——《道德經》英語譯本的歷時描述[J].南京農業大學學報(社會科學版),2008 (01):79-84.
[6]嚴敏芬,閔敏.基于語料庫的《道德經》核心哲學術語英譯研究[J].南京航空航天大學學報(社會科學版),2013,15 (04):60-65.
[7]Baker,Mona.Corpus linguistics and translation studies:implications and applications[A].In M.Baker,et al(eds.).Textand Technology[C].Amsterdam:Benjamins,1993:233-252.