王 培
(成都理工大學 四川 成都 610000)
語料庫在科技論文摘要翻譯中的應用
王 培
(成都理工大學 四川 成都 610000)
隨著我國建設創新型國家戰略的逐步深化,科學技術的發展成為必然趨勢。科技論文摘要對科技論文的傳播極為重要,但是由于我國在該領域的研究時間不長,因此科技論文摘要的英譯存在許多問題。本文基于現代語料庫的技術,通過自建小型語料庫,從詞匯和句法兩個方面對科技論文摘要中的詞頻及平均句長進行了對比和分析,并得出結論。
語料庫;摘要翻譯;常見錯誤
隨著科學技術的發展,科技英語以及科技論文在世界上發揮著越來越重要的作用。為了滿足科學技術交流的需要,論文摘要的翻譯也日益重要。由于科技英語的研究歷史短,因此翻譯質量參差不齊,對國際技術交流造成了一定的障礙。本文在對科技論文摘要的自建小型語料庫的基礎上,對15個譯本的類符形符比、詞頻和平均句長進行了對比分析,并利用這些數據,分析了科技論文摘要的常見翻譯錯誤。找出這些常見的錯誤,可以幫助我們更好地翻譯文摘。
2.1 科技論文摘要的定義。作為科技論文主要觀點的集中概括,科技論文摘要是科學研究的發展呈現,是理解科技成果的捷徑。對于許多科技工作者而言,他們會先接觸到摘要,然后才是科技論文。學術文摘在學術界不容忽視。摘要翻譯的規范化將有助于學術界的國際交流,也有利于擴大中國科學成就的影響。
2.2 科技論文摘要的特點
摘要的特點包括規范性、簡潔性、具體性和完整性。
首先,科技論文摘要采取正式的風格,要求嚴謹。其結果是,摘要中的句子是完整的,用詞是規范的。此外,標準術語取代了縮寫詞和古語詞。其次,摘要要求簡明扼要,有示例和對比。此外,在摘要中應使用一些單詞來連接上下文,使上下文簡潔緊湊。 第三,每一個概念和論點都應該是具體和不同的。在摘要中,法語和拉丁語應該用來替代詞的多義詞。最后,摘要本身應該是完整的。有些讀者會用摘要來進行研究,因此,完整性是很重要的。
英語摘要的長度應控制在100到150個單詞之間。冗長的翻譯將導致內容累贅,而過于簡短的內容又無法概括摘要的信息。在科技論文的摘要翻譯中,廣泛應用被動語態和無生命的主體,因為可以強調摘要的客觀性,并突出摘要所要表達的信息。
2.3 語料庫的定義。在語言科學中,一個語料庫是一個書面文本或轉錄的語音,可以作為語言分析和描述的基礎。作為一個電子數據庫中文本的集合,語料庫的定義是電子數據庫,但由于其種類繁多也帶來許多疑問。
以下是一些語料庫的定義:在《語料庫、一致性和搭配》中,辛克萊指出,主體是一個自然發生的語言文本集合,用來表示一種語言的狀態或變體。通常的假設是,存儲在一個語料庫的語言是自然發生的,它是根據明確的設計標準和大腦中的特定目的,來代表所選語言的較大數據塊。通常情況下,語料庫處理的是自然、真實的語言。斯塔布在《單詞和詞組》指出,語料庫是一個集合的文本,為一些特定的目的所使用,通常是教學或研究。一個主體不是一個說話者所做或知道的事情,而是一個研究者所建構的東西。它通常是許多不同用戶的行為記錄,并用來進行研究,以便我們可以對典型的語言使用有新的認識。
語料庫可以分為多種類型,如:一般/平衡/核心語料庫;專業語料庫編譯構建語言模型和語言處理:訓練語料和測試語料庫;編制區域或社會語言學變異研究:方言語料庫,語料庫的語料和區域、非標準語料庫等。語料庫語言學中有許多基本的概念,如:類符(被看作是代表所有與它類型相同的一類符號);形符(被視為一個單獨的具體符號,而不是作為一類相同的符號)等等。
本文在對科技論文摘要的自建小型語料庫的基礎上,對15個譯本的類符/形符比、詞頻和平均句長進行了對比分析,并利用這些數據,分析了科技論文摘要的常見翻譯錯誤,減少了主觀性,便于對科技論文摘要的常見翻譯錯誤進行分析,而且發現常見的錯誤也可以幫助我們更好的翻譯文摘。
3.1 平均句長。在面對具有鮮明文體特征的原始文本時,我們應該考慮翻譯過程中是否再現了文體特征。在一個詞中,文體分析可分為四個部分:句法結構、詞匯、語音和語篇結構。本文只分析了句子的長度,這是句法的基本層次。通過分析不同翻譯版本的平均句長,可以發現翻譯的文體特征。
讓我們運用Wordsmith軟件對15個譯本的平均句子長度差異進行分析。根據WordSmith的統計功能,作者提取了其中三個語料庫,經過分析后發現,針對相同的原文,15位譯者都有自己的翻譯版本。其中兩個版本中的句子屬于長句,但語料庫有巨大的差距,這應該引起我們的注意。根據顯示的信息,作者發現,原文是5句,128個字,平均句子長度為25.6;Amy的翻譯為7句,156個字,平均句子長度為22.2;David的翻譯是9句,168個字,平均句子長度為18.6。在對統計數據進行分析后,作者發現兩個學生的翻譯版本都比原來的文本長。因此,兩個版本都不接近原文,沒有考慮到摘要翻譯的特點,因為英語摘要的長度需控制在100到150個單詞之間。
3.2 詞頻。作者用AntConc從處理過的文本中提取高頻詞,然后分析詞頻,從而對詞語的使用情況進行分析。通過分析數據作者發現,在David的翻譯中,“他”一詞出現了四次,“一”這個詞出現了三次。摘要有一個明顯的特征,就是客觀性。但是,在這15個翻譯版本中,作者發現有13個人使用了“我”。科技論文的摘要是為了陳述事實,因此,譯者應盡量避免使用第一人稱,防止因個人主觀性而影響論文的客觀性。
本文在對科技論文的摘要和語料庫進行簡單分析后指出了科技論文摘要翻譯中的常見錯誤,并在對科技論文摘要的自建小型語料庫的基礎上,對15個譯本的詞頻和平均句長進行了對比分析,從而減少了主觀性,便于對科技論文摘要的常見翻譯錯誤進行分析,從而使研究更具科學性。作者也認為,摘要有其自身的翻譯特征,語料庫在科技論文摘要翻譯中的應用將有利于譯者的翻譯。
[1] 何安平,《語料庫語言學與英語教學》。北京:外語教學與研究出版社,2004年
[2] 黃昌寧,李涓子著,《語料庫語言學》。北京:商務印書館,2002年
[3] 錢多秀,《計算機輔助翻譯》。北京:外語教學與研究出版社,2011年
王培(1992.02-),女,漢族,陜西榆林,碩士研究生,成都理工大學,英語筆譯方向。
G232
A
1672-5832(2016)08-0263-01