劉政+程麗
【摘要】口譯語料庫在教學和研究上日漸重要,本文在評價當今具有代表性的三個國內外口譯語料庫的基礎上,歸納和總結了口譯語料庫的發(fā)展現(xiàn)狀,指出了語料庫研究和發(fā)展應注意的問題和前景。
【關鍵詞】口譯語料庫 發(fā)展現(xiàn)狀 總結反思
【中圖分類號】H059 【文獻標識碼】A 【文章編號】2095-3089(2016)07-0102-01
一、口譯語料庫研究綜述
隨著科技發(fā)展的不斷進步,語料庫研究和發(fā)展取得了令人矚目的成績,逐漸發(fā)展成為了當今語言學研究的主要方法之一,同時也在不同程度的影響各個分支學科的研究(梁茂成,2010)。在翻譯研究中,語料庫翻譯在最近二十年中反戰(zhàn)迅速,在譯者風格,翻譯教學,翻譯普遍性,翻譯規(guī)范等各領域取得了不少的亮點。在此基礎上,口譯研究也開始借鑒語料庫,但是相比文本翻譯,口譯語料庫研究進展不夠明顯(張威,2012)。
我們的口筆譯教學或培訓,將不可避免的要使用新的工具和技術,誰先邁出一步,誰就占據(jù)前沿,誰就能夠獲得創(chuàng)新的資源(王克非,2004)。口譯語料庫的研究方法為人們探索口譯現(xiàn)象打開了全新的視野,也給現(xiàn)有的口譯理論和假說提供了絕佳的檢驗和研究的途徑。在近二十年的口譯語料庫研究上,學者們在口譯語料庫建設,數(shù)據(jù)轉寫和標注,檢索工具的開發(fā)和具體研究與應用等方面進行了一系列的開拓研究,為進一步發(fā)掘其研究潛力奠定了良好的前期基礎(陳菁,2014)。口譯語料庫可以幫助我們探尋口譯譯文的特點,檢驗現(xiàn)存的口譯理論,考察各種口譯對策對口譯效果的直接影響,還可以幫助我們撇開偏見,研究語際交流和口譯的特殊性。這種基于語料庫語言學的方法和技術將最終幫助口譯研究實現(xiàn)從規(guī)定性研究到描寫性研究的飛躍(Baker, 1993)。
二、口譯語料庫現(xiàn)狀分析
在最近十幾年的研究發(fā)展中,日本,意大利和中國等各國的研究人員先后建立了幾個不同的口譯語料庫,分別是日本名古屋大學建立的CIAIR口譯語料庫,意大利博洛尼亞大學建立的EPIC歐洲議會口譯語料庫,中國由文秋芳教授等學者建立的大學生口譯學習者語料庫等。
1.日本名古屋大學綜合語音信息研究中心同聲傳譯語料庫
從1999到2003年日本名古屋大學綜合語音信息研究中心初步完成了包含英語和日語的同聲傳譯語料庫,共收錄了182小時的錄音資料,轉寫材料共計約百萬字,是目前世界上最大規(guī)模的同聲傳譯語料庫。該語料庫包括演講和對話的英語和日語的口譯錄音和文本,一共收錄了三十位英語話語者,十五位日語話語者和三十一位口譯譯員的同聲傳譯翻譯材料。這些錄音和文本材料同時具備時間標注和文本識別標注,每一段文本都配備了源語言話語者和同聲傳譯譯員結合在一起,全部經(jīng)過了聲道處理。經(jīng)過了耳機處理,左右耳分別會傳出源語言話語者和譯員聲音。
名古屋大學的研究學者在此口譯語料庫的基礎上做出了各方面的研究,包括機器同聲傳譯,同聲傳譯中譯員語速和翻譯單位,同聲傳譯譯員和源語言話語者的輸出時間差等。作為世界最大規(guī)模的口譯語料庫,CIAIR有完善的建庫技術,非常有利于機器翻譯,包括機器口譯的研制與發(fā)展,豐富了機器口譯研究以來的語料以及語言實踐操作的基礎,有利于挖掘口譯中的一些自動對應的結構和規(guī)則(李婧,李德超,2011)。
CIAIR同聲傳譯語料庫所有的錄音全部非正式的口譯現(xiàn)場場景,而是來自于模擬場景,語料庫錄音來源于口譯訓練教室或者模擬會場,不是真正的同聲傳譯工作情景,這些錄音及文本很有可能與真實同聲傳譯工作情境有差異,所以語料庫在口譯研究的真實性和生態(tài)效力上很有可能存在較大誤差。
2.意大利博洛尼亞大學的EPIC歐洲議會口譯語料庫
在2004年意大利博洛尼亞大學的翻譯語言與文化研究小組創(chuàng)建了包含英語,意大利語以及西班牙語的歐洲會議口譯語料庫。這個語料庫的錄音全部來自于歐洲國家聯(lián)盟全體會議的口譯現(xiàn)場,共有一百四十個四小時左右的錄像文件,包含了會議中的源語言演說以及相對應的英語,意大利語和西班牙語的同聲傳譯。
本語料庫中的同聲傳譯錄音與日本語料庫最大的不同在于譯員全部都是具有高專業(yè)技能和經(jīng)驗的從業(yè)人員,并且譯員之間水準差別不大,所有的語言均是由譯員的被動語言譯為主動語言,即從源語言轉化為譯員的母語。其他可能影響口譯的因素如會前準備,工作場合及設備等都相似或一致。這些特點使得本語料庫適合于研究特殊體裁的同聲傳譯。同時,此語料庫還適用于教學,會議錄音和錄像非常適合于學員訓練,包括在聽力練習,源語言概述,糾正錯誤和鍛煉新技能。
3.中國大學生口筆譯語料庫
中國大學生英漢漢英口筆譯語料庫即PACCEL是由我國的文秋芳教授牽頭創(chuàng)建的,收集了從2003年到2007年全國十八所高校英語專業(yè)學生在三年級或者四年級進行英漢漢英互譯測試的語料,規(guī)模接近二百一十萬字。其中的口譯語料庫主要收集的是專業(yè)八級考試中的口試部分,受試群體為英語專業(yè)高年級學生。有余受試群體和測試標準和評判標準都具有非常好的一致性,本語料庫,能夠有效幫助研究者了解中國英語專業(yè)學生的英語學習過程和效果,對教學,研究,測試,培訓,教材編寫和課程設置具有重要的意義。
本語料庫具有較好的檢索功能,能夠在教學與研究上提供良好的幫助,但與上述兩個語料庫相比不足之處在于這是一個學習者語料庫,與口譯的真實場景有較大差異,而且受試者的水準離專業(yè)譯員相差比較大,因此,語料庫研究領域受到限制,語料庫研究變量難以控制,控制變量和后期處理更為難以把握。
三、口譯語料庫的研究總結和反思
將語料庫語言學的理念和方法引入口譯教學和研究領域,是口譯學科發(fā)展的一個戰(zhàn)略方向和重點,同樣,口譯語料庫的建設和研究也是將來口譯教學和研究反戰(zhàn)的方向(張威,2012)。在口譯語料庫現(xiàn)有的基礎上,我們應該從以下幾個方面加強相關建設和研究:首先,擴大語料庫的規(guī)模,加強語料庫的類型,深化語料加工層次,提高語料加工精度,完善口譯語料庫建設和提高其代表性。語料庫的建設比較復雜,需要收集,錄制,分類處理聲音,收集程序繁復,真實口譯場景資源較少。語料庫的建立同時要注意語料的代表性,語料庫是否具有代表性直接關系到在語料庫基礎上所做的研究以及結論的可靠性和普遍性(楊惠中,2002)。其次,我們應該拓展研究視野和主題,同時運用多種研究方法進行綜合考察分析,加大學科間的合作交流,提高語料庫的研究質量。口譯語料庫能夠為教學和研究提供寶貴的素材,真實場景的語料可以為學員學習和訓練的參考和標準。不同的口譯語料庫對于學員聽力,多任務處理能力有重要的作用。基于語料庫的教學分析和反饋能夠為教學和研究提供更多的途徑。這樣,口譯語料庫的建設和研究才能更加成熟,在此基礎上的教學和研究才能夠不斷提升,口譯教學和研究與多學科領域的交流才能進一步擴大。
參考文獻:
[1]王克非.雙語平行語料庫在翻譯教學上的用途[J].外語電化教學,2004(6):27-32.
[2]秦洪武,王克非. 對應語料庫在翻譯教學上的應用:理論依據(jù)和實施原則[J].中國翻譯,2007(5):49-52.
[3]張威.口譯語料庫的開發(fā)與建設:理論與實踐的若干問題 [J].中國翻譯,2009(3):54-59.
[4]胡開寶,陶慶. 漢英會議口譯語料庫的創(chuàng)建與應用研究 [J].中國翻譯 2010(5):49-56.
[5]王斌華,葉亮.面向教學的口譯語料庫建設:理論與實踐[J].外語界,2009(2):23-32.