靳 松
(西北民族大學外國語學院 甘肅 蘭州 730030)
國外口譯語料庫的開發起步于20世紀末,現已建成幾個較為成熟的語料庫。其中最有特色的語料庫有兩個:一是日本名古屋大學設計研發的目前世界上規模最大的英語、日語雙語同傳語料庫,該語料庫采編的口譯錄音材料為182小時轉寫;二是意大利博洛尼亞大學研究人員開發的歐洲議會口譯語料庫,該語料庫是一個包含英語、意大利語、西班牙語的多語平行語料庫,庫容量約為18萬字。
國內口譯研究起步雖晚(20世紀70年代),但發展速度較快,各類專著、譯著、研究課題及相關論文如雨后春筍,異彩紛呈。盡管口譯研究成績斐然,但是口譯語料庫的研究與建設到2007年后才初現端倪。目前已進入研究和應用階段的口譯語料庫是由上海交通大學研究開發的以國內外新聞發布會口譯活動為對象的漢英會議口譯語料庫,容量約為54萬字,該語料庫的語料也來自職業譯員的口譯實踐。另外還有文秋芳教授等人創建的50萬字規模的中國大學生英漢、漢英口譯語料庫,該語料庫為了真實反映口譯學習者口譯狀況,選取的研究對象為高等院校英語專業漢族學生。
隨著口譯語料庫的開發與建設,基于語料庫的口譯研究也相繼展開,包括對口譯文本、口譯操作方式、口譯策略等問題進行的初步量化描述與分析。目前,基于語料庫的大多數口譯研究主要遵循“建設語料庫,研究語料庫”的原則,即依托現有的口譯語料庫,通過數據統計和分析,對具體問題進行量化描述。
“語料庫是應用計算機技術對海量自然語言材料進行處理(包括預處理、語法自動附碼、自動句法分析、語義分析等)、存儲,以供自動檢索(retrieva1)、索引(concordance)以及統計分析的大型資料庫”(李文中,1999:51)。英語語料庫作為口譯教學的輔助工具,可以提供大量真實的語言材料、豐富的詞匯和語境,而其可獨立操作性可以充分調動學生學習口譯的積極性??谧g教學中語料庫的運用對口譯教學有著巨大的價值,表現在:1.呈現了大量真實的語言材料;2.提供了豐富的詞匯及語境;3.可以獨立操作,從而鼓勵學生主動思考;4.“語料庫方法注重運用而非能力,重描述(description)而非普遍語法(universals),重量化分析(quantitative analysis) 而非定性分析(qualitative analysis)”(李文中,1999:52)。教師和學生能夠得到更加具有統計意義的數據,客觀審視語言的實際運用而不拘泥于書面的文本,這一點對口譯實際操作更具指導意義。由于語料庫中語料的內容和形式多樣,教師可根據各種口譯語料內容、形式開展不同的口譯教學與實踐,這種口譯課堂的教學內容與形式更加多樣,效果更加明顯。而且語料庫中的教學語料難度各異、語速及口音多樣,教師可在不同的教學階段為學生安排相應的訓練內容,并讓學生體會、適應真實的口譯現場,這樣的口譯課堂顯得更加合理,有利于對學生的培養。對于教師來說,口譯教學語料庫的資料多樣性、大規模性、檢索便利性等特點能有效幫助口譯教師增加訓練材料,豐富訓練內容,節約訓練時間。
建設基于口譯教學的實際情景的口譯語料庫,不僅可以在很大程度上克服口譯教學在材料、環境等方面“非真實性”的缺陷,使口譯學員更多地獲得“身臨其境”的感受,還可以嘗試新的教學形式與策略,活躍教學氣氛,提高教學效果。與其他類型語料庫不同,口譯教學語料庫注重材料的現場性和實時性、提取的便利性、語料存儲的多媒體性。主要包括以下幾個方面:
1.口譯教學語料的收集
口譯教學語料庫的語料主要來自于利用多媒體設備對口譯課堂中學生口譯訓練的錄音以及各類會議、會談、訪談、演講等需要進行口譯的現場。收集內容涵蓋源語發言、目標語口譯以及文稿、會議日程等材料,材料以錄音或錄像和文字的形式呈現出來。
2.語料的整理
與其他語料庫不同,口譯教學語料庫的初始語料多為音頻或視頻,需要對原始語料進行錄音轉寫,使口譯教學語料庫的主體語料應至少具備音頻和文字兩種形式以便學生和教師使用。
3.語料的標注
口譯教學語料庫需要根據口譯材料的主題、場合、源語語體、難易程度、語速、時長、來源進行細致的分類。(l)“副語言”標注。“副語言”信息是口譯語料標注的一項關鍵內容,應該充分借鑒口語語料庫對口語信息標注的成功經驗,探索適合口譯特點的“副語言”標注策略。(2)超語言信息標注。除基本的詞性標注外,口譯語料的超語言標記不僅應該包括譯者信息、時間、地點、口譯活動組織者等信息,還應考慮包括反映口譯交際特色的其他信息,如源語發布形式(自由發言、提綱式發言、帶稿誦讀等)、場景(會議口譯、社區口譯等)、工作形式(同傳、交傳等)、口譯聽眾性質(知識背景、目的、外語水平等)、技術設備(傳統會場形式、遠程口譯、如電視、電話、網絡)等。
4.技術處理
技術處理是口譯教學語料庫建立過程中最為復雜的環節,這一環節的處理需要與相關技術人員的有效配合,對各種語料進行多媒體格式處理、噪音處理、相關軟件配備,雙語語料的平行對齊處理,檢索工具的開發等程序。當前,數碼式錄音、錄像設備日益普及,不僅可以保證原始口譯語料的采集質量,也非常有利于語料的后期校對、時間標記、對齊等工作。同時,語料自動標注技術也對口譯轉寫材料的標注加工有較大的應用價值 (參見王克非等,2004:21-22)。此外,自然語言工程領域內的語音識別技術也取得了一定突破,有利于口譯語料的自動轉換工作。(參見倪崇嘉等,2009)
口譯語料庫的建設面臨諸多困難。口譯語料必須由口語轉寫為文字形式,而這只能通過人工來進行;而且,實際口譯活動中,如商務口譯、法庭口譯和會議口譯等,口譯內容轉瞬即逝,而且常常涉及機密和隱私,不便于公開,這些都增加了口譯語料建設的難度,具體表現在以下幾點:
1.語料采集與轉寫。首先,口譯活動的時間、場所以及人員配合程度(口譯員、會場主辦者等)等因素依然在很大程度上限制著語料收集的順利進行。其次,作為一種特殊的口頭語料,口譯語料涉及源語口語與譯語口語兩種語料,語料的采集、轉寫工作更加復雜、艱辛,面臨著口語語料采集工作的“雙重困難”。(參見楊惠中,2002:57;kedney,2000:80-82)
2.口譯語料標注的特殊性。除對語料進行文本結構和詞性標注等一般性加工處理外,口譯活動的特殊性也給口譯語料的標注帶來了特殊的困難與挑戰。(1)語料時間切分。在口譯活動中,發言人與譯員的語言表達往往存在一定的時間間隔,這種間隔能較直接地反映出主題熟悉程度、譯員認知素質等問題。此外,通過考察原文與譯文在語言形式與語義兩方面的對應情況,可有助于確定口譯信息的轉換單位,同時也能為客觀分析口譯中的“脫離源語語言外殼”現象(巴黎的釋意派Déverbalisation)提供實證材料。而要實現以上目標,就須對原文和譯文語料進行精確的時間切分與標注,并根據具體要求進行不同層次的對齊。目前的錄音設備雖然能對原始語料進行較為精確的標定,但原文與譯文的起始時間差異以及具體對應單位的時間關系,仍需人工確定,很大程度上影響了時間切分的精確性。(2)“副語言”信息標注。如前所述,停頓、支吾語、語音拖長等“副語言”現象在口譯活動中具有重大的意義,但當前的語料標注工具還不能對這些“副語言”現象進行自動標注,仍需進行人工辨別,僅此一項工作就大大增加了口譯語料庫建設的難度。
3.源語與譯語的對應層次??谧g實踐的特點(特別是同傳)要求口譯員在短時間內完成源語核心信息的有效傳遞,促成交際雙方的交流與溝通。因此,“字字對譯”或“逐句對應”并非口譯實踐的常態,“信息對等”、“功能等效”才是評價口譯質量的首選因素(劉和平,2002)。因此,口譯語料庫不應進行“字對應”,也難以實現在筆譯語料庫中的“句對應”(參見王克非,2004)。同時,要想實現口譯語料庫的“信息對應”,須首先解決口譯信息單位的劃定標準、量化指標等關鍵問題,而上述問題迄今尚未形成定論。(參見勒代雷,2001:15一16.蔡小紅,2003)
基于語料庫的口譯教學能夠適應當代學生的習慣,注重他們的個人需求,刺激他們的學習興趣,有效幫助他們進行口譯訓練。將語料庫語言學與口譯活動進行有機結合,創建具有教學與研究多重用途的口譯語料庫,不僅符合翻譯學科發展的大方向,更應該成為語料庫建設與應用性研究的一個新課題,受到更多的關注與支持。而且,口譯語料庫的開發與建設,不僅對提高口譯研究質量、促進口譯教學改革、完善機器口譯研究與應用有重大意義,也必然對豐富語料庫類型、擴大語料庫應用研究范圍、深化語料庫研究層次起到積極的促進作用。
[1]Bendazzoli,C.,Sandrelli,A.,&Russo,M.Disfluencies in Simultaneous Interpreting:A corpus-based analysis[A].In Kruger,A.,Wallmach,K.&J.Munday(eds.) Corpus-Based Translation Studies:Research and Applications[C].London&New York:Continuum Continuum International Publishing Group,2011.
[2]葉亮.面向教學的口譯語料庫建設:理論與實踐[J].外語界,2009(2)
[3]北京大學計算語言學研究所.北京大學漢英雙語語料庫標記規范[J].北京:JournalofChineseLanguageandComputing,2003.
[4]陳振東.口譯課程培養模式探索[J],中國翻譯,2008(4).
[5]李文中,語料庫、學習者語料庫與外語教學[J],外語界,l999(1).
[6]王立非,張巖.基于語料庫的大學生英語議論文中的語塊使用模式研究[J].外語電化教學,2006(8).
[7]胡開寶.語料庫翻譯學概論[M].上海:上海交通大學出版社,2011.
[8]李婧,李德超.基于語料庫的口譯研究:回顧與展望[J].中國外語,2010(5).
[9]楊惠中.語料庫語言學導論[M].上海:上海外語教育出版社,2002.
[10]張威.口譯語料庫的開發與建設:理論與實踐的若干問題[J].中國翻譯,2009(3).
[11]張威.近十年來口譯語料庫研究現狀及發展趨勢[J].浙江大學學報,2012(3).