張慧婷
(江蘇省有色金屬華東地質勘查局,江蘇 南京 210007)
語料庫是按照一定的語言原則,運用文本或話語片段而建成具有一定容量的大型電子文本庫。1999 年廣東外語外貿大學桂詩春教授和上海交通大學楊惠中教授牽頭開發建成“中國學習者語料庫”(CLEC)。許多高校研究者個人也建立了適合自己的小型專用英語語料庫,如廣州體育學院陳建生建立了美國職業籃球比賽賽事報道語料庫,并探討了體育英語語料庫的建設;在工作中積累了很多專用詞匯,結合實際,本文主要進行后者的研究,探討構建個性化的,專門化以及行業化的語料庫的設想。
(1)對外發展需要。隨著礦業對外的發展,對外的交流就越來越需要得到重視,建立一個有色金屬行業英語語料庫,對ECE的涉外業務的發展也會添磚加瓦。
(2)資源綜合利用。ECE下設的翻譯中心承擔對外業務文件翻譯,每年約280萬字的翻譯量。翻譯過的資料都未整理成庫,建設專用語料庫,可以將之前工作積累的一部分資源轉換為語料,服務于自行建立的語料庫,倡導資源綜合利用。
(3)有色金屬行業創新性。目前經過初步調研,有色金屬行業還未出現專業的語料庫,而語料庫語言學又的確提供了研究專門英語的新方法與新視角,建立一個有色金屬行業專用語料庫是大勢所趨,也具有行業創新性,將給有色金屬翻譯研究者注入新的活力[1]。
語料庫的建設要考慮的因素很多,構建方面如建庫目的,建庫內容,建庫原則。構建步驟可分為語料采集、語料校對、語料標注等。本文從以下幾個方面闡述構建ECE專用英語語料庫的主要參數。
依據Mona Baker的理論,用于翻譯研究的語料庫主要有三種類型:平行語料庫(parallel corpus)、可比語料庫(comparable corpus)和多語語料庫(multilingual corpus)。在這三類語料庫中,平行語料庫與翻譯實踐之間結合最為緊密。翻譯人員在遇到一些無法翻譯的詞語或者搭配時,可以通過查詢工作,從語料庫中找出相關內容,從而輔助翻譯者的翻譯。譯者通過檢索語料可以有效、即時地提高翻譯速度和譯文質量。語料庫建設的初衷就是更好的服務于翻譯,資源的綜合利用,因此ECE專用英語語料庫構建的是平行語料庫[2]。
為了滿足對有色金屬英語詞匯、句法、篇章等多方面的定量與定性分析研究的需要,有色金屬英語語料庫需要遵循以下原則:
①抽樣隨機原則:對有色金屬語言素材進行分層次、分類別地收集,從而建立盡可能全面反映有色金屬英語語言事實的語料庫。保證語料的質量和樣本的代表性。②內容真實原則:收集的語料不進行刻意的改正與修飾,盡量保證語料的原汁原味。③庫容適度原則:語料規模是中小型。建庫第一階段,只考慮書面語文本,暫不收口語語料。④質量過硬原則:收錄的語料要挑選語言質量高的原本,特別注意譯本的質量。

圖1 建庫步驟
(1)人工翻譯轉換為機器翻譯,提高工作效率。利用專用英語語料庫,把制作好的語料庫按照規定的格式編輯好,然后利用計算機輔助翻譯軟件的詞庫和例句庫導入功能,把該語料導入到翻譯軟件,如果遇到庫中儲存的詞語和例句,可以利用軟件的翻譯記憶和計算機匹配技術,既提高翻譯效率,又提高翻譯的準確性和一致性。
(2)加深有色金屬英語語言規律的認識。建立語料庫能夠對有色金屬英語的各種現象做出全面細致的描寫,易于觀察發現其特點與規律。專用語料庫針對性強,語料新,語境豐富,利用檢索功能,可以對有色金屬行業的英語措辭,詞語搭配等進行研究,可以了解行業英語規律。
(3)學習材料與辭典編纂。語料庫不僅能夠提供更完備和詳盡的關于詞義和詞匯搭配的信息,而且利用語料庫中的頻率統計可以直觀的反映詞匯用法的使用情況。由于語料庫的素材來自實際使用的語言,利用其素材作為詞典的例句更具真實性和準確性。利用語料庫編撰詞典不僅能反映語言的真實變化,而且編撰周期也會大大縮短。待語料庫庫容逐漸擴大后,可以整理一些學習材料并且適當時編撰專屬于ECE的學習詞典[3]。
目前國內沒有有色金屬的英語語料庫,因此建立一個專門用途的有色金屬語料庫,使有色金屬語料更廣泛,操作更簡便,更具即時性,集學習、研究和使用為一體,是一個值得研究的話題。本文對建立有色金屬語料庫進行了可行性研究,語料庫建設是一項復雜、繁重的工作,更好的服務工作。語料庫是有用的參考工具或工作平臺,具有廣闊的使用前景和潛在開發價值。無論從深度上還是從廣度上,該領域的研究還有進一步提高的空間。