王敏 李麗霞
摘 要: 近年來,專門用途語料庫的研究與建設逐漸成為語料庫語言學研究領域的一大熱點,眾多專門用途語料庫都在紛紛籌建之中,為專門用途英語的發(fā)展及教學研究提供了幫助。然而,作為專門用途英語教學中的重要部分,農(nóng)業(yè)英語教學卻缺乏對應的語料庫建設和研究。本文在簡述建設FAO農(nóng)業(yè)英語語料庫的背景和意義的基礎上,探討了FAO農(nóng)業(yè)英語語料庫的創(chuàng)建思路和技術支撐,指出了其建設的可行性;并總結了其在教學中的應用價值及其建設的必要性。
關鍵詞: 語料庫 FAO農(nóng)業(yè)英語語料庫 建設 應用
1.概述
1.1語料庫和語料庫語言學。
語料庫(corpus,復數(shù)為corpora)一詞來源于拉丁語,本意為body。它是一個按照一定采樣標準采集而來的、能夠代表一種語言或者某語言的一種變體或文類的電子文本集。語料庫是建立在計算機上的,必須以電子計算機為載體存放語料,且這些語料均在實際使用中出現(xiàn)過,因此可以真實地反映語言現(xiàn)象。語料庫使大規(guī)模真實文本的自動處理得以實現(xiàn),可以為語言研究提供更加豐富、更加詳盡的語料,同時為語言研究提供另外一種客觀的方法,即基于實驗和統(tǒng)計的方法(譚鍵,2005)。它改變了傳統(tǒng)的語言研究方法,有助于克服語言研究過程中的主觀性和片面性。此外,語料庫對于詞典編纂、字頻統(tǒng)計、詞頻統(tǒng)計、語法研究等具有巨大的推動作用。
語料庫語言學(Corpus linguistics)是在語料庫的基礎上對語言進行分析和研究的科學(許家金,2003;衛(wèi)乃興,2009)。傳統(tǒng)的語言學家收集資料的方法基本為手工收集,進而在此基礎上進行分析與研究,最后得出結論。手工收集到的資料有限且主觀性較強,具有很大局限性,而語料庫語言學使大量地、詳盡地收集語料成為可能,可以使我們更為深刻、更為全面地研究語言現(xiàn)象。總之,語料庫語言學的產(chǎn)生,將改變語言研究的觀念,使語言研究日趨深入、精細。
1.2專門用途英語語料庫。
在語料庫語言學中,專門用途語料庫,是指出于某種特定研究目的需要,只收集某特定領域的語料樣本建成的語料庫(梁茂成,2010)。隨著語料庫在各領域研究的深入,通用語料庫,盡管容量巨大,還是無法滿足各專業(yè)領域研究的需要,如語言習得、語用語體、法律語言學研究等,這就要求研究者建立自己的專用語料庫,以進行某個特殊領域的研究。在大型通用語料庫不斷擴建的同時,研制更多的小型專用語料庫將是一大趨勢(何中清,2011)。隨著語料庫語言學的發(fā)展和完善,語料資源將會越來越豐富,通用語料庫的容量也會越來越大。此外,隨著語料庫研究在各個領域的縱深發(fā)展,小型的專門用途英語語料庫必然會成為一種發(fā)展趨勢,研究的越深入、專業(yè)性越強,專門用途英語語料庫越必不可少。
近年來,專門用途語料庫發(fā)展迅速,許多與專業(yè)相結合的專用英語語料庫紛紛建設起來(黃大網(wǎng),秦羿,許賽穎,2010),然而,作為專門用途英語教學的重要組成部分,農(nóng)業(yè)英語教學仍然沒有得到足夠重視,缺乏對應的語料庫建設和研究,不利于農(nóng)業(yè)英語教學的發(fā)展與進步。目前,國內(nèi)已經(jīng)有建成的或建設中的眾多與專業(yè)英語相結合的專門用途英語語料庫,如航空航天英語語料庫、醫(yī)學英語語料庫、學術英語語料庫、商務英語語料庫(梁燕,馮友程,良坤,2004;劉滿堂,2004),這些語料庫的建立及其研究成果,推動了專門用途英語教學(English for specific purpose,ESP)的發(fā)展,對提高國內(nèi)專門英語教學水平有重要意義,同時為我們進一步完善建成農(nóng)業(yè)英語語料庫提供了寶貴借鑒。目前,國家農(nóng)林院校擁有農(nóng)學、林學、植物保護、動物科學和生命科學等優(yōu)勢學科和專業(yè),如果這一優(yōu)勢能夠和專門用途英語教學相結合,建立相應的農(nóng)業(yè)英語語料庫,則將大大推動農(nóng)業(yè)英語教學,尤其是詞匯教學,將邁向新的臺階,對解決目前農(nóng)業(yè)院校外語教學中存在的諸多問題具有重要意義。同時,農(nóng)業(yè)語料庫的建成,也將豐富和完善語料庫的類型,推動語料庫語言學在農(nóng)業(yè)詞匯、短語及語篇等方面的發(fā)展。
2.研究意義
本研究力圖建設FAO農(nóng)業(yè)英語語料庫,作為農(nóng)業(yè)英語語料庫下的一個子庫,并在此基礎之上進行農(nóng)業(yè)英語語言特點方面的研究,這一研究將有助于填補學科專業(yè)語料庫的空白,豐富專門用途語料庫的研究內(nèi)容,提高農(nóng)林院校專業(yè)英語的教學水平,具有重要的現(xiàn)實意義和應用價值;為農(nóng)業(yè)專業(yè)英語教學,特別是詞匯教學,提供新途徑,對探索圍繞某一主題、以語義聯(lián)想為中心的農(nóng)業(yè)英語詞匯學習有一定的幫助作用,對提高教學和學習的效率有重要意義;通過詞匯范疇的分析,讓專業(yè)學生及時把握農(nóng)業(yè)熱點領域,同時獲得更多的擴展學習資源;探索解決目前農(nóng)業(yè)專業(yè)英語教學中存在的問題,推廣語料庫驅動型教學模式,順應專門用途英語(ESP)教學改革的熱潮,對提高農(nóng)林院校農(nóng)業(yè)專業(yè)英語教學水平具有實用價值;通過對專業(yè)詞匯的準確把握,提高各專業(yè)教師和學生的論文寫作質量,進一步保障其在SCI等國際期刊中論文發(fā)表的成功率,提高學校的國際影響力,與建設世界一流農(nóng)業(yè)大學的目標相呼應;有利于提高農(nóng)林院校教師和學生的專業(yè)農(nóng)業(yè)英語翻譯水平,對服務于歷年一次的國際農(nóng)業(yè)高新技術博覽會有重要意義,培養(yǎng)農(nóng)業(yè)英語高水平人才,加快與世界農(nóng)業(yè)科技接軌的步伐。
3.研究設計
3.1研究對象。
以聯(lián)合國糧食及農(nóng)業(yè)組織(Food and Agriculture Organization of the United Nations)官方網(wǎng)站上的涉農(nóng)新聞報道為文本來源建設FAO農(nóng)業(yè)英語語料庫,文本選自于2008年至2013年的農(nóng)業(yè)新聞報道,涉及農(nóng)業(yè)、畜牧業(yè)、生物科技、食品安全等18個農(nóng)業(yè)新聞主題,語料庫總量為234696個形符,共423篇。
聯(lián)合國糧食及農(nóng)業(yè)組織是聯(lián)合國系統(tǒng)內(nèi)最早的常設專門機構,其宗旨是提高人民的營養(yǎng)水平和生活標準,改進農(nóng)產(chǎn)品的生產(chǎn)和分配,改善農(nóng)村和農(nóng)民的經(jīng)濟狀況,促進世界經(jīng)濟的發(fā)展并保證人類免于饑餓。其官方網(wǎng)站的新聞報道涉及面廣,緊扣其工作重心,主要向全世界人民介紹當下的農(nóng)業(yè)熱點和糧食問題、對于向欠發(fā)達地區(qū)推廣農(nóng)業(yè)新技術和解決當?shù)氐募Z食短缺問題起到重要的推動作用,如政府有關農(nóng)業(yè)、農(nóng)村、農(nóng)民方面的政策;農(nóng)業(yè)生產(chǎn)實踐中的新發(fā)展、新發(fā)明、新成果;農(nóng)業(yè)科研方面的新問題、新進展及新經(jīng)驗;農(nóng)業(yè)科技戰(zhàn)線上杰出的人物、事跡等;農(nóng)業(yè)新技術推廣的新辦法、新途徑、效果及社會效益等。
3.2技術支撐。
3.2.1清潔工具。借助PowerGrep等文本編輯工具中的查找功能,清潔收集到的語料,處理全角標點、全角字母和數(shù)字、全角空格、跳格、行尾和文中多余空格、多余空行等問題,保證語料文本由清潔文本構成,保證自動詞性賦碼的準確性,進而保證檢索結果的準確性(梁茂成,李文中,許家金,2010)。以往的MicrosoftWord雖然也能清潔文本,但是只能處理單個文本,PowerGrep既可以處理單個文本,又可以進行批量處理。
3.2.2標注工具。一方面,可以通過BFSU Qualitative Coder1.1語料庫軟件進行元信息的批量標注,對每篇文本的標題、發(fā)表時間、來源、作者、期刊名稱、發(fā)表時間、建庫人和組織信息等信息進行標注,以便使用者清楚地知道文本信息的信息,也便于應用者單文本的查找。另一方面,為了對語料進行詞性和句法結構等方面的深度研究,也為了對語料庫數(shù)據(jù)分析能夠更加系統(tǒng)精確,對特殊數(shù)據(jù)信息進行提取和處理,本研究擬對生文本語料進行詞語切分和詞性賦碼標注。經(jīng)過比選,本語料庫的創(chuàng)建選用了比較成熟的Helmut Schmid設計的TreeTagger詞性賦碼軟件,TreeTagger詞性賦碼軟件可以根據(jù)概率的原則,用計算機進行自動化處理,是目前最權威的英語語料賦碼軟件之一。將清潔文本用Treetagger進行詞性標注,標注后的文本可以進行微觀的詞匯研究,通過檢索軟件可以得到相應的形成名詞詞表、動詞詞表等。
3.2.3重命名工具。由于文本處理過程中運用到了詞性標注軟件,詞性標注軟件在對文本進行詞性標注的同時,對文本的域名也進行了批量改寫,域名從原來的“.txt”改為了“.txt.pos”。因此必須運用重命名軟件將域名改回原來的“.txt”,才能被接下來的檢索軟件識別。因此,本研究可以利用Super Batch Renamer語料庫軟件進行批量改名。
3.2.4檢索工具。日本早稻田大學Laurence Anthony設計的Antconc,許家金和賈云龍(2013)研制開發(fā)的PowerConc軟件,英國利物浦大學Mike Barlow設計的Word smith Tools,北京外國語大學中國外語教育研究中心設計的PatCount等語料庫軟件,都可以進行單詞或者多詞的檢索,包含詞匯索引、詞表生成、主題詞計算等功能,這樣就為農(nóng)業(yè)科學學術英語的高頻詞進行量化分析提供了充分的技術保障,尤其是近來,許家金和賈云龍(2013)又研制開發(fā)了PowerConc軟件,PowerConc對傳統(tǒng)的詞匯索引、詞表生成、主題詞計算等功能進行了重構、擴展和優(yōu)化,正則表達式(regular expressions)的N元組(N-gram)為基礎二者的有機結合,功能強大,為我們利用正則表達式檢索被動語態(tài)和名物化的形式提供了強有力的技術支撐。此外,還有BFSUCollocator搭配分析軟件,BFSUcolligator類連接分析專用工具,SPSS,Excel等統(tǒng)計分析工具,都具有免費使用、功能強大、準確率高等特點,都為本研究提供了技術支撐,能夠保證本語料庫的建設和研究順利完成。
同時,國內(nèi)已經(jīng)有建成的眾多與專業(yè)英語相結合的專門用途英語語料庫和學術英語語料庫,如航空航天英語語料庫、醫(yī)學英語語料庫、旅游英語語料庫、商務英語語料庫,這些語料庫的建立及其研究成果,都給建設農(nóng)業(yè)科學學術英語語料庫提供了研究方法上的寶貴借鑒。
4. FAO農(nóng)業(yè)英語語料庫在農(nóng)業(yè)英語教學中的價值
4.1完善專門用途英語語料庫的建設,促進教學改革。
建立國內(nèi)首個FAO農(nóng)業(yè)英語語料庫,改變農(nóng)業(yè)英語專用語料庫發(fā)展滯后的現(xiàn)狀,完善專門用途英語語料庫的建設,為今后建立大規(guī)模農(nóng)業(yè)英語語料庫提供范例。語料庫可以提供大量可靠性高的參照數(shù)據(jù)和新鮮實例,使語言研究更具概括性和說服力,將給以往的教學材料帶來沖擊,為今后農(nóng)業(yè)英語教學提供直接的、可操作的、可靠性強的素材;FAO農(nóng)業(yè)英語語料庫將提供基于語料庫的農(nóng)業(yè)科技英語詞典編撰、基于語料庫和計算機的多媒體課件開發(fā)等,傳統(tǒng)的編寫方式比較固定,大多是依靠他人資料和個人經(jīng)驗編寫而成,而自語料庫出現(xiàn)之后,教材的編寫處于新的形勢,這將幫助教授農(nóng)業(yè)英語的英語專業(yè)教師更好地向專門用途英語教師方向轉變,促進專門用途英語教學改革(蔡基剛,2004)。
4.2改變教師的傳統(tǒng)教學模式。
英語教師一旦掌握了語料庫研究的使用技能,就可以通過語料庫進行農(nóng)業(yè)英語和通用英語詞匯、句法等方面的比較,進行主題分析、例句援引、詞語搭配、詞素分析、話語分析等,從而在掌握學生語言學習情況的過程中,根據(jù)語料樣本解決學生語言學習中遇到的問題,這種數(shù)據(jù)驅動學習的教學模式,把建成之后的FAO農(nóng)業(yè)英語語料庫直接應用于課堂教學,解決了英語教師缺乏農(nóng)業(yè)專業(yè)知識和專業(yè)詞匯,很難開展結合農(nóng)業(yè)特色的英語教學的矛盾,縮小了實際使用與課堂教學的差距(程世祿,張國揚,1995)。如課前,教師可以根據(jù)課程需求和學生英語掌握水平,從FAO農(nóng)業(yè)英語語料庫中選取與課堂教學相關的語言信息,可以是短語,也可以是例句,建立微型文本,有針對性地為學生提供大量豐富的語例,有效解決普通教材語例復現(xiàn)率低的弊端,更符合英語學習規(guī)律;課中,教師可以指導學生觀察更多語料,逐步修正完善規(guī)則,掌握目標知識。由于微型文本中所選的語例都是來源于FAO官方網(wǎng)站,語料真實、準確,不僅可以提高學生的語言實際運用水平,更有利于鍛煉其探究型學習能力;課后,教師可以將微型文本共享,方便學生進行課后復習查閱,并依據(jù)學生課堂表現(xiàn),從FAO農(nóng)業(yè)英語語料庫中抽取其他語例,編制測試題目,鞏固課堂教學內(nèi)容,很大程度上避免了出題過難、過偏或者脫離語言實際使用等情況。
4.3促進學生更有效地學習。
課中,學生可以以個體或者小組的形式,結合語料庫驅動的方法,開展基于微型文本語言實例的自主學習或合作學習,讓學生作為活動和研究的主體,探究學過文章的詞塊、語法及語篇特點,觀察語言搭配,在閱讀和搜索中獲得專業(yè)知識。在這一過程中,學生運用語料庫軟件自主觀察真實語料,從大量語料中觀察某一語言現(xiàn)象的呈現(xiàn)規(guī)律,然后反思、討論、分享這一過程中的發(fā)現(xiàn),對某個語言現(xiàn)象的規(guī)則進行歸納;課后,語料庫能讓學習者在掌握了相關技術之后,根據(jù)自己的具體情況,利用已經(jīng)建成的農(nóng)業(yè)科學國際期刊論文語料庫進行操練,在沒有教師指導答疑的情況下,借助語料庫的相關功能同樣可以解決疑問,直到最終掌握相關的內(nèi)容,這也體現(xiàn)了人本主義教育思想,值得國內(nèi)農(nóng)林院校大力探索和提倡。
5.結語
借助宏大的計算機數(shù)據(jù)庫——語料庫,F(xiàn)AO農(nóng)業(yè)英語語料庫的建成,為農(nóng)業(yè)英語教學人員提供了一個分析、研究、描述和應用農(nóng)業(yè)英語的載體,為農(nóng)業(yè)英語教學、編寫農(nóng)業(yè)英語辭典、研究動物科學英語語言特點、各種論文寫作教材編寫提供了重要的語料源,而且為農(nóng)業(yè)英語研究、農(nóng)業(yè)英語教師發(fā)展和農(nóng)業(yè)學生學習專業(yè)英語提供了全新途徑。由于客觀原因,F(xiàn)AO農(nóng)業(yè)英語語料庫的建設和應用仍然存在缺陷,主要表現(xiàn)在語料采集的深度和廣度不夠,但是語料庫不是一次成品,相信在今后的研究中,F(xiàn)AO農(nóng)業(yè)英語語料庫會更加發(fā)展成熟完善,為農(nóng)業(yè)專業(yè)其他學科的語料庫建設打下基礎,為國內(nèi)同行的類似研究提供一定的啟發(fā)。
參考文獻:
[1]蔡基剛.ESP與我國大學英語教學發(fā)展方向[J].外語界,2004(2).
[2]程世祿,張國揚.ESP教學的理論和實踐[J].外語教學與研究,1995(4).
[3]何中清,彭宣維,英語語料庫研究綜述:回顧、現(xiàn)狀與展望[J].外語教學,2011(1).
[4]黃大網(wǎng),秦羿,許賽穎.專門用途英語語料庫:挑戰(zhàn)、理據(jù)與愿景[J].寧波大學學報(人文科學版),2010(5).
[5]梁茂成,李文中,許家金.語料庫應用教程[M].北京:外語教學與研究出版社,2010.
[6]梁燕,馮友程,良坤.近十年我國語料庫實證研究綜述[J].解放軍外國語學院學報,2004(6).
[7]劉滿堂.近40年英語語料庫及語料庫語言學研究的回顧與展望[J].陜西教育學院學報,2004(1).
[8]譚鍵.語料庫及語料庫語言學的發(fā)展與應用[J].西北工業(yè)大學學報:社會科學版,2005,25(1):61-63.
[9]衛(wèi)乃興.語料庫語言學的方法論及相關理念.外語研究,2009:36-42.
[10]許家金.語料庫語言學的理論解析[J].外語教學,2003(6).
基金項目:2013年西北農(nóng)林科技大學人文社科重點項目資助(項目編號:2013RWZD05)
通訊作者:李麗霞