王家義 李德鳳
(1.湖南工程學院 外國語學院,湖南 湘潭 411104;2.澳門大學 人文學院,澳門)
詞匯知識在語言學習中至關重要。已有的研究主要集中于詞匯知識的廣度、深度以及二者的關系上(Haastrup et al., 2000; Read,2000; Bogaards et al., 2004; Milton, 2009; Akbarian,2010 )。詞匯的廣度主要指語言學習者擁有詞匯量的數量(Nation 2013),即詞匯量的大小。詞匯深度是指語言學習者在多大程度上了解一個詞(Read, 1993, 2000)。二者是密切相關,不可分離的關系(Milton 2009)。研究表明,詞匯知識具有復雜性和多層面性,涵蓋了詞匯的發音、拼寫、語域、語體、形態特征(Richards 1976; Haastrup et al.,2000; Nation, 2013),以及與其他詞匯一起構詞的句法、語義關系,包括搭配、同義反義、上下義關系等(Chapelle, 1994; Henriksen, 1999; Read, 2000)。
國內學者對二語詞匯廣度的研究重點討論了英語學習者詞匯量的調查,詞匯的獲取與詞匯量的擴大,詞匯量與語言綜合能力的關系等(桂詩春,1985; 喻愛菊,1991; 周大軍, 文渤燕, 陳莉,李春榮,1999; 周大軍, 文渤燕,2000; 鄧昭春,2001; 邵華,2002)。隨著二語詞匯知識的理論探討和實證研究的深入,詞匯研究的重點從詞匯量或詞匯寬度的發展轉移到對詞匯深度習得的研究(劉紹龍 2001:436)。國內學者開展了一系列英語詞匯深度的實證研究和量化分析(劉紹龍,2001; 濮建忠,2003; 李曉陸,2004; 呂長竑,2004; 李曉,2007; 張萍,2009)。他們的研究嘗試從“深度”的層面分析二語學習者的詞匯知識習得模式、發展路徑和具體特征,并為詞匯教學提供建議和參考。總體上這些研究更多的側重詞匯深度與語言綜合能力的關系,通常以二語學習者的作文為語料進行對比分析。目前詞匯深度習得的另一方面,即針對具體詞匯如何開展英語詞匯深度學習與教學,哪些資源可以幫助學習者開展英語詞匯深度分析等問題的研究尚不多見。基于此,本研究在簡要介紹BNCweb (CQP-Edition)的使用后,以“commit”為例通過具體操作從詞匯深度的不同層面探討基于BNCweb (CQP-Edition)的英語詞匯深度分析方法。
了解了一個詞的音、形、義,只能說是完成了對該詞的認知,而要真正掌握一個詞就必須知道該詞的詞匯深度知識。Richards (1976)首先提出了詞匯知識的七大標準,即:(1)單詞的頻率預測和同義聯想;(2)單詞使用的得體性;(3)單詞的句法行為或語法特征;(4)單詞的基本形式和派生形式;(5)詞間聯想;(6)概念意義;(7)一詞多義。這七大標準實際囊括了構成個體單詞知識的七個不同層面和能力(肖善香 等,2003:85)。之后, Richards (1985)又把掌握詞匯知識概括為: (1)知道在口語或書面語中遇到該詞的概率;(2)知道該詞的句法行為;(3)知道該詞與其他詞構成的關聯網絡。
在Richards的基礎上,Nation(1990)提出了詞匯多維框架理論,他認為,了解一個詞意味著知道它的形式(口頭和書面)、位置(語法句型、搭配)、功能(頻率、得體性)和意義(概念意義、聯想意義)(Laufer et al., 1998:367)。
隨著語料庫語言學的興起,基于語料庫的詞匯共選理念和工作程序被廣泛應用于詞匯教學與研究。在語料庫研究的基礎上,研究者(Sinclair et al.,1988; Willis 1990; Lewis 1993)提出了詞匯大綱和詞匯中心教學法的思路和設想并得到廣泛認同,詞項作為語言的基本單位被放在了更加突出的位置。Sinclair & Renouf (1988:148)明確指出英語教學的重點應放在:(1)語言中最常見的詞形;(2)這些詞形的核心用法模式(patterns of usages);(3)它們的典型組合(combinations)。
在對詞匯知識構成成分的分類描述、分析詞匯的意義和用法的基礎上,借助語料庫語言學的研究方法和技術手段,本研究認為詞匯深度分析的維度應包括以下幾個方面:(1)詞的語域分布(口頭、書面);(2)詞的常見使用形式;(3)詞的核心用法模式(類聯結);(4)詞的典型搭配;(5)詞的語義傾向(語義韻)。
BNC(英國國家語料庫)是較早被介紹并引入國內的大型語料庫(張煤,1997; 王建新,1999; 李賽紅,2002)。目前該庫已成為最常用、最權威的參照語料庫之一,為推動語料庫語言學的發展和研究做出了巨大貢獻。
隨著“網絡語料庫”(WaC,Web as Corpus)和“云計算”(cloud computing)的興起,有學者研究開發了在線檢索語料庫工具,如WebCorp(A. Renouf)、Phrase in English(W. Fletcher)、BYU系統(M. Davies)、Sketch Engine(A. Kilgarriff)、BNCweb(S. Hoffmann等)和CQPweb(A. Hardie)(許家金 等,2014:10)。根據McEnery & Hardie ( 2011:37-48)對語料庫分析工具的進時代劃分,上述檢索工具[基于瀏覽器—服務(B/S)模式的語料庫檢索工具]屬于第四代語料庫分析工具。基于網絡的第四代語料庫分析工具實現了語料庫與分析工具合二為一,降低了語料庫使用技術得門檻。不僅使普通用戶可以像瀏覽網頁一樣輕松便捷地使用語料庫,也便于語料庫專業人員深入、充分地挖掘語料庫資源。
基于CQP的BNCweb是語料庫與分析工具合二為一的第四代語料庫工具的典型代表(參見https:∥cqpweb.lancs.ac.uk/bncxmlweb/)。作為開源語料庫,BNCweb (CQP-Edition)的用戶界面友好、操作簡便靈活,主界面見圖1。BNCweb (CQP-Edition)不僅實現了語料庫的在線檢索,而且支持更復雜的高級檢索。相比第三代語料庫工具BNCweb (CQP-Edition)的用戶檢索響應速度更快,操作更簡單,功能更全面。能實現的主要功能包括:(1)在線生成語料庫的詞頻表(frequency list);(2)查詢(query)字詞、語言結構等,以獲取大量語言實例或相應結構的出現頻次(frequency),并可以按語體、年代、性別、難度、寫作題材等分別呈現查詢結果;(3)計算特定詞語在語料庫中的典型搭配(collocation);(4)計算語料庫中的核心關鍵詞(keywords)等。BNCweb (CQP-Edition)對檢索結果還可進行包括搭配計算等在內的后續操作(見表1)。

圖 1:BNCweb (CQP-Edition) 語料庫查詢界面

New query新查詢Thin查詢結果隨機抽樣Frequency breakdown頻數分解Distribution查詢結果的分布展示 Sort查詢結果排序設定Collocations搭配計算Download下載保存查詢結果Categorise hits對檢索結果手工分類標注 Save current set of hits保存檢索結果
英語中一些實詞(如名詞、動詞)等存在多種屈折形式,如TAKE就有take、takes、took、taking、taken五種屈折形式。在BNCweb (CQP-Edition)的查詢界面輸入“{關鍵詞原形}”我們獲得該詞在BNC中的各種屈折形式。通過輸入“{commit}”(下文中我們用COMMIT表示通過 “{commit}”檢索commit的各種屈折形式),并在檢索結果右側New query選項框中選中Frequency breakdown按鈕,點擊后“commit”的各種屈折形式按使用頻率和百分比從高到低分別呈現,其結果見表2。表2中,“commit”有六種詞形,按頻率高低分別為“committed”“commit”“committing”“commits”“commited”和“commiting”。結果中我們發現兩個值得注意的情況。其一,“committed”在各種屈折形式中使用頻率最高,超過了其他幾種形式的總和,達到了所有詞形的67.59%。在BNCweb (CQP-Edition)的查詢結果中點擊“committed”,語料庫中4486例“committed”居中顯示,在右側New query選項框中選中并點擊“Thin”(隨機抽樣)按鈕,并把隨機抽樣數量定為23,得到圖2結果。通過對圖2的分析,我們發現,18例為be+committed,即78%為被動形式,這一結果表明,“commit”在英語中主要以被動形式出現。其二,我們通常認為“commit”的“-ed”形式和“-ing”形式為“committed”和“committing”,即雙寫“t”再加“-ed”和“-ing”。但在BNCweb (CQP-Edition)的查詢結果中卻出現了“commited”和“commiting”各3次,如:

(1)public art galleries in the area , iscommitedto showing a wide range of fine(2)Chelsea or Arse , although hecommitedhis fair share of blunders(3)down the search for a man whocommitedat least two rapes , because
語料庫的研究以樣本量的龐大取勝,但并不排斥少數例外情況。Sinclair特別強調,觀察索引行時我們應該注重中心性(centrality)和典型性(typicality),在尋找語言規律的同時應容忍大型語料庫中的少數例外情況(梁茂成 等,2010:70)。我們認為以上6例中的“commited”和“commiting”屬于這種例外情況,并不影響本研究的結果。

表2 COMMIT的詞頻與詞形

圖2 committed抽樣
BNCweb(CQP-Edition)提供了關鍵詞的在語料庫中的分布情況。查詢結果后續操作分項功能中,有一個Distribution按鈕,點擊該按鈕,即可獲得關鍵詞在BNC中的6類分布情況(如圖3)。包括口筆語(written, spoken),衍生文本類型(Derived text type),文本類型(Text type),文本領域(Text Domain),作者年齡(Age of Author),作者性別(Sex of Author)。
我們對COMMIT在BNC語料庫中的分布情況進行了統計。COMMIT在口、筆語中的頻率分別為393和6244,折算成每百萬詞的比例后,頻率分別為37.75和71.03,表明COMMIT更常用于書面語。圖4中的語域分布情況表明,COMMIT在不同語域中的出現概率依次為社會科學(Social science)、國際事務(World affairs)、信仰和思想(Belief and thought)、商業和金融(Commerce and finance)、藝術(Arts)、應用科學(Applied science)、散文(prose)、自然科學(Natural and pure sciences)。

圖3 關鍵詞在BNC語料庫中的語域分布

圖4 “{commit}”在BNC語料庫中的的語域分布
3.3.1 類聯結
類聯結是語法層面搭配關系,是比搭配更高一級的抽象(衛乃興,2001:22)。類聯結體現了有關詞類或語法類別的共現關系,是關于詞語組合類別的抽象表述,而搭配則是類聯接的具體實現。衛乃興(2001:22)認為一個類聯接代表了一個類別的詞語搭配,可稱為搭配類(collocational class)。比如, V+ N就是一個類聯接,表示“動詞+名詞”這一類的搭配關系,而“make money”“take notes”和“give birth”等都是V+ N搭配的具體實例。

圖5 COMMIT抽樣
本研究中,把COMMIT的索引提取后,發現commit 的各種屈折形式在BNC中的頻數為6637。大型語料庫提取索引行后,往往頻數較多。為避免研究者淹沒于數據之中,有學者如Sinclair(2003)提出,在形成自己的假設時,首先可以從少量的假設開始。Sinclair(2003)主張每次從大型語料庫中抽取一屏左右的索引行(約23行)進行觀察。參照Sinclair的做法,我們對索引進行了隨機抽樣(23行)。觀察抽樣,我們發現commit的類聯接形式主要有以下三類:V+N(13),V+PREP(8)和V+PNX+to(2)。V+N又主要分為“commit+名詞”和“commit+冠詞/修飾詞+名詞”,如“commit crime”“commit a wonderful act”。V+PREP中的PREP主要是介詞to(占88%)。
3.3.2 搭配
搭配是“在文本中實現一定的非成語意義并以一定的語法形式因循組合使用的一個詞語序列,構成該序列的詞語相互預期,以大于偶然的概率共現”(衛乃興,2001:100)。通常我們可以通過觀察索引行來了解關鍵詞的搭配情況。一定跨距內的詞項與關鍵詞的共現次數是重要參考指標,但并不能完全決定關鍵詞與其他詞項的搭配是否具有顯著意義。語料庫語言學主要借助統計手段來確定。如計算Z值、MI值等。Z值計算需要考慮關鍵詞的頻數、搭配詞的頻數、跨距、關鍵詞與搭配詞共現的頻數和整個語料庫的容量。Z值給人一種把握,使他可以判斷共現的詞語間在多大程度上存在著典型搭配關系,而非偶然共現(衛乃興 等,2005:74)。互信息值(MI)可以測量詞與詞的搭配強度。其意義在于表明兩詞共現的概率。互信息值(MI)值的大小主要取決于兩個頻數的比值,即搭配詞與關鍵詞共現的頻數和搭配詞在語料庫中的總頻數之比。
BNCweb(CQP-Edition)提供了計算特定詞在語料庫中的典型搭配的多種供選擇的統計手段,如互信息(MI/mutual information)、MI3、Z-Score、對數似然率(log-likelihood)等多種測量搭配強度的方法。其操作方法為,在查詢界面輸入關鍵詞獲得關鍵詞的索引行并居中顯示。然后在查詢結果后續操作分項功能選中collocations,點擊后進入搭配參數頁面,在statistics欄中可以根據自己的需要對統計手段進行選擇。圖6為COMMIT按照Z-score值搭配強度由高到低的搭配詞。

圖6 COMMIT的搭配詞
COMMIT的前10位的搭配詞分別為:suicide,offense,crimes,offenses,crime,atrocities,two-phase,to,arrestable,murder。這些詞中名詞8個,形容詞和介詞各1個。為了更全面分析COMMIT的搭配情況,我們把考察范圍擴大到COMMIT的前50個搭配詞。發現其中名詞36個。按照類別主要為表示犯罪、謀殺、傷害、自殺、欺騙、通奸等,反身代詞4個,分別為themselves,himself,itself,ourselves和yourself。副詞6個,fully,ideologically,irrevocably, firmly,totally,deeply。形容詞兩個 alleged和naturalistic。介詞1個,to。疑問代詞1個,who。BNCweb (CQP-Edition)在提供了搭配詞的同時在提供關鍵詞和搭配詞共現的頻率。圖6第5列顯示COMMIT與to的共現頻率相當高,總數達到了4523,超過了COMMIT與其他顯著共現之和。因此,有必要進一步考察COMMIT to 及其右搭配詞。
COMMIT to在BNC中的頻率情況如表3所示,總頻率為1949,按頻率高低依次為committed to,commit to,committing to,commits to,commited to其中“committed to”占了絕大多數,達到了1872次,占到COMMIT to總詞頻的96.05%。按照之前的抽樣方法,我們考察了“committed to”的23例隨機抽樣如圖7,其中15例(65%)用于被動語態。由此可以判斷COMMIT to的主要形式為“committed to”,這一結構主要用于被動語態。
圖8為COMMIT to的右搭配詞情況。同樣的方法,我們考察了COMMIT to按Z-score值顯著性搭配的前50右搭配詞,結果顯示COMMIT to的右搭配詞主要有兩種形式,均表示“致力于做某事”。其一為commit to+動名詞,這類詞為表示建立、維持、保持、發展、促進、提升、增加的詞:maintaining,improving,achieving,supporting,ensuring,providing,establishing,retaining, bringing,introducing,developing,promoting,accepting;表示降低減少的詞reducing,cutting。其二為commit to+名詞,這些名詞包括:監獄、庇護的詞,如 prison,asylum,trial;概念、規則、原則、標準的詞:concept,standards,principle, provision, rule;目標的詞: aims ,goals;改革、發展、提高的詞:reform,development,improvement,change,struggle;防衛、斗爭、維持、保持、實施的詞:defence,struggle,maintenance,implementation;觀點、想法、策略的詞:idea,view,strategy,scheme,社會主義,民主自由的詞:democracy,peace,freedom等。

表3 {commit} to在BNC中的頻率統計

圖7committedto的抽樣

圖8 COMMIT to 的右搭配詞
3.3.3 語義韻
語義韻是語料庫語言學研究的重要課題。語義韻可分為積極、中性和消極三類。在消極語義韻里,關鍵詞吸引的詞項幾乎都具有強烈或鮮明的消極語義特點,它們使整個語境彌漫一種濃厚的消極語義氛圍。積極語義韻的情況正好相反:關鍵詞吸引的幾乎都是些具有積極語義特點的詞項,由此形成一種積極語義氛圍;在中性語義韻里,關鍵詞既吸引一些消極涵義的詞項,又吸引一些積極涵義或中性涵義的詞項,由此形成一種錯綜的語義氛圍。因此,中性語義韻又可稱錯綜語義韻。絕大多數英語詞的搭配行為呈現出錯綜語義韻現象,一些詞項具有強烈的消極語義韻,另一些詞項則有明顯的積極語義韻(衛乃興,2002:300)。衛乃興(2002:300)提出了語義韻研究的一般方法即:(1)建立并參照類聯接,用基于數據的方法(data-based approach)研究;(2)計算節點詞的搭配詞,用數據驅動的方法(data-driven approach)研究;(3)用基于數據與數據驅動相結合的折中方法研究。通過觀察節點詞的索引行能對節點詞的語義韻特征進行分析。
通過對COMMIT搭配詞和COMMIT to右搭配詞的分析,我們可以歸納出commit具有的兩類語義韻律特征。作為“做……”和“犯……”意思時,周邊詞幾乎都是具有消極語義特點的詞項,如“犯罪、謀殺、傷害、自殺、欺騙、通奸”等,均指生活中那些消極之事或不好的事,呈現出消極的語義韻特征。與to搭配作為“使承擔義務”“致力于某事”時,周邊詞是表示保持維持改革發展提高的詞項,或是降低費用、減輕負擔的詞項,整體上呈現出一種積極的語義氛圍。
長期以來,詞匯教學并沒有在英語教學中引起足夠的重視,濮建忠(2003:438)把原因歸結為以下兩點,即:1)對詞匯知識關鍵要素的認識還不夠充分。2)缺乏有效的教授詞匯的方法。本研究在厘清詞匯知識關鍵要素的同時,以commit為實例介紹基于第四代語料庫工具BNCweb (CQP-Edition)的詞匯深度分析方法。研究表明,“committed”在該詞各種屈折形式中使用頻率最高,COMMIT在英語中主要以被動形式出現。COMMIT更常用于書面語。COMMIT to在不同語域中的出現概率依次為社會科學(Social science)、國際事務(World affairs)、信仰和思想(Belief and thought)、商業和金融(Commerce and finance)、藝術(Arts)、應用科學(Applied science)、散文(prose)、自然科學(Natural and pure sciences)。commit的類聯接形式主要有三類:V+N,V+PREP和V+PNX+to。COMMIT的典型搭配詞有:suicide, offense,crimes,offenses,crime,atrocities,two-phase,to,arrestable,murder等。該詞呈現出兩類完全不同的語義韻特征。作為“做…”和“犯……”時表現出消極語義韻特征。與to搭配表示“致力于某事”時,呈現出一種積極的語義韻特征。