韋愛(ài)云,方雯鑫,李 盈
(廣西師范大學(xué)外國(guó)語(yǔ)學(xué)院,廣西桂林,541006)
劍橋商務(wù)英語(yǔ)證書(shū)考試(Cambridge Business Certificate,BEC)是根據(jù)公務(wù)商務(wù)工作的實(shí)際需要,從聽(tīng)說(shuō)讀寫(xiě)四個(gè)方面對(duì)考生在商務(wù)和一般生活環(huán)境中使用英語(yǔ)的能力進(jìn)行全面考查的一項(xiàng)水平測(cè)試。該考試設(shè)有初級(jí)、中級(jí)和高級(jí)三個(gè)級(jí)別,是目前國(guó)內(nèi)外衡量商務(wù)英語(yǔ)水平的權(quán)威性考試。
目前對(duì)BEC真題集的研究甚少,現(xiàn)有研究多采用內(nèi)省法分析各個(gè)題型,幫助考生有效備考[1-2],針對(duì)商務(wù)英語(yǔ)詞匯研究的語(yǔ)料采樣范圍不夠廣,量化的研究方法使用也較少。計(jì)量語(yǔ)言學(xué)將語(yǔ)言視為復(fù)雜的自適應(yīng)系統(tǒng),追求語(yǔ)言研究的精確化,是一個(gè)系統(tǒng)地采用定量方法研究語(yǔ)言的學(xué)科。計(jì)量語(yǔ)言學(xué)對(duì)普通英語(yǔ)和科技英語(yǔ)的詞匯量化特征已有較為深入的研究,但對(duì)商務(wù)英語(yǔ)詞匯研究較少[3],目前尚未有學(xué)者針對(duì)BEC真題文本進(jìn)行專(zhuān)題詞匯研究。基于BEC真題文本進(jìn)行詞匯研究,從而指導(dǎo)BEC考試乃至商務(wù)英語(yǔ)教學(xué)的研究尚未出現(xiàn)。因此,本研究基于計(jì)量語(yǔ)言學(xué)的研究方法,以自建的77933詞的BEC語(yǔ)料庫(kù)為語(yǔ)料,對(duì)BEC文本詞匯的量化特征進(jìn)行分析。擬圍繞以下三個(gè)問(wèn)題展開(kāi):第一,BEC語(yǔ)料庫(kù)的詞長(zhǎng)分布呈現(xiàn)出什么特點(diǎn)?第二,BEC語(yǔ)料庫(kù)的高頻詞和低頻詞呈現(xiàn)出什么特點(diǎn)?第三,可為商務(wù)英語(yǔ)教學(xué)帶來(lái)什么啟示?
本研究分別選取BEC初級(jí)、中級(jí)與高級(jí)真題卷的第二、三、四和五輯作為語(yǔ)料,每一等級(jí)的真題中分別包含真題卷各16套,由劍橋大學(xué)考試委員會(huì)推薦,是歷年考題中經(jīng)過(guò)劍橋考試中心解密的題目,具有較高的參考價(jià)值。為了保證語(yǔ)料的標(biāo)準(zhǔn)化,只選取真題中構(gòu)成完整句子的真實(shí)文本(閱讀理解部分)進(jìn)行語(yǔ)言定量分析。將語(yǔ)料校對(duì)后計(jì)數(shù),BEC語(yǔ)料庫(kù)共包含77933詞,其中初級(jí)13485個(gè),中級(jí)30271個(gè),高級(jí)35268個(gè)。
本研究基于自建的小型語(yǔ)料庫(kù),從詞長(zhǎng)和詞頻對(duì)BEC語(yǔ)料庫(kù)的詞匯進(jìn)行量化研究。宏觀上,將BEC語(yǔ)料庫(kù)與其他英語(yǔ)文體語(yǔ)料庫(kù)進(jìn)行對(duì)比,探究BEC詞匯與其他英語(yǔ)文體的共性和特性;微觀上,對(duì)BEC語(yǔ)料庫(kù)三個(gè)等級(jí)(初、中和高級(jí))試題文本語(yǔ)料庫(kù)進(jìn)行對(duì)比,以求多角度探究BEC的詞匯特征。
本研究使用Python分別測(cè)量出BEC語(yǔ)料庫(kù)中以字母和音節(jié)為單位的詞長(zhǎng)和詞頻分布數(shù)據(jù)。
1.平均詞長(zhǎng)
詞形還原基于字典,將單詞的復(fù)雜形態(tài)變?yōu)榛A(chǔ)形態(tài)。其中單詞的基礎(chǔ)形態(tài)被稱(chēng)為詞形。[4]例如,單詞go、goes、going、went和gone構(gòu)成一個(gè)以go為詞形的形態(tài)學(xué)范式。詞形還原對(duì)形態(tài)變化豐富的語(yǔ)言來(lái)說(shuō)尤其重要,能減少詞匯量過(guò)大導(dǎo)致的標(biāo)注困難和理解困難問(wèn)題。BEC四個(gè)語(yǔ)料庫(kù)平均詞長(zhǎng)分布情況見(jiàn)表1。

表1 BEC四個(gè)語(yǔ)料庫(kù)平均詞長(zhǎng) 單位:個(gè)
由表1可知,詞形還原前,以字母為單位測(cè)量詞長(zhǎng)時(shí),BEC總語(yǔ)料庫(kù)的平均詞長(zhǎng)為4.98,大于一般用途英語(yǔ)的平均詞長(zhǎng)(4.66)[5],稍大于法律英語(yǔ)語(yǔ)料庫(kù)平均詞長(zhǎng)(4.84)。[6]而以音節(jié)為單位測(cè)量時(shí),總語(yǔ)料庫(kù)的平均詞長(zhǎng)為1.56。無(wú)論是以字母還是以音節(jié)作為測(cè)量單位,平均詞長(zhǎng)與試題難度均呈正相關(guān)。
詞形還原后,以字母為單位測(cè)量詞長(zhǎng)時(shí),BEC總語(yǔ)料庫(kù)的平均詞長(zhǎng)為4.71。以音節(jié)為單位的總語(yǔ)料庫(kù)平均詞長(zhǎng)為1.51。同樣,兩種方式測(cè)量的平均詞長(zhǎng)都隨著試題等級(jí)難度的上升而增長(zhǎng)。
2.各庫(kù)詞長(zhǎng)分布情況
對(duì)各個(gè)原始語(yǔ)料庫(kù)以字母為單位分別測(cè)量詞長(zhǎng),圖1為各個(gè)層級(jí)的詞頻分布情況。

圖1 各庫(kù)中不同長(zhǎng)度(字母)詞匯占比(%)
圖1顯示,各個(gè)語(yǔ)料庫(kù)的詞長(zhǎng)主要集中在2—4個(gè),其中初級(jí)語(yǔ)料庫(kù)中占53.95%,中級(jí)占51.94%,高級(jí)占51.63%,總語(yǔ)料庫(kù)中占52.14%。
此外,初級(jí)語(yǔ)料庫(kù)中的詞長(zhǎng)分布在1—21個(gè),但鮮見(jiàn)詞長(zhǎng)為17和19的詞。中級(jí)語(yǔ)料庫(kù)詞長(zhǎng)范圍為1—27個(gè),其中24與25的詞長(zhǎng)缺少。高級(jí)語(yǔ)料庫(kù)詞長(zhǎng)分布在1—26個(gè),缺少詞長(zhǎng)為21、23和25的詞。BEC總語(yǔ)料庫(kù)的詞長(zhǎng)分布范圍為1—27個(gè),缺少了詞長(zhǎng)為25的詞。其中一些特定詞長(zhǎng)的詞缺少的主要原因是本文語(yǔ)料庫(kù)的樣本量不足,但總體可以反映出BEC考試真題各梯度的詞長(zhǎng)分布范圍。
圖2顯示,各庫(kù)中多數(shù)詞為單音節(jié)詞,單音節(jié)詞在各庫(kù)中的占比均超過(guò)60.00%,其中初級(jí)68.00%,中級(jí)65.09%,高級(jí)64.64%,BEC總庫(kù)65.39%。結(jié)合統(tǒng)計(jì)數(shù)據(jù)可知,BEC總語(yǔ)料庫(kù)的詞長(zhǎng)分布范圍為1—10個(gè),其中初級(jí)語(yǔ)料庫(kù)的詞長(zhǎng)分布范圍為1—7個(gè),中級(jí)為1—8個(gè),高級(jí)的音節(jié)數(shù)分布在1—9個(gè)。
詞頻是測(cè)量英語(yǔ)語(yǔ)言中特定詞出現(xiàn)頻率的重要方法。在超過(guò)700萬(wàn)詞的普通英語(yǔ)詞表中從未出現(xiàn)過(guò)的詞相較于出現(xiàn)過(guò)的詞更不易被使用。[7]同樣,在語(yǔ)料庫(kù)中,出現(xiàn)次數(shù)多的詞更易受到關(guān)注。h點(diǎn)是秩頻率分布中功能詞和實(shí)詞之間的模糊分界點(diǎn)。一般來(lái)說(shuō),h點(diǎn)之前的詞屬于高頻詞,h點(diǎn)之后的詞為低頻詞。h點(diǎn)之前的詞以功能詞居多,但也可能包含該文本的核心詞,通常能反映該文本的特征。
1.BEC與NE高頻詞對(duì)比
為探究BEC語(yǔ)料庫(kù)與其他英語(yǔ)文體的語(yǔ)料庫(kù)的共性與特性,筆者分別選取BEC語(yǔ)料庫(kù)與海軍英語(yǔ)(NE)語(yǔ)料庫(kù)[2]詞頻表前50的詞進(jìn)行分析。
高頻實(shí)詞與更豐富的世界知識(shí)體系相關(guān)聯(lián)。[8]由表2可知,BEC語(yǔ)料庫(kù)中有6個(gè)核心詞,如“公司”company(666)、“業(yè)務(wù)”business(401)、“工作”work(276)、“經(jīng)理”manager(218)、“時(shí)間”time(215)、“顧客”customer(213)。由表5可知,NE語(yǔ)料庫(kù)有8個(gè)核心詞,“力量”force(3185)、“海軍的”naval(2442)、“火車(chē)”train(2315)、“大海”sea(2130)、“船”ship(5589)、“海軍”navy(3954)、“飛機(jī)”aircraft(2014)、“潛艇”submarine(1793)。這些高頻核心詞反映具體領(lǐng)域的目的和活動(dòng)。BEC語(yǔ)料庫(kù)中的高頻詞展現(xiàn)出了明顯的商務(wù)英語(yǔ)特征,NE語(yǔ)料庫(kù)中的高頻詞也體現(xiàn)出海軍英語(yǔ)特征。

表2 BEC語(yǔ)料庫(kù)和NE語(yǔ)料庫(kù)詞頻前50詞
就詞匯定制而言,詞可分為實(shí)詞和功能詞。[9]實(shí)詞具有極強(qiáng)的所指性,可單獨(dú)用來(lái)描述可感知的實(shí)體(如物體、事件和特征),為每句言語(yǔ)提供主題義。[9]實(shí)詞包括名詞、動(dòng)詞、形容詞和副詞。功能詞在實(shí)詞之間提供語(yǔ)言聯(lián)系,要在小句或句子中與其他詞結(jié)合才構(gòu)成意義。助動(dòng)詞、連詞、介詞和代詞都屬于功能詞。[9]在BEC前50高頻詞中,有38個(gè)功能詞(如the、to、of、a和it)和12個(gè)實(shí)詞(如company、business),分別占76.00%和24.00%。在NE語(yǔ)料庫(kù)中,功能詞有22個(gè),占44.00%,實(shí)詞有28個(gè),占56.00%。卡方檢驗(yàn)結(jié)果顯示p=0.5>0.05。這表明NE語(yǔ)料庫(kù)與BEC語(yǔ)料庫(kù)中前50個(gè)高頻詞表中實(shí)詞與功能詞的使用情況并無(wú)統(tǒng)計(jì)學(xué)意義上的差異。
2.BEC子語(yǔ)料庫(kù)中高頻核心詞對(duì)比
表3為三個(gè)子語(yǔ)料庫(kù)中的高頻核心詞。結(jié)果表明,試題等級(jí)難度與高頻實(shí)詞的個(gè)數(shù)成正相關(guān)的關(guān)系。隨著試題難度的加大,更高一級(jí)的高頻核心詞中幾乎囊括了前一等級(jí)的高頻核心詞。在中級(jí)高頻核心詞中,初級(jí)的覆蓋率為61.53%;在高級(jí)高頻核心詞中,中級(jí)的覆蓋率為62.50%。“company”(公司)均為三個(gè)子語(yǔ)料庫(kù)的最高頻核心詞,該詞也是讀者在商務(wù)英語(yǔ)領(lǐng)域中所期待見(jiàn)到的高頻詞,因?yàn)樵谏虅?wù)英語(yǔ)的文本語(yǔ)境中,公司為進(jìn)行商務(wù)活動(dòng)的主要場(chǎng)所及載體。

表3 初、中、高級(jí)語(yǔ)料庫(kù)中的高頻核心詞
高頻實(shí)詞構(gòu)建了文本的語(yǔ)義網(wǎng)絡(luò)。Trier指出,語(yǔ)言之間的界限可以決定其真實(shí)的價(jià)值。[10]詞不應(yīng)被單獨(dú)作為考察對(duì)象,而應(yīng)系統(tǒng)分析其語(yǔ)義的相互關(guān)系。以施動(dòng)者為例,初級(jí)語(yǔ)料庫(kù)中商務(wù)動(dòng)作執(zhí)行者或參與者為people和customer,在中級(jí)語(yǔ)料庫(kù)中擴(kuò)展到了manager與staff,到高級(jí)語(yǔ)料庫(kù)中出現(xiàn)了manager的語(yǔ)義功能詞management。結(jié)構(gòu)主義認(rèn)為,某種語(yǔ)言中的所有詞組成的詞庫(kù)是語(yǔ)言形式和語(yǔ)義關(guān)系構(gòu)成的關(guān)系網(wǎng)。隨著文本難度梯度的加大,詞匯所構(gòu)建的關(guān)系網(wǎng)愈發(fā)復(fù)雜和精確。
1.BEC與CCBNC低頻詞對(duì)比
低頻詞是指在文本中出現(xiàn)少于4次的詞。可通過(guò)文本測(cè)量分析軟件QUITA迅速了解低頻詞占比。本節(jié)將BEC語(yǔ)料庫(kù)的低頻詞與CCBNC語(yǔ)料庫(kù)低頻詞[11]進(jìn)行對(duì)比。
在BEC總語(yǔ)料庫(kù)中,僅出現(xiàn)一次的單詞占比2.86%,出現(xiàn)兩次的單詞占比1.80%,出現(xiàn)過(guò)3次的單詞數(shù)占比1.44%,低頻詞的總數(shù)僅占文本的6.10%。在CCBNC中,只出現(xiàn)一次的單詞占比35.00%,出現(xiàn)兩次的單詞占比13.00%,出現(xiàn)三次的單詞占比7.00%,低頻詞占文本的55.00%。卡方檢驗(yàn)結(jié)果顯示p=000<0.05,表明在兩個(gè)語(yǔ)料庫(kù)的低頻詞使用上呈現(xiàn)出顯著差異,BEC語(yǔ)料庫(kù)的低頻詞遠(yuǎn)遠(yuǎn)少于CCBNC的低頻詞。CCBNC的研究結(jié)果表明商務(wù)英語(yǔ)的獨(dú)有詞匯一般由低頻詞構(gòu)成,這說(shuō)明BEC語(yǔ)料庫(kù)中含有的商務(wù)英語(yǔ)獨(dú)有詞匯較少,不足以涵蓋整個(gè)商英語(yǔ)域的所有詞匯。
文本中頻次為1的詞被稱(chēng)為單現(xiàn)詞。Kornai認(rèn)為,某個(gè)文本中將近一半的詞只出現(xiàn)一次。[12]表中數(shù)據(jù)顯示,單現(xiàn)詞的占比僅為2.86%。而黃潔得出的結(jié)論為,商務(wù)英語(yǔ)的單現(xiàn)詞比例為35.00%。[11]CCBNC的單現(xiàn)詞占比35.35%。[3]統(tǒng)計(jì)檢驗(yàn)表明BEC語(yǔ)料庫(kù)的單現(xiàn)詞與其余兩個(gè)語(yǔ)料庫(kù)出現(xiàn)顯著差異。這表明BEC語(yǔ)料庫(kù)的單現(xiàn)詞數(shù)量較少,詞匯豐富度低。這是因?yàn)锽EC試卷通常使用高頻詞來(lái)表達(dá)其含義。因此,如果考生掌握了BEC語(yǔ)料庫(kù)高頻詞的含義,他們?cè)诶斫馕谋痉矫鏁?huì)遇到的生詞困難就相對(duì)較少,能較為順利地通過(guò)BEC考試。這也反映出BEC考試所涉及的詞匯只是商務(wù)英語(yǔ)領(lǐng)域的少量詞匯,要對(duì)商務(wù)英語(yǔ)領(lǐng)域的知識(shí)有更深入和準(zhǔn)確的了解,必須努力增加商務(wù)英語(yǔ)方面的詞匯量。
2.BEC子語(yǔ)料庫(kù)低頻詞對(duì)比
筆者對(duì)三個(gè)子語(yǔ)料庫(kù)的低頻詞做了統(tǒng)計(jì)。獨(dú)立性檢驗(yàn)結(jié)果顯示p=0.997>0.05,表明BEC三個(gè)子語(yǔ)料庫(kù)之間低頻詞的占比并未出現(xiàn)統(tǒng)計(jì)學(xué)意義上的顯著差異,即初、中和高級(jí)語(yǔ)料庫(kù)中的低頻詞分布情況相似。這與上節(jié)測(cè)出的BEC總語(yǔ)料庫(kù)高頻詞占比少的結(jié)論相符。
低頻詞在英語(yǔ)詞匯構(gòu)成中的能產(chǎn)性較強(qiáng)[13],大量新詞的產(chǎn)生和詞法化往往始于低頻詞。此外,單現(xiàn)詞通常能反映文本的詞匯豐富度。三個(gè)子語(yǔ)料庫(kù)中TTR的值(初級(jí)0.140,中級(jí)0.099,高級(jí)0.106)與表8中低頻詞的占比波動(dòng)相似,這說(shuō)明各個(gè)子語(yǔ)料庫(kù)的詞匯豐富度普遍較低。理論上,文本的難度梯度越大,詞匯豐富度越高(即TTR與單現(xiàn)詞占比越高)。但是,為何初級(jí)的TTR值和單現(xiàn)詞占比要高于中級(jí)和高級(jí)?筆者認(rèn)為,初級(jí)真題語(yǔ)料有限,但初級(jí)真題中的詞匯必須構(gòu)建完整的商務(wù)環(huán)境語(yǔ)境,從而造成型符與例符的比例變大。
在英語(yǔ)詞匯教學(xué)中,詞長(zhǎng)和詞頻看似是極為抽象的概念,但對(duì)兩者的研究可為針對(duì)BEC考試的詞匯教學(xué)提供可靠數(shù)據(jù)支持。立足前文研究結(jié)果,本節(jié)嘗試為BEC考試教學(xué)與商務(wù)英語(yǔ)教學(xué)提出以下建議。
1.注重單音節(jié)和雙音節(jié)詞匯教學(xué)
詞長(zhǎng)因素會(huì)影響英語(yǔ)學(xué)習(xí)者的詞匯學(xué)習(xí)。[14]BEC平均詞長(zhǎng)與真題難度呈正相關(guān)。大部分BEC詞匯主要由2—4個(gè)字母構(gòu)成,分布范圍多集中于單音節(jié)和雙音節(jié)詞。教師在詞匯教學(xué)中應(yīng)特別注重教學(xué)文本中單音節(jié)和雙音節(jié)詞匯的教授。
2.引導(dǎo)學(xué)生通過(guò)掌握基本詞形主動(dòng)學(xué)習(xí)詞匯
在進(jìn)行BEC考試詞匯教學(xué)時(shí),教師應(yīng)從詞匯的基本形態(tài)抓起。多數(shù)詞匯的基本形態(tài)較簡(jiǎn)單,易于記憶習(xí)得。[15]多數(shù)商務(wù)英語(yǔ)詞匯由基本的普通英語(yǔ)詞匯詞形構(gòu)成,主要通過(guò)復(fù)合詞和派生詞進(jìn)行詞匯構(gòu)建。[16]此外,BEC考試的備考對(duì)象多為以高效完成商務(wù)活動(dòng)為目的的社會(huì)人士和商務(wù)英語(yǔ)專(zhuān)業(yè)學(xué)生,具有較強(qiáng)的學(xué)習(xí)動(dòng)機(jī)和邏輯思維能力。教師應(yīng)引導(dǎo)學(xué)生掌握基本詞形,同時(shí)將構(gòu)詞法的知識(shí)融入詞匯教學(xué),以此提高學(xué)生構(gòu)建其詞匯語(yǔ)義網(wǎng)絡(luò)的能力,達(dá)到一詞記多詞的效果。
3.高頻詞詞表制作與教材選擇
高頻詞詞表的生成可減輕教與學(xué)的負(fù)擔(dān)。因此,BEC備考的教材應(yīng)盡可能涵蓋商務(wù)英語(yǔ)專(zhuān)業(yè)詞匯,尤其是高頻詞。此外,教師課后應(yīng)安排相關(guān)任務(wù),如造句、根據(jù)場(chǎng)景使用新詞匯進(jìn)行對(duì)話(huà),鼓勵(lì)學(xué)生使用當(dāng)天學(xué)習(xí)的詞匯,提高詞匯使用率。
4.進(jìn)行課外知識(shí)補(bǔ)充,擴(kuò)大學(xué)生商務(wù)英語(yǔ)詞匯量
對(duì)BEC語(yǔ)料庫(kù)低頻詞的研究表明,BEC真題的詞匯豐富度較低。這說(shuō)明BEC真題涵蓋的商務(wù)英語(yǔ)語(yǔ)域詞匯較少,詞匯覆蓋率較低。任何教材都無(wú)法將一個(gè)語(yǔ)域中的詞匯包羅萬(wàn)象。[18]適當(dāng)選取課外讀物進(jìn)行教學(xué),可提高學(xué)生的閱讀能力,增加學(xué)生商務(wù)英語(yǔ)語(yǔ)域的詞匯量。在讀物的選取上,應(yīng)盡量選擇真實(shí)文本,如商務(wù)英語(yǔ)信函、英文合同等。
本文基于自建的BEC語(yǔ)料庫(kù),借助計(jì)量語(yǔ)言學(xué)的相關(guān)指標(biāo),結(jié)合質(zhì)性分析手段,有以下幾個(gè)方面發(fā)現(xiàn)。
BEC語(yǔ)料庫(kù)平均詞長(zhǎng)隨著真題難度梯度的不斷上升而增加,其中多為單音節(jié)詞和雙音節(jié)詞。初級(jí)與中、高級(jí)詞長(zhǎng)的難度跨度相差明顯。中級(jí)真題中不同音節(jié)詞匯的音節(jié)數(shù)最長(zhǎng)。
在與NE和商務(wù)英語(yǔ)語(yǔ)料庫(kù)的對(duì)比中,BEC語(yǔ)料庫(kù)與NE語(yǔ)料庫(kù)的前50個(gè)高頻詞都具有各自的語(yǔ)言特色。BEC語(yǔ)料庫(kù)與商務(wù)英語(yǔ)語(yǔ)料庫(kù)的前10個(gè)高頻詞均為功能詞。對(duì)比內(nèi)部三個(gè)語(yǔ)料庫(kù)后發(fā)現(xiàn),試題等級(jí)難度與高頻實(shí)詞的個(gè)數(shù)呈正相關(guān),更高一級(jí)文本語(yǔ)料庫(kù)的高頻核心詞中幾乎涵蓋了前一等級(jí)文本語(yǔ)料庫(kù)的高頻核心詞。
BEC語(yǔ)料庫(kù)中低頻詞所占比例遠(yuǎn)遠(yuǎn)低于CCBNC語(yǔ)料庫(kù),說(shuō)明BEC語(yǔ)料庫(kù)中單現(xiàn)詞的比例較低,詞匯豐富度較低。此外,三個(gè)子語(yǔ)料庫(kù)的低頻詞和單現(xiàn)詞占比均較低。
本文最后提出BEC詞匯教學(xué)的建議:第一,教師應(yīng)在備考教學(xué)中注重單音節(jié)和雙音節(jié)詞匯教學(xué);第二,引導(dǎo)學(xué)生通過(guò)掌握基本詞形主動(dòng)學(xué)習(xí)詞匯;第三,制作高頻詞詞表,選擇高頻詞出現(xiàn)多的教材以及布置針對(duì)性的課后作業(yè)加深記憶;第四,進(jìn)行課外知識(shí)補(bǔ)充,擴(kuò)大學(xué)生商務(wù)英語(yǔ)詞匯量。