徐秀玲
(浙江大學(xué) 外國(guó)語(yǔ)言文化與國(guó)際交流學(xué)院,浙江 杭州 310058)
字母詞在新聞中使用情況的語(yǔ)料庫(kù)考察
徐秀玲
(浙江大學(xué) 外國(guó)語(yǔ)言文化與國(guó)際交流學(xué)院,浙江 杭州 310058)
字母詞已廣泛出現(xiàn)在現(xiàn)代漢語(yǔ)新聞?wù)Z體中。本研究基于兩個(gè)語(yǔ)料庫(kù)新聞子庫(kù),從使用頻率、詞形和語(yǔ)義內(nèi)容定量等方面分析了在語(yǔ)料庫(kù)中出現(xiàn)的字母詞,多角度追蹤了字母詞近二十年間在新聞?wù)Z體中的使用情況。研究發(fā)現(xiàn),字母詞在漢語(yǔ)新聞中的使用頻率迅速增長(zhǎng),兩個(gè)子庫(kù)中都是純字母詞的使用比例最高,漢字字母詞和數(shù)詞字母詞次之,而拼音字母詞使用最少。近幾年字母詞已滲透到各個(gè)領(lǐng)域,呈現(xiàn)出多元化的特點(diǎn)。
字母詞 新聞 語(yǔ)料庫(kù)
隨著我國(guó)社會(huì)、經(jīng)濟(jì)、科學(xué)技術(shù)的快速發(fā)展及對(duì)外交流的日益頻繁,漢語(yǔ)與外語(yǔ)的接觸日漸加深。隨之而來(lái)的是現(xiàn)代漢語(yǔ),尤其新聞?wù)Z體中經(jīng)常出現(xiàn)諸如GDP、T恤、PM2.5之類的字母詞。
字母詞進(jìn)入漢語(yǔ)系統(tǒng)已經(jīng)引起國(guó)內(nèi)學(xué)者的關(guān)注。對(duì)字母詞的研究始于上世紀(jì)90年代(劉涌泉,1994)。字母詞,簡(jiǎn)言之,就是漢語(yǔ)中使用的含有或完全由字母構(gòu)成的詞語(yǔ)。劉涌泉(2002)將字母詞定義為“由拉丁字母(包括漢語(yǔ)拼音字母)或希臘字母構(gòu)成的或由它們分別與符號(hào)、數(shù)字或漢字混合構(gòu)成的詞”。陳佳璇、胡范鑄 (2003)對(duì)2002年8月國(guó)內(nèi)十五份報(bào)紙中使用的字母詞做了窮盡性調(diào)查統(tǒng)計(jì),并從使用頻率、詞形、語(yǔ)義內(nèi)容等方面定量分析了這些字母詞。皇甫素飛(2004)統(tǒng)計(jì)了1938年~1999年間50個(gè)高頻字母詞在《文匯報(bào)》中出現(xiàn)的頻率及其歷史演變與時(shí)代變異,發(fā)現(xiàn)字母詞正以前所未有的速度和規(guī)模進(jìn)入我們生活的各個(gè)領(lǐng)域。
然而前人研究并未考察字母詞在多種新聞文本中的歷時(shí)變化。鑒于此,本研究將基于兩個(gè)漢語(yǔ)語(yǔ)料庫(kù)中的新聞?wù)Z料,試圖追蹤字母詞在我國(guó)新聞?wù)Z體中的使用情況。
本研究采用蘭卡斯特大學(xué)漢語(yǔ)語(yǔ)料庫(kù)LCMC和現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)Torch2009中的新聞?wù)Z體子庫(kù)。兩個(gè)新聞子庫(kù)在建庫(kù)標(biāo)準(zhǔn)等方面完全一致,都包括新聞報(bào)道、社論和新聞綜述三個(gè)文本類型,兩者庫(kù)容也相近,分別為14萬(wàn)8163詞和18萬(wàn)3975詞,分別代表20世紀(jì)90年代初期及2009年左右漢語(yǔ)新聞?wù)Z體的使用面貌,可用于考察現(xiàn)代漢語(yǔ)新聞?wù)Z體近20年的動(dòng)態(tài)發(fā)展。
筆者首先人工標(biāo)注了兩個(gè)語(yǔ)料子庫(kù)中出現(xiàn)的字母詞,并使用一款免費(fèi)實(shí)用的語(yǔ)料分析軟件AntConc進(jìn)行數(shù)據(jù)檢索和統(tǒng)計(jì)。最后從LCMC新聞子庫(kù)中檢索出37例字母詞,Torch2009新聞子庫(kù)中檢索出188例字母詞。所有的字母詞均根據(jù)其詞形和語(yǔ)義內(nèi)容進(jìn)行分類和討論。
1.使用頻率
上文提到,字母詞在LCMC新聞子庫(kù)和Torch2009新聞子庫(kù)中分別出現(xiàn)37例和188例。由于這兩個(gè)語(yǔ)料庫(kù)子庫(kù)庫(kù)容有差異,因而將原始頻數(shù)轉(zhuǎn)化成標(biāo)準(zhǔn)頻數(shù),即每百萬(wàn)詞中字母詞出現(xiàn)的次數(shù)。因此得出LCMC和Torch2009新聞子庫(kù)每百萬(wàn)詞中字母詞分別出現(xiàn)250次和1022次,這一差異高達(dá)4倍,對(duì)數(shù)似然比檢驗(yàn)顯示該差異具有統(tǒng)計(jì)學(xué)意義上的顯著性(p<0.001),即Torch2009新聞子庫(kù)中字母詞的使用頻率顯著高于LCMC新聞子庫(kù)。這表明從上世紀(jì)90年代到2009年這20年間,字母詞在漢語(yǔ)新聞中的使用頻率迅速增長(zhǎng)。
2.詞形分類
陳佳璇、胡范鑄(2003)認(rèn)為字母詞詞形可以分為四類,即純字母詞、漢字字母詞、拼音字母詞和數(shù)詞字母詞。純字母詞指的是一個(gè)詞語(yǔ)全部采用外文字母的詞,主要是英語(yǔ)詞匯的縮略語(yǔ),如CNN(美國(guó)有線電視新聞網(wǎng))。漢字字母詞是由字母和漢字共同組成的詞,如阿Q、T恤,如果沒(méi)有漢字的參與,這個(gè)詞的語(yǔ)義將會(huì)改變甚至不存在。拼音字母詞是源于漢語(yǔ)拼音字母的詞,如GB(國(guó)標(biāo))、HSK(漢語(yǔ)水平考試),這些字母詞都是由拼音中的聲母組成的。數(shù)詞字母詞由數(shù)字和字母組合而成,如3D、G20。
表1是不同字形的字母詞在LCMC新聞子庫(kù)和Torch2009新聞子庫(kù)中的分布情況。由此可以看出,在兩個(gè)語(yǔ)料子庫(kù)中都是純字母詞的使用比例最高,漢字字母詞和數(shù)詞字母詞次之,而拼音字母詞使用最少,這與陳佳璇、胡范鑄(2003)的統(tǒng)計(jì)結(jié)果吻合。值得注意的是20年間一些完全由外文字母組成的純字母詞數(shù)量明顯增多 (從15次增加到119次),說(shuō)明大眾對(duì)外文詞匯的接受程度提高,這一現(xiàn)象與經(jīng)濟(jì)社會(huì)的發(fā)展、對(duì)外交流的加強(qiáng)和英語(yǔ)教育的普及密不可分。

表1 不同詞形字母詞在兩個(gè)語(yǔ)料子庫(kù)中的分布情況
3.語(yǔ)義內(nèi)容
按照語(yǔ)義內(nèi)容,字母詞大致可以分為八大類 (皇甫素飛,2004),本研究在此基礎(chǔ)上略有改動(dòng)。表2顯示,在LCMC新聞子庫(kù)中字母詞主要分布在專門(mén)名稱、科技和軍事交通領(lǐng)域,而經(jīng)濟(jì)和教育類字母詞一次都未出現(xiàn)。相比之下,Torch2009新聞子庫(kù)中字母詞已經(jīng)滲透到各個(gè)領(lǐng)域,呈現(xiàn)出種類多元多樣的特征,其中又以專門(mén)名稱、經(jīng)濟(jì)類和娛樂(lè)時(shí)尚類字母詞的增長(zhǎng)最明顯。

表2 不同語(yǔ)義內(nèi)容字母詞在兩個(gè)語(yǔ)料子庫(kù)中的分布情況
專門(mén)名稱類字母詞包括企業(yè)公司、機(jī)構(gòu)組織、會(huì)議賽事、計(jì)量單位等。LCMC中此類字母詞如CNN(美國(guó)有線電視新聞網(wǎng))、℃(攝氏度);Torch2009中如IBM (美國(guó)國(guó)際商業(yè)機(jī)器公司)、CCI(美國(guó)控制組件公司)、CCTV(中國(guó)中央電視臺(tái))、FIFA(國(guó)際足球聯(lián)盟)、G8(八國(guó)集團(tuán))、PECC(太平洋經(jīng)濟(jì)合作會(huì)議)。
科技術(shù)語(yǔ)類字母詞的使用達(dá)到了一定的規(guī)模。LCMC中這類字母詞如CAD(計(jì)算機(jī)輔助設(shè)計(jì))、STAQ(證券交易自動(dòng)報(bào)價(jià)系統(tǒng)),Torch2009中如COD(化學(xué)需氧量)、3G(第三代移動(dòng)通信技術(shù))、PC(個(gè)人計(jì)算機(jī))、PSP(掌上型多媒體終端)。
經(jīng)濟(jì)術(shù)語(yǔ)類字母詞二十年間使用頻率有較大幅度的增長(zhǎng)。LCMC新聞?wù)Z體中未出現(xiàn)一次經(jīng)濟(jì)類字母詞,而Torch2009新聞?wù)Z體中使用了36次,如GDP(國(guó)內(nèi)生產(chǎn)總值)出現(xiàn)23次,CEO(首席執(zhí)行官)5次,其他使用頻率較低的有CPI(消費(fèi)物價(jià)指數(shù))、PPI(生產(chǎn)者物價(jià)指數(shù))、IPO(首次公開(kāi)募股)、A股(人民幣普通股票)。
醫(yī)療健康類字母詞在兩個(gè)語(yǔ)料庫(kù)新聞子庫(kù)中分別出現(xiàn)2次和3次。LCMC中BM_D生物信息波治療儀出現(xiàn)2次,Torch2009中甲型H1N1出現(xiàn)2次和DNA(脫氧核糖核酸)出現(xiàn)1次。
文化教育類字母詞使用頻率較低。LCMC新聞子庫(kù)中未使用這類字母詞,Torch2009新聞子庫(kù)中使用了兩次,分別是SCI(科學(xué)論文索引)和SSCI(社會(huì)科學(xué)論文索引)。
娛樂(lè)時(shí)尚類字母詞二十年間使用頻率呈現(xiàn)出大幅度增長(zhǎng)。LCMC新聞子庫(kù)中僅出現(xiàn)2次卡拉OK,而Torch2009中這類字母詞種類較多,如Q版畫(huà)像、PK(游戲中引申出來(lái)的“對(duì)決”含義)、各種游戲名稱,如DNF(地下城與勇士)、RA3(紅色警戒3)、NCAA2010、MaddenNFL10,等等。
軍事交通類字母詞保持在較高的使用頻率。LCMC新聞?wù)Z體中此類字母詞如B-52轟炸機(jī)、F15戰(zhàn)斗機(jī)、SY-132型卡車;Torch2009新聞?wù)Z體中如AC310A直升機(jī)、Z9系列直升機(jī)、C-130運(yùn)輸機(jī)等。
其他類字母詞是排除上面六類剩下的字母詞,使用頻率比較穩(wěn)定,如等級(jí):A級(jí)、A檔,車牌號(hào):魯K2***5、閩D3***9。
以上列出的統(tǒng)計(jì)數(shù)據(jù)充分反映了近二十年來(lái)我國(guó)社會(huì)的發(fā)展?fàn)顩r,尤其表現(xiàn)在經(jīng)濟(jì)和娛樂(lè)時(shí)尚這兩個(gè)領(lǐng)域的快速發(fā)展和對(duì)外交流的頻繁。
本研究基于兩個(gè)漢語(yǔ)語(yǔ)料庫(kù)的新聞子庫(kù),追蹤了近二十年間字母詞在漢語(yǔ)新聞?wù)Z體中的使用情況。結(jié)果發(fā)現(xiàn),字母詞在漢語(yǔ)新聞中的使用頻率迅速增長(zhǎng),已成為一個(gè)難以阻擋的潮流。此外,本研究還從詞形和語(yǔ)義內(nèi)容兩個(gè)方面定量分析了兩個(gè)新聞子庫(kù)中使用的字母詞。從詞性來(lái)看,兩個(gè)子庫(kù)中都是純字母詞的使用比例最高,漢字字母詞和數(shù)詞字母詞次之,而拼音字母詞使用最少。從語(yǔ)義內(nèi)容來(lái)看,20世紀(jì)90年代,字母詞主要集中于某幾個(gè)領(lǐng)域,而近幾年字母詞已滲透到各個(gè)領(lǐng)域,表現(xiàn)出多元化的特征。
字母詞的產(chǎn)生和發(fā)展是一種正常的語(yǔ)言現(xiàn)象,字母詞被吸納為漢語(yǔ)詞匯,正是漢語(yǔ)不斷發(fā)展且具有強(qiáng)大生命力之所在。如果對(duì)字母詞持排斥態(tài)度,必將制約文化的交流。字母詞的使用規(guī)范該如何建立,是進(jìn)一步討論和研究的重點(diǎn)。
[1]陳佳璇,胡范鑄.我國(guó)大眾傳媒中字母詞使用狀況的調(diào)查與分析[J].修辭學(xué)習(xí),2003(4).
[2]皇甫素飛.從《文匯報(bào)》看漢語(yǔ)字母詞的歷史演變[J].修辭學(xué)習(xí),2004(5).
[3]劉涌泉.談?wù)勛帜冈~[J].語(yǔ)文建設(shè),1994(10).
[4]劉涌泉.關(guān)于漢語(yǔ)字母詞的問(wèn)題[J].語(yǔ)言文字應(yīng)用,2002(1).