王秋萍
(沈陽師范大學 國際教育學院,遼寧 沈陽 110034)
《現代漢語詞典》收錄的字母詞使用情況調查與分析
王秋萍
(沈陽師范大學 國際教育學院,遼寧 沈陽 110034)
字母詞指漢語中單獨由字母構成,或者由字母、數字、符號、漢字混合構成的詞,在《現代漢語詞典》(第6版)中總計收錄字母詞242條。此次調查將關注這些字母詞在漢語中的使用情況,尤其關注高頻、低頻字母詞,第6版新增字母詞在漢語中的使用情況,并對調查結果做出比較分析。擬展示不同頻段字母詞在漢語中各異的使用面貌,量化其發展變化規律,總結其使用特點和成因;剝離低頻字母詞,補充使用程度較高的字母詞,為詞典修訂提供參考。
《現代漢語詞典》;字母詞;使用;調查;分析
自20世紀90年代以來,字母詞在漢語中廣泛和大量使用已是不爭的事實,它也已成為漢語詞匯系統引進外來詞和產生新詞的重要形式之一[1-4]。然而,字母詞使用卻也一直惹爭議[5][6],這些由字母構成的詞,是否可以與漢字詞同等視為漢語詞,即便作為借詞的一種形式接納了它們,可這些很難見其形而度其義的字母詞接受起來是否跟學習和使用外語一樣。其實,一項通過對1990-2014年(以下25年均指此時間段)漢語書面語中字母詞使用情況的大規模調查發現①在王秋萍博士學位論文《近二十年來漢語書面語中字母詞使用狀況調查》的基礎上,加入近五年的語料后調查得出的數據和結論。,其字母詞使用量總計8 000多個,其中,使用頻次為1的字母詞占至50%左右,這說明字母詞的一過使用率非常高,穩定性差。累計使用總頻次大于100的字母詞僅有不到200個,卻可以覆蓋字母詞總使用頻次的70%以上。這表明,高頻使用的字母詞數量相當有限,了解起來根本不能與學習外語等而視之,更不必產生過于強烈的因字母詞的使用而導致人們閱讀理解障礙的擔憂。
為了方便查閱字母詞,《現代漢語詞典》自1996年第3版起,除收錄“阿Q”“卡拉OK”“三K黨”3條字母詞外,首次在“西文字母開頭的詞語”題錄下收錄39個字母詞。又分別在2002年第4版,2005年第5版和2012年第6版中,總計收錄字母詞145個、185個和242個。
本文將以《現代漢語詞典》(第6版)(下文簡稱“《現漢6》”)中收錄的242個字母詞為調查對象[7],擬通過對其使用情況的調查展示字母詞在漢語中的使用面貌,量化其發展變化規律,總結其使用特點和成因,為字母詞使用規范和入典提供參考。
《現漢6》收錄字母詞總計242個,其中,同形詞2個,形成244個統計詞條。將244個字母詞分別在1990-2014年歷時25年的《人民日報》語料中檢索,并統計出各詞條25年總使用頻次和各年度使用頻次,以及在語料中出現的年份等信息,形成字母詞使用情況的25張年表和一張總表。
頻次是衡量詞匯常用程度的一個最直觀的統計量,25年總使用頻次可以反映出字母詞自20世紀90年代以來在現代漢語中累計使用量的多寡,其統計結果見表1。

表1 244條字母詞不同頻次段詞種、詞次分布
從表1可以看出:第一,《現漢6》中所收錄的244個字母詞,25年使用總詞次為110748次。1990-2014年這25年《人民日報》中使用的字母詞總共有8 000多個,近200 000詞次,相當于每近2 328個漢字詞,就會出現一個字母詞①在王秋萍博士學位論文《近二十年來漢語書面語中字母詞使用狀況調查》的基礎上,加入近五年的語料后調查得出的數據和結論。。而所收錄的244個字母詞詞種數僅占25年《人民日報》使用總字母詞詞種數的3%左右,卻覆蓋了總使用詞次的近50%,總體上看,這244個字母詞中涵蓋了大多數漢語中常用的字母詞,而且在現代漢語中常用字母詞的數量并不多。
第二,244個字母詞中,25年總使用頻次在300以上的詞條有66條,占收錄總詞種數的27.05%,500以上的詞條有44條,占18.03%,1000以上的詞條有25條,占10.25%。25年總使用頻次在300以下的詞條有178條,占收錄總詞種數的72.95%,100以下的詞條有132條,占54.1%,50以下的詞條有99條,占40.57%。
第三,25年總使用頻次在300以上的66條字母詞僅占收錄總詞種數的27.05%,其25年總使用頻次覆蓋率卻可達89.39%,這說明這一小部分字母詞的使用頻次很高。而25年總使用頻次在300以下的178條字母詞占收錄總詞種數的72.95%,其25年總使用頻次覆蓋率僅達到10.61%,可見這些字母詞中很大一部分的使用頻次較低。《現漢6》收錄的244條字母詞中,高頻詞與中、低頻詞的比例約為1:2。
在《現漢6》所收錄的244個字母詞中,25年總使用頻次在300以上的字母詞有66條,各詞條25年總使用頻次見表2。
表2數據顯示:25年總使用頻次最高的字母詞是“GDP”,位居第二、三位的是“WTO”和“APEC”,這三個字母詞覆蓋了244條字母詞總使用頻次的30.45%,66條高頻字母詞總使用頻次的34.06%。

表2 高頻字母詞詞表
GDP的漢譯詞是“國內生產總值”,我國從1985年起建立GDP核算制度,1993年正式取消GNP核算,從此,“國內生產總值”成為國民經濟核算的核心指標。20世紀90年代以來,世界上絕大多數國家也紛紛放棄GNP而重點采用GDP作為國家經濟核算指標。這一經濟領域的變化馬上反映在詞匯的使用上。圖1所見,GNP在25年各年度的使用量均不高。而且,1994年以后,其使用頻次呈現下降趨勢,除個別年份外,基本降至年總使用頻次10次以內,而GDP的使用頻次卻逐年迅增。圖2則反映出漢語系統對這一經濟概念采用字母詞還是漢字詞形式的選擇趨勢。1998年以前,“國內生產總值”這一詞形占據頻次優勢,以后則字母詞GDP使用頻次優勢凸顯。25年總體而言,漢字詞形式年度使用頻次相對不高,且呈下降趨勢,字母詞形式反之呈上升趨勢,2004年以來,年度使用頻次均高于800次。這一變化趨勢不僅體現出國家對經濟發展的重視,也體現出詞匯系統在接納這一經濟領域術語的博弈中,字母詞形式所表現出的表達優勢。
GDP一詞25年總使用頻次非常高,年度使用頻次總體呈上升趨勢,這反映了高頻字母詞使用的一種變化類型。類似的字母詞還有PMI,指“制造業采購經理指數”,在2005年語料中首次出現,2009年開始進入使用頻次的上升期,累計至今成為高頻詞。近些年來,PMI已發展成為衡量世界經濟運行活動的重要評價指標和世界經濟變化的晴雨表,使得其使用頻次持續高升。這類字母詞還有:NBA、CBA、A股、CPI、IPO。

圖1 “GDP”和“GNP”25年使用頻次變化

圖2 “GDP”和“國內生產總值”25年使用頻次變化
WTO即“世界貿易組織”,其25年總使用頻次也非常高,但是它的高頻使用則反映了字母詞使用頻次歷時變化的又一種類型。圖3所示,WTO一詞在2001和2002年使用頻次特別高,年使用頻次1700以上,在其前后一兩年是頻次的驟升期和驟降期,呈現此變化趨勢與2001年底中國正式加入WTO這一事件息息相關。又如字母詞APEC、PM2.5和SARS,2001年APEC會議在上海召開,2003年SARS疫情爆發,2012-2014年,長時間懸浮于空氣中,直徑小于等于2.5微米的細顆粒物與空氣質量的話題成社會熱點,使其使用頻次呈現出陡峰突起之勢。伴隨非典疫情的有效控制,SARS一詞也漸漸淡出人們的視線。而2014年APEC會議再度在中國召開,APEC一詞又迎來了第二個陡峰突起。可以想見,若PM2.5得到有效治理,空氣質量好轉,PM2.5一詞也將淡出人們的視線。這類字母詞還有:F1、CEPA、B股、NMD、ECFA、H股。
有些字母詞雖然25年總使用頻次很高,但是正經歷年度使用頻次變化的下降期,進而可能進入低頻期,如圖4,卡拉OK一詞從1996年開始進入使用頻次下降期,并逐漸轉入低頻期,這反映字母詞歷時變化的第三種類型。這類字母詞還有:ISO、VCD、 CDMA、IC卡、CD、PC、GSM、BBC、MBA、BP機、SUV、CAD、CIMS、IP電話。

圖3 “WTO”和“APEC”25年使用頻次變化

圖4 “卡拉OK”25年使用頻次變化
還有兩類字母詞,一類是經過逐漸升溫的關注期后趨于穩定使用,圖5所見,IT一詞從1999年至2001年是其使用頻次的增長期,2002年以來穩定在一個較高的頻次范圍內。這類字母詞還有:DNA、GPS、LED、DVD、M2、M1、GMP、ATM機、CNN、IP地址、POS機、VIP。

圖5 “IT”25年使用頻次變化

圖6 “CT”和“X光”25年使用頻次變化
另一類字母詞是25年間使用頻次歷時變化趨勢不明顯,或者年度使用頻次不高,頻次歷時變化不大,趨于穩定。圖6所見,前者如CT,后者如X光。這類字母詞還有:CCTV、IMF、QQ、B超、CEO、ST、X射線、CPU、QFII、CBD、WAP、PPI、MTV、T恤衫、BBS、SCI、ABC、HIV、阿Q。
(2)C-E mistranslation of publicity materials of red tourism in Hunan Province will hinder Hunan Province from boosting its Red Tourism
高頻字母詞在漢語中的歷時發展狀態顯示,它們有些成為字母詞中的常青樹,有些伴隨社會關注度的冷熱程度變化而時隱時現,有些則將漸漸退出交際的舞臺。
字母詞的“首次出現年份”記錄了其出現年代的早晚,而“累積出現年份”則可以反映其生命力,它們也是字母詞在漢語中使用情況的體現。
如表3所見,66條高頻字母詞中,56個字母詞于20世紀90年代已經在漢語中使用,占高頻字母詞詞種總數的85%。根據語料統計得到的字母詞累計出現年份數據,66條字母詞中,累計使用20年以上的字母詞有36個,約占高頻字母詞詞種總數的55%,累計使用15年以上的字母詞有50個,占高頻字母詞詞種總數的76%,累計使用10年以上的字母詞有62個,占高頻字母詞詞種總數的94%,累計使用年份不足5年的高頻字母詞為0。可見,這66個高頻字母詞在漢語中的使用已經經歷了很長一段時間,絕大多數已經發展成為漢語詞匯中成熟而常用的組成部分,已經具備了相當的生命力。

表3 高頻字母詞首次出現年份和累計出現年份分布
如果將字母詞分為組織機構名、專業術語和一般名詞3種類型,那么這66個高頻字母詞的類型分布見表4。

表4 高頻字母詞類型分布
從表4的統計結果看,在高頻字母詞中,術語所占比例最大,其次是一般名詞,專名所占比例最低。如果將高頻字母詞按照其使用的領域劃分,其分布情況見表5。

表5 高頻字母詞領域分布
在高頻字母詞中,反映國家政治經濟和人民生活的最多,其次是科技文化及醫療衛生,反映農業生產的沒有。這一方面與國計民生、社會關注息息相關;另一方面,從語言學角度看,也和字母詞所對應的漢譯詞的有無關系也非常大。有些字母詞至今沒有可替代的漢譯詞,如:卡拉OK、CT、X光、CD、B超、X射線、T恤衫、B股、A股、BP機、IC卡、H股、M1、M2、VCD、DVD、F1、IP電話、QQ。它們有些用到了字母的構形特點,有些用到了字母的分類排序作用,有些因為漢語釋義繁瑣晦澀,難以推廣而積極使用字母詞形式,有些是專名,總之,這些因素都構成字母詞高頻使用的原因。可見,字母詞是漢語產生新詞語的一個重要途徑,有些新詞語最早產生就是一個字母詞。
25年總使用頻次小于50的字母詞被劃入“低頻字母詞”,列入表6,總計98個,占收錄字母詞總詞條的40%。其在不同頻段分布見圖7,其中,25年總使用頻次為0的字母詞有9條,25年總使用頻次小于20的有66個,占低頻字母詞的67.3%。
低頻字母詞的首次出現年份分布見圖8。首次出現年份分布于 1990-1999年間的有 58條,1990-2009年間的有85條,2010-2014年間的有4條。可見,絕大多數低頻字母詞并非新詞,其25年累計使用頻次小于50次的確表明它們是低頻字母詞。
這些低頻字母詞,除了其指稱的事物或概念本就不常用以外,從語言學視角分析,導致低頻的原因還有:第一,其漢譯詞使用占優勢,如:AI(人工智能)、DC(數碼相機)、APC(復方阿司匹林)、Wi-Fi(無線網絡)等。第二,在口語交際中使用占優勢,如:NG、K歌等。第三,在非大眾傳播媒介,如專業領域交際中使用占優勢,如:SSD、HDMI、OLED等。第四,其另一種書寫形式占優勢,如:hi-fi(HIFI)、CCC(3C)等。
①“PE”是同形字母詞,釋義為“市盈率”的頻次為1,釋義為“聚乙烯”的頻次為57。
與《現漢5》相較,《現漢6》新增字母詞60個,形成61個統計詞條,其25年總使用頻次見表7。其中,中、高頻字母詞有31個,成為詞典收錄字母詞的重要補充。其余30個為低頻字母詞,占新增字母詞的近50%,約占低頻字母詞的1/3。

表6 低頻字母詞詞表
僅就統計得到的25年使用數據而言,低頻新增字母詞收錄的理由并不十分充分。通過對1990-2014《人民日報》中字母詞使用情況的調查發現①在王秋萍博士學位論文《近二十年來漢語書面語中字母詞使用狀況調查》的基礎上,加入近五年的語料后調查得出的數據和結論。,其中有些使用程度較高的字母詞《現漢6》并未收錄。這里“使用程度較高”的篩選規則為:25年累計使用總頻次不低于50,并且累計分布總文本數不低于50或者累計使用總年份不低于10年②25年累計使用總頻次、分布總文本數和使用總年份三個統計量的閾值是通過對1990-2014《人民日報》中字母詞使用數據的統計分析以后得到的經驗值。。并且,將得到的字母詞進行人工甄別,去掉產品品牌名、公司名等部分專名,去掉頻次雖高,但缺乏時代感,已然面臨淘汰的詞,列入表8中。

圖7 低頻字母詞頻段分布

圖8 低頻字母詞首次出現年份分布
表8使用程度較高而《現漢6》未收錄的字母詞詞表《現漢6》除了在漢字詞條目中非常謹慎地收錄了3條漢字開頭的字母詞以外,其它字母詞均收錄在“西文字母開頭的詞語”題錄下。因此,表8中以漢字或數字開頭的字母詞僅基于詞形上的客觀條件考慮即沒有被選錄其中。然而,通過大規模語料的調查統計,表8所列字母詞僅從統計數據角度比較,的確比《現漢6》所收錄的部分中低頻字母詞常用,入典的理由也更充分些。

表7 《現漢6》新增字母詞詞表

表8 使用程度較高而《現漢6》未收錄的字母詞詞表
統計采用《人民日報》語料,因受到新聞語料所限,新聞事件中涉及到的字母詞,其使用頻次可能會高些。但是,調查采用歷時25年語料,語料量和歷時跨度均較大,會削弱新聞語料這種語料屬性的局限性;且詞典所收錄字母詞均遵循在漢語中已經使用很成熟的原則,這也會削弱語料性質的影響。因此,調查結果在一定程度上可以反映《現漢6》中所收字母詞在漢語中的使用面貌。
雖然絕對頻次在反映字母詞使用量方面受語料量影響較大,但是它依然可以客觀反映出該版詞典所收錄的244個字母詞之間相對使用量的關系,即哪些是高頻的,哪些是低頻的。
研究結果顯示,《現漢6》所收錄的字母詞中,高頻使用的字母詞僅占約27%,而40%左右是低頻字母詞,另33%是中頻的。然而,高頻字母詞雖少,其覆蓋率卻很高,66個高頻字母詞覆蓋字母詞使用總量的近90%。即使是高頻字母詞,其致高頻的原因也存在不同情況,還有些使用頻次已呈遞減趨勢。由此可見,在漢語系統中,真正高頻穩定使用的字母詞詞種數并不多,詞次覆蓋率卻可以很大,并通過反復使用而漸漸為人們所熟知。
[1]沈孟瓔.淺議字母詞的入典問題[J].辭書研究,2001(1):30-38.
[2]劉涌泉.關于漢語字母詞的問題[J].語言文字應用,2002(1):85-90.
[3]鄭澤芝.字母詞語跟蹤研究[J].語言文字應用,2009(1):69-78.
[4]侯敏,滕永林,劉俊,劉欣斐.廣播電視語言外文縮略詞使用狀況調查[J].北華大學學報:社會科學版,2011(4):18-25.
[5]國家語言資源監測與研究中心.2006中國語言生活狀況報告:下編[M].北京:商務印書館,2007:40-43.
[6]劉佳,鄒煜,侯敏.如何引導媒體語言規范——以外文縮略詞在廣播電視語言中的使用為例[J].語言文字應用,2011(4):78-83.
[7]中國社會科學院語言研究所詞典編輯室.現代漢語詞典:第6版[M].北京:商務印書館,2012:1,716,1117,1750-1755.
Research on Letter Words in Modern Chinese Dictionary
Wang Qiuping
(College ofInternational Education,ShenyangNormal University,ShenyangLiaoning110034)
Letter words consist of either a single letter or numbers,punctuation and Chinese characters.There are 242 letter words in Modern Chinese Dictionary(6thedition).This research focuses on the usage ofthese letter words and the frequency as well as the newly added words in the 6thedition.It also makes a comparison and analysis of the results so as to showthe frequency of the words used.The regularity of development,features and possible reasons are discussed as well.Hopefully,it will provide references for revisingthe dictionary.
Modern Chinese Dictionary;letter words;usage;survey;analysis
H 08
A
1674-5450(2016)02-0081-06
2016-01-08
遼寧省教育廳科學研究一般項目(W2013148);遼寧省社會科學基金規劃項目(L11DYY051);沈陽師范大學博士科研項目啟動基金經費資助
王秋萍,女,遼寧沈陽人,沈陽師范大學講師,語言學博士,主要從事語料庫語言學及語言監測研究。
【責任編輯:楊抱樸責任校對:王鳳娥】