摘 要:20世紀以來,現代漢語字母詞應用研究成果不斷增多。目前已有的字母詞綜述性文章,對其理論研究成果梳理較多,應用研究提及較少。本文綜述了現代漢語字母詞在語言調查、社會調查和中文信息處理三個領域的應用研究成果。
關鍵詞:字母詞 應用研究 綜述
一、引言
詞匯是語言系統中最活躍的要素,直接反映社會發展和語言變化。一種語言對詞匯形式的自然選擇也能夠反映出人類實踐中認識和思維傾向的發展。語言要素由音、形、義三部分組成,字母詞在語音和構形上都與漢語中的其它詞匯成員不同,這體現了字母詞在形式上的特殊性。字母詞形式簡潔、醒目,隨著外來新事物、新概念的引入和中國人外語整體水平的提升,字母詞成為引進外來詞和產生新詞的一種被接受程度越來越高的詞匯形式。字母詞曾經在語言學界引發了很多研究課題,是一種在社會上引起熱烈討論的語言現象。
字母詞理論研究已經取得了很多成果。什么是字母詞,字母詞屬于漢語系統還是外語系統,哪些屬于漢語字母詞,這些問題引起了熱議。隨著字母詞使用量增大,形式紛繁復雜,以怎樣規范使用字母詞的研究為標志,帶動了對字母詞來源、讀音、分類、詞典編纂、教學等多角度研究成果的出現。目前,字母詞的使用狀況,用“廣泛使用”“全民使用”這兩個詞來概括已經不為過。立足當下字母詞使用的現實狀況,反觀之前的研究論題就不夠全面和與時俱進了。實際上,字母詞研究迫切需要能夠真實反映語言生活中字母詞使用狀況的報告,以助益于字母詞研究、習查的工具軟件及在中文信息處理領域與字母詞相關的研究成果。
二、字母詞研究概況
字母詞形式上的特殊性,使它成為詞匯研究所關注的熱點問題之一,產生了一大批研究成果。單就“中國期刊全文數據庫”中的論文,以“字母詞(語)”為篇名關鍵字進行檢索,得到的文章就有215篇。①字母詞研究論文的時間分布見圖1。
圖1:中國期刊全文數據庫中“字母詞(語)”研究論文數量的時間分布圖
從圖1可看到,從1999年至2009年這十年間,是字母詞研究最蓬勃的時期。世紀之交,新事物和新概念勢必引起詞匯系統的變化,新的專名和術語不斷引進和產生,最經濟、最快速的追求勢必使得“字母詞”這種詞匯形式占據優勢。字母詞的大量涌現是字母詞備受關注的重要原因。
研究字母詞的論文研究角度多樣,涉及字母詞的諸多方面。字母詞的研究內容分布情況見表1。
表1:中國期刊全文數據庫中“字母詞(語)”研究論文內容分布表
研究內容論文篇數(篇)占總數的百分比(%)
字母詞的定義198.37
字母詞的讀音94.19
字母詞產生途徑和原因106.51
字母詞構成和特點73.72
字母詞語法研究10.47
字母詞的規范3316.74
字母詞個案研究156.98
字母詞使用研究4823.26
字母詞CIP研究52.33
字母詞詞典編纂和書評104.65
字母詞對外漢語教學31.40
字母詞多角度研究3918.14
字母詞研究綜述73.26
總 計215100
表1顯示:第一,對字母詞使用狀況的研究所占比例最高,其次是對字母詞的規范研究和多角度分析描寫。第二,除理論研究外,字母詞使用研究和字母詞中文信息處理(CIP)領域研究作為字母詞應用研究的代表,也取得了一定成果。
除發表的論文外,還出版了兩本字母詞詞典,分別是劉涌泉編著的《漢語字母詞詞典》(2001年版和2009年版),沈夢瓔主編的《實用字母詞詞典》(2002年版)。
字母詞研究的專著目前尚屬空白。不過,相關的博士論文有兩篇:鄭澤芝(2005)《基于動態流通語料庫(DCC)的漢語字母詞語識別及考察研究》和鄒玉華(2006)《現代漢語字母詞研究》。
字母詞研究的內容涉及面廣,有針對一個或幾個字母詞的個案研究,但多數是針對字母詞整體的研究;有從一個層面或角度的深入研究,也有多角度的全面研究;有理論上的分析,也有語言使用中的調查研究和教學探討,還有針對自然語言處理所作的專門研究。研究成果除了論文外,還有對詞典編纂的指導性建議和字母詞識別、標注的工具軟件開發。
三、字母詞與漢語詞匯系統
最早對字母詞下定義的是劉涌泉(1994),認為字母詞是指漢語中帶外文字母(主要是拉丁字母)或者完全用外文字母表達的詞,前者如“B超、卡拉OK”,后者如“CD、UFO”。它是一種新形式的外來語。劉涌泉(2002)修改了定義,認為稱為漢語字母詞或中文字母詞(Chinese lettered words)更合適,指“由拉丁字母(包括漢語拼音字母)或希臘字母構成的或由它們分別與符號、數字或漢字混合構成的詞”。強調了字母詞屬于漢語詞匯系統和字母詞是中文這種非字母構詞語言特有現象的性質。與他持比較一致觀點的還有郭伏良(1997)、沈孟瓔(2001)、周健等(2001)。
關于字母詞包含的對象,各家觀點不一。周玉琨(2002)認為,字母詞是指含有西文字母的外來詞,是從書面角度說的,與“漢字詞”相對,他只承認西文字母構成的才是字母詞,漢語拼音字母構成的,如“GB、HSK”不是字母詞。胡明揚(2002)認為,只有像“GB、HSK”這樣由漢語拼音縮略構成的詞才能說是“漢語字母詞/語”;像“X光、γ射線”那樣包含外文字母的詞可以稱為“外文字母詞”或“西文字母詞”;像“WTO、DNA、CD”那樣的外文縮略語只能說是“原裝外文縮略語”。慧生(1995)和黃文貴等(2002)認為,外文字母加漢字語素構成的詞語才是字母詞,外文縮略語不是字母詞。漢語字母詞應該是已經漢化、具有漢語特征的詞,它可以或已經融入漢語詞匯系統中。多數學者認為外文原詞不是字母詞,而劉涌泉(2001)、劉建梅(2002)將部分外文原詞也列入字母詞范圍。
對漢語字母詞對象認定的代表性的觀點有4種,以劉涌泉(2001)等文獻認定的集合最大,其它3種觀點各取其真子集。探究爭論的焦點,主要集中在字母詞中字母的來源,外語原詞是不是字母詞和是否含有漢字,即漢化才是字母詞等問題上。
字母詞本身是從形式角度定義的,從認知語言學角度,我們贊同鄒玉華(2006)運用原型理論解釋認定字母詞范圍差異的觀點:每個人心目中,對字母詞原型的認識不同,因此,在面向含有字母的詞匯成分時,所調動的認知相似性和聯系也不同,這就導致了大家對字母詞對象認定的差異。
概率、典型性和隸屬度是定性研究的重要特征。對字母詞典型性的探討,有代表性的觀點的提出者是潘雪蓮(2006)和鄒玉華(2006)。潘雪蓮根據語感將字母詞分為非典型字母詞和典型字母詞,非典型字母詞包括字母符號、拼音縮寫和未經縮寫的外文單詞原形;典型字母詞包括直接移用的外文縮寫,外文字母、外文縮寫和漢字的組合,利用字母自身的性質創造的詞。鄒玉華將原型理論引入字母詞典型性界定,制定了認定字母詞典型性的4個因素:形體大寫、讀字母名稱音、與漢字組合和縮略。含有的典型性特點越多,字母詞典型性越強。我們認為,鄒玉華的方法具有采用一套形式化的方法來界定概念的特點。
詞匯系統的變化主要表現在詞形和詞義的變化上。新詞形的產生無外乎外來詞和自造詞兩類,在這兩類詞語中,字母詞都占據一定的數量。它們之間的關系可以表示為圖2。
圖2:字母詞與漢語詞匯系統的關系
字母詞在漢語詞匯系統中,與新詞語產生和語言監測工作關系密切。在2009年9月召開的“國家語言資源監測與研究中心暨平面媒體中心成立五周年紀念學術會議”上,有聲媒體語言分中心的侯敏教授介紹了語言監測的兩個層面:語言形式監測和語言內容監測。字母詞的監測研究正是語言形式監測的一項重要內容。
可見,字母詞研究發端于理論探討和規范制定,目前,正從理論研究走向應用研究。對字母詞使用狀況的語言調查、社會調查和中文信息處理領域等一系列應用領域研究成果的綜述,將助益于字母詞應用研究的深入和視角的擴展。
四、字母詞使用狀況調查研究
字母詞在漢語中普遍存在,在報紙、廣播、電視、網絡等媒體,書面語和口語中,字母詞都發揮著作用。漢語中字母詞的使用可以追溯至1903年《新爾雅》中對“X光”一詞的記載。但是,字母詞廣泛使用是在改革開放以后。《字母詞使用規范方案研制報告(2006修訂稿)》對《人民日報》(2002.11.16~2002.12.15)的文章(不算廣告和天氣預報)檢索發現,字母詞共出現748次,平均每天出現24.9次。《現代漢語詞典》(第5版)收錄“西文字母開頭的詞語”182個。可見,字母詞已被大眾、媒體和辭書接受。
字母詞使用狀況的語言調查研究分為共時研究和歷時研究。最早的歷時調查研究是皇甫素飛(2004)對《文匯報》從1938年創刊至1999年的語料中字母詞的詞頻和種類的定量統計,結果發現,字母詞絕大部分出現在改革開放以后,90年代字母詞使用頻次最高,增幅最大,種類最多,使用領域最廣泛。共時研究成果主要有:從語體分布角度,原新梅(2005)發現,從總體上看,字母詞在新聞語體、科技語體中分布較多,而在政論語體、文學語體、公文語體中數量有限,且涉及領域較窄。關潤芝、楊建國(2005)對2002年《人民日報》全年語料中帶標點的字母詞自身特征和標點出現情況進行了分析。楊建國、鄭澤芝(2005)對2002年《人民日報》全年語料中字母詞和漢字詞在專名中同現的情況進行了調查,并對如何規范使用字母詞提出了思考。鄭澤芝、張普(2005)對2002年《人民日報》全年語料進行了調查,得到ELWP(字母詞語工程定義)在該語料中使用情況的分類,并對單字母ELWP、含數字ELWP的分類分析和并列結構ELWP處理等問題進行了探討。《中國語言生活狀況報告(2006)》(下編)對報紙、廣播電視、網絡(新聞)的字母詞使用狀況進行了調查,結論是:字母詞已經成為漢語詞匯的一部分;字母在漢語中最經常、最主要的作用就是指代、排序;典型字母詞的造詞方式主要是簡縮;異形字母詞量大,使用頻率不同;同形字母詞量大,有時會影響交際;字母詞音、形、義之間關系復雜多樣;典型字母詞主要用于專業術語;字母詞的書寫錯誤現象比較嚴重;帶字母的分詞單位在不同媒體中使用頻度不同。鄒玉華等(2006)對字母詞占據數量最多的術語字母詞使用狀況進行了考察,發現術語字母詞的使用與文章領域相關,科技和經濟領域文章使用術語字母詞最多。鄒玉華等(2007)通過對字母詞在當代漢語中使用狀況的分析發現,字母詞的使用密度和文章領域相關,和報紙地域、性質無關。其中,科技領域使用密度最高,其次是教育領域、經濟領域,使用密度最低的是軍事領域和政法領域。鄭澤芝(2009)“字母詞語跟蹤研究”一文采用共時調查和歷時調查兩種方法,對漢語字母詞的使用范圍、穩定性、用法等情況進行了探討,這是目前所得到資料中,對真實文本中字母詞使用概況所進行的一項較大規模的調查研究。
語言領域中字母詞使用狀況研究最多的是對報刊語言的研究。陳佳璇、胡范鑄(2003)對2002年8月全國15種報紙使用字母詞的形式、種類、分布和使用頻次等情況進行了定量分析。陳佳璇、聶桂蘭(2006)通過對新聞語言中字母詞的易讀性測量發現,文化程度高低和語境有無對字母詞理解產生影響,而使用頻次與理解度不構成必然聯系。散見的還有對體育新聞、網絡語言、廣告語言中字母詞使用情況的調查分析。
字母詞使用狀況社會調查研究中,語言態度的調查是一項重要內容。研究成果主要有:鄒玉華等(2005)關于漢語中使用字母詞的語言態度的調查發現,職業是影響字母詞態度的重要因素,性別、年齡、文化程度與字母詞的態度關系不大。曹欽明(2005)通過對字母詞的流通度差異調查發現,社會人群的性別、年齡、受教育程度、職業因素對字母詞使用與否的傾向性均不產生統計學上的顯著影響。裴昕月(2007)通過對大學生常用字母詞使用情況調查,歸納出大學生這一特定人群使用字母詞的規律、特點和影響因素。字母詞的知曉度是字母詞社會調查的又一個重要方面,鄒玉華(2006)字母詞知曉度的調查報告分析了職業、性別、年齡、教育程度對字母詞知曉度的影響,其中,職業是影響知曉度的主要因素,其次是教育程度,性別和年齡對字母詞的知曉度不構成影響。原新梅等(2007)對留學生這個特定人群的字母詞知曉度進行了調查,考察國籍、母語、年齡、性別、漢語水平、英語水平、對英語的態度、受教育程度等因素對字母詞知曉度的影響。
五、字母詞在中文信息處理領域的研究
字母詞散布在漢語文本中,并具有一定的形式特征,研究者希望可以自動提取字母詞,這是文本檢索的一項內容。另外,字母詞識別的正確性也關系到中文文本的自動分詞和標注等,因此,字母詞的識別和提取研究成為字母詞在中文信息處理領域研究中涉及最多的內容。
鄭澤芝等(2005a)在對字母詞在大規模真實文本中的分布情況進行分析時發現,字母詞所含標點,非漢字串與漢字串分合,字母詞詞種數辨認和等義同現問題成為字母詞提取中的難點。在此分析基礎上,鄭澤芝等(2005b)運用字母串作為錨點,從中心向兩邊擴展的規則加統計的方法進行了字母詞自動提取,召回率100%,準確率80%以上。鄭澤芝(2007)后來改進上述思想,提出了一種字母詞的自動標注算法。
關于詞語流通使用度的研究,尹斌庸等(1994)和孫茂松(2000)曾經有文章探討。鄭澤芝(2009)探討了字母詞通用程度的評判方法。文章將絕對指標方法、通用度方法和散布均勻度方法進行了比較,散布均勻度方法效果較好。
六、結語
語言理論研究和應用研究在語言研究中相輔相成,相互促進。字母詞研究發端于理論探討,已有的綜述性文章也對這部分研究成果梳理較多。對字母詞在使用狀況的調查研究和中文信息處理領域的研究探討進行描寫和綜述,不僅可以彌補已有字母詞綜述性文章介紹理論研究成果多,應用研究成果少的缺憾,而且也將促進字母詞應用的深入研究,并引發對理論研究爭議的重新思考。
注 釋:
①檢索結果截止到2009年12月31日。
參考文獻:
[1]曹欽明.字母詞的社會流通度考察[J].廣西社會科學,2005,(4).
[2]陳佳璇,胡范鑄.我國大眾傳媒中字母詞使用狀況的調查與分析
[J].修辭學習,2003,(4).
[3]陳佳璇,聶桂蘭.試論我國新聞語言中字母詞的易讀性測量[J].
韓山師范學院學報,2006,(1).
[4]關潤芝,楊建國.字母詞語塊中“標點”的使用狀況考察[J].語
言文字應用,2005,(1).
[5]郭熙.字母詞使用規范方案研制報告(2006修訂稿)[R].暨南大
學,2006.
[6]郭伏良.字母詞與詞典二題[J].河北大學學報(哲學社會科學版),
1997,(2).
[7]國家語言資源監測與研究中心.中國語言生活狀況報告(2006)
下編[R].北京:商務印書館,2006.
[8]胡明揚.關于外文字母詞和原裝外文縮略語問題[J].語言文字應
用,2002,(2).
[9]皇甫素飛.從《文匯報》看漢語字母詞的歷史演變[J].修辭學習,
2004,(5).
[10]黃文貴,謝英捷.漢語中外來詞語的規范問題[J].江西農業大
學學報(社會科學版),2002,(3).
[11]慧生.也談字母詞[J].語文建設,1995,(7).
[12]劉建梅.現代漢字系統中外來字母規范淺議[J].語言文字應用,
2002,(1).
[13]劉涌泉.關于漢語字母詞的問題[J].語言文字應用,2002,(1).
[14]劉涌泉.漢語字母詞詞典[Z].北京:外語教學與研究出版社,
2009.
[15]劉涌泉.漢語字母詞詞典[Z].上海:上海辭書出版社,2001.
[16]劉涌泉.談談字母詞[J].語文建設,1994,(10).
[17]潘雪蓮.略論字母詞的定義與定位[J].科技術語研究,2006,
(2).
[18]裴昕月.大學生使用字母詞情況調查[J].中國科技術語,2007,
(6).
[19]沈孟瓔.淺議字母詞的入典問題[J].辭書研究,2001,(1).
[20]沈孟瓔.實用字母詞詞典[Z].上海:漢語大詞典出版社,2002.
[21]孫茂松.關于詞匯使用度的初步研究[J].語言文字應用,2000,
(1).
[22]薛笑叢.現代漢語中字母詞研究綜述[J].漢語學習,2007,(2).
[23]楊建國,鄭澤芝.漢語文本中字母詞語的使用與規范探討[J].
語言文字應用,2005,(1).
[24]尹斌庸,方世增.詞頻統計的新概念和新方法[J].語言文字應
用,1994,(2).
[25]原新梅,梁盟.留學生字母詞語的知曉度[J].語言文字應用,
2007,(1).
[26]原新梅.字母詞語在不用語體中的分布[J].河南社會科學,2005,
(1)
[27]張鐵文.《現漢》“西文字母開頭的詞語”部分的修訂[J].語
言文字應用,2006,(4).
[28]鄭澤芝,張普,楊建國.基于語料庫的字母詞語自動提取研究
[J].中文信息學報,2005b,(2).
[29]鄭澤芝,張普.漢語真實文本字母詞語[J].語言科學,2005d,
(6).
[30]鄭澤芝.基于動態流通語料庫(DCC)的漢語字母詞語識別及考
察研究[D].北京語言大學博士學位論文,2005c.
[31]鄭澤芝.通用字母詞語提取研究[A].國家語言資源監測與研究
中心暨平面媒體分中心成立五周年紀念學術會議論文集(討論稿)[C].2009.
[32]鄭澤芝.一種字母詞語自動標注算法[J].廈門大學學報,2007,
(5).
[33]鄭澤芝.字母詞語跟蹤研究[J].語言文字應用,2009,(1).
[34]鄭澤芝.字母詞語自動提取的幾點分析[J].語言文字應用,2005a,
(1).
[35]中國社會科學院語言研究所詞典編輯室.現代漢語詞典(第5
版)[Z].北京:商務印書館,2005.
[36]周健,張述娟,劉麗寧.略論字母詞語的歸屬與規范[J].語言
文字應用,2001,(3).
[37]周玉琨.“GB”“HSK”是字母詞嗎?[J].漢字文化,2002,(1).
[38]鄒玉華,馬廣斌,劉紅,韓志湘.關于漢語中使用字母詞的語
言態度的調查[J].語言教學與研究,2005,(4).
[39]鄒玉華,馬廣斌,馬叔駿,劉哲,馬宇菁.字母詞知曉度的調
查報告[J].語言文字應用,2006,(2).
[40]鄒玉華,翟國忠,董春萍.術語字母詞在當代漢語中的使用狀
況考察[J].科技術語研究(季刊),2006,(2).
[41]鄒玉華,翟國忠,董春萍.字母詞在當代漢語中使用狀況的分
析[J].佛山科學技術學院學報(社會科學版),2007,(2).
[42]鄒玉華.現代漢語字母詞研究[D].中國傳媒大學博士學位論文,
2006.
(王秋萍 北京 中國傳媒大學文學院 100024)