對2007年新詞語的動態監測
韓黎
(北京師范大學文學院,北京100875)
摘要:采用網絡調查法和計量分析法,對2007年新詞語進行詞頻和發展曲線的動態監測。2007年新詞語的使用度并不樂觀,絕大多數都處于低頻和超低頻的區間內。只有極少數的詞語穩定下來,成為常用詞匯。根據2007年新詞語的特點,將其發展曲線歸為九大類,即增長型、衰減型、孤峰型、雙峰型、周期型、凸起型、波動型、間歇型、孤點型。增長型和周期型詞語未來的復現率都為100%,衰減型、孤峰型、凸起型、間歇型詞語處在“即將退隱”的狀態,孤點型詞語已經退隱。
關鍵詞:新詞語;頻次;發展曲線;退隱;動態監測
作者簡介:韓黎,在讀碩士,北京師范大學2013級。研究方向:現代漢語。 白鑫,在讀碩士,云南師范大學文學院。研究方向:語言學及應用語言學。
文章編號:1672-6758(2015)07-0141-6
中圖分類號:H136
文獻標識碼:A
Abstract:This paper monitors the frequency and progress curve of neologisms appeared in 2007 dynamically by means of searching online and quantitative analysis. The usage of neologisms appeared in 2007 shows a less optimistic prospect. The overwhelming majority of the words has low frequency or ultra-low frequency. Only a very small number are steadying and become everyday vocabulary. According to the features of neologisms appeared in 2007, they are divided into nine categories, namely the form of growth, attenuation, isolated peak, double-humped, periodic, upward heave, fluctuation, intermittent, acnodal. The recurrence rates of growth and periodic type are 100% in the future. The types of attenuation, isolated peak, upward heave and intermittent are in the condition of “going to be latent”. The types of acnodal are already latent.
基金項目:本文系國家社會科學基金一般項目(項目編號:12BYY103)的階段性成果,研究同時得到教育部人文社會科學研究青年基金項目(項目編號:10YJC740143)和云南省教育廳科學研究基金項目(項目編號:2010Y035)的資助。
世界萬物都處在不斷變化發展的過程中,一成不變的事物是不存在的。語言詞匯也不例外,既是穩定的,又是動態變化的。詞頻是了解一個新詞語動態發展情況的重要指標。從一個較大的語料中搜索得出的使用次數,便可知道一個新詞語的流行度。使用次數越多,說明該詞語的生命力越強,流行度越高。2007年出現的新詞語如今的“命運”如何呢?需要我們回過頭去看。本文旨在監測2007年新詞語的使用頻次,追蹤其生命軌跡,刻畫其生命曲線。
本文選擇的調查范圍來自于新浪網2007年到2014年的新聞。監測對象是《2007漢語新詞語》[1]一書中的所有新詞語,加上《2008漢語新詞語》[2]附錄中補收的2007年新詞語72條,共計492條。
一頻次的動態監測
要實現對語言的動態監測,經常用到的兩個概念是頻次和頻率。在日常生活中,這兩個概念是可以混用的,詞典對二者的解釋也不那么清楚,意義區別不大。但是,在統計學中,這兩個詞有著明確的分工。頻次,是指所監測的詞語在調查語料中出現的次數,是進行計量研究的基礎。在統計的語料范圍內出現了幾次,那么頻次就是幾。“頻次是一個具體數字,它直觀地反映了某個詞語在語料中真實、原始的使用情況。”[3]頻率,是所監測詞語的頻次與所有調查詞語的總頻次的比值,反映某個詞語的使用情況在整個語料中的比重。
使用頻次是一個“量”的標準,能夠反映新詞語的真實發展狀態,它既代表著詞語所代表事物或概念的影響力,也代表著人們對該詞語接受和認可的程度。因此,從新詞語每年的使用頻次上,我們就可以大致推斷出該詞語生命力的強弱。
我們以新浪網新聞為文本語料,按年份分別統計出每個新詞語每年在該文本中出現的次數,將頻次輸入到Excel中,求出每個新詞語從產生到2014年之間的總頻次,從高到低排序。為了對頻次高低有一個定性的衡量,我們規定:總頻次1萬以上為“超高頻”;1000-10000為“高頻”;100-1000為“中頻”;10-100為“低頻”;1-10為“超低頻”。

表1 07年新詞語頻次水平匯總表
由上表可知,2007年新詞語的使用情況不容樂觀。低頻和超低頻詞語占了一半以上,高頻和超高頻只占11.5%。
通過觀察示例詞語,我們可以發現,超高頻和高頻的新詞語往往是當年影響重大的事件或是與人們日常生活息息相關的事物,正因為關系重大,所以才會被頻繁提及,就像2007年的“金融海嘯”“次貸危機”一直到2014年,二者的使用頻次都一直保持在每年1000以上,可見詞語所指代的事件影響力之深遠。而那些低頻尤其是超低頻的新詞語要么指代極少數人群,要么指代不起眼的新聞事件,要么指代一個非生活必需品,要么是詞語顯得過于新穎怪異,陌生度太高,這些都是造成使用度極低的原因。還有很多新詞語在產生之初頻率很高,所代表的事件或人物在當年的關注度很高,詞語顯示了一定的生命力,但隨著時間的推移,慢慢就銷聲匿跡了。
二動態發展曲線
劉長征(2011)將新詞語的歷時生命力曲線分為孤點型、斷續型、連續型、周期型、成長型、衰減型、凸起型、凹陷型等八種。《中國語言生活狀況報告(2012)下編》根據新詞語在各年度使用的變化趨勢,將其分為高穩、低穩、上升、下降、起伏、偶現六種類型。[4]
本文綜合上述兩種分類方法,并根據2007年新詞語頻次走勢的具體特點,把新詞語發展曲線分為:增長型、衰減型、孤峰型、雙峰型、周期型、凸起型、波動型、間歇型、孤點型等九類。下文中所展示的新詞語發展曲線圖,橫軸都表示監測時點,縱軸都表示使用頻次。
1.增長型。
增長型,也叫上升型、成長型。它所代表的新詞語在產生當年,頻次不算太高,但是隨著時間的推移,頻次會逐漸增長或突然增長,雖然中間可能會有波動,但是總體趨勢都是上升的。這類新詞語從產生后,逐漸被大眾所知曉、熟悉,最后被接受和認可,流通度、使用度越來越高,在達到一個峰值之后,頻次往往會略微降一點,但降幅不會很大,繼續保持穩定的發展態勢,最終會成為社會生活中的常用詞。

(1)

(2) 圖1 增長型新詞語示例 (1)道德模范(2)小長假
增長型又可以分為平穩增長、波動增長、高速增長三種類型。前二者增幅較小;而高速增長型的增幅非常大,頻次可以從幾百一下增漲到幾千甚至幾萬,呈現出爆發的增長態勢,如“小長假”的頻次從最初的451(2007年)突增到6229(2008年),然后繼續保持高速增長,到2012年,頻次達到了一個峰值17009。2012年之后,“小長假”每年的使用頻次有所下降,但依然保持在9000以上。該詞語經歷了從產生到高速發展再到成熟這樣三個階段。對于這類詞語,即使頻次在達到峰值之后有所下降,也應該歸為“增長型”,關鍵要看其整體發展趨勢,以及峰值之后的使用頻次的高低。
這些詞語往往與社會生活緊密相關,隨著頻次和知曉度的增加,大部分會逐漸消失其新穎色彩,變為通用詞語。因此,增長型詞語不僅不會退隱,而且很可能進入基本詞匯,被規范的語文詞典收錄。如“腦殘”產生以后,迅速發展,2010年以后頻次均保持在1000以上,再如“動車”,頻次從最初的656,到2011年達到最大值23150,之后則保持每年5000以上的使用頻次。這兩個高頻詞語都已被《現代漢語詞典》(第6版)收錄。

(1)

(2) 圖2 被《現代漢語詞典》收錄的增長型新詞語 (1)腦殘(2)動車
2.衰減型。
衰減型,也叫下降型。它所代表的新詞語是在產生之初頻次很高,但隨著時間的推移,使用頻次逐年下降或波動下降,流通度、使用度都越來越低,甚至歸0。

(1)

(2) 圖3 衰減型新詞語示例 (1)陽光工場(2)次級債危機
衰減型走勢圖也包括三種情況:平穩下降、波動下降、驟降。前二者減幅較小;而驟降型的降幅會高達90%以上,如“次級債危機”,在07年和08年都是高頻詞語,每年的頻次都在3500以上,而到了2009年,隨著事過情遷,頻次跌落至200,降幅達94.68%,此后一直維持低頻萎縮狀態,趨于隱退。
衰減型的新詞語有很多,約占39%。這類新詞語多表示突發事件或某個有影響力的特定事件,具有很強的時間性和事件性,如:正龍拍虎、行業限批、去功能化、惡意取款、濾油粉、黑磚窯事件。它們在產生之后,往往會在人們的視線里活躍一段時間,但這個活躍期很短,一般不超過三年,然后便隨著該事物或事件影響力的降低,新詞語的生命力也隨之逐漸衰弱直至隱退。這些詞語的衰減,也適應了漢語詞匯系統新陳代謝、吐故納新的要求。
3.孤峰型。
孤峰型,也叫單峰型、“驟升驟降”型。它的發展態勢總是先驟升達到一個峰值之后再驟降,是“驟升型”和“驟降型”的組合。
這類新詞語往往代表一個轟動全中國甚至全世界的重大事件,新詞語在事件發生的前一年處于萌芽期、預備期,頻次不高,而到了第二年就會處于爆發期,突增到一個峰值,到事件發生之后的第三年,使用頻次就會迅速下降。

(1)

(2) 圖4 孤峰型新詞語示例 (1)次貸(2)祥云火炬
圖4反映了2008年的次貸危機和北京奧運會這兩個重大事件。這些事件在十年的時間之內一般不會重復發生,曲線圖呈現單峰狀態。2007年產生的新詞語“次貸”“祥云火炬”“金融海嘯”“奧運體驗場”的使用頻次都在2008年達到頂峰,而一旦這個事件過后,它們的使用度會大幅降低,直至退隱。這些詞語曾經風靡一時,而如今已經失去了往日的顯赫。
4.雙峰型。
雙峰型,也叫“M型”,它的曲線走勢是“增-減-增-減”。這類新詞語在產生之后的七年時間里,達到過兩次高潮,因而呈現出雙峰狀態。

(1)

(2) 圖5 雙峰型新詞語示例 (1)樓瘋(2)歧視門
由圖可知,“樓瘋”的使用高潮期在09年和12年,分別是由于房價瘋漲和香港樓瘋而引起的。請看:
(1)“樓瘋”兩周年來到。從2007年十月樓市最高位,到2009年金九銀十的當下,樓市經過驚天逆轉,又驚人地回歸,市場瘋狂再度喚醒我們的記憶。(《購房者也瘋狂 從07年的盲目追漲到09年的精神分裂》《羊城晚報》2009年09月27日)
(2)QE3火上澆油 香港“樓瘋”重現 (《中國證券報》2012年09月21日)
“歧視門”的使用高潮期在08年和12年,分別是由于“IBM辭退抑郁癥員工”和“倫敦殘奧會”等事件而引起了較高的關注度。請看
(3)IBM辭退抑郁癥員工陷歧視門(《新聞晚報》2008年06月22日)
(4)倫敦殘奧會曝“歧視門”(《揚子晚報》2012年08月30日)
雙峰型新詞語多表示一個具體的事件。與單峰型詞語不同的是,雙峰型新詞語所代表的事件的影響力不會特別重大,它有可能多次發生。事件每發生一次,使用頻次就會達到一個高峰。
5.凸起型。
凸起型,也叫“緩升緩降”型。與“驟升驟降”型(孤峰型)相比,二者都有一個峰值,但是凸起型新詞語的整體發展過程比較平緩,增幅和降幅都比較小,沒有大起大落。

(1)

(2) 圖6 凸起型新詞語示例 (1)公共單車(2)農事村辦
2007年的凸起型新詞語約占10%,它們所代表的事件或人群的影響力比較小,總體頻次水平也不高。除了“公共單車”“農事村辦”以外,還有“宅人”“試客”“碳匯林”“格子鋪”“畢婚族”“瘋果盒子”等詞語都屬于這一類。它們在產生后前三年平穩增長,一般在2010年或2011年便會達到一個小高峰,后兩年便開始走“下坡路”。
6.周期型。
周期型,也叫循環型。這類新詞語在產生以后的監測時段內,使用頻次呈現出有規律的高低起伏的波浪形。周期型新詞語數量不多,指代的多是“定期出現或舉行的某種現象或重大活動,如會議、節日、運動會等等”。[5]

(1)

(2) 圖7 周期型新詞語示例 (1)非遺節(2)快男
“非遺節”,即國際非物質文化遺產節,每兩年舉辦一次,首屆非遺節在2007年5月23日開始。因此這個新詞語的頻次在07年、09年、11年、13年分別達到一次使用高峰,在其他年度,則保持低頻使用。可以預計,只要這個節日存在,那么該詞語在此后的2015年、2017年、2019年都會高頻使用。
“快男”,“快樂男聲”節目的簡稱,三年一屆。使用頻次在07年、10年、13年分別達到高潮,其發展曲線也呈現出一條波峰波谷交替進行的有規律的波浪線。
周期型與雙峰型新詞語雖然都會有兩次以上的使用高潮,但二者的不同也很明顯:雙峰型的高潮期是無規律的,難以預測;而周期型的高潮期則是有規律的,可以預測。
7.間歇型。
間歇型,也叫斷續型、偶發型、時隱時現型。這類新詞語在各個監測時點上的表現是:有時出現,有時不出現,即使出現,頻次也不會很高。但是,到底何時隱,何時現,幾乎沒有規律可循。而且,有些詞語間歇的時間很長,長達四五年,已經趨于退隱了,但又會突然“冒”出來,具有很強的偶然性,如“粉色航空”從2009年到2013年已經退隱了長達五年,卻在2014年復現了,但頻次僅1次。

(1)

(2) 圖8 間歇型新詞語示例 (1)火療店(2)粉色航空
只要調查對象在監測范圍內有一年頻次為0,我們就將其歸為“間歇型”。2007年間歇型新詞語有很多,約占30%,比例在衰減型之后,位居第二。這類詞語以記錄新的科技發明、新鮮事物、新鮮的社會現象為主,并不與人民生活息息相關。間歇型新詞語的分布:多分布在低頻和超低頻詞語中,如“懶購”“華漂”“違法門”“童心節”“非銀時代”“公廁戶口”“隱性家教”“3Q寶寶”“天堂郵局”“良知消費”“心靈超市”“人肉多米諾”“中華學位服”“阿爾法女孩”“積木型住宅”;中頻詞語中只有極個別的情況,如“光能手機”“零利肉”。這些詞語都處在“半退隱”的狀態。
8.孤點型。
孤點型,從廣義上說也屬于衰減型。它與衰減型不同的是,衰減型的新詞語在產生之后還有一個發展期,而孤點型是剛剛“出生”一年便夭折,屬于最不被大眾認可的一類了。由于這類詞語太過特殊,數量也不少(2007年新詞語中有12%屬于孤點型),因此我們將其單列一類。
孤點型新詞語的“詞齡”[6]為1年,即在產生的當年被使用幾次之后,就再也無人問津。這類新詞語的生命力極低,存活1年甚至短短幾個月的時間即告退隱。

(1)

(2)

(3) 圖9 孤點型新詞語示例 (1)鼠條(2)機器人鳥(3)道德恐高癥
“鼠條”,“鼠年賀歲金條”的簡稱。詞齡只有1年的原因是:第一,該簡稱與“薯條”同音,會出現表達不明的問題,造成交際障礙;第二,該詞語只能運用于鼠年賀歲之時,可用期限太短;第三,金條屬于奢侈品,并不是普通民眾日常生活不可或缺的東西。“機器人鳥”由于是專業性詞匯,使用人群受限,使用范圍狹小,缺乏普遍常用性。“道德恐高癥”由于不是我國社會主流文化所推崇的現象,生命力自然很低。與“道德模范”“孝老愛親”等宣傳真善美、傳遞高尚品質的新詞語相比,“道德恐高癥”顯然處于劣勢,退隱是必然的。
9.波動型。
波動型,也叫起伏型。這里指的“波動”并非波動增長或波動下降,它并沒有明顯的或增或減或隱的走勢,而是忽高忽低,忽升忽降,難以捉摸,發展極不穩定,沒有規律可循。波動型詞語的頻次往往會隨著社會的變化和媒體的關注程度而發展變化。這類詞語不太多,約占3.9%。

(1)

(2) 圖10 波動型新詞語示例 (1)近月點(2)時空郵箱
三結語
通過對2007年新詞語進行詞頻和發展曲線的動態監測,我們發現,2007年新詞語的使用度并不樂觀,絕大多數都處于低頻和超低頻的區間內。根據2007年新詞語的特點,將發展曲線歸為九大類,即增長型、衰減型、孤峰型、雙峰型、周期型、凸起型、波動型、間歇型、孤點型。當然,新詞語紛繁復雜,其發展曲線也不止這九類,需要我們繼續跟蹤監測。增長型和周期型詞語未來的復現率都為100%;衰減型、孤峰型、凸起型詞語的頻次逐漸降低,處在“即將退隱”的狀態;間歇型詞語屬于“半退隱”;孤點型詞語已經退隱。
對于新詞語,我們不僅要研究其靜態的共時狀況,還要用發展的眼光關注其后續的動態變化情況。新詞語產生之后,受不受歡迎,有沒有被大眾認可,哪些被保留了,哪些被淘汰了,原因是什么,這些問題都需要不斷地進行動態監測。本文只能作為對該問題的初探,期望有更多學者投入到新詞語的動態研究中來。
參考文獻
[1]侯敏,周薦.2007漢語新詞語[M].北京:商務印書館,2008.
[2]侯敏,周薦.2008漢語新詞語[M].北京:商務印書館,2009.
[3]蘇新春.詞匯計量及實現[M].北京:商務印書館,2010:291-292.
[4]教育部語言文字信息管理司.中國語言生活狀況報告(2012)[M].北京:商務印書館,2012.
[5]劉長征.基于動態流通語料庫的新詞語監測研究[M].北京:世界圖書出版公司,2011:117.
[6]于根元.詞語的時空分布[J].世界漢語教學,1997(4):21-24.
Dynamic Monitoring of Neologisms Appeared in 2007
Han Li
(School of Literature, Beijing Normal University, Beijing 100875, China)
Key words:neologisms; frequency; progress curve; latent; dynamic monitoring
Class No.:H136Document Mark:A
(責任編輯:蔡雪嵐)