鄒曉玲
(湖南科技大學 外國語學院,湖南 湘潭 411201)
新時期《人民日報》新聞標題用字調查研究
鄒曉玲
(湖南科技大學 外國語學院,湖南 湘潭 411201)
新時期《人民日報》新聞標題在不同區間段用字存在較大共性,這在總字種數、高頻字、共用字、常用字等方面有突出表現。各區間段前10個高頻字、部分共用字、獨用字以及超綱字的字義特征體現了新時期《人民日報》新聞報道較強的時政色彩,以及新聞標題制作對人物、地點要素的重視。此外,標題字頻與其它6種字頻統計成果的比較顯示,漢字字頻受語料性質的影響。立足于新聞標題的字頻統計結果不僅有別于綜合性語料的字頻,而且有別于新聞語篇的字頻統計結果。
新時期;《人民日報》;新聞標題;漢字;使用
現代漢字統計歷史悠久。自1928年陳鶴琴先生編寫《語體文應用字匯》以來,學界對現代漢語常用字、通用字分別進行了定量研究,相繼產生了系列成果。如:《印刷通用漢字字形表》(1965)、《漢字頻度表》(1976)、《信息交換用漢字編碼字符集·基本集》(1981)、《社會科學、自然科學綜合漢字頻度表》(1985)、《1986年度新聞信息流通頻度(6001字)》(1987)、《現代漢語常用字表》(1988)、《現代漢語通用字表》(1988)等[1]。其中,《1986年度新聞信息流通頻度(6001字)》全部取材于新聞語料。郭冶方先生曾對其給予較高評價,認為“新聞信息中漢字流通頻度統計,有助于我們摸清漢字在新聞信息中的流通規律,有助于漢字規范化的工作,對新聞出版、編碼設計、教學、語言文字的研究、信息產業的建立等都有重大意義。”[2]
自2005年以來,教育部、國家語言文字工作委員會每年定期向社會發布年度語言生活狀況綠皮書,其中包括大眾傳媒用字用詞情況調查研究。相比于以往有關字詞統計研究來說,其規模更大、技術更先進、成果更豐碩、影響更深遠。然而,在對現代漢字的統計研究中,專門針對新聞標題漢字使用狀況的研究文獻目前尚沒有。因此,本文將以1978年以來《人民日報》新聞標題為語料,對其用字情況展開相關研究。
由于時間跨度較大、語料規模大,我們將采用構造周抽樣法①,一年構造兩個抽樣周②。為盡可能兼顧語料的同質性,在堅持新聞標題抽樣的同時,我們也考慮了語料的穩定性、不重復性等原則③。在此基礎上,累計抽樣了745349個字符的新聞標題語料,其中漢字共計706636字次(不包括標點符號、阿拉伯數字、西文字母等字符),字種數共計3977個。同時,為了解不同時間段標題用字的異同,在盡可能兼顧歷史分期、語料數量的平衡性以及《人民日報》版面沿革的情況下,我們將《人民日報》新聞標題語料分成三個區間段。其中第一區間段(1978-1989)語料容量為232149字符(占比31.15%);第二區間段(1990-2003)語料容量為251069字符(占比33.68%);第三區間段語料容量為262131字符(占比35.17%)。
文中所有字頻均由專門的字頻統計工具統計。相關統計術語遵照《中國語言生活狀況報告(2009)》(下編)。
(一)不同區間段標題用字總體概況
統計顯示,第一至三區間段總字種數依次為3267、3224、3282個,總字次分別為225051、239466、242119次。其中三區間共用字有2595個,分別占第一至三區間段字種數的79.431%、80.490%、79.068%,覆蓋了99.414%、99.362%、99.369%的區間語料。任意兩區間部分共用字分別占第一至三區間段字種數的12.152%、12.593%、12.462%,依次覆蓋了0.406%、0.507%、0.452%的區間語料。
這表明,不同區間段《人民日報》新聞標題在用字上保持了較高的一致性和穩定性。首先,各區間總字種數相差不大,都保持在3200~3300個字種以內。其次,各區間段共用字字種數多、覆蓋率高。兩種類型的共用字累計在92%左右,覆蓋了各區間段約99.762%~99.914%的語料。
(二)不同區間段高頻字比較
1.前10個高頻字比較
各區間段使用頻次最高的前10個高頻字依次為,第一區間段:“國、會、的、中、人、大、一、工、在、行”;第二區間段:“國、會、中、大、人、的、行、發、一、工”;第三區間段:“國、會、中、的、人、大、發、年、行、全”。
其中“國、會、大、人、中、行”6個高頻共用實字主要涉及國家、會議、大會、人、行動(包括某人某地之行)等,并且“國、會、人”3個高頻共用字在各區間段的頻次序位完全一致。這不是偶然,體現了不同時期《人民日報》新聞報道重點的一致性。同時,這類高頻共用字的使用初步體現了新時期《人民日報》新聞報道對時政要聞投入了較高關注度,反映了我國黨報新聞報道的現狀。
2.不同閾值下高頻字共用與獨用情況比較
不同區間段在高頻字方面共性比較大。表現在,17.355%~17.432%的高頻字種就能覆蓋80%的語料,其中有14.107%~14.361%的三區間共用字;27.300%~27.518%的高頻字種能覆蓋90%的語料,其中有22.821%~23.232%三區間共用字;63.467%~64.187%的高頻字種能覆蓋99%的語料,其中有53.473%~54.435%的三區間共用字。這說明新時期《人民日報》不同區間段新聞標題高頻字使用效率比較高,并且用字情況比較穩定,共性比較大。
當覆蓋率增加時,獨用字數量明顯上升。這說明隨著漢字在語料中覆蓋率的遞增,標題用字共性減少,差異增大。這主要是受低頻字的影響。相對來說,高頻字部分比較穩定。
相同覆蓋率下,較之另外兩個區間段,第二區間段兩種類型的共用字比例均最高,獨用字比例均最低。這說明《人民日報》新聞標題在20世紀90年代至本世紀初期,標題用字共性最高,與之前的80年代和最近十來年標題用字的關聯度最大,穩定性最強。
(三)不同區間段共用字比較
1.任意兩個區間段部分共用字比較
部分共用字數量不多,三個區間段累積606個,只覆蓋了0.406~0.507%的語料。其中第二、三區間段共用的漢字最多(209個),第一、三區間段次之(200個),第一、二區間段最少(197個)。
各區間段使用頻次相對最高的前5個字依次為:“耿、飚、粗、灤、倪”;“镕、嵐、琛、尉、璇”;“篪、岐、弘、炬、璇”。結合區間語料可知,14個相對高頻部分共用字④中有9個字涉及國家前領導人名字,“璇”為運動員姓名用字,“炬”也與我國近幾年體育賽事中的“火炬”有密切關系。這說明《人民日報》新聞標題用字具有較強的時代特征以及對國家領導人活動的較高關注度。同時,部分共用字中人名用字的相對高頻出現,體現了新聞標題制作對人名的較高關注。
2.三區間共用字比較
在各區間段語料中,三區間共用字有2595個字種,占各區間字種數的80%左右,分別覆蓋了99.40%左右的區間語料。這些數據也表明,《人民日報》新聞標題在不同時期用字比較穩定,各區間段用字共性比較大,且共用字使用頻率高。另外,從2595個三區間共用字在各區間段平均頻次來看,第三區間段最高(92.713%),第二區間段居中(91.691%),第一區間段最低(86.217%)。
(四)不同區間段獨用字分析
《人民日報》新聞標題中不同區間段獨用字累積776個,分別占各區間段字種數的8.418%、6.917%和8.470%,累積覆蓋了各區間段不足0.2%的語料。其中各區間段使用頻次位列前十的獨用字為,第一區間段:“篡、僚、紉、丕、赳、棧、鶉、剖、掖、彗”;第二區間段:“珮、嶄、喉、抒、岱、貶、坻、柕、颯、紜”;第三區間段:“咋、擎、曬、雋、靚、凸、娥、蓬、琨、嫦”。
參照各區間段語料發現,各區間段前10個獨用字有著鮮明時代特點,部分獨用字的使用有一定的偶然性。各區間段均有國家前領導人姓名用字,如“丕”(第一區間段)、“珮、杼”(第二區間段)、“雋、琨、蓬”(第三區間段)。第一、二區間段均有地名用字,如“掖、岱、坻”。另外還有其它專名用字,如“鶉”(鵪鶉)、“彗”(哈雷彗星),星體名稱用字“娥”、“嫦”(嫦娥一號/二號人造衛星)。此外,還有反映改革開放初期社會生產生活原貌的“紉”(縫紉機)、“棧”(貿易貨棧)等。這些獨用字再次體現了新時期《人民日報》新聞報道較強的時政色彩及標題制作對人名、地名的較高關注度。
不過,與前兩個區間段明顯不同的是,第三區間段前10個獨用字中出現了方言字、網絡熱字⑤,如“咋、靚”為方言字;“曬”屬于舊字翻新,特指將東西拿出來與人分享,在語料中有“曬賬本、曬三公、曬家底”等搭配。方言字、網絡熱字在標題中的出現,反映了近年來《人民日報》用字用語的變遷。盡管其使用頻次不多,但對我國傳媒語言,特別是黨報語言的發展和走向具有重要影響。囿于篇幅,這方面內容我們將另撰文探討。
(五)不同區間段常用字分布情況
將不同區間段漢字與《現代漢語常用字表》比較后可知,《人民日報》各區間段在漢字的使用上都堅持常用性為主。各區間段均有86%以上的字種屬于常用字,累積覆蓋了各區間段99.302%~99.441%的語料,其中70%屬于一級常用字,累積覆蓋了各區間97.291%~97.629%的語料。其余不足14%的超綱字⑥僅覆蓋了不足0.7%的區間語料。
相比而言,第一區間段常用字字種數相對最多(86.808%),常用字語料覆蓋率也最高(99.441%);第三區間段其次(86.319%、99.413%);第二區間段常用字字種數最少、語料覆蓋率最低(86.012%、99.302%)。
不同區間段《人民日報》新聞標題中常用字和超綱字的分布特征體現了“文字使用的有限性和層級性”[3],即在具體語料中漢字的使用量是有限的,這些有限的漢字又按照常用程度分成了一級常用字、次常用字、超綱字等不同層次。
陳原先生曾認為,“常用字2500應在小學畢業時掌握,次常用字1000應在初中畢業時掌握”[4]。不同區間段《人民日報》新聞標題中常用字字種多、頻次高、覆蓋率高這一用字特征也說明,作為中共中央機關報,《人民日報》并沒有將自己的讀者群簡單定位于機關企事業單位領導及職員,而是關注到不同文化層次下更廣泛的讀者群和新聞受眾。在當前傳播主體多元化以及網絡文化、異文化不斷滲透的新形勢下,《人民日報》新聞標題這一用字特征對抵制大眾傳媒中亂用生僻字、簡化字、繁體字、外來字、網絡符號等不良現象具有積極的示范和引導作用。
(一)超綱字的使用規律
將《人民日報》標題語料3977個漢字與《現代漢語常用字表》比較后得知:3977個漢字中,有817個(占20.543%)超綱字,累積覆蓋了0.616%的標題語料。雖然其整體使用頻次偏低,但具有鮮明特征。下面我們以使用頻次最高的前50個超綱字為例。
前50個超綱字依次為:圳、镕、埔、嵐、迪、琛、肇、喀、鄒、耶、韋、璇、磋、暨、弘、茨、撾、篪、姬、圭、茲、斌、岐、汶、厄、俞、汕、廖、邯、蔡、崛、弗、鄂、炳、斐、鄲、襄、亟、阜、沂、鰲、檻、奎、郝、柯、邵、曝、烯、贛、昊。
周有光先生曾提出,“現代漢語用字中有‘特種用字’,包括科技新字、人地名專用字,等等。它們的特殊之處是,用途極狹,只在特定場合應用。”[5]周先生在文中提到以下幾類特種用字:科技專用字、民族和宗教專用字、人地名專用字、行業專用字、譯音和象聲專用字、方言專用字、外族漢字。根據以上特種用字的分類,我們結合標題語料對前50個超綱字考察后發現:
(1)全部為地名專用字,如:圳、埔、喀、撾、汕、鄲、阜、沂、贛。
(2)全部為人名專用字,如:镕、琛、篪、斌、俞、廖、炳、昊。
(3)人名、地名混用字,如:嵐、鄒、韋、茨、圭、岐、汶、邯、蔡、奎、郝、邵、茲。
(4)科技專用字,如:烯。
(5)人地名專用字與其它專名用字,如:弗、璇、柯、鄂。
(6)專名用字(主要為人地名專用字)為主,偶有其它普通用法,如:鰲、襄、迪、肇、耶、姬、斐、厄。
(7)普通用字為主,偶為專名用字,如:弘、暨。
(8)全部為普通用字,如:磋、崛、亟、檻、曝。
以上8小類中,只出現于人地名及其它專名用字中的超綱字35個;專名用字為主,偶有其它普通用法的超綱字8個;普通用字為主,偶有專名用法的超綱字2個;只有普通用法的超綱字5個。
前50個超綱字中絕大部分為特種用字,特別是人名地名專用字的狀況是新聞標題獨特性的鮮明體現。作為新聞事實六要素之一,“何地”、“何人”是新聞的重要構成要素。為了準確、鮮明地報道新聞事實,在有“文眼”之稱的新聞標題中適當運用表地點、人物類的專名,對提高新聞報道效果以及觀眾的閱讀效率具有積極意義。當然,相對于語料中其它漢字的分布情況而言,標題中特種漢字字種數并不多,且絕大多數特種字使用頻次也不高。
(二)高頻字的鮮明特征
陳原先生曾將7種漢字字頻統計成果⑦中前10個最高頻漢字與美國“AHI:Rank list”(1971)測定的10個英語最高頻字歸在一起,認為“如果把各次測量出來頻率最高的漢字加以比較研究,是很有意義,很有啟發的。”[4]受該觀點啟發,我們從中選擇6種字頻統計成果,輔以本研究漢字頻次統計結果,對這7種統計成果中前10個高頻漢字進行比較(表1)。

表1 7種字頻統計成果中前10個高頻漢字表
比較發現,除了本研究統計的標題語料漢字頻次表外,其余6種漢字字頻統計成果中位列第一位的高頻漢字均為功能字(詞)“的”。而在本研究《人民日報》新聞標題語料中,位列第一位的高頻漢字為“國”,“的”則位列第四⑧。我們還注意到,除《1986年度新聞信息流通頻度(6001字)》(以下簡稱為《1986年字表》)與《<人民日報>新聞標題語料漢字頻次表》(以下簡稱為《<人民日報>字表》)外,其余5種字頻表前10個高頻漢字中均出現了可單獨成代詞或動詞的“我、他、這、是、有”。
不同統計結果中高頻漢字的差異說明:首先,漢字頻次與語料性質有密切關系。以上7種漢字字頻統計成果中,《1986年字表》和本研究《<人民日報>字表》均取材于新聞語料,其余均為綜合性語料。語料性質的差異造成了漢字頻次統計結果的差異。一般而言,新聞語料的新聞性、即時性與文學語料的文學性、科技語料的專業性、政論語料的思辨性等有明顯差異,這種差異必然在漢字使用上有所表現。以上7種字頻統計結果中前10個高頻漢字的差異即是語料性質差異的反映。
其次,標題與語篇字頻統計結果同中有異。這在同樣取材于新聞語料的兩份字頻表中得以充分體現。將《<人民日報>字表》與同樣取材于新聞語料的《1986年字表》前10個高頻字進行比對不難發現,兩表有“國、的、中、一、人”5個共用字。特別是高頻字“國”在其它綜合性語料前10個高頻字中均未出現,但在《1986年字表》中頻次僅次于“的”,位列第二。此外,在其它5種漢字表中均出現的可單獨成代詞或動詞的“我、他、這、是、有”均沒有出現在兩份取材于新聞語料的前10個高頻漢字表中。這表明新聞語料的特征決定了字頻統計的某些共性。
新聞語篇與新聞標題字頻統計結果也存在差異。表現在雖然兩表前10個高頻字中有5個共用字,但兩表中的獨用字非常值得我們關注和思考。
《1986年字表》前10個高頻漢字中的獨用字為“十、在、和、了、年”;《<人民日報>字表》前10個高頻漢字中的獨用字為“會、大、行、發、工”。兩表高頻獨用字不僅在單個漢字上不同,而且在語法特征上差別明顯。其中《1986年字表》前5個高頻獨用字中有3個虛字(均可獨自成詞),分別為“在、和、了”;而《<人民日報>字表》前5個高頻獨用字均為實字。兩表高頻獨用字語法特征上的差別,體現了標題體與篇章體的差別。一般而言,標題受空間因素制約,盡可能采用表意實在的實詞,虛詞則能省則省;篇章則不然,一些在標題中簡省的成分,我們在篇章中均可找到完整的敘述。
以漢字“了”為例,該字有時態助詞、動詞、語氣詞以及構詞等作用,其中在動詞后作時態助詞用法在語篇中非常常見。對比以上字頻統計成果發現,“了”字除了沒有出現在本研究《<人民日報>字表》前10個高頻字中外,在其余6個漢字字頻統計成果(包括取材于新聞語料的《1986年字表》)中前10個高頻漢字中均出現。在我們所統計的《<人民日報>字表》中,“了”字的序位為第197位(899次)。
“了”字的序位在不同語料來源的漢字頻次統計成果中出現巨大差異,重要原因在于標題語言對時態助詞“了”的排斥。尹世超先生從音節、語法句式、語用等方面探討多數報道性標題中不用“了”的原因,他將語用因素看作根本原因,認為“只有刪除‘了’,才能使一個言語片段由句中解脫出來,實現有界向跨界、由入句到超句的過渡,獲得概括全篇的能力和資格。”[6]
標題語言對時態助詞“了”的排斥,造成了漢字“了”在本研究中的頻次序位不僅有別于以上5種綜合性語料的漢字頻次統計成果,而且有別于取材于新聞語篇的《1986年字表》。
標題是文章的眼睛,在新聞報道中有重要的意義和價值。《人民日報》新聞標題在不同區間段用字上較高的共性,體現了黨報新聞用字的穩定性。同時,標題中領導人姓名用字及地名等特種用字的相對高頻出現,反映了《人民日報》新聞報道的價值取向及標題制作特征。這些對黨報標題制作與宣傳有積極的參考價值。此外,《人民日報》新聞標題字頻與其它語料字頻統計成果的異同,顯示了語料性質對字頻統計的影響以及標題用字與篇章用字的差異,再次驗證了語言研究中語體區分的必要性。
[注 釋]
①構造周抽樣法的定義,及其相比于其它抽樣方法如簡單隨機抽樣、連續日期抽樣的優勢等,可參看任學賓《信息傳播中內容分析的三種抽樣方法》,載《圖書情報知識》1999年第3期。
②具體依據可參看Riffe D,Aust C.F.,Lacy S.R.The effectiveness of random,consecutive day and constructed week sampling in newspaper content analysis[J].Journalism Quarterly, 1993, 70(1):133-139.
③穩定性原則體現在以政治法律社會、教育科技文化體育各方面內容為主(均以《人民日報》當日所注版名為依據)。這是因為從歷時角度來看,《人民日報》以上版面穩定性較高;不重復性原則,即前6版以外,相近或相同版面只選擇靠前的一版(近年來前6版有重復版名,但考慮到其重要性,我們特殊對待,不排除)。如2010年以來國際版常有兩個版面,我們只抽取其中靠前的一版。再比如,如果同一天既有“國民經濟”版面,又有“經濟專頁”或“經濟周刊”版面,我們只抽取其中靠前的一個版面進行統計。
④“璇”在二、三區間段同。
⑤實際上這幾個字在語料中均獨立成詞使用。
⑥指超過了3500常用字外的漢字。
⑦經核對,我們對原文中部分字頻統計成果的名稱及年限有所補充與更正,具體參見表1。
⑧這在本文上一節各區間段前10個高頻字中也有較為一致的體現。
[1]傅永和.現代漢語常用字表的研制[J].語文建設,1988(2):22-25.
[2]郭冶方.新聞信息漢字流通頻度統計[A].陳原.現代漢語定量分析[M].上海:上海教育出版社,1989:96.
[3]王敏.新中國常用字問題研究概述[J].語言文字應用,2007(2):12-18.
[4]陳原.系統整理漢字的一個里程碑——談常用字表的制定[J].語文學習,1989(3):2-3.
[5]周有光.現代漢語用字的定量問題[J].辭書研究,1984(4):2-12.
[6]尹世超.標題語法[M].北京:商務印書館,2001:134.
Study on Chinese Character of thePeople’sDailyHeadlines in the New Period
ZOU Xiao-ling
(Foreign Language Department, Hunan University of Science &Technology, Xiangtan Hunan 411201, China)
Characters of thePeople’sDailynews title in different period are concentrated and stable, they have the same characteristics as follow: total species, high-frequency words, common words, frequent words.The semantic character of the former ten high-frequency words of different interval period, partial common words, seperate words and super class words reflects that: thePeople’sDailynews reports in the new period is full of distinct era characteristic and political, but also reflects the high attention to people, places elements of headlines. In addition, the comparison of the top ten high frequency characters of seven kinds of Chinese statistics results shows that the frequency of Chinese character is influenced by nature of the corpus. The frequency statistics which is based on news title is not only different from the word frequency of comprehensive corpus, but also different from the word frequency statistics of news discourse.
the new period;People’sDaily; news title; Chinese character; usage
2016-12-19
湖南省教育廳科研項目“新時期以來《人民日報》新聞標題用字用詞情況調查研究(1978-2015)——我國黨報語言變遷的一個視角”(15C0573)。
鄒曉玲(1979- ),女,講師,博士,從事傳媒語言、現代漢語詞匯學研究。
H0-05
A
2095-7602(2017)05-0065-06