《中國(guó)語言生活狀況報(bào)告(2006)》(下編)進(jìn)入“收官”階段,為便于讀者閱讀和使用本書數(shù)據(jù)和圖表,有必要將成果背后無法反映的一些情況作個(gè)補(bǔ)充說明。
2006年5月22日,教育部召開第11次新聞發(fā)布會(huì),國(guó)家語委發(fā)布2005年中國(guó)語言生活狀況報(bào)告及相關(guān)數(shù)據(jù)。這是中國(guó)第一次就年度的語言使用實(shí)態(tài)發(fā)布報(bào)告,引起了社會(huì)和國(guó)內(nèi)外學(xué)術(shù)界的關(guān)注。發(fā)布會(huì)上,教育部副部長(zhǎng)、國(guó)家語委主任趙沁平在題為《關(guān)注語言國(guó)情,建設(shè)和諧的語言生活》的書面講話中明確指出:“這項(xiàng)工作我們會(huì)持續(xù)做下去,每年公布語言生活狀況報(bào)告,以引導(dǎo)社會(huì)語言生活向著健康和諧的方向發(fā)展,為國(guó)家語言文字政策的制定、調(diào)整和學(xué)術(shù)研究提供參考。”沁平同志多次對(duì)我們講:科學(xué)發(fā)展有賴于政府的科學(xué)決策。科學(xué)決策首先需要宏觀數(shù)據(jù)的支持,此外還要有國(guó)內(nèi)外深入的調(diào)查研究和比較研究,以及向資深專家進(jìn)行咨詢,這三者加起來才能正確、科學(xué)地決策。沁平同志還要求有關(guān)部門,把基于數(shù)據(jù)分析的戰(zhàn)略研究作為部門建設(shè)的重點(diǎn)和基本任務(wù)來抓。本書的數(shù)據(jù)處理和報(bào)告撰寫,就是根據(jù)沁平同志的上述指示進(jìn)行的。
去年新聞發(fā)布會(huì)后,國(guó)家語言資源監(jiān)測(cè)與研究中心立即著手搜集新聞媒體和社會(huì)反應(yīng),及時(shí)分析、總結(jié)2005年數(shù)據(jù)發(fā)布工作,并于同年8月在福建省廈門市召開有5個(gè)分中心學(xué)術(shù)負(fù)責(zé)人參加的工作會(huì)議,研討和部署2006年數(shù)據(jù)發(fā)布工作。此次會(huì)議既是2005年數(shù)據(jù)發(fā)布工作的總結(jié)會(huì),也是研討和啟動(dòng)新課題的動(dòng)員會(huì)。當(dāng)時(shí),《中國(guó)語言生活狀況報(bào)告(2005)》(下編)尚未正式出版,而新的數(shù)據(jù)發(fā)布任務(wù)項(xiàng)目就已經(jīng)緊鑼密鼓地策劃和布置了。從課題啟動(dòng)到《中國(guó)語言生活狀況報(bào)告(2006)》(下編)成書,相應(yīng)的語料庫(kù)建設(shè)、數(shù)據(jù)處理、統(tǒng)計(jì)分析和報(bào)告撰寫、修改定稿等工作,差不多進(jìn)行了將近一年。現(xiàn)在大家看到的,就是國(guó)家語言資源監(jiān)測(cè)與研究中心對(duì)中國(guó)2006年平面媒體語言、有聲媒體語言、網(wǎng)絡(luò)媒體語言和教育教材語言進(jìn)行監(jiān)測(cè)研究,所得出的最新成果。
此次調(diào)查和發(fā)布的數(shù)據(jù),除保留“報(bào)紙、廣播電視、網(wǎng)絡(luò)(新聞)用字用語調(diào)查”外,增加了“報(bào)紙、廣播電視、網(wǎng)絡(luò)(新聞)字母詞語使用狀況調(diào)查”“漢語作為第二語言教材字、詞和詞語義項(xiàng)調(diào)查”“漢語年度新詞語”等內(nèi)容。有聲媒體語言分中心今年首次參與到年度流行語研究中來,形成報(bào)紙、廣播電視流行語一起發(fā)布的態(tài)勢(shì),發(fā)表的研究報(bào)告?zhèn)戎赜谘芯糠椒ê图夹g(shù)路線的描述和探討,本年度該專題還就流行語的界定等組織了小型學(xué)術(shù)研討會(huì),從而使流行語的自動(dòng)提取和發(fā)布提高了一個(gè)層次。網(wǎng)絡(luò)語言監(jiān)測(cè)研究方面,增加了“中文網(wǎng)絡(luò)用字用語調(diào)查”和“中文博客用字用語專項(xiàng)調(diào)查”的內(nèi)容,而“中文網(wǎng)絡(luò)BBS用字用語專項(xiàng)調(diào)查”則囊括了7所高校BBS網(wǎng)站和7個(gè)社會(huì)類BBS站點(diǎn),取樣更有代表性。即使是與去年相同的調(diào)查題目(如“報(bào)紙、廣播電視、網(wǎng)絡(luò)(新聞)用字用語調(diào)查”),在方法上也沒有簡(jiǎn)單照搬,調(diào)查統(tǒng)計(jì)項(xiàng)目增添了在計(jì)算機(jī)自動(dòng)分詞的基礎(chǔ)上區(qū)分詞性等內(nèi)容,難度陡然增大,遇到許多需要探索攻關(guān)的課題;最后公布的數(shù)據(jù),也沒有簡(jiǎn)單地羅列字表、詞語表,而是增設(shè)了不少與2005年的相關(guān)數(shù)據(jù)進(jìn)行比較的項(xiàng)目,讀者從中可以清楚地看出年度用字用語的動(dòng)態(tài)變化。“報(bào)紙、廣播電視、網(wǎng)絡(luò)(新聞)字母詞語使用狀況調(diào)查”,在目前技術(shù)手段受到限制的情況下,盡可能地對(duì)夾雜在漢字中的字母形式使用情況作了較全面的調(diào)查,有關(guān)字母詞語的統(tǒng)計(jì)數(shù)據(jù),可以為了解和把握字母詞語在漢語系統(tǒng)中的分布提供參考。“漢語作為第二語言教材字、詞和詞語義項(xiàng)調(diào)查”,抽取現(xiàn)行12種不同類型、不同學(xué)習(xí)對(duì)象的對(duì)外漢語教材,細(xì)致解剖其詞語使用情況,其中的詞語義項(xiàng)、義頻統(tǒng)計(jì)分析,以往沒有人做過,不失為一次初步而有益的嘗試,可能會(huì)為對(duì)外漢語教材詞語研究摸索出一條新路子,也從一個(gè)側(cè)面顯示出計(jì)算機(jī)輔助教材詞語研究的深化。此外,為了幫助讀者形象、直觀地了解本書數(shù)據(jù),我們繪(編)了大量的圖表(計(jì)表格124個(gè),附表11個(gè),圖25個(gè),合計(jì)圖表160個(gè))。總之,與已經(jīng)發(fā)布的2005年數(shù)據(jù)相比,本年度的調(diào)研范圍、領(lǐng)域有所拓展、加深,研究方法有新的改進(jìn),技術(shù)含量明顯提高,數(shù)據(jù)所體現(xiàn)出的信度和可靠性進(jìn)一步增強(qiáng)。
調(diào)查統(tǒng)計(jì)和撰寫報(bào)告過程中,始終遵循實(shí)事求是的原則。“實(shí)事求是”體現(xiàn)在兩個(gè)方面:一是力求客觀記錄語言文字使用的實(shí)態(tài),二是吸收和改進(jìn)現(xiàn)有技術(shù)手段,在記錄語言文字使用實(shí)態(tài)的過程中努力體現(xiàn)出技術(shù)“實(shí)態(tài)”的最新進(jìn)展和較高水平。兩個(gè)“實(shí)態(tài)”缺一不可,前者是追求的目標(biāo),后者是實(shí)現(xiàn)目標(biāo)的手段和方法上的改進(jìn)。隨著科技的進(jìn)步,中文信息處理技術(shù)發(fā)展非常快,使得我們現(xiàn)在有條件運(yùn)用計(jì)算機(jī)、語料庫(kù)和數(shù)理統(tǒng)計(jì)的方法定期發(fā)布監(jiān)測(cè)數(shù)據(jù),開展語言使用實(shí)態(tài)的研究,這是非常了不起的進(jìn)步!但是,技術(shù)的發(fā)展和走向成熟需要一個(gè)過程,由于多方面原因,現(xiàn)有的信息技術(shù)手段在處理語言文字時(shí)尚有一些“瓶頸”問題(如自動(dòng)分詞和提高詞性標(biāo)注的準(zhǔn)確率等)沒有得到圓滿解決,也在一定程度上影響甚至阻礙著統(tǒng)計(jì)數(shù)據(jù)和研究報(bào)告質(zhì)量的進(jìn)一步提升。因此可以說,發(fā)布中國(guó)語言使用狀況報(bào)告和相關(guān)數(shù)據(jù),既得益于信息技術(shù)的發(fā)展,也受制于目前信息技術(shù)水平的“實(shí)態(tài)”,這是需要信息處理界和語言學(xué)界合力攻關(guān)才能逐步解決的問題。在《中國(guó)語言生活狀況報(bào)告(2006)》(下編)數(shù)據(jù)處理和報(bào)告撰寫遇到需要攻關(guān)的問題時(shí),我們時(shí)常采取請(qǐng)教信息處理專家,或者召開信息處理和語言學(xué)專家都參加的專題研討會(huì)等方式,探索某些無法回避的技術(shù)“瓶頸”問題的處理策略,力爭(zhēng)使所采用的技術(shù)“實(shí)態(tài)”能夠代表最新和較高發(fā)展水平。當(dāng)然這類問題目前解決得還不是很理想,這是需要說明的。
還有一點(diǎn)需要說明的是,利用現(xiàn)代信息技術(shù)手段對(duì)動(dòng)態(tài)、鮮活的年度語言文字使用狀況進(jìn)行數(shù)據(jù)處理和初步分析,是一項(xiàng)全新的、具有開創(chuàng)意義的工作。工作開始的頭幾年主要還是探索性的,工具、手段都不是很完善、很成熟,人們對(duì)語言現(xiàn)象的認(rèn)識(shí)(語言觀和語言規(guī)范觀)也有許多不同。這種探索往往依賴于技術(shù)上的支持,而處理語言文字的信息技術(shù)眼下還有一定局限性,兼通語言學(xué)和計(jì)算機(jī)科學(xué)的“兩棲型”研究隊(duì)伍的培養(yǎng)建設(shè),目前也還不能滿足實(shí)際研究工作的需要,等等。在這種情況下,調(diào)查統(tǒng)計(jì)本身有些缺陷,數(shù)據(jù)有一點(diǎn)兒誤差應(yīng)該是允許的,事實(shí)上也是難免的。在本編的研究撰寫中,我們遇到了局外人難以想象的困難,付出了比編寫其他著作辛苦得多的巨大努力,除召開4次專家審稿會(huì)外,本編還針對(duì)研究難點(diǎn)和數(shù)據(jù)處理中遇到的問題約請(qǐng)有關(guān)專家開了3次專題研討會(huì)、4次專題審稿會(huì),各位審訂和責(zé)編更是嚴(yán)格把關(guān)。盡管如此,數(shù)據(jù)和報(bào)告中的不足和疏漏之處依然在所難免,懇請(qǐng)讀者不吝賜教,幫助年度語言生活狀況報(bào)告的數(shù)據(jù)發(fā)布和撰寫工作逐步完善。
《中國(guó)語言生活狀況報(bào)告(2006)》(下編)是個(gè)集體項(xiàng)目。本編的研究撰寫,得到了國(guó)家語言資源監(jiān)測(cè)與研究中心所屬平面媒體語言分中心、有聲媒體語言分中心、網(wǎng)絡(luò)媒體語言分中心和教育教材語言分中心的通力協(xié)作和支持,南開大學(xué)文學(xué)院提供了2006年度新詞語的全部素材,我們從中選登了一些條目;商務(wù)印書館為本書出版提供了無私的幫助。對(duì)上述作者、出版者所做的工作,一并表示感謝!還有一些參加了相關(guān)語料庫(kù)建設(shè)的同志,作者名錄上雖然沒能留下他們的名字,但對(duì)其所做的大量基礎(chǔ)性工作也要表示感謝!文稿初稿完成后,從2007年2月起,我們先后邀請(qǐng)陳章太、戴慶廈、陸儉明、孫茂松和陳敏等專家分別審閱、修改了部分篇目;孫茂松參加了數(shù)據(jù)處理中若干技術(shù)問題的討論,提出許多有價(jià)值的意見;高永偉、張鐵文審讀了“報(bào)紙、廣播電視、網(wǎng)絡(luò)(新聞)字母詞語使用情況調(diào)查”的部分資料;晁繼周審讀了“漢語作為第二語言教材字、詞和詞語義項(xiàng)調(diào)查”的部分資料;于根元、周洪波、劉一玲、李志江等參加了年度新詞語詞條的討論;我和魏勵(lì)參加了審稿和修改加工的全過程。尤其難忘的是其中的幾次專題審稿會(huì),審稿專家和作者一起討論切磋,逐字逐句地推敲修改,不知不覺就干到了后半夜,有些同志還是帶病堅(jiān)持工作。我們認(rèn)為,發(fā)揚(yáng)這種無私奉獻(xiàn)、團(tuán)結(jié)協(xié)作的精神和廢寢忘食、精益求精的工作態(tài)度,沒有什么困難是不能克服的;年度語言生活狀況報(bào)告一定會(huì)逐步成為一個(gè)品牌,越編越好!
(王鐵琨,教育部語言文字信息管理司副司長(zhǎng)、中國(guó)文字學(xué)會(huì)副會(huì)長(zhǎng)兼秘書長(zhǎng))