"/>
999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

辭書編纂現代化趨勢下的新詞語詞典編纂——評《2007漢語新詞語》《2008漢語新詞語》

2011-04-02 02:28:13周明海
辭書研究 2011年4期

周明海

國家語委于2005年啟動的“新詞語編年本”課題目前已推出了《2006漢語新詞語》《2007漢語新詞語》《2008漢語新詞語》三本編年本漢語新詞語,今后還將繼續推出更多的系列研究成果。這三本詞典是繼于根元等編纂的四本新詞語編年本(1991-1994)之后的又一編年本新詞語系列詞典。其中《2007漢語新詞語》《2008漢語新詞語》(下文簡稱“07、08漢語新詞語”)由教育部語言文字信息管理司策劃,侯敏、周薦主編,商務印書館出版,屬于中國語言生活綠皮書B卷系列。

一、普通意義上的新詞語詞典

“07、08漢語新詞語”具有普通新詞語詞典及其他編年本新詞語詞典所具有的作用和意義:

(一)“07、08漢語新詞語”是社會變化的晴雨表,是思維認知動向的鏡子

《2008漢語新詞語》中的“范跑跑”、“郭跳跳”看似只是兩個很普通的新詞語,卻記錄了“5.12”汶川地震這一歷史災難,記錄了此次災難催生的社會現象——“范跑跑”事件、“郭跳跳”事件,是社會現象、社會變化的忠實記錄者。同時這兩個新詞語也折射了人們對社會現象的認識態度,范美忠臨震一“跑”和挑戰國民容忍度的言論,引發了一場道德倫理大討論,用“范跑跑”來“泛指那些標榜自由主義,遇到險境不顧他人、一心自保的人”明顯可以看出國人對此事的認知評價態度。

(二)“07、08漢語新詞語”的編寫不僅具有詞典學上的意義,而且還具有詞源學、歷史學、文化學、心理學等方面的意義

“07、08漢語新詞語”作為新詞語詞典,可以為人們查解困難提供幫助,具有詞典學的意義,但同其他新詞語詞典一樣,“07、08漢語新詞語”的意義絕非僅限于此。雖然“07、08漢語新詞語”收錄的很多新詞不為大眾所熟知,也有很多新詞只是曇花一現,但其卻記錄了新詞產生的背景、原因、所指等一系列內容,這些知識是后人了解我們這個時代的重要線索,具有詞源學意義。“07、08漢語新詞語”中有一些新詞語是記錄社會時事的,如“3.14”事件、“5.12”汶川大地震、“三鹿”事件等,這些事件有的不會進入正規的歷史書,但“07、08漢語新詞語”收錄了,可以作為歷史書的補充。從這個角度來看,“07、08漢語新詞語”具有歷史學的意義,是小部頭的編年史,有一定的時效性。同時,“07、08漢語新詞語”也傳承著人類文化,折射著人們的認知心理,如“山寨”反映了當下人們日趨通俗化和大眾化的審美取向,代表了基層人民的心聲,形成了一種特殊的草根文化,同時也反映了民眾“去主流化”的心理狀態,具有心理學上的意義。

二、辭書編纂現代化下的新詞語詞典

李宇明(2006)在《關于辭書現代化的思考》中指出,“辭書編纂手段現代化其現實含義就是在整個辭書編纂過程中充分使用數字技術和各種數據庫,具體說,就是開發功能強大的語料庫、知識庫和適用于辭書編纂的軟件系統”。其中特別強調了辭書編纂手段的現代化。我們認為辭書編纂現代化還應包括辭書編纂理念的現代化,即以讀者為中心,提供更多和更準確的詞目、釋義、例句和背景知識。作為新世紀具有真正意義的編年本新詞語,“07、08漢語新詞語”是辭書編纂現代化趨勢下的新成果,在編纂過程中充分體現了辭書編纂手段和辭書編纂理念的現代化,具體表現如下:

(一)巨型、動態語料庫的運用

詞典編纂語料庫是現代化辭書編纂的基礎,而編年本新詞語的編纂對此要求則更高:一方面要求有足夠大的語料庫,這樣得出的新詞語才能全面、權威;另一方面要求語料庫必須能夠得到及時更新,這樣才能實現編年,才能得到真正的“新”詞語,而國家語言監測中心的動態語料庫恰好滿足了這一要求。

“07、08漢語新詞語”正是在巨型、動態語料庫基礎上進行編纂的。《2007漢語新詞語》所用語料均來自國家語言資源監測語料庫(包括平面媒體、有聲媒體、網絡媒體),共計1 363 747個文本文件,1 236 120 162字符次,1 007 053 180字次。其中平面媒體選擇了2007年《北京青年報》《北京日報》《南方周末》等15種報紙作為調查語料,廣播電視語料包括中央電視臺、北京電視臺等媒體的282個欄目,網絡媒體語料選擇了新浪、騰訊兩個網站的全部年度新聞語料。[1]

《2008漢語新詞語》所使用的語料庫在原有語料來源的基礎上增加了《新民晚報》2008年全年語料,廣播電視語料、網絡媒體語料基本維持了2007年的風格,共計1 441 090個文本文件,1 273 286 677字符次,1 032 847 155字次,如此規模的語料庫和最及時的動態更新是傳統新詞語詞典和其他新詞語詞典難以做到的。[2]

(二)計算機自動提取新詞語技術的應用

王鐵琨在《2006漢語新詞語》序言中指出“抽選年度漢語新詞語詞條,最理想的方式是利用現代信息技術手段,在已經建立的國家語言資源動態流通語料庫中自動提取。但囿于目前研究和技術手段的某些局限,計算機自動提取漢語新詞語的研究尚未取得明顯的進展和實質性的突破。”而“07、08漢語新詞語”在這方面有了長足的進步。

“07、08漢語新詞語”的調查采用的是“機器+人工”的方法,07年的編纂程序大致如下:語料全切分(保留2-9字的符號串)※計算符號串的歸一化使用率※重復上兩步的方法生成2004、2005、2006各年度數據表(即參照底表,也稱為背景詞表)※計算年使用率差并進行比較※按條件對符號串進行過濾※回查過濾掉的符號串※使用網絡自動搜集的方法從網絡(新聞)提取候選新詞語※形成新詞語候選集※人工排除非詞條目和專有名詞※利用百度、谷歌等搜索工具確認最初出現的時間等※放到新浪網上,面向社會廣泛征求意見※專家審定,剔除偶發的、不易確定時間的以及品位低下的詞語※與周薦教授及其團隊所做的新詞語合并起來,去除重復者,又經過若干調整※《2007漢語新詞語》。

《2008漢語新詞語》在上述技術路線的基礎上,又增加了特征對比法。當一個詞語或一個意義剛剛產生的時候,人們使用它時往往會有一些形式上的特征,如用引號或括號標記出來,在提取2008年新詞語時,他們充分利用這一點,彌補了“全切分對比法”過濾掉一些低頻新詞的不足。

與《2006漢語新詞語》及其他新詞語詞典主要由人工進行編纂的方法相比,“07、08漢語新詞語”編纂考察的語料更多、得出的候選集也更大,再輔以人工排查,質量高、權威性強。

(三)“07、08漢語新詞語”收詞更加全面,釋義更加準確,例句更為豐富,提供的知識更為廣闊

“07、08漢語新詞語”真實地記錄這一年內出現的新詞、新語和舊有詞的新義與新用法,分別給予注音,給出詞類、釋義和用例,具有一般新詞語詞典的特點。但由于其編寫是在“寬容、全面、前瞻”的原則指引下,建立在巨型、動態語料庫的基礎上,并輔以先進的計算機編纂技術,因而其收詞更全面,尤其是“相關詞語”這一模塊,它鏈接了相關詞語,擴大了所收詞語的規模,也為詞群、詞族研究提供了素材。(侯敏2010)在巨型、動態語料庫的基礎上考察新詞語,也使“07、08漢語新詞語”釋義更準確,選用的例句也更為豐富、恰當。除此之外,“07、08漢語新詞語”給出了“知識窗”,該模塊進一步補充解釋新詞語,給人們提供了更多的背景知識,為后人考察我們這個時代留下了“痕跡”。

此外,《2008漢語新詞語》附錄中給出了新詞語的頻次、文本數,這是其編纂體例上的又一大閃光點。人們利用這些信息可以更加深入地了解新詞語的使用情況,還可以做進一步的跟蹤研究。

(四)編纂者態度嚴謹,充分發揮群眾的力量

《2008漢語新詞語》附錄中補收了2007年產生的新詞、新語和舊有詞語的新義與新用法72條,一方面這是運用新技術、新方法的成果,另一方面也說明項目工作者本著為讀者服務的態度不回避先前存在的問題,將以前沒發現的新詞、新語、新義或新用法補上,這是學界值得提倡的精神。

專家、網友互動也是“07、08漢語新詞語”的一個創新。“07、08漢語新詞語”項目組將收集到的新詞語先放在新浪等網站上讓網民進行評議,經過評議后,再把大家認可的、品位較高的詞語收錄到“07、08漢語新詞語”里。這不僅讓廣大網民發揮了話語權,也使得最終的結果充分體現網民的意愿,所得結果也更容易為廣大群眾接受。

三、有待提高之處

“07、08漢語新詞語”在編纂手段、編纂理念等方面都有了長足的進步,但也存在需要進一步提高的地方。

(一)如何提高提取速度

“全切分對比法”雖然保證了新詞語全部都在切出的符號串中,但這是以犧牲時間為代價的。我們選取2010年《每日新聞》1萬字的語料進行全切分實驗,共切出約5.4萬個符號串,據此估算,《2007漢語新詞語》所用的10億多字的語料會切分出約54億個符號串,這樣,無論是在全切分階段還是在歸一化使用率和年使用率差計算階段都必然要耗費大量的時間。如何使基數變小或是在全切分后先去掉一部分必然不是新詞的符號串是提高提取速度亟待解決的問題。

(二)如何提高自動化程度

由于基數大的緣故,經過年使用率差計算和對垃圾串過濾后得到的新詞語候選集還有近5萬條,從中篩選出不到500條的新詞語,工作量之大可想而知,這就需要項目組進一步提高自動化程度。目前項目組新詞語提取走的是概率統計的路線,如何在后期加入規則進行機器篩選是提高自動化程度應關注的又一方面。

(三)如何提取舊詞新義詞語

“07、08漢語新詞語”所走的技術路線能提取到的依然是新詞形,對于新詞義的自動提取還需要進一步的深入研究(侯敏2010)。通過分析發現,《2008漢語新詞語》所用的“特征對比法”從理論上來說是可以提取舊詞新義詞語的。2008年共收19個舊詞新義詞語,有15個在例句中帶有引號,占總數的78.95%,剩余的4個也都能從網上檢索到帶引號的例子。這說明舊詞新義詞語開始出現的時候一般是帶有引號等特征的,而原義一般是沒有特征標記的,這樣,將前景詞表中帶特征的符號串和底表中不帶特征的符號串進行比較,共有的部分就是舊詞新義詞語的候選集。

(四)如何更全面地保留新詞語

有學者認為,漢語每年產生的新詞有一千個左右;我們對亢世勇的《新詞語大詞典》進行統計發現平均每年大約有八百條新詞語產生。“07、08漢語新詞語”受原則、標準、篇幅等方面的規約,每年收詞400多條,約為統計平均值的一半。筆者認為,對于使用率低、格調有爭議的詞,可以為其專辟版塊,這樣一方面可以更加如實地記錄新詞語,另一方面也為后續研究留下鮮活的資料。畢竟,新詞語是記載、傳承歷史文化的一條重要途徑,是國家重要的語言資源,完整地加以保留不失為一個明智的嘗試。

四、結 語

李宇明(2009)在教育部、魯東大學共建漢語辭書研究中心揭牌儀式上的講話中指出“語料庫、知識庫和一套軟件系統,可以稱之為辭書編纂的`三大法寶'”。侯敏、周薦先生很大程度上擁有了這“三大法寶”,我們期待著更多的編年本漢語新詞語詞典的出版,從而學習到最新的編纂理念,借鑒到最成功的技術手段,吸收到最豐富的編纂經驗。

附 注

[1] 參見:王鐵琨主編.中國語言生活狀況報告2007.北京:商務印書館,2008.

[2] 參見:侯敏,周薦.2008漢語新詞語.北京:商務印書館,2009.

1.侯敏.關于新詞語編年本編纂的思考.辭書研究,2010(2).

2.侯敏,周薦.2007漢語新詞語.北京:商務印書館,2008.

3.樂嘉民,亢世勇.辭書編纂現代化研究.上海:上海辭書出版社,2009.

4.李宇明.關于辭書現代化的思考.語文研究,2006(3).

5.周薦,侯敏.2006漢語新詞語.北京:商務印書館,2007.

主站蜘蛛池模板: 精品国产美女福到在线不卡f| 亚洲久悠悠色悠在线播放| 伊人激情综合| 亚洲人成影视在线观看| 99在线视频精品| 91福利免费| 色婷婷视频在线| 国产成人高清精品免费5388| 国产精品亚欧美一区二区三区 | 特级毛片免费视频| 精品无码国产自产野外拍在线| 国产96在线 | 中文字幕人成人乱码亚洲电影| 国产成人免费| 日韩毛片在线视频| 国产自在自线午夜精品视频| 午夜免费小视频| 亚洲视频无码| 激情影院内射美女| 91色在线视频| 天天综合天天综合| 国产欧美日韩在线一区| 欧美 亚洲 日韩 国产| 国内精品久久久久鸭| 一区二区三区高清视频国产女人| 国产女人在线视频| 国产欧美日韩另类| 亚洲欧美自拍视频| 亚洲无码高清视频在线观看| 亚洲人成网18禁| 亚洲无卡视频| 欧美精品在线看| 国产亚洲精品97在线观看| 亚洲成人网在线观看| 欧美午夜一区| 亚洲视频在线青青| 亚洲色大成网站www国产| 国产精品成人啪精品视频| 97se亚洲综合在线| 狠狠色丁婷婷综合久久| 男女男精品视频| 国产午夜人做人免费视频| 丝袜无码一区二区三区| 色综合婷婷| 国产精品hd在线播放| 一本一本大道香蕉久在线播放| 综合天天色| 日日拍夜夜嗷嗷叫国产| 日韩黄色大片免费看| 精品亚洲国产成人AV| 国产新AV天堂| 日韩一区二区三免费高清| 97在线国产视频| 欧美精品aⅴ在线视频| 久草视频中文| 亚洲人成高清| 亚洲成人在线免费| 黄色网页在线播放| 中文字幕乱码二三区免费| 激情影院内射美女| 不卡午夜视频| 99国产精品免费观看视频| 日韩欧美中文在线| 女人天堂av免费| 成人福利在线观看| 欧美成一级| av在线人妻熟妇| 亚洲天堂网2014| 最新国产网站| 日本在线免费网站| 欧美狠狠干| a级毛片免费网站| 国产午夜小视频| 亚洲欧美成人在线视频| 国产偷国产偷在线高清| 亚洲综合专区| 亚洲国产成人无码AV在线影院L| 国产欧美日韩91| 午夜日b视频| 国模极品一区二区三区| 亚洲天堂视频网站| 538国产视频|