張晨
摘 要:對語義的理解能幫助我們更好地理解某個詞語、整句話乃至整個篇章或整個對話的含義,而找出語義識別則就是幫助計算機“理解”詞語、句子和篇章含義的前提性工作。其中,詞語的語義識別是基礎。新詞語的增長早已是一個不可忽視的趨勢,中文信息處理作為應用語言學的一大觸手,面對這樣的形勢當然也要邁出自己的步伐。本文以語料的句法成分和語義角色的標注為基礎,研究滿足某句法成分和語義角色條件的詞語的義類傾向,以期能夠將研究成果用于中文信息處理中新詞語義類的推測研究,來幫助推進中文信息處理早日實現“智能化”。
關鍵詞:中文信息處理 語義角色標注 句法成分標注 義類識別
一、引言
在信息處理中,若能讓計算機對語義做出分析、判斷、預測,讓計算機能夠識別和理解人類自然語言,這將是信息處理的一項重大舉措,也是讓計算機真正實現“智能化”的重要前提。其中,詞語的語義識別是基礎,也是信息抽取、機器翻譯等應用領域的基礎問題。本文的研究重點就是詞語的語義識別。
在句法與語義對應關系的接口問題的研究上,我們認為是詞匯語義在這條鎖鏈中起著決定性作用,它決定著語義角色,進而影響到句法成分,部分研究也正是選用了從詞匯語義到語義角色、句法成分的研究方向。結合阿普列相的語言整合描寫理論,本文采取了與上述研究方向相反的逆向研究方向,以語義角色和句法成分為抓手,反推詞匯語義,以期用于中文信息處理的新詞語處理工作中。……