摘要:利用知網(wǎng)的義原層次樹,考慮樹的深度、密度等因素對義原節(jié)點權重的影響,得到義原相似度。通過分析義項的描述語言結構,將關系義原和關系符號描述結構進行加權合并,綜合考慮主要特征、次要特征、關系特征計算義項相似度,減少補充義原作為次要特征中的基本義原所帶來的誤差,在此基礎上提出一種改進的詞匯相似度計算方法。實驗證明,該方法呈現(xiàn)向兩端擴散的現(xiàn)象,能夠更精確地區(qū)分詞匯間的細微語義差別,計算結果更趨于合理。
關鍵詞:知網(wǎng);描述語言結構;詞匯相似度;補充義原
中圖分類號:TP301.6 文獻標志碼:A 文章編號:1001-3695(2010)09-3329-05