摘要:提出一種中文合成詞識別及分詞修正方法。該方法先采用詞性探測從文本中提取詞串,進而由提取到的詞串生成詞共現有向圖,借鑒Bellman—Ford算法思想,設計了運行在詞共現有向圖中識別合成詞的算法,即搜索多源點長度最長、權重值滿足給定條件的路徑,則該路徑所對應的詞串為合成詞。最后,采用核心屬性滲透理論對合成詞標注詞性,同時修正分詞結果。實驗結果表明,合成詞識別正確率達到了91.60%,且分詞修正效果良好。
計算機應用研究2011年8期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現代工業經濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業管理與科技》2024年6期
9《現代食品》2024年4期
10《衛生職業教育》2024年10期
關于參考網