摘要:中文分詞是計算機中文信息處理中的難題,而中文分詞算法是其中的核心,但由于中英文環(huán)境中語素的不同特點,使得中文必須要解決分詞的問題。這篇文章較為深刻的闡述了中分分詞的算法,基于對分詞算法的理解和對匹配法分詞的分析,對最大匹配分詞方法進行了較深入的研究探討,提出了什么算法是解決分詞效率的最佳方法以及各種方法的比較優(yōu)劣等問題。及可能產(chǎn)生的歧義,對不同的算法給予了充分的解釋,通過對各種算法的比較,總結(jié)出了比較常用和效率較高的算法。
關(guān)鍵詞:中文分詞;最大匹配算法;最大概率算法;算法;系統(tǒng)
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2009)01-0192-02