摘 要:提出了一種對專有名詞字串進行自動切分的方法,該方法對大量通用形式的專有名詞進行統計分析,根據專有名詞用字的出現位置和出現次數來分析,并把出現概率轉換為估價值。則根據中丈專有名詞的特點,將中文專有名詞的切分問題轉換為決策樹求最優解問題。采用動態規劃法選取最優路徑,從而確保結果的整體估價值最優。以中文姓名為例,實驗表明該方法具有很快的速度和很高的正確率,用10個名字的字符串進行測試正確率為99.66%以上。
關鍵詞:人工智能; 自然語言處理;專有名詞識別;動態規劃
中圖法分類號:TP301
文獻標識碼:A
文章編號:1001—3695(2005)07—0078—03