摘要:利用可變長語言模型對中文文檔的關鍵詞進行準確識別是中文信息處理中的一個重要問題。由于不存在n元語言模型的截斷效應,對關鍵詞檢索的長度沒有限制,因此增加了關鍵詞識別的難度。利用PAT-tree技術設計了一個改進的可變長統計語言模型對中文文檔中的關鍵詞進行識別。在該模型基礎上進行相關性檢測實驗。實驗結果表明基于PAT-tree的改進語言模型能更好的識別關鍵詞。
關鍵詞:PAT-tree;信息檢索;語言模型;交互信息
中圖分類號:G250.76
文獻標識碼:A
計算技術與自動化2009年2期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現代工業經濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業管理與科技》2024年6期
9《現代食品》2024年4期
10《衛生職業教育》2024年10期
關于參考網