法陳雪 胡曉峰 徐浩



摘 要:針對當前短文本的突發事件分析不能較為簡易且準確地描述事件發展過程的問題,提出一種新的基于短文本的突發事件發展過程表示方法。首先,提出一種事件狀態值,它被用于描述事件在各個時間點的狀態,以便于用戶分析事件的發展過程;其次,根據短文本的結構化信息,將事件狀態值從文本信息和用戶信息兩個方面考慮;然后,考慮文本信息的影響因子,構造相關公式計算文本信息權重;再次,考慮用戶信息的影響因子,提出一種改造的PageRank算法和用戶分層思想,構造相關公式計算用戶信息權重;最后,根據文本信息權重和用戶信息權重計算事件狀態值。實驗結果表明依次考慮用戶信息、采用改造的PageRank算法以及采用分層思想均能修正1~2個描述點,提高事件發展過程表示的準確度。
關鍵詞:事件分析;PageRank;分層;短文本;狀態值
中圖分類號:TP391 文獻標志碼:A英文標題