摘要:利用論壇的問題解答資源作為數(shù)據(jù)源建立了網(wǎng)絡(luò)論壇問答檢索系統(tǒng),系統(tǒng)涉及到數(shù)據(jù)采集、數(shù)據(jù)處理、答案抽取、索引排序、問題映射等問題。重點(diǎn)研究了決定系統(tǒng)性能的答案抽取技術(shù)。在進(jìn)行答案抽取時(shí),使用Ranking SVM對回帖文檔進(jìn)行排序,得到問題對應(yīng)的所有回帖的一個(gè)全序排列,進(jìn)而抽取序列的前幾項(xiàng)得到最佳答案。
關(guān)鍵詞:問答檢索;答案抽??;Ranking SVM;排序