摘要:構建了關于Web表格特征信息知識的領域本體,提出并設計了一種用于Web文本分類的二次分類模型。該模型使用支持向量機方法對測試樣本進行第一次分類;由于設定了較高的分類閾值,一次分類后部分測試樣本未確定所屬類別,對于這些測試樣本,抽取樣本中的Web表格特征信息,與基于領域本體的分類模板進行相似度匹配,進行第二次分類。最后通過實驗驗證了該方法的可行性。
關鍵詞:Web文本分類;特征信息;領域本體;相似度匹配
計算機時代2008年12期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現代工業經濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業管理與科技》2024年6期
9《現代食品》2024年4期
10《衛生職業教育》2024年10期
關于參考網