于北瑜
【摘要】XML文檔,作為新數(shù)據(jù)形式,將文本內(nèi)容信息和結(jié)構(gòu)信息綜合起來(lái),是目前進(jìn)行研究的一個(gè)熱點(diǎn)。支持向量機(jī)方法為了對(duì)分類器具體的構(gòu)造問題進(jìn)行解決,利用核函數(shù)做了空間映射,同時(shí)將分類的最優(yōu)超平面構(gòu)造出來(lái),這一方法對(duì)于文本自動(dòng)分類有著明顯的優(yōu)點(diǎn)。本文首先介紹了向量模型,其次,對(duì)基于支持向量機(jī)的XML文檔自動(dòng)分類進(jìn)行闡述。
【關(guān)鍵詞】核方法;XML文檔;自動(dòng)分類
XML文檔,有可擴(kuò)展性以及結(jié)構(gòu)化和跨平臺(tái)性的特點(diǎn),它和其他文本分析不同的是將結(jié)構(gòu)信息和文本內(nèi)容綜合起來(lái)。本文在支持向量機(jī)的基礎(chǔ)上,對(duì)此文