摘要:在大規(guī)模高維數(shù)據(jù)挖掘研究中,數(shù)據(jù)存儲(chǔ)與索引方法的有效性是決定算法時(shí)空效率的重要因素。將數(shù)據(jù)空間網(wǎng)格劃分策略與高效率的樹型索引結(jié)構(gòu)結(jié)合起來,可以充分發(fā)揮兩者在數(shù)據(jù)組織上的綜合優(yōu)勢(shì),將復(fù)雜問題轉(zhuǎn)換為結(jié)構(gòu)化的簡單重復(fù)問題。在統(tǒng)一的框架下給出了各種數(shù)據(jù)空間網(wǎng)格劃分的定義,討論了兩種適用于實(shí)現(xiàn)網(wǎng)格化數(shù)據(jù)索引的R-樹和PK-樹索引結(jié)構(gòu)。試驗(yàn)結(jié)果表明,PK-樹在數(shù)據(jù)存儲(chǔ)和索引上具有更高的效率,與網(wǎng)格化數(shù)據(jù)組織方法結(jié)合起來,對(duì)于降低大規(guī)模高維數(shù)據(jù)分析問題的時(shí)空復(fù)雜度具有重要意義。
關(guān)鍵詞:網(wǎng)格劃分; PK-樹; 索引
中圖法分類號(hào):TP391
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1001-3695(2005)12-0033-03