摘要:圖挖掘已成為數(shù)據(jù)挖掘領(lǐng)域研究的熱點,然而挖掘全部頻繁子圖很困難且得到的頻繁子圖過多,影響結(jié)果的理解和應(yīng)用。可通過挖掘最大頻繁子圖來解決挖掘結(jié)果數(shù)量巨大的問題,最大頻繁子圖挖掘得到的結(jié)果數(shù)量很少且不丟失信息,節(jié)省了空間和以后的分析工作。基于算法FSG提出了最大頻繁子圖挖掘算法FSG-MaxGraph;結(jié)合節(jié)點的度、標(biāo)記及鄰接列表來計算規(guī)范編碼,提出兩個定理來減少子圖同構(gòu)判斷的次數(shù),并應(yīng)用改進后的決策樹來計算支持度。實驗證明,新算法解決了挖掘結(jié)果太多理解困難的問題,且提高了挖掘效率。
關(guān)鍵詞:數(shù)據(jù)挖掘;規(guī)范編碼;最大頻繁子圖;決策樹;子圖同構(gòu)
中圖分類號:TP311 文獻標(biāo)志碼:A 文章編號:1001-3695(2010)09-3303-04