摘要:數據流的無限性、高速性使得經典的頻繁模式挖掘方法難以適用到數據流中。針對數據流的特點,對數據流中頻繁模式挖掘問題進行了研究,提出了數據流頻繁模式挖掘算法FP-segCount。該算法將數據流分段-并利用改進的FP grow*h算法挖掘分段中的頻繁項集,然后利用Count-Min sketch進行項集計數。算法解決了壓縮統計和計算快速高效的問題。通過實驗分析,FP—segcount算法是有效的。
關鍵詞:數據流;數據挖掘;數據流挖掘;頻繁模式
中圖分類號:TP3ll
文獻標志碼:A
文章編號:1001—3695(2009)11—4054-03