, ,
(福建工程學院 管理學院, 福建 福州 350118)
關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中主要的技術(shù)之一,其所挖掘的頻繁項集主要是以1994年的Agrawal等人所提出的Apriori算法最具代表性[1]。然而Apriori算法在執(zhí)行時會產(chǎn)生龐大數(shù)量的候選項目集合以及多次重復掃描數(shù)據(jù)庫等缺點,進而造成算法效能不佳。因此許多學者都提出了許多改進的方式,其目的主要是減少數(shù)據(jù)庫的掃描與增加執(zhí)行上的效率。例如DHP算法可減少候選項目集,來生成關(guān)聯(lián)規(guī)則[2];DIC算法可同時掃描多個階段,并降低掃描數(shù)據(jù)庫的次數(shù),提高整體效率[3];FP-Growth算法是利用FP-tree的樹狀結(jié)構(gòu)來將事務數(shù)據(jù)壓縮在內(nèi),且在整個挖掘的過程中,只須掃描數(shù)據(jù)庫兩次。在過程中不須產(chǎn)生候選項目集,除了大幅的加快挖掘的速度外,還可節(jié)省大量的儲存空間,因而整體的效率相當不錯[4]。
其次,對于一個決策問題而言,需要考慮到使用者的認知與主觀判斷所產(chǎn)生的認知不確定性。Zadeh所提出的模糊理論可用來處理包含含糊性與意義不明確的認知不確定性[5]。再加上語意變數(shù)與語意值[6-8]所描述的模糊概念較符合決策者在主觀上的認知,有助于決策分析的進行,因此近來的模糊數(shù)據(jù)挖掘則成為一項重要議題。
一般在對交易項目描述時,除了可用實體名稱來表示外,交易項目之間還能透過抽象化的階層方式來進行分類。也就是說,從較高階層上來尋找項目間的關(guān)聯(lián)性是個重要的研究。Han與Fu提出類似圖1關(guān)于“食品”的樹狀結(jié)構(gòu)的概念階層結(jié)構(gòu)圖[9],該結(jié)構(gòu)模型有4個遞階層次,階層編號由最上層開始編為層次0,直到產(chǎn)品最底層為層次3,而階層越高名稱越是廣泛化(General)。……