摘要:高效性和可擴(kuò)展性是多關(guān)系數(shù)據(jù)挖掘中最重要的問(wèn)題,而提高算法效率的主要瓶頸在于假設(shè)空間,且用戶對(duì)分類的指導(dǎo)會(huì)在很大程度上幫助系統(tǒng)完成分類任務(wù),減少系統(tǒng)獨(dú)自摸索的時(shí)間。針對(duì)以上問(wèn)題提出了改進(jìn)的多關(guān)系決策樹(shù)算法,即將虛擬連接元組傳播技術(shù)和提出的背景屬性傳遞技術(shù)應(yīng)用到多關(guān)系決策樹(shù)算法中。對(duì)改進(jìn)的多關(guān)系決策樹(shù)算法進(jìn)行了理論證明,并且對(duì)多關(guān)系決策樹(shù)算法和改進(jìn)的多關(guān)系決策樹(shù)算法進(jìn)行比較實(shí)驗(yàn)。通過(guò)實(shí)驗(yàn)可以得出,當(dāng)改進(jìn)的多關(guān)系決策樹(shù)在搜索數(shù)據(jù)項(xiàng)達(dá)到背景屬性傳遞閾值時(shí),改進(jìn)的多關(guān)系決策樹(shù)算法的效率相對(duì)很高且受屬性個(gè)數(shù)增加(或記錄數(shù)增加)影響較小。因此提出的算法優(yōu)于現(xiàn)有的同類算法,實(shí)現(xiàn)了預(yù)期的研究目標(biāo)。
關(guān)鍵詞:多關(guān)系數(shù)據(jù)挖掘;多關(guān)系決策樹(shù);元組標(biāo)志傳播;背景屬性
中圖分類號(hào):TP311;TP301.6 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(20(2009)12-4502-04