999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機(jī)的分布數(shù)據(jù)挖掘模型DSVM

2012-04-12 00:00:00孔令信

摘要:本文主要對(duì)基于支持向量機(jī)的分布數(shù)據(jù)挖掘模型DSVM進(jìn)行有關(guān)的介紹和探討,由于在對(duì)環(huán)境進(jìn)行挖掘的過(guò)程中,對(duì)其分布的數(shù)據(jù)有一定的要求,因而提出了DSVM模型,一方面介紹了特征多叉樹(shù)的有關(guān)概念,一方面又對(duì)通過(guò)移動(dòng)Agent來(lái)對(duì)分布數(shù)據(jù)進(jìn)行訪問(wèn)從而建立特征多叉樹(shù)的方式方法進(jìn)行一定的論述。闡述了利用特征多叉樹(shù)的相關(guān)概念和方法來(lái)對(duì)分布環(huán)境的有關(guān)數(shù)據(jù)集的特征或者屬性進(jìn)行有效反映的思想,又由于該數(shù)據(jù)的結(jié)構(gòu)以及對(duì)向量機(jī)支持的特色,使得在分布環(huán)境下的全局?jǐn)?shù)據(jù)挖掘都變得容易,通過(guò)研究和實(shí)驗(yàn),得出了這個(gè)模型可以有效地解決了其他算法中出現(xiàn)的執(zhí)行率差、存儲(chǔ)的開(kāi)銷(xiāo)大、安全和隱私較低的缺陷。

關(guān)鍵詞:特征多叉樹(shù) 分布數(shù)據(jù) 向量機(jī)

隨著我國(guó)經(jīng)濟(jì)和科技水平的迅猛發(fā)展,企業(yè)的管理方式也在發(fā)生著日新月異的變化,目前很多企業(yè)數(shù)據(jù)庫(kù)的管理方式從集中式的管理逐漸演變到分布式的管理,這種分布式的管理使得數(shù)據(jù)庫(kù)可以有效地分布在各個(gè)門(mén)店,而且隨著時(shí)間的不斷推移,這些分布的數(shù)據(jù)庫(kù)也在不斷增加,因而數(shù)據(jù)就具有異構(gòu)、分布和海量等特點(diǎn),這些特點(diǎn)對(duì)于數(shù)據(jù)挖掘來(lái)說(shuō)無(wú)疑造成了巨大的考驗(yàn)。

一、當(dāng)下數(shù)據(jù)挖掘方法的概述

就目前而言,出現(xiàn)了很多的數(shù)據(jù)挖掘的算法,例如,其中具有代表性的有:決策樹(shù)、神經(jīng)網(wǎng)路等等,這些算法主要應(yīng)用于客戶(hù)的分類(lèi)和流失的預(yù)測(cè)上。但是這些挖掘算法通常的都具有兩個(gè)很明顯的缺點(diǎn):首先,就是在對(duì)待所處理的數(shù)據(jù)規(guī)模較大、維度較高或者數(shù)據(jù)中有非線性的關(guān)系存在時(shí),處理出來(lái)的效果不是很理想;其次,這些數(shù)據(jù)挖掘算法依靠的原則主要就是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小,這樣就很容易較低泛化能力,使得整體模型的結(jié)構(gòu)得不到確定。而在結(jié)構(gòu)風(fēng)險(xiǎn)最小原則下能夠有效地解決上述兩個(gè)缺點(diǎn)的算法非SVM莫屬,另外,其他的一些沒(méi)提到的方法,在對(duì)分布環(huán)境下挖掘大部分會(huì)出現(xiàn)增大網(wǎng)絡(luò)負(fù)擔(dān)、占用大量存儲(chǔ)空間以及響應(yīng)時(shí)間較長(zhǎng)等狀況。因而,根據(jù)上面提到的我們可以很明顯地看出,SVM挖掘算法的研究具有重要的現(xiàn)實(shí)和理論意義以及價(jià)值。

二、相關(guān)理論的概述

1.支持向量機(jī)簡(jiǎn)介

所謂支持向量機(jī)就是以VC理論為基礎(chǔ)的機(jī)器學(xué)習(xí)的方法。它的分類(lèi)思路就是構(gòu)建一個(gè)超平面當(dāng)做決策平面,從而使得正負(fù)模式的距離最大。它的發(fā)展是從線性可分的情況下中最優(yōu)分類(lèi)面而來(lái),這最優(yōu)分類(lèi)面需要的是區(qū)分兩類(lèi),使得中間的間隔達(dá)到最大,而距離達(dá)到最優(yōu)的情況下就是所謂的支持向量。

2.增量學(xué)習(xí)的算法和分布數(shù)據(jù)挖掘介紹

所謂的增量學(xué)習(xí)就是將新增訓(xùn)練樣本視為增量,從而在原先的樣本集上進(jìn)行訓(xùn)練,得到分類(lèi)器之后再進(jìn)行新的訓(xùn)練,從而使得這種分類(lèi)器可以有效地對(duì)原先的樣本和新增的樣本集都進(jìn)行分類(lèi)。與傳統(tǒng)的分類(lèi)方法比較而言,這種增量學(xué)習(xí)的算法可以有效地利用先前的經(jīng)驗(yàn)結(jié)果,減少后繼的訓(xùn)練時(shí)間和存儲(chǔ)空間、而且無(wú)須對(duì)歷史數(shù)據(jù)進(jìn)行保留。而分布數(shù)據(jù)挖掘,由于目前很多的企業(yè)應(yīng)用分布式的數(shù)據(jù)庫(kù)進(jìn)行企業(yè)的管理,因而Agent技術(shù)應(yīng)用就較為廣泛,它可以有效的為企業(yè)提供客戶(hù)流失情況、客戶(hù)的分類(lèi)情況以及在價(jià)格進(jìn)行決策時(shí)候提供有效的幫助。

三、基于支持向量機(jī)的分布數(shù)據(jù)挖掘模型

這種模型的主要思路就是:首先利用分站點(diǎn)的數(shù)據(jù)采集,然后利用采集到的結(jié)果進(jìn)行局部的挖掘,然后利用特征多叉樹(shù)(特征多叉樹(shù)是一棵帶有頭表的多叉樹(shù),樹(shù)中除了葉子節(jié)點(diǎn)外每一層的節(jié)點(diǎn)對(duì)應(yīng)于數(shù)據(jù)的一個(gè)特征屬性,這些特征是影響決策內(nèi)容的相關(guān)原始屬性的線性組合)的方法來(lái)將挖掘的結(jié)果映射成局部的特征多叉樹(shù),然后通過(guò)移動(dòng)Agent將支持向鼉和殼向量信息裝載到下一個(gè)站點(diǎn),再將新增樣本(前幾個(gè)站點(diǎn)的殼向量集)與已有樣本(下一個(gè)站點(diǎn)的樣本集)合并后挖掘(HDIS),并隨著樣本集的積累(各個(gè)站點(diǎn)的移動(dòng))逐步提高學(xué)習(xí)精度;最終實(shí)現(xiàn)分布環(huán)境下支持向量機(jī)的全局挖掘。DSVM模型挖掘中的兩個(gè)核心機(jī)制:考慮到企業(yè)目前對(duì)于數(shù)據(jù)挖掘決策屬性的選擇大都采用先驗(yàn)知識(shí),隨著數(shù)據(jù)量的增大,指標(biāo)屬性有效性大大降低.因此,首先在各個(gè)分站點(diǎn)采用多元統(tǒng)計(jì)分析方法——主成分分析法(Principal component analysis,PCA)從局部數(shù)據(jù)集中提取出主成分構(gòu)建特征多叉樹(shù)(Multibranches tree of Eigen,ET),有效降低訓(xùn)練數(shù)據(jù)集維度和提高挖掘效率;圍繞ET提出一種基于殼向量的分布式支持向量機(jī)增造算法(HDIS).經(jīng)過(guò)研究表面,DSVM模型中使用HDIS的預(yù)測(cè)結(jié)果與神經(jīng)網(wǎng)絡(luò)、貝葉斯、決策樹(shù)相比除比神經(jīng)網(wǎng)絡(luò)的命中率略低外,其他指標(biāo)均具有一定的優(yōu)勢(shì).其重要原因是神經(jīng)網(wǎng)絡(luò)覆蓋率較小,可知該方法一定程度上出現(xiàn)了過(guò)擬合現(xiàn)象。

四、總論

文本主要對(duì)數(shù)據(jù)挖掘模型DSVM進(jìn)行了有效的論述,當(dāng)然所有的論述和介紹都是以企業(yè)的數(shù)據(jù)分布為依據(jù)的,當(dāng)然分布式的高性能算法的設(shè)計(jì)基礎(chǔ)是主成分分析和支持向量機(jī),而移動(dòng)的Agent訪問(wèn)的分布數(shù)據(jù)集是被用來(lái)作為構(gòu)建特征多叉樹(shù)的橋梁,從企業(yè)分布的數(shù)據(jù)庫(kù)中分析得出全局的有效信息,從而為企業(yè)做出商業(yè)決策提供高效和精確的信息。經(jīng)過(guò)理論和實(shí)驗(yàn)的探討,我們得出,這種模型的算法可以有效地解決其他算法中出現(xiàn)的弊端或者毛病,例如:存儲(chǔ)開(kāi)銷(xiāo)較大、效率低下、安全和隱私保障較低等等,因而采用了這種模型的算法之后,我們今后的研究方向主要傾向于并行運(yùn)算以及模型的動(dòng)態(tài)方面。

參考文獻(xiàn):

[1]王益萍,琚春華.基于分布式數(shù)據(jù)挖掘的連鎖商業(yè)企業(yè)經(jīng)營(yíng)決策分析[J].商業(yè)研究,2006年20期

[2]於俊,周維.一種基于殼向量的SVM快速增量學(xué)習(xí)算法[J].電子測(cè)量與儀器學(xué)報(bào),2006年6期

[3]琚春華,張捷.基于貝葉斯網(wǎng)絡(luò)的分布數(shù)據(jù)挖掘模型DDMB研究[J].情報(bào)學(xué)報(bào),2008年5期

主站蜘蛛池模板: 国产本道久久一区二区三区| 色135综合网| 亚洲国产精品成人久久综合影院 | 无码人妻热线精品视频| 日韩精品一区二区深田咏美| 亚洲成AV人手机在线观看网站| 中文字幕无码制服中字| 91国内在线观看| 亚洲男人在线| 久久精品欧美一区二区| 国产精品亚洲一区二区在线观看| 日韩第八页| 永久在线精品免费视频观看| 免费在线不卡视频| 欧美日韩福利| 精品剧情v国产在线观看| 中文无码精品a∨在线观看| 孕妇高潮太爽了在线观看免费| 麻豆国产原创视频在线播放| 高h视频在线| 国产日韩欧美视频| 中文字幕在线一区二区在线| 在线免费不卡视频| 久久国产高清视频| 色综合久久无码网| 人妻无码中文字幕第一区| 波多野结衣无码视频在线观看| 欧美专区在线观看| 欧美在线伊人| 国产 在线视频无码| 国精品91人妻无码一区二区三区| 尤物视频一区| 日韩视频免费| 国产亚洲欧美另类一区二区| 91九色最新地址| 日韩欧美一区在线观看| 国产在线小视频| 亚洲第一成年网| 在线国产资源| 试看120秒男女啪啪免费| 国产97视频在线| 欧美激情视频一区| 亚洲综合国产一区二区三区| 91久久国产成人免费观看| 日韩123欧美字幕| 久久精品最新免费国产成人| 中字无码精油按摩中出视频| 欧美日本在线一区二区三区| 亚洲午夜18| 999国内精品视频免费| 日韩欧美中文在线| 在线看AV天堂| 亚洲天堂网2014| 在线播放91| 国产成本人片免费a∨短片| 亚洲另类第一页| 亚洲Va中文字幕久久一区| 国产精鲁鲁网在线视频| 在线观看国产小视频| 一级毛片在线播放| 国产精品久久自在自线观看| 国产青榴视频| 中文字幕伦视频| 欧美成a人片在线观看| 中文字幕欧美日韩高清| 九九九精品成人免费视频7| 欧美色视频在线| 国产丝袜无码精品| 99这里只有精品6| 五月婷婷导航| 国产午夜一级毛片| 在线欧美日韩| 久久免费观看视频| 国产成人禁片在线观看| 亚洲高清中文字幕| 午夜无码一区二区三区| 午夜性刺激在线观看免费| 国产高颜值露脸在线观看| 久久久久国产精品熟女影院| 国产乱视频网站| 欧美成人影院亚洲综合图| 国产成人久视频免费|