999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機(jī)的分布數(shù)據(jù)挖掘模型DSVM

2012-04-12 00:00:00孔令信

摘要:本文主要對(duì)基于支持向量機(jī)的分布數(shù)據(jù)挖掘模型DSVM進(jìn)行有關(guān)的介紹和探討,由于在對(duì)環(huán)境進(jìn)行挖掘的過(guò)程中,對(duì)其分布的數(shù)據(jù)有一定的要求,因而提出了DSVM模型,一方面介紹了特征多叉樹(shù)的有關(guān)概念,一方面又對(duì)通過(guò)移動(dòng)Agent來(lái)對(duì)分布數(shù)據(jù)進(jìn)行訪問(wèn)從而建立特征多叉樹(shù)的方式方法進(jìn)行一定的論述。闡述了利用特征多叉樹(shù)的相關(guān)概念和方法來(lái)對(duì)分布環(huán)境的有關(guān)數(shù)據(jù)集的特征或者屬性進(jìn)行有效反映的思想,又由于該數(shù)據(jù)的結(jié)構(gòu)以及對(duì)向量機(jī)支持的特色,使得在分布環(huán)境下的全局?jǐn)?shù)據(jù)挖掘都變得容易,通過(guò)研究和實(shí)驗(yàn),得出了這個(gè)模型可以有效地解決了其他算法中出現(xiàn)的執(zhí)行率差、存儲(chǔ)的開(kāi)銷(xiāo)大、安全和隱私較低的缺陷。

關(guān)鍵詞:特征多叉樹(shù) 分布數(shù)據(jù) 向量機(jī)

隨著我國(guó)經(jīng)濟(jì)和科技水平的迅猛發(fā)展,企業(yè)的管理方式也在發(fā)生著日新月異的變化,目前很多企業(yè)數(shù)據(jù)庫(kù)的管理方式從集中式的管理逐漸演變到分布式的管理,這種分布式的管理使得數(shù)據(jù)庫(kù)可以有效地分布在各個(gè)門(mén)店,而且隨著時(shí)間的不斷推移,這些分布的數(shù)據(jù)庫(kù)也在不斷增加,因而數(shù)據(jù)就具有異構(gòu)、分布和海量等特點(diǎn),這些特點(diǎn)對(duì)于數(shù)據(jù)挖掘來(lái)說(shuō)無(wú)疑造成了巨大的考驗(yàn)。

一、當(dāng)下數(shù)據(jù)挖掘方法的概述

就目前而言,出現(xiàn)了很多的數(shù)據(jù)挖掘的算法,例如,其中具有代表性的有:決策樹(shù)、神經(jīng)網(wǎng)路等等,這些算法主要應(yīng)用于客戶(hù)的分類(lèi)和流失的預(yù)測(cè)上。但是這些挖掘算法通常的都具有兩個(gè)很明顯的缺點(diǎn):首先,就是在對(duì)待所處理的數(shù)據(jù)規(guī)模較大、維度較高或者數(shù)據(jù)中有非線性的關(guān)系存在時(shí),處理出來(lái)的效果不是很理想;其次,這些數(shù)據(jù)挖掘算法依靠的原則主要就是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小,這樣就很容易較低泛化能力,使得整體模型的結(jié)構(gòu)得不到確定。而在結(jié)構(gòu)風(fēng)險(xiǎn)最小原則下能夠有效地解決上述兩個(gè)缺點(diǎn)的算法非SVM莫屬,另外,其他的一些沒(méi)提到的方法,在對(duì)分布環(huán)境下挖掘大部分會(huì)出現(xiàn)增大網(wǎng)絡(luò)負(fù)擔(dān)、占用大量存儲(chǔ)空間以及響應(yīng)時(shí)間較長(zhǎng)等狀況。因而,根據(jù)上面提到的我們可以很明顯地看出,SVM挖掘算法的研究具有重要的現(xiàn)實(shí)和理論意義以及價(jià)值。

二、相關(guān)理論的概述

1.支持向量機(jī)簡(jiǎn)介

所謂支持向量機(jī)就是以VC理論為基礎(chǔ)的機(jī)器學(xué)習(xí)的方法。它的分類(lèi)思路就是構(gòu)建一個(gè)超平面當(dāng)做決策平面,從而使得正負(fù)模式的距離最大。它的發(fā)展是從線性可分的情況下中最優(yōu)分類(lèi)面而來(lái),這最優(yōu)分類(lèi)面需要的是區(qū)分兩類(lèi),使得中間的間隔達(dá)到最大,而距離達(dá)到最優(yōu)的情況下就是所謂的支持向量。

2.增量學(xué)習(xí)的算法和分布數(shù)據(jù)挖掘介紹

所謂的增量學(xué)習(xí)就是將新增訓(xùn)練樣本視為增量,從而在原先的樣本集上進(jìn)行訓(xùn)練,得到分類(lèi)器之后再進(jìn)行新的訓(xùn)練,從而使得這種分類(lèi)器可以有效地對(duì)原先的樣本和新增的樣本集都進(jìn)行分類(lèi)。與傳統(tǒng)的分類(lèi)方法比較而言,這種增量學(xué)習(xí)的算法可以有效地利用先前的經(jīng)驗(yàn)結(jié)果,減少后繼的訓(xùn)練時(shí)間和存儲(chǔ)空間、而且無(wú)須對(duì)歷史數(shù)據(jù)進(jìn)行保留。而分布數(shù)據(jù)挖掘,由于目前很多的企業(yè)應(yīng)用分布式的數(shù)據(jù)庫(kù)進(jìn)行企業(yè)的管理,因而Agent技術(shù)應(yīng)用就較為廣泛,它可以有效的為企業(yè)提供客戶(hù)流失情況、客戶(hù)的分類(lèi)情況以及在價(jià)格進(jìn)行決策時(shí)候提供有效的幫助。

三、基于支持向量機(jī)的分布數(shù)據(jù)挖掘模型

這種模型的主要思路就是:首先利用分站點(diǎn)的數(shù)據(jù)采集,然后利用采集到的結(jié)果進(jìn)行局部的挖掘,然后利用特征多叉樹(shù)(特征多叉樹(shù)是一棵帶有頭表的多叉樹(shù),樹(shù)中除了葉子節(jié)點(diǎn)外每一層的節(jié)點(diǎn)對(duì)應(yīng)于數(shù)據(jù)的一個(gè)特征屬性,這些特征是影響決策內(nèi)容的相關(guān)原始屬性的線性組合)的方法來(lái)將挖掘的結(jié)果映射成局部的特征多叉樹(shù),然后通過(guò)移動(dòng)Agent將支持向鼉和殼向量信息裝載到下一個(gè)站點(diǎn),再將新增樣本(前幾個(gè)站點(diǎn)的殼向量集)與已有樣本(下一個(gè)站點(diǎn)的樣本集)合并后挖掘(HDIS),并隨著樣本集的積累(各個(gè)站點(diǎn)的移動(dòng))逐步提高學(xué)習(xí)精度;最終實(shí)現(xiàn)分布環(huán)境下支持向量機(jī)的全局挖掘。DSVM模型挖掘中的兩個(gè)核心機(jī)制:考慮到企業(yè)目前對(duì)于數(shù)據(jù)挖掘決策屬性的選擇大都采用先驗(yàn)知識(shí),隨著數(shù)據(jù)量的增大,指標(biāo)屬性有效性大大降低.因此,首先在各個(gè)分站點(diǎn)采用多元統(tǒng)計(jì)分析方法——主成分分析法(Principal component analysis,PCA)從局部數(shù)據(jù)集中提取出主成分構(gòu)建特征多叉樹(shù)(Multibranches tree of Eigen,ET),有效降低訓(xùn)練數(shù)據(jù)集維度和提高挖掘效率;圍繞ET提出一種基于殼向量的分布式支持向量機(jī)增造算法(HDIS).經(jīng)過(guò)研究表面,DSVM模型中使用HDIS的預(yù)測(cè)結(jié)果與神經(jīng)網(wǎng)絡(luò)、貝葉斯、決策樹(shù)相比除比神經(jīng)網(wǎng)絡(luò)的命中率略低外,其他指標(biāo)均具有一定的優(yōu)勢(shì).其重要原因是神經(jīng)網(wǎng)絡(luò)覆蓋率較小,可知該方法一定程度上出現(xiàn)了過(guò)擬合現(xiàn)象。

四、總論

文本主要對(duì)數(shù)據(jù)挖掘模型DSVM進(jìn)行了有效的論述,當(dāng)然所有的論述和介紹都是以企業(yè)的數(shù)據(jù)分布為依據(jù)的,當(dāng)然分布式的高性能算法的設(shè)計(jì)基礎(chǔ)是主成分分析和支持向量機(jī),而移動(dòng)的Agent訪問(wèn)的分布數(shù)據(jù)集是被用來(lái)作為構(gòu)建特征多叉樹(shù)的橋梁,從企業(yè)分布的數(shù)據(jù)庫(kù)中分析得出全局的有效信息,從而為企業(yè)做出商業(yè)決策提供高效和精確的信息。經(jīng)過(guò)理論和實(shí)驗(yàn)的探討,我們得出,這種模型的算法可以有效地解決其他算法中出現(xiàn)的弊端或者毛病,例如:存儲(chǔ)開(kāi)銷(xiāo)較大、效率低下、安全和隱私保障較低等等,因而采用了這種模型的算法之后,我們今后的研究方向主要傾向于并行運(yùn)算以及模型的動(dòng)態(tài)方面。

參考文獻(xiàn):

[1]王益萍,琚春華.基于分布式數(shù)據(jù)挖掘的連鎖商業(yè)企業(yè)經(jīng)營(yíng)決策分析[J].商業(yè)研究,2006年20期

[2]於俊,周維.一種基于殼向量的SVM快速增量學(xué)習(xí)算法[J].電子測(cè)量與儀器學(xué)報(bào),2006年6期

[3]琚春華,張捷.基于貝葉斯網(wǎng)絡(luò)的分布數(shù)據(jù)挖掘模型DDMB研究[J].情報(bào)學(xué)報(bào),2008年5期

主站蜘蛛池模板: 又爽又黄又无遮挡网站| 国产污视频在线观看| 国产情精品嫩草影院88av| 欧美午夜理伦三级在线观看 | 狠狠干综合| 国产91特黄特色A级毛片| 狠狠色狠狠综合久久| 国模粉嫩小泬视频在线观看| 日韩av无码精品专区| 精品少妇人妻无码久久| 国产精品天干天干在线观看| 精品国产电影久久九九| 国产成人精品日本亚洲| 91丝袜美腿高跟国产极品老师| 日本亚洲国产一区二区三区| 在线人成精品免费视频| 爆操波多野结衣| 久久99精品久久久久久不卡| 伊人久久大香线蕉影院| 99久久国产精品无码| 国产Av无码精品色午夜| 国产成人高精品免费视频| 亚洲视频四区| 欧美日本一区二区三区免费| 中国精品自拍| 黄色免费在线网址| 精品国产免费第一区二区三区日韩 | 欧美成人免费午夜全| 人妻精品全国免费视频| 九九热这里只有国产精品| 91无码国产视频| 久久综合色播五月男人的天堂| 伊人久综合| 成人精品在线观看| 久久精品丝袜高跟鞋| 婷婷综合亚洲| 中文字幕一区二区视频| 精品国产免费观看| 91视频区| 一本综合久久| 不卡视频国产| 欧美a级在线| 国产一级精品毛片基地| 69av免费视频| 毛片久久网站小视频| 国产成人精品一区二区三在线观看| 久久男人视频| 国产精品永久免费嫩草研究院| 日韩第一页在线| 青青操国产视频| 丝袜国产一区| 无码人中文字幕| 草逼视频国产| 亚洲国产中文精品va在线播放| 97se亚洲综合在线| 亚洲综合第一页| 亚洲中文字幕日产无码2021| 毛片网站免费在线观看| 尤物亚洲最大AV无码网站| 欧美激情综合一区二区| 91视频99| 婷婷丁香在线观看| 日本道综合一本久久久88| 日韩AV无码免费一二三区| 操美女免费网站| 中文字幕66页| 亚洲第一成网站| 国产91视频免费| 噜噜噜综合亚洲| 91麻豆国产精品91久久久| 国产精品尹人在线观看| 国产女同自拍视频| 久久亚洲日本不卡一区二区| 日韩久久精品无码aV| 四虎影视永久在线精品| 女人18毛片一级毛片在线| 国产日韩欧美一区二区三区在线| 亚洲天堂在线免费| 国产99热| 美女高潮全身流白浆福利区| 欧美色香蕉| 性视频久久|