999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于蜂群算法的數據庫知識發現過程的研究

2014-10-11 11:22:34
湖南師范大學自然科學學報 2014年2期
關鍵詞:數據挖掘數據庫模型

黎 華

(西昌學院電子工程系,中國四川 615000)

數據挖掘(data mining)是當前數據庫研究領域一個的重要方向.數據挖掘主要是指利用各種分析方法和技術,對以往累積的大量復雜的數據進行分析、歸納和整合,從而在大量數據中發掘出有用的信息,為相應的決策提供依據.

所以借助數據挖掘技術,企業完全有能力從浩瀚的數據海洋中,挖掘出全面而又有價值的信息和知識,并作為決策支持之用,進而形成企業獨有的競爭優勢.

1 CRISP-DM模型

CRISP-DM模型是由歐盟幾家在數據挖掘應用上有豐富經驗的公司共同籌劃提出來的,CRISP-DM模型主要強調完整的數據挖掘過程,不是只針對數據整理、數據顯示、數據分析和模型的構建,而是將對企業的需求問題的理解和后期對模型的評價和模型的延伸應用都應用于數據挖掘中[1-2].

圖1 CRISP-DM模型Fig.1 CRISP-DM model

因此,CRISP-DM模型強調實施數據挖掘項目的方法和步驟,同時該模型獨立于每種具體數據挖掘算法和數據挖掘系統之外.

2 蜂群算法

2.1 基本原理

自然界中,蜂群實現采蜜的集體智能行為主要包括3個主要部分,分別為蜜源、采蜜蜂EF、待工蜂UF.另外,在此基礎上又引入3種行為模式,分別為搜索蜜源、為蜜源招募以及放棄蜜源[3-4].

蜂群采蜜的流程圖如圖2所示.

假設目前有2個已經被發現的食物源A和B,起初,待工蜂沒有獲得任何食物源的信息,那么它有兩個可能的選擇:

(1)待工蜂作為偵察蜂,由于外在因素或激勵因素的存在,其會自動搜尋蜂巢附近的食物源(圖中‘S’線).

(2)當待工蜂發現其他蜜蜂之后,其被招募,按照自身獲取的信息搜尋食物源(圖中‘R’線).

當待工蜂找到新的食物源的時候,蜜蜂可以記住并獲取食物源所在的位置,與此同時實現采蜜工作.

因此,這時待工蜂成為采蜜蜂,等到蜜蜂采蜜回到蜂箱,此時將采到的蜜吐到空的蜂房之后,其有下面幾個選擇:

a)拋棄食物源,變成待工蜂的跟隨蜂;

b)返回同一食物源之前,通過跳搖擺舞實現蜂群的招募;

c)繼續采蜜,不招募其他蜂群.

初始時,所有蜜蜂都是偵察蜂,等到它們隨機搜索到食物源后,偵察蜂重新回到蜂巢的舞蹈區.依據食物源的收益度的大小,偵察蜂可以變成任何一種蜜蜂.

圖2 蜜蜂采蜜工作圖Fig.2 Working drawing of honey bees

圖3 蜂群算法流程圖Fig.3 Flowchart of bee colony algorithm

2.2 要素組成

依據蜂群算法的原理介紹,蜂群算法主要有以下3個基本要素構成:

(1)食物源.食物源表示各種可能的解;食物源值由多種因素決定的,比如食物源和蜂巢的距離、能量的大小和集中程度等.

(2)采蜜蜂EF.采蜜蜂是和食物源有聯系的,采蜜蜂擁有采集到的具體的食物源信息,信息主要有食物源和蜂巢的距離、食物源方向以及食物源的收益度;

(3)待工蜂UF.待采蜜蜂尋找食物源,主要分為偵察蜂和跟隨蜂;偵察蜂負責找尋蜂巢附近的新食物源;而跟隨蜂在蜂巢內等待,通過分享到的采蜜蜂的信息,實現食物源的尋找[4].

算法流程如圖3所示.

3 基于蜂群算法的數據庫知識發現模型

參考CRISP-DM模型和數據庫知識發現的多處理階段模型[5],本文提出將信任分配學習機制和基于蜂群算法的規則發現機制有機地結合在一起的基于蜂群算法的數據庫知識發現系統模型,其特點是系統采用概率轉換規則,使用并行的規則觸發機制,是一種自適應的學習系統.

基于蜂群算法的數據庫知識發現模型基本結構如圖4所示.

圖4 基于蜂群算法的數據庫發現模型Fig.4 Model of database discovery based on bee colony algorithm

客觀數據庫環境信息通過數據處理器將完整的數據信息發往模式生成器,模式生成器根據指定的數據挖掘任務,從數據信息中提取相關的模式并將這些模式劃分為訓練數據集以及測試數據集[6].被觸發的知識生成器通過設計的蜂群算法與訓練集交互的學習,將滿意的學習結果提供給測試集,測試集將評測結果交給解釋評價價機構,通過解釋/評價機構將知識提交給用戶并作用于數據庫環境,同時更具評測結果和用戶需求,修改信任分配算法,以希望下次能得到更好的結果[7].

4 仿真實驗

數據挖掘算法的任務是對海量數據庫進行挖掘,對于只有如此少的記錄數據庫的效果不能說明問題.作者又選擇了機器學習研究通常使用的Cleve心臟病例比較實驗數據庫進較實驗.訓練數據為200個,測試數據為103個.

4.1 Cleve原始數據的處理

(1)C leve原始數據含有部分數據屬性值的缺失,首先補足缺失數據.

(2)對于 Age,Trestbps,Cholesterol,Fasting blood sugar,Max heart rate,Old peak 和 Number of vessels colored的連續屬性進行離散化為:

Age:>47.5;<47.5 兩類

Trestbps,Cholestrol對其劃分的邊界計算信息嫡,其信息消值都不足以對分類進行有效劃分,因此這兩個屬性對分類的劃分不起任何作用,因而從屬性列表中刪去.

Fasting blood sugar:>120;<120兩類;

Max heart rate:> 147.5;< 147.5 兩類;

Old peak:> 1.7;< 1.7 兩類 ;

Number of vessels colored:> 0.5;< 0.5兩類:

由于離散屬性的屬性值均較少(2~4個),無需對其縮減.

圖5 測試結果對比Fig.5 Comparsion chart of test results

4.2 實驗結果

為了進一步驗證蜂群算法進行數據庫知識發現的優越性和準確性,將其同文獻[8]算法進行對比,主要從訓練準確率、測試準確率和運行時間3個方面進行驗證,運用仿真進行仿真,仿真結果分別如圖5~圖7.

從圖5中可以看出,蜂群算法的準確率達到100%,而文獻中的算法的準確率只達到93.333 3%.從圖6中可以看出,蜂群算法的準確率普遍高于文獻算法的準確率.從圖7中可以看出,蜂群算法的運行時間也優于文獻算法.

通過算例的測試,發現蜂群算法有很好的尋優能力,求解速度也快.下面重點研究蜂群算法的不用參數對尋優結果的影響.

圖6 測試結果正確率對比圖Fig.6 Comparison chart of correct rate of testing result

圖7 算法時間對比圖Fig.7 Comparison chart of algorithm time

5 不同種群大小對蜂群算法性能的影響

5.1 不同種群大小對收斂性的影響

分別分析種群數為15,30,45時,種群大小對蜂群算法性能的影響.

通過圖8(a)、(b)、(c)3圖的對比,發現種群越大,蜂群算法收斂性越快,更容易逼近最優值.

5.2 不同迭代次數對蜂群算法性能的影響

分析迭代次數為100,200,300時,迭代次數對GA算法性能的影響.

通過圖9(a)、(b)、(c)3圖的對比發現,隨著迭代次數的增加,蜂群算法求解問題的收斂性不斷增加,能更快地逼近最優值.

圖8 蜂群大小對收斂結果的影響Fig.8 Colony size effects on convergence results

圖9 不同迭代次數對結果的影響Fig.9 Different iterations effects on results

6 結論

在CRTSP-DM模型的基礎上,本文提出一種基于蜂群算法的知識庫發現系統模型,將蜂群算法同CRTSP-DM模型有機地結合起來,運用Matlab軟件,進行仿真實驗,并同文獻中的算法進行了對比,主要研究結果如下:(1)根據仿真結果,蜂群算法的準確率達到98.1%,效果很好.(2)同文獻中的算法進行對比,主要從訓練準確率、測試準確率和運行時間3個方面進行驗證.從圖5中可以看出,蜂群算法的準確率達到100%,而文獻中的算法的準確率只達到93.333 3%.從圖6中可以看出,蜂群算法的準確率普遍高于文獻算法的準確率.由圖7可見,蜂群算法的運行時間也優于文獻算法.

最后,調整蜂群算法的不同參數,對比了不同參數對蜂群算法知識庫發現系統尋優結果的影響.

[1]王興偉,鄒榮珠,黃 敏.一種基于蜂群算法的ABC支持型QoS組播路由機制[J].計算機科學,2009(6):47-52.

[2]袁 浩.基于改進蜂群算法無線傳感器感知節點部署優化[J].計算機應用研究,2010,26(7):2704-2708.

[3]KARABOGA D,OKDEM S,OZTURK C.Cluster based wireless sensor network routings using artificial bee colony algorithm[J].J Wireless Networks,2012,18(7):847-860.

[4]丁海軍,馮慶嫻.基于boltzmann選擇策略的人工蜂群算法[J].計算機工程與應用,2009,45(1):53-55.

[5]暴 勵,曾建潮.一種雙種群差分蜂群算法[J].控制理論與應用,2011,28(2):267-272.

[6]胡中華,趙 敏.基于人工蜂群算法的機器人路徑規劃[J].電焊機,2009,26(1):93-96.

[7]康 飛,李俊杰,許 青.改進人工蜂群算法及其在反演分析中的應用[J].水電能源科學,2009,27(1):126-129.

[8]暴 勵,曾建潮.自適應搜索空間的混沌蜂群算法[J].計算機應用研究,2010,26(4):1331-1334.

猜你喜歡
數據挖掘數據庫模型
一半模型
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據庫
財經(2017年2期)2017-03-10 14:35:35
3D打印中的模型分割與打包
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 国产国语一级毛片| 亚洲欧洲日韩久久狠狠爱 | 国产激情无码一区二区APP | 亚洲精品福利网站| 日本三级欧美三级| 亚洲男人天堂2018| 国产一级妓女av网站| 国产乱子伦无码精品小说| 亚洲精品福利视频| 久久人妻xunleige无码| 最新加勒比隔壁人妻| 免费国产无遮挡又黄又爽| 无码AV日韩一二三区| 高潮毛片无遮挡高清视频播放| 动漫精品中文字幕无码| 刘亦菲一区二区在线观看| 亚洲资源站av无码网址| 亚洲国产精品一区二区第一页免| 国产精品对白刺激| 国产精品人人做人人爽人人添| 国产aⅴ无码专区亚洲av综合网| 亚洲无码久久久久| 欧美一区二区自偷自拍视频| 福利视频99| 又大又硬又爽免费视频| 色成人亚洲| 亚洲视频免费在线看| 欧美亚洲国产精品第一页| 亚洲国产看片基地久久1024| 亚洲综合经典在线一区二区| 欧美视频免费一区二区三区| 国产精品无码AⅤ在线观看播放| 国产综合精品一区二区| 国产人人乐人人爱| 亚洲一欧洲中文字幕在线| 亚洲第一成年网| 精品久久久久成人码免费动漫| 成人在线天堂| 国内自拍久第一页| 欧美亚洲一区二区三区导航| 免费高清毛片| 国产成人精品男人的天堂下载| 亚洲视频欧美不卡| 国产成人啪视频一区二区三区| 成人欧美在线观看| 波多野结衣一区二区三视频| 被公侵犯人妻少妇一区二区三区 | 久久久久久国产精品mv| 久操线在视频在线观看| 国产成人精品无码一区二| 九九免费观看全部免费视频| 亚洲综合激情另类专区| 国产h视频在线观看视频| 久久成人免费| 无码专区在线观看| 国产喷水视频| 亚洲无码视频一区二区三区| 成人国产精品视频频| 欧美一区二区自偷自拍视频| 午夜精品一区二区蜜桃| 丁香五月婷婷激情基地| 成人在线亚洲| 亚洲国产日韩欧美在线| 欧美区一区二区三| 欧洲免费精品视频在线| 国产91熟女高潮一区二区| 欧美激情综合一区二区| 中国一级毛片免费观看| 97久久人人超碰国产精品| 91午夜福利在线观看精品| 久久香蕉国产线看观看式| 最新国产精品第1页| 久久窝窝国产精品午夜看片| 韩国福利一区| 国内精自视频品线一二区| 国产69精品久久久久妇女| 国产精品自在在线午夜 | 97视频在线精品国自产拍| 国产玖玖视频| 男女男免费视频网站国产| 亚洲大尺度在线| 99爱在线|