999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于規則型挖掘的油料裝備知識發現研究

2011-10-10 13:13:12后勤工程學院重慶401311
物流科技 2011年4期
關鍵詞:數據挖掘關聯規則

楊 昆,陳 軍,張 培,梁 峪 (后勤工程學院,重慶 401311)

·產經研究·

基于規則型挖掘的油料裝備知識發現研究

楊 昆,陳 軍,張 培,梁 峪 (后勤工程學院,重慶 401311)

1 知識發現

1.1 知識發現的概念。知識發現,又稱數據庫知識發現(KDD),是從大量原始數據中挖掘出隱含的、有用的、尚未發現的信息和知識。Fayyad將數據庫知識發現定義為 “KDD是從數據集中識別出有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過程[1]?!?/p>

1.2 知識發現的過程。本文采用知識發現的方法對油料裝備知識進行繁衍[2],油料裝備的知識發現過程可粗略的劃分為3個階段:數據準備階段、數據挖掘階段和結果的解釋評估階段,其流程圖如圖1所示:

圖1 KDD過程圖

(1)數據準備階段包括3個方面的內容。①數據選取,主要是確定目標數據,即根據用戶需求從原始數據庫中抽取一組感興趣的數據,并將其組織成適合挖掘的數據組織形式。②數據預處理,也叫數據清洗,主要是消除噪音數據。噪音數據是指那些明顯不符合邏輯的偏差數據,如某人300歲,這樣的數據往往影響挖掘結果的正確性。③數據變換,主要是指對數據進行降維處理。

(2)數據挖掘階段。數據挖掘階段是油料裝備知識發現的核心,是根據挖掘的任務或目的使用具體的挖掘算法對準備好的數據集進行知識發現。這些知識是隱含的、先前未知的、對決策有潛在價值的。提取的油料裝備知識可表示為概念 (Concepts)、規則 (Rules)、規律 (Regularities)和模式 (Patterns)等形式。這些形式蘊含了數據庫中一組對象之間的特定關系,揭示出一些有用的信息,從而為油料裝備設計人員提供決策依據。

(3)結果的解釋和評價階段。就是對挖掘出來的知識模式進行解釋和評價,即剔除冗余或無關的知識模式,將最后結果展現給用戶。

2 規則型挖掘技術

現代數據挖掘技術按照其不同的技術特點,可以分為規則型挖掘技術、神經網絡型挖掘技術、遺傳算法型挖掘技術、粗造集挖掘技術、決策樹型挖掘技術。

本文采用規則型挖掘技術,對從數據庫中抽取的一組油料裝備功能性需求數據進行數據挖掘,并從中發現新的規則。對規則的歸納是數據挖掘的一種主要形式,并且是無教師學習系統中最普遍的知識發現形式,它也是與大多數人想象的數據挖掘過程最為相似的一種數據挖掘形式,即在數據庫中 “淘金”。這里的金子是指人們原先不知道或者不能明確表達出來的知識。

(1)關聯規則的基本概念。關聯規則也稱為關聯模式,是美國BIM Almaden Research Center的R.Agrawal等人于1993年提出的,是數據挖掘研究中的一個重要課題。關聯規則是指大量數據中項集之間有趣的關聯或相關聯系[3]。關聯規則發現的對象主要是事務數據庫,例如售貨數據,也稱為貨籃數據。它是描述一個事務中物品之間同時出現的規律的知識模式?;谶@一概念,本文利用關聯規則來描述油料裝備設計過程中不同功能需求同時出現的規律。

關聯規則本身是 “如果條件怎么樣,那么結果或情況就如何”的簡單形式,它是一種蘊含關系、對稱關系,不是因果關系。關聯規則的表示形式為:A?B,其中左部A稱為前件,右部B稱為后件。前件可以包括一個或多個條件,在某個給定的正確率限制情況下,要使后件為真,前件中的所有條件必須同時為真。后件一般只包含一種情況,而不是多種情況。

例如,購買了計算機的用戶有購買財務軟件的趨向,用關聯規則表示為:

家庭是構成社會的基本元素,家庭的生存狀態是社會發展水平的標志。以往的城鄉規劃關注企業勝于關注家庭,關注勞動力資源勝于關注勞動者本身。大量農民工的出現,導致了農村家庭的碎片化和離散化、留守人群關愛的缺失,以及遠程通勤造成經濟負擔和資源的浪費等等。城鄉規劃應從家庭的完整性、聚合性和生活質量方面,對就業、居住和公共服務進行規劃,使城鄉聚落適宜于家庭生活,而非人口和勞動力集聚的空間。

(2)關聯規則的評價標準。①支持度 (Support)是對A?B的重要性 (或適用范圍)的衡量。在事物數據庫D中,規則A?B的支持度定義為物品集A和B同時出現的概率。支持度用公式定義為:

例如,如果某天有500個顧客 (元組數)到商場購買物品,其中有100個顧客同時購買了牛奶和面包,那么牛奶?面包的支持度就是20%。

②可信度 (Confidence)。它是對關聯規則的準確度的衡量,事物數據庫D中規則A?B的可信度定義為在物品集A出現的前提下,B出現的概率??尚哦扔霉蕉x為:

如上面所舉的牛奶和面包的例子,該關聯規則的可信度就回答了這樣一個問題:如果一個顧客購買了牛奶,那么他同時也購買面包的可能性有多大呢?在上述的例子中,如果在購買牛奶的200名顧客中有100人購買了面包,則該規則的可信度是50%。

關聯規則的挖掘問題就是在事務數據庫D中找出大于等于用戶給定的最小支持度或者最小可信度的關聯規則。而挖掘關聯規則是指在事務數據庫D中挖掘出具有這種形式的規則:由于某些事件的發生而引起另外一些事件的發生。這些規則在決策支持系統、專家系統和智能設計等各個方面起著重要作用。

(3)關聯規則的算法。Agrawal等人在1993年提出了解決客戶事務數據庫中的項集間關聯規則問題的Apriori算法。該算法的核心是將關聯規則的數據挖掘算法分解成兩步[4]:①找出所有支持度大于最小支持度的項集,這些項集稱為頻集,包含k個項的頻集稱為k-項集。②使用算法第①步找到的頻集產生所期望的規則。

Apriori算法的第①步采用遞歸方法,算法表示為:

L1={large 1-itemset s};//產生頻繁1項集L1

For( k=2; Lk-1≠?; k++);//循環產生頻繁2項集L2直到某個r, 使Lr為空

begin

Ck=apriori-gen( Lk-1 );//產生k-項集的候選集

for all transaction t∈D do

begin

Ct=subset( Ck,t);//事物t中包含的候選集

for all candidates c∈Ctdo

c.count++;

end

Lk={c∈Ck|c.count≥minsup}

end

Answer=UkLk

算法首選產生頻集1項集L1,然后循環生成頻集2項集L2,直到某個r使Lr為空,算法結束。在第k次循環中,首先產生候選k-項集的集合Ck,Ck中的每一項集是對兩個只有一個項不同的屬于Lk-1頻集做k-()2 -項集連接產生的,Ck中的每個項需要在事物數據庫中進行驗證以決定是否加入Lk。

3 Apriori算法的應用

在運用Apriori算法進行數據挖掘之前,首先要明確抽取的這組油料裝備功能性需求數據包括運油、加油、泵油、儲油4項數據,這4項數據是存儲在油料裝備設計綜合數據庫中的,它們是與油料裝備設計問題相關的初始數據,表示了油料裝備所具有的復合功能。其次要明確油料裝備設計綜合數據庫相當于關聯規則發現的對象事物數據庫D,4個復合功能相當于事物中的物品集合,根據用戶不同的功能需求,這4個復合功能組成了不同的項集,正是在這些不同的項集間,存在著關聯規則。

設定數字 “1,2,3,4”分別代表 “運油、加油、泵油、儲油”,事物數據庫D為油料裝備設計綜合數據庫,則Apriori算法在油料裝備功能數據挖掘中的應用如圖2所示:

圖2 Apriori算法應用

本文為了便于計算和比較各個項集支持度的大小,用項集在數據庫中的出現次數來表示支持度,等到算法結束挖掘出功能需求間的關聯規則時,再運用公式 (2)將支持度換算成百分數,并對關聯規則進行評判。

在C1的產生過程中,首先掃描數據庫,由于項集{1 }在數據庫中出現了3次,故其支持度為3,其余以此類推。如果用戶要求最小支持度在1以上,那么在由C1產生L1時,項集4被刪除。

在由L1產生C2的第二次循環過程中,由于項集{4 }沒有在L1中出現,因此在C2中的項集就不會包含有子項集{4 }的項集。獲得C2后,掃描數據庫獲得C2中所有項集的支持度,由于項集{1,2 }分別在數據庫D中的功能需求標識A3、A4中出現了一次,故其支持度為2,其余類推。然后對具有支持度的C2比較支持度,選擇大于支持度為1的項集,最后獲得L2。

在由L2產生C3的第三次循環過程中,由于只有{1,2,3}的所有子項集{1,2}、 {2,3}和{1,3 }在L2出現,因此C3中只有項集{1,2,3}。在掃描數據庫后獲得{1,2,3 }的支持度為2,最后獲得L3。此時已經無法由L3產生C4,故算法結束。

由上述算法可得3個頻集:L1、L2、L3。根據Apriori算法的第②步,可從頻集L2中產生至少3條功能需求關聯規則,并運用公式 (1)和公式 (2)分別計算3條關聯規則的支持度和可信度,如表1所示:

表1 功能需求關聯規則

若用戶規定關聯規則的最小支持度為25% (與支持度1對應),最小可信度為50%,那么表1中的3條關聯規則都是符合用戶要求的,可以作為新知識加入到知識庫中,并可在以后的油料裝備設計中進行利用。如關聯規則 “加油?泵油”,表示如果設計的油料裝備具有加油功能,那么也應同時具有泵油功能。

4 結束語

隨著 “知識經濟”時代的到來,油料裝備設計正逐漸向依靠知識驅動的創新設計方向發展。如何在呈爆炸性增長的數據中挖掘出對油料裝備設計有用的知識,已成為油料裝備知識發現研究的重點。本文在油料裝備知識發現過程中運用規則型挖掘技術,可以從油料裝備設計綜合數據庫中挖掘出功能需求間的關聯規則,并將其存入知識庫。這不僅實現了油料裝備知識的自我繁衍,而且提高了油料裝備設計的創新性。

[1]Fayyad U,Piatesky-Shapiro,Smyth,Uthurusamy.Advance in Knowledge Discovery and Data Mining[M].MIT Press,1996.

[2] 彭穎紅,胡潔.KBE技術及其在產品設計中的應用[M].上海:上海交通大學出版社,2007.

[3] 宋麗,林利.基于關聯規則的數據庫知識發現及應用[J].商場現代化,2009(2):49-50.

[4] 陳京民.現代數據挖掘技術與發展[M].北京:電子工業出版社,2007.

Mining Based on Rule-based Knowledge Discovery Oil Equipment

YANG Kun,CHEN Jun,ZHANG Pei,LIANG Yu (Logistical Engineering University,Chongqing 401311,China)

在基于知識的油料裝備設計過程中,利用知識發現的方法實現油料裝備知識的自我繁衍,對豐富油料裝備知識庫,提高油料裝備的自動化設計水平具有重要意義。運用規則型挖掘技術中的Apriori算法挖掘出油料裝備功能性需求數據中的關聯規則,并將其存入知識庫。這些關聯規則,直接揭示了隱含在油料裝備功能需求數據間的規律,為油料裝備的功能設計決策提供了依據。

油料裝備;知識發現;規則型挖掘;關聯規則

Knowledge-based oil equipment design process,using knowledge discovery methos to achieve oil self-reproduction equipment knowledge,knowledge of the rih oil equipment,oil equipment to improve the design level of automation is important.In this regard,the use of rule-based mining technology in the Apriori algorithm for mining the oil equipment functional requirements in the data association rules,and store them in knowledge base.These association rules,directly revea the functional requirements implicit in the oil equipment rules among the data,the function of equipment for the oil provided the basis for design decisions.

oil equipment;knowledge discovery;rule-based mining;association rules

F270

A

2011-01-24

楊 昆(1983-),男,四川樂山人,后勤工程學院碩士研究生,研究方向:油氣儲運工程。

1002-3100(2011)04-0142-03

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 欧美日韩国产综合视频在线观看| 尤物国产在线| 国产91特黄特色A级毛片| 亚洲国产系列| 国内精品视频在线| 曰韩免费无码AV一区二区| 国产成人乱码一区二区三区在线| 国产欧美日韩免费| 免费观看男人免费桶女人视频| 亚洲一区二区三区在线视频| 亚洲精品黄| 久久亚洲中文字幕精品一区| 97人妻精品专区久久久久| 91久久偷偷做嫩草影院精品| 欧美日韩久久综合| 免费中文字幕一级毛片| 中国国产A一级毛片| 亚瑟天堂久久一区二区影院| 日韩精品高清自在线| 亚洲欧美一区二区三区蜜芽| 高清无码手机在线观看| 无码AV动漫| 国内精品久久久久久久久久影视| 91欧美亚洲国产五月天| 国产精品人莉莉成在线播放| 亚洲第一在线播放| 亚洲无码高清一区二区| 国产精品精品视频| 国产在线自揄拍揄视频网站| 精品人妻AV区| 制服丝袜亚洲| 欧美色视频在线| 国产欧美日韩视频一区二区三区| 污视频日本| 米奇精品一区二区三区| 亚洲人在线| 色呦呦手机在线精品| 久久久受www免费人成| 狠狠干综合| 性欧美在线| 91在线播放国产| 国产亚洲精品自在久久不卡| 国产午夜在线观看视频| 久久国产乱子伦视频无卡顿| 亚洲男人天堂网址| 国产欧美日韩在线一区| 99热这里只有精品在线播放| 亚洲人成在线精品| 在线观看精品自拍视频| av在线人妻熟妇| 国产激情在线视频| 亚洲中文字幕在线观看| 国产女主播一区| 日韩在线播放中文字幕| 日韩精品无码免费专网站| 国产在线视频自拍| 99无码熟妇丰满人妻啪啪| 日韩精品免费一线在线观看| av手机版在线播放| 午夜在线不卡| 热久久这里是精品6免费观看| 欧美一级黄片一区2区| 欧美成人午夜视频免看| 国产第四页| 国产不卡一级毛片视频| 久久人搡人人玩人妻精品一| 色国产视频| 美女高潮全身流白浆福利区| 超碰91免费人妻| vvvv98国产成人综合青青| 国产精品成人AⅤ在线一二三四| 福利在线不卡| 成人一级免费视频| 国产最新无码专区在线| 国产理论一区| 精品视频福利| 在线播放真实国产乱子伦| 欧美色综合久久| 国产精品女人呻吟在线观看| 国产又黄又硬又粗| 国产福利免费观看| 欧美三级自拍|