999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于K—均值算法的數據挖掘技術研究及應用

2017-06-20 23:03:33穆榮斌仲梁維
軟件導刊 2017年4期
關鍵詞:數據挖掘

穆榮斌+仲梁維

摘要:隨著企業信息系統集成的應用,數據庫中積累了大量分散但有效的數據。如何從大量數據中挖掘出有效的決策信息,從而帶領企業快速發展,成為企業信息化發展進程中一個至關重要的問題。提出一種基于K-均值聚類算法的數據挖掘技術,并為某制造企業開發了信息系統集成平臺,輔助決策者制定合理方案。

關鍵詞:數據挖掘;信息系統集成;K均值算法;聚類算法;BOM系統

中圖分類號:TP391

文獻標識碼:A

文章編號:16727800(2017)004018503

0引言

充分利用企業信息系統集成中所產生的生產業務信息數據成為企業的關鍵技術,數據挖掘技術則是企業系統中使用的技術之一。數據挖掘指對數據庫中的海量數據進行過程復雜的數據分析,從而獲得其中隱含信息的過程。根據用戶需求,選擇比較切合的數據挖掘算法,成為挖掘技術成功的關鍵。通過研究各種數據挖掘算法,筆者在眾多算法中選擇了K均值算法作為本文數據挖掘的基礎算法。

1K均值算法概述

1.1K均值算法概念

聚類問題是將給定的數據集合D劃分成一組聚類:{C1,C2,…},Ci∈D,使不同種類中的數據盡可能不相似(或距離較遠),同一種類中的數據盡可能相似(或距離較近)。聚類是一種無監督的學習,所謂無監督學習指事先并不知道要找的內容,即沒有目標變量,它將相似的對象歸到同一個簇中[13]。K均值(Kmeans)算法在聚類算法中使用最為廣泛。首先根據分類的個數k,隨機地選取k個初始的聚類中心,當然這個k值是難以確定的,并把每個對象分配給離它最近的中心,分別得到起始的聚類點。然后,將當前每個聚類的中心作為新的聚類中心,并把每個對象重新分配到最近的中心。不斷地循環迭代,直到目標函數的最小值,即最終的聚類中心點沒有移動。其中,目標函數通常采用平方誤差準則,即:其中,E表示所有聚類對象的平方誤差和,S是聚類對象,Mi是類Ci的各聚類對象的平均值,即:

其中,|Ci|表示類Ci的聚類對象數目。每一次迭代時,每一個點都要計算一遍它和各聚類中心的距離,并取最短距離的類作為該點所屬的類。直到E獲取最小值,最終表現為最后的聚類中心無法移動。一般k的典型取值為2~10。

1.2K均值算法計算模型

假設在一片小區域中有若干數據點,如圖1所示。先假設k=2,即最終這些數據點會聚類成兩個類。K均值算法具體解釋如下: (1)由于k=2,任意的兩個數據點被選作初始類的聚類中心(圖中用點F、G表示),如圖1(a)所示。 (2)將其余的各個點分配到距離最近的聚類中心點(本例中為F點、G點)所代表的類中,即求圖中所有點到各個聚類中心的距離。如果Si距離Ci近, 則Si屬于Ci聚類。如圖1(b)所示,A、B點與F點的距離相對G點更近,所以屬于F點聚類,C、D、E點與G點相對F點距離更近,所以屬于G點聚類。 (3)將聚類中心點F點、G點移動到“自己”的聚類中心,如圖1(c)、圖1(d)所示。 (4)重復步驟(2)、(3),直到每個類中的聚類對象(如圖1(e)中的點)不再重新分布為止,第一個點聚合了A、B、C,第二個點聚合了D、E,此時重復循環的迭代過程結束。

2.1系統概述

通過對K均值算法的介紹及其算法處理模型,筆者結合某制造型企業的信息化系統平臺用戶實際需求建立數據倉庫,在數據倉庫的基礎上使用數據挖掘中的K均值算法對大量數據進行潛在信息的挖掘,并開發出基于K均值算法的挖掘器,輔助決策者進行決策。假如數據庫中的數據關于產品信息生成了k個聚類中心,即k個中心點point,將其余的各個點分配到距離最近的聚類中心點所代表的類中,距離為distance,并獲取距聚類中心距離最小的距離min2,將該元素歸類于距離聚類中心點最近的那個聚類中,核心代碼如下:

private void clusterSet() { float[] distance = new float[m]; for (int l = 0; l < length; l++) { for (int e = 0; e < m; e++) { distance[e] = distance(data.get(l), point.get(e)); } int min2 = min1(distance); cluster.get(min2).add(data.get(l)); } } //將聚類中心點移動到自己的聚類中心,求兩點誤差平方 private float result(float[] point1, float[] point) { float x = point1[0] - point[0]; float y = point1[1] - point[1]; float result1 = x * x + y * y; return result1; } //利用上述“求兩點誤差平方”的方法,計算誤差平方和準則 private void result2() { float a1 = 0; for (int r = 0; r < cluster.size(); r++) { for (int j = 0; j < cluster.get(r).size(); j++) { a1 += result(cluster.get(r).get(j), point.get(r)); } } sum.add(a1); } //設置新的聚類中心 private void setNewPoint() { for (int h = 0; h < m; h++) { int n = cluster.get(h).size(); if (n != 0) { float[] newpoint = { 0, 0 }; for (int k = 0; k < n; k++) { newpoint[0] += cluster.get(h).get(k)[0]; newpoint[1] += cluster.get(h).get(k)[1]; } newpoint[0] = newpoint[0] / n; newpoint[1] = newpoint[1] / n; point.set(h, newpoint); } } } //對第2、3步進行重復迭代,直至得到算法最終結果 private void kmeans() { init(); while (true) { clusterSet(); result2(); if (n != 0) { if (sum.get(n) - sum.get(n - 1) == 0) { break; } } setNewPoint(); n++; cluster.clear(); cluster = cluster1(); } }

2.2零部件市場需求分析

在銷售系統“零部件市場需求分析”模塊,主要針對銷售信息以及產品信息所建立的數據倉庫中的信息進行數據挖掘。合同中記載了所銷售的產品圖號、數量、客戶相關信息等,同時根據產品圖號可以得到產品BOM信息。 產品BOM信息即該產品的設計信息,包括零件信息、物料進貨方式及加工作業方式、工藝信息、圖紙信息、層次碼、總數量等。其中零件信息主要有:零件圖號、零件名稱、材料、牌號、外形尺寸等;物料進貨方式及加工作業方式主要包括:物料類別(如:配套件、緊固件)、物料進場狀態(如:成品、半成品、毛胚)、加工方式(如:自加工、外加工)、加工內容(如:金工、電工);工藝信息即零部件加工的工藝信息;圖紙信息包括圖紙幅面等;層次碼主要用來標注該零部件在產品中的所處位置;總數量即表明該零部件在產品中該層次碼下的個數。 相同產品可能會有處于不同層次的相同零部件,不同產品可能會有相同零部件。因此,在所建立的數據倉庫基礎上,使用數據挖掘技術挖掘出查詢條件,從銷售的產品中具體細化到銷售需求較多的零部件,從而在企業決策時察覺出該情況。通過針對性地制定預投生產計劃、增加庫存,能夠幫助企業提高生產效率,對于市場快速反應,以提高市場占有率。 對于該部分功能,首先可以進行條件查詢。查詢屬性有:產品圖號、產品型號、代號、名稱、規格尺寸、長度寬度、材料、牌號、年份和客戶編號。 從查詢屬性看,這是多種搜索條件的組合;從數據挖掘角度看,這是在K-均值聚類算法設計的數據倉庫基礎上開發出來的一個數據挖掘工具。此項功能設計時是從月份出發,將每年的銷量按照月份呈現,因此“年份”是必選項,其余條件用戶可以自由組合。例如:選擇“2012年”,查詢結果如圖2所示。

該圖表示在2012年的銷售產品里對零部件數量進行匯總的結果。通過該數據挖掘器,提出了銷量最領先的4個零部件。曲線代表其在各月的銷售總數及市場需求總數,單位以“百”計。每條曲線代表的零部件圖號在圖右側進行了說明。該表示方法直觀、清晰,可以給決策者提供明確的零部件市場需求變化曲線圖。通過聚類結果可知,“零件圖號”為“8UE.016.0211”的零件,從八月開始銷量減少,并且其它3種零件在六月開始需求量變大,從而可使決策者在來年制定更合理的方案,以提高企業競爭力。

2.3廢料統計情況分析

廢料統計情況分析主要是針對生產中由于工人誤操作、材料劣質、機器故障等各種原因造成所領物料報廢,需要重新領料進行加工的情況進行統計分析。 物料是一個統稱,它包括可以直接領的成品、需要再加工的半成品,以及需要加工的原材料。因此,對于物料有一個物料編碼,專門對所有可領的成品、半成品、原材料進行唯一標示。物料編碼根據零件圖號、零件名稱、材料、牌號、外形尺寸、物料進場狀態、物料類別、加工方式8個字段進行唯一性區分。根據編碼方式,產生唯一的物料編碼,例如“A00B021”。該企業的物料有“定額”和“非定額”兩種情況。“定額”即可以用個數來統計的零部件物料;“非定額”指無法用個數來統計的物料,如:5米長的銅線等。具體而言,本文主要研究針對某個工作令從生產開始到生產結束,所有定額物料的生產料廢情況。在工作令系統和領料單系統的基礎數據庫上建立數據倉庫。工作令系統的數據庫中存有工作令號、起始生產日期、結束生產日期及其它工作令的基本信息。領料單系統數據庫中的廢料表中存有料廢的物料編碼、材料、數量等信息。查詢屬性有:工作令號、合同號、起始時間和終止時間。 填入工作令號“2B7-1D044205”,點擊“查詢”按鈕,會通過數據挖掘方法統計該工作令下的所有零件材料料廢情況,如表1所示。

表1清晰表明了該工作令號“2B7-1D044205”中各個物料損失的比重。從表中可以看出,以廢料“A03B004”、

“D03E334”和“E17B231”為聚類中心的廢料占多數,從而可以使企業決策者從這些材料損失中發現問題,分析物料損耗原因,如:采購質量問題、工人操作失誤,還是其它可避免的各類原因。因此,該基于數據倉庫的數掘挖掘器,有利于輔助企業決策者從實際生產中找出各類潛在問題,從而制定合理的政策,降低生產損失,提高企業競爭力。

3結語

本文采用數據挖掘技術對數據庫中積累的大量數據進行了分析處理,系統雖然實現了將基于K均值算法的數據挖掘技術應用于信息化系統集成平臺中,但也只是實現了部分輔助決策功能。根據企業的具體使用情況,決策者肯定不會滿足于系統中已經提供的決策支持功能,如何更近一步地發揮系統集成能力,開發更多決策支持功能,提高數據倉庫查詢速度,以滿足企業決策者更多需求,是下一階段研究的主要方向。

參考文獻:

[1]王欣,徐騰飛,唐連章,等.SQL Server2005數據挖掘實例分析[M].北京:中國水利水電出版社,2008:15.

[2]李銳,李鵬,曲亞東,等.機器學習實踐[M].北京:人民郵電出社,2013:184199.

[3]彭木根.數據倉庫技術與實現[M].北京:電子工業出版社,2002:321.

[4]陳文偉.數據倉庫與數據挖掘教程[M].第2版.北京:清華大學出版社,2011:190.

[5]孫水華,趙釗林,劉建華.數據倉庫與數據挖掘技術[M].北京:清華大學出版社,2012:122.

[6]李晶,陳驥.數據挖掘技術對ERP實施的重要性[J].福建電腦,2008(8):6061.

[7]余臘生,李強.數據挖掘在質量管理系統中的應用研究[D].長沙:中南大學,2010.

[8]范明,孟小峰.數據挖掘概念與技術[M].北京:機械工業出版社,2001:150.

(責任編輯:黃健)

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: a毛片在线播放| 人妻无码中文字幕第一区| 伊在人亚洲香蕉精品播放| 国产在线视频自拍| 亚洲人成电影在线播放| 欧美在线中文字幕| 色老头综合网| 欧美精品v欧洲精品| 国产精品极品美女自在线看免费一区二区| 欧美日韩午夜视频在线观看 | 亚洲国产成人在线| 99爱在线| 国模私拍一区二区| 国产精品无码制服丝袜| 国产91小视频| 国产在线日本| 丁香综合在线| 亚洲综合激情另类专区| 91亚瑟视频| 久久亚洲AⅤ无码精品午夜麻豆| 欧美精品二区| 日韩色图在线观看| 久久亚洲欧美综合| 亚洲不卡无码av中文字幕| 久久伊伊香蕉综合精品| 欧美区一区| 尤物亚洲最大AV无码网站| 国产免费黄| 亚洲视频免费在线看| 欧美一区二区人人喊爽| 亚洲成a人片在线观看88| 91无码人妻精品一区| 成人一区在线| 亚洲精品欧美日本中文字幕| 亚洲AV一二三区无码AV蜜桃| 国产乱人免费视频| 国模视频一区二区| 亚洲国产中文在线二区三区免| 尤物国产在线| 国产不卡一级毛片视频| 国产原创演绎剧情有字幕的| 波多野结衣视频一区二区| 免费毛片在线| 手机精品福利在线观看| 久久久久中文字幕精品视频| 亚洲人成在线精品| 制服无码网站| AV不卡在线永久免费观看| 精品国产Ⅴ无码大片在线观看81| 中文字幕久久波多野结衣| 国产欧美精品一区二区| 国产伦精品一区二区三区视频优播| 国产精品免费p区| 第一区免费在线观看| 国产a v无码专区亚洲av| 国产成人免费高清AⅤ| 亚洲国产综合自在线另类| 国产精品七七在线播放| 欧美成人精品高清在线下载| 国产成人综合久久精品尤物| 色屁屁一区二区三区视频国产| 18禁黄无遮挡免费动漫网站 | 老司机久久99久久精品播放| 自拍欧美亚洲| 午夜无码一区二区三区| 日韩一级二级三级| 欧美亚洲国产精品久久蜜芽| 97视频免费看| 亚洲精品无码不卡在线播放| 一本大道AV人久久综合| 国产91精品调教在线播放| 亚洲成A人V欧美综合天堂| 欧美丝袜高跟鞋一区二区| 成人午夜亚洲影视在线观看| 成人综合网址| 婷婷中文在线| 一边摸一边做爽的视频17国产| 欧洲在线免费视频| 福利片91| 亚洲成aⅴ人在线观看| 亚洲精品中文字幕无乱码| 男人的天堂久久精品激情|