999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據背景下基于分布式LDA算法的生產模式識別

2017-05-02 23:51:44石宇強夏世洪
制造業自動化 2017年3期
關鍵詞:模式識別生產

石 焱,石宇強,夏世洪

(西南科技大學 制造科學與工程學院,綿陽 621010)

大數據背景下基于分布式LDA算法的生產模式識別

石 焱,石宇強,夏世洪

(西南科技大學 制造科學與工程學院,綿陽 621010)

結合大數據時代背景,在車間已經實現信息化的基礎上,自行設計構建出了一種基于Hadoop框架的車間系統架構,用于車間海量數據的存儲和分析。運用HDFS存儲車間產生的海量數據;借鑒控制圖識別不同生產模式的方法,將Mapreduce編程模型與LDA算法相結合對存儲在HDFS上的數據進行分析,實現了對異常生產模式的快速識別和對生產過程的實時監控,從而解決了產品在生產過程中產生的海量數據存儲難、分析難的問題,并為上層決策提供了支持。

混雜RFID無線傳感網絡;HDFS;Mapreduce;分布式線性判別(LDA)

0 引言

隨著互聯網,物聯網和移動互聯網的快速發展,數據規模呈指數增長,大數據時代已經到來。車間現場數據也表現出了海量,復雜,多樣等特點。區別于傳統基于抽樣技術的生產過程控制[1],如何快速、及時地對車間內產生的全樣本數據進行存儲和分析,識別出異常的生產模式,對生產過程進行實時監控,保證產品正常生產,避免不合格品的產生,實現基于全樣本的生產過程決策成為研究的關鍵問題。分布式計算的快速發展為解決這一問題指明了方向。

1 基于分布式的車間系統架構

分布式計算作為一種新興的技術,為解決大數據存儲難、分析難的問題提供了方向。Hadoop是一個分布式的數據存儲計算平臺,主要包括并行化編程模型Mapreduce和分布式文件存儲系統HDFS兩部分.Mapreduce負責對大規模數據進行并行化計算,HDFS則是負責大規模數據的分布式存儲[2]。本文基于Hadoop分布式框架自行設計構建出了車間的系統架構,完成對車間現場全樣本數據及時,快速地存儲和分析,如圖1所示。

該車間系統架構的層級結構主要分為以下五個部分:

1)完成車間混雜RFID無線傳感網絡的覆蓋,通過混雜RFID無線傳感網絡完成對車間現場數據的全樣本采集,并在傳輸過程中完成數據清洗和數據融合。

2)將經過初步處理過的現場數據,通過現場總線進行傳輸。

圖1 車間系統架構圖

3)將傳輸過來的現場數據存儲到關系型數據庫和非關系型數據庫中,最后統一存儲在HDFS分布式文件系統中。

4)通過Mapreduce, mathout, hive等分布式計算框架和工具,利用相關機器學習算法,對存儲在HDFS上的車間數據進行計算分析,得到需要的結論,反饋給上層進行決策。

5)上層根據分析計算的結果,從實際需求出發,進行決策:既包括對現行方案計劃進行調整改善也包括出臺新的方案計劃等。

2 生產過程模式識別

在實現上述車間系統架構的基礎上,將控制圖識別異常模式的原理和機器學習算法相結合,對收集到的海量車間現場數據進行分析,及時有效地識別出異常生產模式,對生產過程進行實時監控,保證產品的正常生產,避免不合格品的出現。

2.1 控制圖識別原理

控制圖作為SPC的基本工具,以統計學的顯著性檢驗原理為理論基礎,一直被廣泛應用于生產過程中異常波動的捕捉。在加工過程中,由于受多種因素的交互影響,導致控制圖模式的基本類型分為正常模式、向上階躍異常模式、向下階躍異常模式、向上趨勢異常模式、向下趨勢異常模式以及周期模式等六種類型[3],如圖2所示。

圖2 控制圖六種基本模式

在控制圖模式識別過程中,根據規定的判別規則,判別出當前生產狀況屬于基本模式中的哪一種,及時完成對除正常類型以外五種異常模式的識別,并做出反饋和處理。

2.2 分布式LDA智能化控制圖模式識別

近年來以人工智能與機器學習為主的智能化控制圖模式識別日趨流行[4], Psarakis、Guh和Das等人使用了BP神經網絡和支持向量機(SVM)進行控制圖基本模式的識別[5~8],都得到了不錯的識別效果,但是隨著大數據時代的到來,如何在海量數據的基礎上完成智能化控制圖模式識別,判別出異常生產模式成為新的問題?;诖吮疚耐瓿闪薒DA算法的分布式實現,為解決這一問題提供了一種有效的方法。

LDA算法又稱線性判別分析,是分類領域里面的經典算法,基本思想是將高維的樣本數據投影到最佳鑒別矢量W上,以達到抽取分類信息和壓縮特征空間維數的效果,投影后保證樣本數據在新的子空間有最大的類間距離和最小的類內距離,即在該空間中有最佳的可分離性。針對LDA目前主要應用的場景還是在集中式處理,對于大規模數據的處理能力還有待提升的問題,通過構建Hadoop集群,完成了LDA算法的分布式實現,提高了算法運行效率,解決了大規模數據環境下智能化控制圖模式識別問題。運用分布式LDA進行生產模式識別的流程如圖3所示。

2.2.1 算法步驟

圖3 基于分布式LDA的生產模式識別的流程圖

LDA算法中求解W的關鍵是計算各類別樣本的均值和各類別樣本的方差。所以轉換到Hadoop集群中樣本均值和方差的計算也是關鍵問題。如圖4所示,實現LDA算法的步驟為:1)使用第一個Mapreduce計算各類別的樣本均值。2)在實現第一個Mapreduce的基礎上使用第二個Mapreduce計算各類別樣本的方差,進一步計算出類內的離散度矩陣和W。3)在實現前面兩個Mapreduce的基礎上,使用第三個Mapreduce計算出判別平面,并根據判別平面進行新樣本的類別判定。

圖4 分布式LDA實現流程

2.2.2 Map和Reduce函數設計

Map階段主要是從HDFS文件系統中按行讀取數據,并對傳入的鍵值對進行初步的處理。第一個Job中的Map階段主要是對傳入的鍵值對進行一些預處理,便于后續Reduce階段的計算,包括值的拆分和類型的轉換。第二個Job中的Map階段也是對傳入的樣本數據進行預處理,與第一個Job中Map階段的不同之處在于多了Setup函數用于處理緩存數據,還包括了各類別樣本方差的計算。Reduce階段是對Map階段的輸出結果進行匯總和進一步的計算。第一個Job中的Reduce階段主要是計算各類別樣本均值。第二個Job中的Reduce階段多了Setup函數用于處理緩存數據,還包括了最佳鑒別矢量W的計算。分布式LDA中Map和Reduce階段對應的偽代碼如下。

第一個Job如圖5所示。

圖5 偽代碼1

第二個Job如圖6所示。

圖6 偽代碼2

3 實驗和結果分析

3.1 實驗環境

實驗集群由四臺計算機搭建完成,配置如下:處理器為Intel(R)Core(TM)i5,CPU為M430@2.27GHz,內存為3.8GB,硬盤容量為600GB,Hadoop版本為1.2.1。集群的配置參考Hadoop官方提供的方法進行配置。其中,隨機選取一臺主機作為Master主節點,啟動NameNode和JobTracker進程,剩余三臺主機作為DataNode和TaskTracker,為Slave從節點。

3.2 實驗數據

利用蒙特卡洛仿真法生成每種模式樣本數據4000個,即4000×6個樣本,組成樣本集S。從每種模式4000個樣本中,分別隨機抽取3000樣本,組成訓練樣本集Train進行訓練,將剩余的樣本作為測試樣本集Test進行測試。

3.3 實驗結果分析

通過對訓練樣本集進行訓練,得到訓練好的LDA分類器,根據第一判別式和第二判別式得到的分類情況如圖5所示,由于分布式的LDA和集中式的LDA的原理是相同的,只是實現的方式不一樣,所以選取測試集進行檢驗時,在預測的準確率上并沒有差異都是0.9898如表1所示,與控制圖顯示的情況基本相符。

圖7 分類情況

分布式和集中式的LDA算法的主要差異表現在其識別的速度上。為了更好地將其差異性表現出來,將樣本集均勻的分成4份,分別標為a、b、c、d,其中異常模式和正常模式的比例均為5:1。使用訓練好的集中式LDA分類器和分布式LDA分類器依次對樣本集a、a+b、a+b+c、a+b+c+d進行模式識別,隨著樣本集中樣本數量的增加花費的時間如圖6所示。

圖8 時間對比

對比分布式LDA算法和集中式LDA算法對生產過程模式的識別結果,不難發現在準確率相同的情況下,分布式LDA算法識別的速度更快,效率更高,總體性能要優于集中式LDA算法,隨著生產過程模式數據的繼續增長整體優勢會繼續增加。

4 結束語

控制圖的智能模式識別,對判斷生產過程是否存在異常有著至關重要的作用,隨著物聯網以及車間信息化的高速發展,車間現場數據呈指數增長,大數據時代已經到來。本文結合當今大數據時代背景,提出了基于分布式存儲計算的智能控制圖識別方法:利用HDFS存儲車間現場數據;利用Mapreduce模型實現分布式LDA算法,進行模式識別。對比集中式的LDA算法,識別速度和效率得到了提升,取得了良好的效果。同時也為如何在大數據時代進行生產過程控制提供了一個有效的方法。

[1] 米子川.大數據時代的三個質量觀[J].中國質量,2014,(3):41-43.

[2] 孟永偉,黃建強,曹騰飛,等.Hadoop集群部署實驗的設計與實現[J].實驗技術與管理,2015,32(1):145-149.

[3] 李太福,胡勝,魏正元,韓亞軍.基于遺傳優化的PCA-SVM控制圖模式識別[J].計算機應用研究,2012,29(12):4538-4541.

[4] 宋李俊,趙虎.基于融合特征與支持向量機的控制圖模式識別[J].計算機應用研究,2014,31(3):937-941.

[5] Stelios Psarakis. The use of neural networks in statistical process control charts[J]. Quality & Reliability Engineering Inter national, 2011,27(5): 641-650.

[6] Guh, Ruey- Shy.A neural network based model for abnormal pattern recognition of control charts[J].Computers & Industrial Engineering,1999,36(1):97-108.

[7] Prasun Das. An hybrid detection system of control chart patterns using cascaded SVM and neural network–based detector[J]. Neural Computing and Applications,2011,20(2):287-296.

[8] 楊世元,吳德會,蘇海濤. 基于支持向量機技術的智能工序診斷研究[J].微電子學與計算機,2006,23(5):42-45.

Production pattern recognition based on the distributed LDA algorithm under the background of big data

SHI Yan, SHI Yu-qiang, XIA Shi-hong

TP301

:A

1009-0134(2017)03-0024-04

2016-12-12

石炎(1991 -),男,安徽人,碩士研究生在讀,研究方向為大數據背景下航天產品的質量管理和可靠性研究。

猜你喜歡
模式識別生產
用舊的生產新的!
“三夏”生產 如火如荼
紫地榆HPLC指紋圖譜建立及模式識別
中成藥(2018年2期)2018-05-09 07:19:52
S-76D在華首架機實現生產交付
中國軍轉民(2017年6期)2018-01-31 02:22:28
淺談模式識別在圖像識別中的應用
電子測試(2017年23期)2017-04-04 05:06:50
第四屆亞洲模式識別會議
可拓模式識別算法中經典域的確定方法
第3屆亞洲模式識別會議
安全生產重于泰山
Сварочное Проμзвоσсmво(《焊接生產》)2012年第5期要目
主站蜘蛛池模板: 久久精品国产国语对白| 无码国产偷倩在线播放老年人| 久久99久久无码毛片一区二区| 国产成人精品三级| 日韩资源站| 国产欧美在线观看一区| 国产精品99一区不卡| 亚洲精品在线观看91| 国产一区二区三区免费观看| a毛片在线免费观看| 国产美女在线观看| 波多野结衣第一页| 亚洲成肉网| 精品一区二区久久久久网站| 亚洲日韩精品无码专区| 综合天天色| 在线观看亚洲精品福利片| 久久婷婷色综合老司机| 激情视频综合网| 亚洲人人视频| 国产精品三级专区| 精品国产自在在线在线观看| 国产高清在线观看| 亚洲人成色在线观看| 色综合久久综合网| 久久青草精品一区二区三区| 91黄视频在线观看| 韩日无码在线不卡| 日本高清有码人妻| 欧美国产精品拍自| 播五月综合| 国产乱子精品一区二区在线观看| 为你提供最新久久精品久久综合| 性色生活片在线观看| 国产aⅴ无码专区亚洲av综合网| 免费在线播放毛片| 99999久久久久久亚洲| 国产麻豆精品在线观看| 日韩色图在线观看| 亚洲福利片无码最新在线播放| 欧美日韩亚洲综合在线观看| 日本人真淫视频一区二区三区| 免费jjzz在在线播放国产| 啪啪永久免费av| 国产女同自拍视频| 亚洲国产成人久久77| 国产a在视频线精品视频下载| 免费观看精品视频999| 在线观看无码av五月花| 无套av在线| 国产你懂得| 成人中文在线| 国产精品流白浆在线观看| 美女啪啪无遮挡| 国产精品久线在线观看| 国产欧美成人不卡视频| 日本免费精品| 免费一级α片在线观看| 欧美性天天| 潮喷在线无码白浆| 在线a网站| 欧美色香蕉| 国产综合亚洲欧洲区精品无码| 国产精品蜜臀| 在线精品自拍| 人妻无码一区二区视频| 国产精品蜜芽在线观看| 91青青草视频在线观看的| 极品私人尤物在线精品首页 | 国产九九精品视频| 久久香蕉国产线| 亚洲二区视频| 一本大道香蕉高清久久| 欧美一区二区丝袜高跟鞋| 日韩美女福利视频| 另类欧美日韩| 国产午夜无码专区喷水| 欧美翘臀一区二区三区| 免费aa毛片| 另类重口100页在线播放| 青青操视频在线| 国产精品偷伦视频免费观看国产 |