王萌
摘 要:從當前大數據環境的特點出發,分析中國制造業及信息化的現狀,闡述在大數據環境下制造業如何進行信息化及智能化的質量改進問題。分析大數據環境下質量分析與改進遇到的新挑戰與新問題,并基于質量分析與改進遇到的新問題與新挑戰,給出相應的解決方案,最后展望問題發展的前景。
關鍵詞:質量分析;大數據;智能化;質量分析
中圖分類號:C931 文獻標志碼:A 文章編號:1673-291X(2018)18-0151-02
引言
質量分析與改進是制造企業不斷追求的企業宗旨之一,企業在制造中使用各種不同的方式進行質量分析與改進。質量改進是企業最有效的核心競爭力之一,對制造企業來說有著至關重要的意義。質量的不斷改進有助于制造企業提高投資收益率,減少質量損失,還能夠促使新產品的開發與生產技術的改進。質量改進活動一般有兩層含義[1]:第一層是保持現有的質量水平,降低質量波動,其核心方法是“質量控制”;第二層是以突破的方式改進質量,主動采取改進措施,使質量有突破性進展,質量水平大幅前進。
隨著大數據及物聯網時代的到來,制造業得益于傳感設備的普及,能夠方便地收集到生產相關數據,這些制造大數據對于促進質量改進效果的作用日益變大。雖然以統計理論為基礎的傳統的質量分析方法在質量改進領域有著廣泛的應用,但是能夠在計算機上便于使用的數據挖掘方法[2]在制造業的應用越來越廣泛。數據挖掘是一種用于發現潛藏于數據中人類未知知識的工具,制造業目前也大量應用了這種方法并進行改進。同樣,數據挖掘方法在質量改進領域中的應用也越來越多,主要研究與應用領域為產品質量預測、工序質量描述、參數優化及質量分類四個方面[3]。
提出相應的算法需要考慮數據挖掘工具解決實際問題的全過程。具體執行流程可分為以下七個步驟:提出質量模型,采集模型相關數據,數據預處理,使用數據挖掘算法,優化算法結果,提出決策分析算法和提取改進規則。質量模型的提出與應用力求符合生產實際,提出的算法能夠針對模型做有效分析,提出的知識對生產的管理人員能夠起到指導生產和輔助決策的作用。
一、研究現狀
數據挖掘可以簡單概括為數據采集、數據預處理、數據分析和知識抽取。數據挖掘方法在質量改進領域的應用已經得到大量學者的關注。數據挖掘方法在生產數據質量改進領域的應用具體可分為以下四個方面:產品及工序質量描述、質量預測、質量分類、參數優化。粗糙集(Rough Set Theory,RST)、決策樹(Decision Tree,DT)、聚類算法(Clustering Algorithm,CA)、遺傳算法(Genetic Algorithm,GA)、支持向量機(Support Vector Machines,SVMs)、關聯規則(Association Rules,AR)、人工神經網絡(Artificial Neural Network,ANN)和模糊邏輯(Fussy Set Logistic,FSL)等常用的數據挖掘方法都廣泛應用于質量改進領域的全過程。
質量數據的數字化是數據挖掘在質量改進應用的重要方向,多被應用于對數據化的描述產品基本情況。Tseng等在電路板印刷制造業中焊點特征識別中使用粗糙集理論識別,并將發現的知識應用于電路板的生產。關聯規則被Chen等用于識別設備故障的根本原因。數據描述步驟中數據挖掘算法的主要作用是將采集到的復雜的數據轉化為數據挖掘算法能夠處理的數據,以因素識別、特征提取為主要手段,為算法做數據分析與知識抽取提供前提。經過質量數據的數字化描述后,質量預測變為可以直接實現的問題。采用適當的預測方法并優化算法參數能夠較為準確地預測制造業質量結論。對于不同數據應采用不同的或者混合的預測算法,往往能夠對解決問題起到決定性作用。
二、質量改進數據挖掘存在的問題
隨著大數據及物聯網時代的到來,質量改進問題也愈加復雜化。由于數據挖掘領域不斷有許多新技術的產生,基于數據挖掘技術的質量改進是當前研究的熱點問題。根據不斷變化的質量改進模型會產生相應的新技術,那么相應的新工作就亟待開展。當前,基于數據挖掘技術的質量改進問題的研究存在以下問題。
1.數據挖掘算法亟待改進。經典的數據挖掘算法對于當今質量改進問題存在效率低下問題。對于數據維度與數量都在增加的質量改進問題不僅經典的質量控制算法效率低下,就連常見的數據挖掘算法算法都出現效率低下問題。因此,海量數據與高維數據的數據挖掘問題成為了數據挖掘領域的一個新課題。
2.數據挖掘算法思路的確立問題。對于新問題提出新方法是常見的解決問題的思路,但是新方法往往通用性與易用性低于經典的算法。因此,將復雜的質量數據經過數據處理轉化為經典算法能夠有效處理的模型是一種使數據挖掘算法在質量改進上能夠煥發新的生機的思路。
3.數據挖掘算法的結合問題。當今問題需要的信息量大、數據復雜,往往使用一種算法不能達到解決問題的目的。如質量改進問題,是分類問題、預測問題和決策問題結合的混合問題。質量改進問題是多種數據挖掘算法協同完成的,方法之間是否能夠有機結合得到有效結論是當前數據挖掘算法需要解決的問題。
4.定量分析與定性分析的問題。數據挖掘算法經常是解決一類數據的數據挖掘問題,如最常見的算法都是解決數值數據的數據挖掘。但是,對于質量改進這一實際問題是混合數據位,需要定量與定性方法結合起來共同完成,或者定量與定性問題之間多次轉化才能到達最終目的。做到定量與定性分析相結合也是當前數據挖掘算法面臨的難題。
結語
本文闡明了大數據時代挖掘技術在質量分析及質量改進領域的研究背景和研究意義,介紹當前制造業質量改進的特點和難點,分析符合當今制造業數據特點的混合分類算法,闡述混合分類算法的優點,提出改進方向。根據混合分類算的特點,論述對其分類結果需要提出新的決策分析算法的必要性。
參考文獻:
[1] 鮑爾·克勞士比管理顧問中心.質量改進手冊[M].北京:中國城市出版社,2003.
[2] 秦現生.質量管理學[M].北京:科學出版社,2002.
[3] 韓家煒,坎伯.數據挖掘:概念與技術[M].北京:機械工業出版社,2001.