林濤 葛玉敏 安玳寧



摘 要:提出一種基于RBF神經網絡的數據挖掘方法,將RBF神經網絡應用于數據挖掘的分類和預測中,解決鋼構件過程中的性能預測問題。其中用黃金分割法確定基于RBF神經網絡的隱層節點數,減少該算法的計算復雜度,最終將其應用于某鋼鐵企業質量控制系統。構建對鋼構件質量檢測的數據挖掘及質量追溯平臺,該平臺是基于RBF神經網絡的數據挖掘技術的。實際應用證明,產品的質量合格率可達到96.27%,符合國家相關的標準和技術指標。
關鍵詞:數據挖掘;徑向基函數神經網絡;黃金分割法; 質量追溯
中圖分類號:TP399 文獻標識碼:A
Abstract:To solve the performance prediction problem in the steel production process, this paper presentsed an approach which is based on RBF neural network data mining method and uses RBF neural network in classification and prediction of data mining. The hidden layer nodes of the RBF neural network were determined by the golden section method to reduce the computational complexity of the algorithm, which were applied to a steel enterprise quality control system. Finally, a platform of data mining and quality retrospective, which is based on RBF neural network data mining technology,was constructed in product quality testing in steel companies. Practical application shows that the qualified rate of products can reach 96.27%, in line with national standards and technical specifications.
Key words:data mining; radial basis function neural network;golden section method; qualitytraceability
1 引 言
在國家“全面提高信息化水平,推進信息化與工業化深度融合”的大環境下,有效的將信息技術、企業先進制造技術與現代管理技術進行結合,使得企業在生產經營過程中產生了海量數據。激增的數據背后隱藏著許多重要的信息,如何從大量的數據中提取并找到有用的信息以指導決策,是迫切需要解決的問題[1,2]。
鋼構件的生產、加工、成型及實際應用的過程中涌現出企業決策的不確定性和不可預測性,大量結構化和非結構化數據,加劇了企業決策的風險。如何有效地收集數據、洞察數據,如何將數據轉化為知識、將知識付諸于行動,已經日益成為企業經營者難以把控的課題。
由于神經網絡對噪聲數據的高承受能力和高容錯能力使得神經網絡在數據挖掘領域的應用得到人們的重視,但是具有結構復雜、可解釋性差、訓練時間長等缺點。針對這些問題本文介紹了基于RBF神經網絡的數據挖掘技術構建的鋼構件企業成品質量檢測的數據挖掘及質量追溯平臺,并且應用黃金分割法確定RBF神經網絡的隱層節點數,減少了該算法的計算復雜度,進而簡化RBF神經網絡算法,使其更能滿足大型企業數據挖掘的需求,提高工作效率。
2 數據挖掘技術
數據挖掘(DM: Data Mining.),也稱為數據庫中的知識發現KDD(Knowledge Discovery in Database),是源于大型零售商在面對決策支撐問題提出的,是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程[3]。它匯聚了數據庫、人工智能、機器學習、統計學、可視化技術、并行計算機等不同學科和領域的知識;借助了多年來數理統計技術及人工智能等領域研究成果構建起自己的理論體系;利用了數據庫技術對數據進行前端處理,應用機器學習方法從處理后的數據中提取有用的知識,并對數據背后隱藏的特征和趨勢進行分析,最終給出關于數據的總體特征和發展趨勢;運用了可視化技術將人的觀察力和智能融入系統,用直觀圖形將信息模式、數據的關聯或趨勢呈現給決策者,使用戶能交互式地分析數據。
數據挖掘大體分為三個步驟:目標數據收集采樣、數據處理再加工和數據輸出與結果分析。數據挖掘就是尋找隱藏在數據中的如趨勢、模式及相關性的信息。數據挖掘屬于數據庫中的知識發現(KDD)的一部分。它的本質就是學習過去經驗的簡單過程。圖1是知識發現過程的簡單流程。
4 鋼構件質量檢測和追溯系統
現階段冶金行業的運營特點趨向于嚴格的冶金產品質量規范,產品要進行全過程的質量跟蹤和嚴格的質量檢測,并為客戶開具質量保證書??梢姡|量管理在鋼鐵冶金行業中占據著越來越重要的地位。質量檢測是實現質量管理的核心環節,只有精確地檢測并分析出產品判廢原因并進行質量追溯,才能把成品質量控制在最佳水平。為了更精確、更智能的進行質量檢測工作,本文將RBF神經網絡應用于數據挖掘的分類和預測中,把二者結合起來解決鋼構件生產過程中的性能預測問題,以此構建了基于RBF神經網絡的鋼構件成品質量檢測的數據挖掘及質量追溯平臺,該平臺將某鋼鐵企業中鋼構件生產過程中的數據采集和質量控制系統歷史數據庫的海量數據作為目標信息源,進行數據清洗和相關性分析,減少數據噪聲、刪除與任務無相關的數據,建立挖掘數據庫。而數據挖掘自動在數據庫中尋找預測性信息,迅速直接由數據本身得出結論。
目前的鋼構件檢測技術基本上是將化學性能、物理性能、尺寸精度和表面質量分開檢測,而化學性能和物理性能基本滿足單方向相關聯的關系,即產品的化學元素含量直接影響到產品的物理性能各項參數。因此,在對鋼構件產品的物理性能檢測時,可利用成品的化學物理性能相關性,通過RBF神經網絡對化學參數的處理后,預測該產品的物理性能,從而簡化了物理性能的檢測環節,大量節省了人力物力并節約了檢測成本。然而,數據挖掘的結果是不確定的,要和專業知識相結合才能對其做出判斷,因此要結合質量追溯對結果進行深刻的分析,理解數據,了解其過程,才能對數據挖掘的結果找出合理的解釋。因此對鋼構件產品化學性能、物理性能、表面質量、尺寸精度的數據挖掘可按照以下流程進行:
依據上圖,僅以鋼構件的化學成分為例進行說明。對構件鋼的化學分析用試樣取樣法以及成品化學成分允許偏差檢測采用GB222—84標準。鋼種產品牌號為Q295,A級鋼,抽取了200組型鋼產品的樣本進行該平臺的測試,首先從目標信息源即數據采集和質量控制系統歷史數據庫的海量數據中獲型鋼的化學成分數據,具體如下表1。
然后采用RBF神經網絡進行數據挖掘,將數據集分為兩組,一組用來訓練RBF神經網絡,一組用來測試RBF神經網絡。為很好考察網絡的泛化能力,要保證測試數據和訓練數據無交集。此外,為了防止所有數據的數據沖突問題,將數據倉庫與挖掘數據庫分開設置。設置二級數據庫為數據倉庫,里面包含所有從生產線采集的數據;數據挖掘庫為三級數據庫,它是數據倉庫邏輯上的一個子集,二級數據庫是三級數據庫的數據源,三級數據庫從二級數據庫挖掘篩選出需求數據。經過RBF神經網絡對38個化學參數的處理后,預測該產品的物理性能,最后對化學成分數據、物理性能數據、尺寸精度數據和表面質量參數進行綜合判定后的判定結果進行結果分析,判定結果以C#完成的界面人性化顯示如圖5.具體結果分析如表2。經過此成品質量檢測的數據挖掘及質量追溯平臺來進行產品質量控制,鋼構件產品的合格率可以達到96.27%。
5 結 論
本文將RBF神經網絡應用于數據挖掘的分類和預測中,把二者結合起來解決鋼構件生產過程中的性能預測問題,并結合質量追溯對數據挖掘結果進行詳細分析解釋。其中,在預測網絡的選擇上綜合考慮鋼構件企業產品性能特點,選用結構相對簡單的RBF前饋神經網絡,同時對鋼構件產品進行預測和檢測兩項工作,將數據挖掘技術深入到企業生產過程中,最終構建了成品質量檢測的數據挖掘及質量追溯平臺,經過此對產品進行質量控制,使得鋼構件產品的質量符合國家相關的標準和技術指標。
參考文獻
[1] Caiyan, Liu, and Sun Youfa. Application of data mining in production quality management[J].Proceedings of the 3rd international conference on Intelligent information technology application. IEEE Press, 2009.
[2] 儲兵, 吳陳, 楊習貝. 基于 RBF 神經網絡與粗糙集的數據挖掘算法[J]. 計算機技術與發展, ISTIC, 2013. 23(7):50-58.
[3] 宮曉曼, 滕榮華.基于神經網絡的數據挖掘在煤礦選煤中的應用[J]. 煤炭技術, 2013. 32(009):127-128.
[4] 趙婧宏,潘維民.人工神經網絡算法在數據挖掘中的應用[J].中國科技論文在線.
[5] 王行甫,覃啟賢,程用遠,等.一種改進的徑向基神經網絡預測算法[J].計算機系統應用,2012,(21)8:2-4.
[6] 李勁松.數據挖掘技術在鋼企質量成本管理中應用研究[J].科技導報,2009.
[7] SPINOLA C., et al. "Image processing for surface quality control in stainless steel production lines." Imaging Systems and Techniques (IST)[J].2010 IEEE International Conference on. IEEE, 2010.
[8] 尉永青.數據挖掘技術在入侵檢測系統中的應用研究[J].信息技術與信息化,2005:95-96.
[9] 林鋼.基于數據挖掘的前向型神經網絡在交通流時序預測中的應用[D].南京:東南大學,2004.
[10]周濤,陸惠玲.數據挖掘中聚類算法研究進展[J].計算機工程與應用,2012,(48)12:40-46.
[11]Shen, Wei, et al.Forecasting stock indices using radial basis function neural networks optimized by artificial fish swarm algorithm[J].KnowledgeBased Systems 24.3 (2011): 378-385.
[12]Cios, Krzysztof J., Witold Pedrycz, and R. M. Swiniarsk.Data mining methods for knowledge discovery.Neural Networks[J].IEEE Transactions on 9.6 (1998): 1533-1534.
[13]Buchtala, Oliver, Manuel Klimek, and Bernhard Sick.Evolutionary optimization of radial basis function classifiers for data mining applications.Systems, Man, and Cybernetics, Part B: Cybernetics[J].IEEE Transactions on 35.5 (2005): 928-947.