林宗繆 唐 浩
(上海市質(zhì)量監(jiān)督檢驗技術(shù)研究院 上海201114)
近年來,因網(wǎng)絡媒體發(fā)展,各種產(chǎn)品質(zhì)量安全問題引起廣泛的輿論討論。例如:校園毒跑道、毒地板、毒校服等。一次次產(chǎn)品質(zhì)量安全事件都給我們的質(zhì)量監(jiān)管部門敲響了警鐘——如何更科學有效地監(jiān)管產(chǎn)品質(zhì)量安全?產(chǎn)品檢驗檢測機構(gòu)每年積累了海量的產(chǎn)品質(zhì)量檢測數(shù)據(jù),大量的產(chǎn)品質(zhì)量信息包含在其中。如何利用質(zhì)量檢測數(shù)據(jù)進行數(shù)據(jù)挖掘去預測產(chǎn)品質(zhì)量風險具有重要的社會意義。
傳統(tǒng)的數(shù)據(jù)挖掘方法面對質(zhì)檢大數(shù)據(jù)時,效率低下,無法及時有效地獲取預警結(jié)果。需要建立一種有效的數(shù)據(jù)挖掘模型對產(chǎn)品檢測數(shù)據(jù)進行分析,利用質(zhì)檢大數(shù)據(jù)為產(chǎn)品安全動態(tài)檢測提供支持,為產(chǎn)品風險監(jiān)測和預警提供決策依據(jù)。由于產(chǎn)品安全檢測數(shù)據(jù)信息量比較大,更新快,每日產(chǎn)生的大量產(chǎn)品檢測數(shù)據(jù)需要進行挖掘,因此對質(zhì)量風險模型提出了并行化、非線性化的要求。
人工神經(jīng)網(wǎng)絡ANN是一種模擬生物神經(jīng)網(wǎng)絡的計算模型。ANN通過反復訓練逼近目標函數(shù),具有并行處理、離散性和自學習特點。這種算法可以對大數(shù)據(jù)進行大規(guī)模非線性運算,適合建立學習與預測模型[1~3]。BP反向傳播神經(jīng)算法是一種常用的訓練人工神經(jīng)網(wǎng)絡的方法,BP算法非常適合進行機器學習和訓練模型。但BP算法在擬合非線性函數(shù)時容易收斂局部最優(yōu)而非全局最優(yōu)且收斂速度慢,而遺傳算法可以解決非線性和多維空間尋優(yōu)問題[4~5]。本文基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡提出一種產(chǎn)品質(zhì)量風險預警模型,對產(chǎn)品質(zhì)量安全進行有效的預測。
BP神經(jīng)網(wǎng)絡算法是一種基于誤差反向傳播的多層感知器,通過反向誤差算法調(diào)整權(quán)值向量,很好地解決了非線性問題[6~8]。BP三層網(wǎng)絡拓撲如圖2所示。

圖2 遺傳算法流程圖
輸入向量為X=(x1,x2,…,xn),隱層輸出向量為H=(h1,h2,…,hm),輸出層向量為Y=(y1,y2,…,yk),期望輸出向量為D=(d1,d2,…,dk),輸入層到隱層之間的權(quán)值矩陣用V表示:V=(v11,v12,…,vnm),隱層到輸出層之間的權(quán)值矩陣用W表示為W=(w11,w12,…,wmk)。激活函數(shù)f(x)為Sigmoid函數(shù)

圖1 BP三層網(wǎng)絡結(jié)構(gòu)圖
BP算法以網(wǎng)絡誤差為目標函數(shù)、采用梯度下降法來計算目標函數(shù)的最小值[9~10]。誤差反向傳播是將誤差隱層逐層求導梯度下降,計算修正權(quán)值。通過反復學習,權(quán)值不斷調(diào)整,誤差最終調(diào)整到可接受的范圍,達到預期目標。
遺傳算法(Genetic Algorithm)是模擬自然界的生物進化過程,在全局中求最優(yōu)值的算法。首先隨機初始化一個群體,用適應度函數(shù)評估每個個體的適應度[11~13]。用選擇函數(shù)擇優(yōu)選擇,再進行交叉產(chǎn)生子代,對子代進行變異,重復循環(huán)直到求出最優(yōu)解。遺傳算法使適應度高的個體有較大機會產(chǎn)生后代,后代就會越來越多,而適應度函數(shù)是最優(yōu)值求解目標函數(shù)的正相關(guān)函數(shù),因此經(jīng)過逐代的遺傳優(yōu)化求得最優(yōu)解。
BP神經(jīng)網(wǎng)絡算法求值時存在局部最優(yōu)和收斂速度慢的缺陷,可以通過遺傳算法對BP神經(jīng)網(wǎng)絡算法的初始權(quán)值和閾值進行優(yōu)化。GA-BP神經(jīng)網(wǎng)絡算法具有更優(yōu)的目標值預測性,具體流程如下:隨機生成初始一個種群,種群里的個體對應BP神經(jīng)網(wǎng)絡的初始權(quán)值和閾值,以BP網(wǎng)絡的輸出值與預期值的差值作為適應度函數(shù),通過選擇、交叉、變異,重復循環(huán)求出最優(yōu)值,從而得出BP神經(jīng)網(wǎng)絡初始權(quán)值和閾值[14~15]。對優(yōu)化后的BP神經(jīng)網(wǎng)絡的進行正向反向訓練,建立預測模型。

變異操作:第m個個體的第l個基因xml進行變異操作方法如下:

xmax為基因xml的上界,xmin為基因xml的下界,k為當前迭代次數(shù),Kmax為最大進化次數(shù),r為[0,1]間的隨機數(shù),λ為一個隨機數(shù)。
產(chǎn)品質(zhì)量風險預警模型采用定性和定量相結(jié)合的方法對產(chǎn)品進行綜合風險分析,評估步驟如下。
1)以不合格的檢測項目作為風險因子,將不合格率按20%為一級,劃分五個等級。根據(jù)表1,確定x值。

表1 風險因子發(fā)生的可能性(x)等級劃分及說明
2)將風險因子對風險的影響程度分為5個等級并對各等級賦值,如表2所示。

表2 風險因子的影響程度(y)說明
3)邀請來自產(chǎn)品質(zhì)量安全、風險評估領(lǐng)域的多名專家,依據(jù)專家分析和評估,給風險因子對風險發(fā)生的影響程度進行評估并按表4的說明打分,以平均分作為評級依據(jù),確定y值。
4)依據(jù)專家分析和評估,確定m和n的值(m+n=1),將風險等級劃分為不同檔,定義風險等級與量化值(Z)之間的對應關(guān)系。

式中Z為風險等級值,m為風險因子可能性的權(quán)重值,n為風險因子影響程度的權(quán)重值,x為風險因子發(fā)生的可能性,y為風險因子的影響程度。
5)根據(jù)1)至4)步驟計算出風險等級值,按照風險因子發(fā)生的可能性和風險因子對風險造成的影響程度構(gòu)建風險等級劃分矩陣,如表3所示。

表3 風險等級劃分矩陣
6)選取最高風險等級值的風險因子,根據(jù)風險等級劃分矩陣,確定產(chǎn)品的風險評估的風險等級。
基于GA-BP神經(jīng)網(wǎng)絡算法對產(chǎn)品質(zhì)量預警模型進行設計與訓練,確定輸入層向量、隱層節(jié)點數(shù)和權(quán)值、輸出層向量、激活函數(shù)。
1)輸入層向量。產(chǎn)品質(zhì)量風險預警需要輸入多種產(chǎn)品質(zhì)量檢測項目,而檢測項目對產(chǎn)品質(zhì)量的影響程度不同,因此提取影響產(chǎn)品質(zhì)量的關(guān)鍵檢測項目作為BP神經(jīng)網(wǎng)絡的輸入向量。
2)隱層設計。隱層設計為1層,4個節(jié)點數(shù),節(jié)點分別對應專家的風險評價(風險因子發(fā)生的可能性值x、風險因子的影響程度y、風險因子可能性權(quán)重值m、風險因子影響程度權(quán)重值n)。
3)輸出層向量。質(zhì)量安全風險評估結(jié)論,3代表高危險,2代表中危險,1代表低危險,0代表無風險。
4)激活函數(shù)。選擇單極性S型Sigmoid函數(shù)。該函數(shù)是兩邊平坦,中間連續(xù)可微變化,適合作為激活函數(shù)。
智能門鎖是通過無線網(wǎng)絡、NFC、現(xiàn)代生物學或光學、遠程操控等技術(shù),在產(chǎn)品安全性、用戶識別、管理性方面更加智能化簡便化的產(chǎn)品。智能門鎖存在數(shù)據(jù)泄密風險、重放攻擊、指紋破解、通訊安全等方面存在安全風險。我們基于上述的GA-BP神經(jīng)網(wǎng)絡風險預警模型對智能門鎖進行風險預警實驗。
我們從上海市質(zhì)檢院的風險監(jiān)測數(shù)據(jù)庫里采集了智能門鎖的風險監(jiān)測數(shù)據(jù)220個產(chǎn)品紀錄,共4620條檢測項目數(shù)據(jù)。抽取200個產(chǎn)品記錄做為訓練樣本,20個為預測樣本。輸入因素選擇防暴力開啟、RFID開鎖安全性、防破壞報警、敏感信息保護、數(shù)據(jù)加密傳輸、安全掃描、反編譯、網(wǎng)絡安全等21項檢測項目進行綜合評級。項目的檢測結(jié)果預處理為合格和不合格。檢測結(jié)果如表4所示。

表4 聯(lián)網(wǎng)智能門鎖項目檢測結(jié)果匯總分析表
算法參數(shù)的初始設置。GA-BP算法參數(shù)設置為輸入21,隱層節(jié)點數(shù)為4,輸出節(jié)點為1,遺傳種群規(guī)模為20,遺傳代數(shù)為40,交叉概率為0.5,變異概率為0.3。在Matlab上建立BP神經(jīng)網(wǎng)絡模型,編程實現(xiàn)基于GA-BP神經(jīng)網(wǎng)絡優(yōu)化模型。使用訓練樣本對模型進行訓練。
預測結(jié)果分析如圖3、圖4所示,基于遺傳基因算法的BP神經(jīng)網(wǎng)絡在訓練次數(shù)的收斂次數(shù)上有了較大的提高,GA-BP的收斂速度是BP的兩倍,提高了訓練速度。預測誤差上,GA-BP對產(chǎn)品質(zhì)量風險預警的準確度達到85%,相較于優(yōu)化前的BP模型的準確度75%,GA-BP神經(jīng)網(wǎng)絡也有具有明顯優(yōu)勢。因此本文提出的基于GA-BP神經(jīng)網(wǎng)絡產(chǎn)品質(zhì)量風險預警方法能更高地對產(chǎn)品風險進行預警。

圖3 GA-BP與BP訓練次數(shù)比較

圖4 GA-BP與BP預測誤差比較
本文建立了一種基于GA-BP神經(jīng)網(wǎng)絡的產(chǎn)品質(zhì)量風險預警方法,將優(yōu)化的神經(jīng)網(wǎng)絡算法應用于產(chǎn)品質(zhì)量大數(shù)據(jù)的質(zhì)量風險預警中,通過實驗表明這種質(zhì)量預警模型收斂速度快,準確率高。優(yōu)化后的遺傳神經(jīng)網(wǎng)絡的準確率提高了10%,收斂速度提高了一倍。該方法有助于為產(chǎn)品質(zhì)量監(jiān)管部門提供質(zhì)量風險預警提示。