孫祥洪
(江西中煙工業有限責任公司信息中心,江西 南昌 330096)
隨著工業4.0時代的到來,大數據分析技術已然成為世界上不同行業信息傳遞與資源共享的潛力資源,各領域通過互聯網技術實現數據的傳遞[1]。例如在智能制造領域,隨著現代傳感自動化等先進技術的發展,通過智能化的感知、人機交互、決策和執行技術,實現了設計過程、制造過程和裝備制造的智能化。然而,現有的卷煙信息分析技術發展滯后,難以對卷煙的信息進行恰當處理[2]。
針對以上問題,國內外學者對于卷煙信息分析方法進行了廣泛探討與研究。文獻[3]采用模擬與數字監控技術實現了卷煙生產活動的動態監控,在煙草信息分析系統的基礎上建立預警機制。文獻[4]設計了卡方自動交叉預警流程,進一步加強了卷煙信息生產運作的控制力度,使異常數據的處理更加具有條理性。然而,以上2種方法的內核計算框架過于簡單、運行數據監測困難,存在局限性。文獻[5]采用1種局部異常因子算法分析異常卷煙數據,通過將數據點的局部密度與其k距離鄰域內的對象進行比較來推導出卷煙生產的異常程度。但當異常多維數據的維度之間存在相關性時,該算法檢測過程會經常失敗,且監測準確性較低。
本文針對現有技術的不足,在智能制造背景下,基于物聯網技術提出了1種卷煙信息采集與數據分析系統。該系統利用計算機算法模型實現卷煙數據信息的異常檢測,并在算法中加入主成分分析法,大幅提高了監測的準確性。
本文通過物聯網技術實現煙草數據信息的分析,提高了數據物聯控制和交互能力,并在智能制造背景下設計了卷煙信息采集與數據分析系統。卷煙信息采集與數據分析系統架構如圖1所示。

圖1 卷煙信息采集與數據分析系統架構圖
由圖1可知,系統首先對卷煙數據信息進行采集。采集內容包括卷煙生產日期、生產量、異常數據信息、正常數據信息等。在數據交互時,采用通用分組無線服務(general packet radio service,GPRS)轉換模塊實現數據信息的傳遞。采集服務器終端將這些數據信息傳送到協議中。卷煙異常數據通過模數轉換,經過路由器和防火墻或者通過GPRS網絡類型的通信機到達管理內網,進而傳送到數據存儲中心[6]。在數據存儲層,所有信息輸入至數據處理系統中。數據提取后經過結構化的方式進行儲存。與此同時,系統通過映射的方式處理卷煙信息數據庫中的異常生產類型的復雜非線性關系,并通過改進的局部矩陣重構檢測算法進行數據信息分析診斷和生產流水線異常位置的研判,使管理人員能夠實時地得出異常問題的解決方案[7-8]。分析后的數據信息通過遠程數據傳輸端口傳遞到數據監控系統進行監控,進而實現底層數據的物聯網傳遞。工作人員無需手工在各制造廠區進行人工檢測,即可實現底層卷煙數據的遠程監控。
在對現場卷煙數據信息進行分析和計算時,通常以AT91RM9200單片機為核心進行現場監控、數據監測、特征參量采集等,從而實現異常數據信息監控。卷煙數據信息故障檢測硬件架構如圖2所示。

圖2 卷煙數據信息故障檢測硬件架構示意圖
監控功能主要由AT91RM9200芯片核心處理器執行。該處理器設置有16 KB指令和16 KB數據Cache存儲模塊,以及Flash存儲器、液晶顯示器(liquid crystal display,LCD)控制器、接口控制器和串行控制器等。數據采集與計算是通過16路12位模擬數字轉換器(analog-to-digital converter,ADC)接口模塊實現的。該模塊嵌入式地采集數據信息,經DM9161芯片計算,通過微處理器將以太網媒體訪問控制器(Ethernet media access controller,EMAC) 接口以擴展的方式連接外部以太網接口RJ45,進而與工業以太網連接[9-10]以進行數據信息的通信,從而實現與外部設備DeviceNet的連接。采用的工業以太網為EtherNet/IP通信體系。AT91RM9200芯片計算單元在串行外設接口(serial peripheral interface,SPI)的作用下,通過改進局部矩陣重構檢測算法在上位機上對采集到的煙草圖像數據進行監測。攝像機監測采用比例積分微分(proportional integral differential,PID)控制器進行速度控制。該算法在對物體或零件進行驗證之前使用PID控制穩定時間。一旦處于穩定狀態,控制系統就啟動光電傳感器。其功能是在每次檢測到物體時提供拍攝信號和圖像捕獲功能。
本文使用的光電傳感器對應于用于非接觸檢測物體和材料的漫反射傳感器。該傳感器的功能是檢測物體或零件何時處于檢查區域,以便向通信卡發送確認信號。控制卡向相機發送1個觸發脈沖(觸發器)。相機保持幾微秒。有了這個信號,相機就可以拍攝到生產流水線上的卷煙生產過程,并開始進行圖像處理,以確定生產過程中卷煙數據信息是否存在異常。光電傳感器中信號通信采用混沌振蕩器。混沌波形的帶寬提高了信號對影響狹窄頻率范圍的干擾的魯棒性。混沌振蕩器電路如圖3所示。

圖3 混沌振蕩器電路示意圖
混沌振蕩器由電感電容(linductance capacitance,LC)諧振電路、公共基極放大器和反饋網絡組成。x(t)由諧振電路產生[11]。s(t)由反饋網絡產生。元件工作時,公共基極放大器作為電路的負電阻有效工作。通過反饋網絡對諧振電路的輸出進行采樣以產生s(t),將s(t)反饋到諧振電路中。振蕩器的基頻f由圖3中的C和L的值設置。對于18.4 kHz振蕩器,C=1 μF,L=150 μH。光電傳感器的通信信號需均衡控制。AT91RM9200芯片接收主要通過變頻器進一步的信號調理來實現。
變頻器結構如圖4所示。

圖4 變頻器結構圖
由圖4可知,整個變頻器由主控制電路和控制電路這2種電路組成。
主控制電路通過不斷地開關電子器件來實現卷煙圖像信息信號的變頻調節,從而對所有設備進行控制。控制電路主要有控制電源、鍵盤與顯示器、采樣電路、驅動電路等。電源穩定性要好。鍵盤與顯示器主要對信號指令進行操作。電流和電壓能夠在特殊情況下保護電路。驅動電路主要是為了控制逆變管,通過變頻器元件實現光電傳感器的高效、節能。
本文通過改進局部矩陣重構檢測算法模型,提高了卷煙數據信息的異常檢測能力。本文在該算法中融入主成分分析方法。主成分分析方法能夠將高維度數據信息轉換為低維度數據信息,比如卷煙數據信息集合為A=[x1,x2,…,xi,…,xn]。卷煙數據信息集合有n×p異常卷煙樣本矩陣,即n為卷煙數據樣本數、p為卷煙數據維度,則矩陣A的協方差矩陣可以表示為:
CO(A)=V(A)×D(A)×V(A)T
(1)
式中:CO(A)為卷煙數據信息協方差矩陣;V(A)為卷煙數據信息p×p正交矩陣;D(A)為p×p對角矩陣。
卷煙數據信息包括卷煙數據特征值λi(i=1,2,…,p)。其中,數據前h(h≤p)個最大特征值的累積貢獻率γh的表達式為:
(2)
采用主成分分析技術將卷煙數據信息降維后,其表達式為:
(3)
式中:Yh(A)為降維過程中異常卷煙數據的異常信息矩陣;Rh(A)為在卷煙數據信息降維過程中的異常卷煙數據信息;Vh(A)為p×h矩陣。
降維誤差通過式(4)進行計算。
(4)
式中:re(xi)為卷煙數據信息降維誤差;ri為卷煙數據信息中Rh(A)內的第i行數據信息。
本文將異常數據信息和正常數據信息通過離散分布的方式表示。
為了將正常卷煙數據信息劃分到1個數據系列內,這些正常點可以與主成分方向一致。在數據與主成分方向不一致時,這些數據則被認為是異常數據信息。
正常卷煙數據信息與異常卷煙數據信息區分如圖5所示。

圖5 正常卷煙數據信息與異常卷煙數據信息區分示意圖
判別過程如下。
①形成局部分布矩陣。假設CO為包含所有異常卷煙數據的集合,則被檢測的卷煙數據點P與故障數據信息點k之間的距離Nk(p)的表達式如下。
Nk(p)={o1(p),o2(p),…,oK(p)}
(5)
式中:K為故障信息點p與故障數據信息點k之間的所有距離,K=|Nk(p)|且K≥k;o為正常卷煙數據信息構成的信息矩陣[12]。
當被檢測的卷煙數據點p為異常數據時,則其局部分布矩陣M(p)為:
(6)

通過這種方法,可以找出與點p比較相似的k個領域點。
②對故障異常數據信息的特征值進行分解。M(p)的協方差矩陣假設為CO[M(p)]。其卷煙數據特征為:
CO[M(P)]=V[M(P)]×D[M(P)]×V[M(P)]T
(7)
式中:V為卷煙數據信息5×5正交矩陣,該正交矩陣構成矩陣中行列數據信息CO的特征向量;D為卷煙數據信息中的5×5對角矩陣,該對角矩陣中對角元素表示CO卷煙數據內的數據信息特征值(λp,1,λp,2,…,λp,5)。
(8)
式中:Vh為V的前h列數據,其特征值假設為5;Rh為降維后的卷煙數據信息局部分布矩陣。
卷煙數據信息降維對象p的局部降維誤差err的計算式為:
(9)
式中:rK+1為Rh內第(K+1)行數據信息;λp,i為所有卷煙數據信息中矩陣CO內第i大特征值;γh(p)為前h個主成分在所有主成分中的比例信息。
在對局部異常值進行計算時,L(p)為降維對象p和異常數據信息之間的差值。其表達式為:
(10)
式中:dist為點p與設置的標準故障數據信息節點k之間的距離。
假設不同的故障異常數據信息應用過程中,其內閾值設置為σ,則當L(p) >σ時,p被認為是異常卷煙數據。σ介于0~1之間。
為了驗證卷煙異常數據信息故障情況,試驗需要搭建計算平臺。該計算平臺通過5臺服務器(ThinkServer RD460×4、Dell R210II×1)組成計算機數據信息集群。服務器之間可以采用千兆交換機相連。本文假設在服務器上安裝Xenserver,并擬合出9個節點。2個虛擬機中央處理器(certral processing unit,CPU)核心安置到1個節點上。CPU型號為CPU i3-2120 3.30 GHz、內存3 GB、存儲250 GB;CPU E5-2609v2 2.50 GHz、內存7 GB、存儲300 GB。
試驗架構如圖6所示。

圖6 試驗架構圖
試驗采用比較的形式,實現數據信息的計算。本文選擇文獻[5]所采用的局部異常因子檢測算法作為試驗參照對象。試驗從試驗數據集中提取0~3 GB卷煙相關檢測數據,利用MATLAB軟件進行模擬仿真。
試驗檢測時間為40 s、采樣頻率為22.05 kHz。試驗結果匯總到數據表中。2種系統檢測性能對比如表1所示。

表1 2種系統檢測性能對比
本文將試驗結果導入Plant Simulation仿真軟件中,生成的誤差方法對比如圖7所示。

圖7 誤差方法對比示意圖
由圖7可知,當數據識別量在0~0.5 GB時,2種系統誤差相差不大。然而,隨著數據量不斷增大,文獻[5]系統的預測誤差越來越大,在3 GB卷煙數據時達到最大。此時,本文系統的檢測誤差為0.68%,文獻[5]系統的檢測誤差為0.86%。試驗結果表明,本文系統對卷煙異常生產信息的監測誤差最小,體現出本文系統的適用性。
本文從卷煙信息檢測與分析時間上開始評估,以文獻[3]與文獻[4]系統作為參照對象。本文采集相同的數據量以計算消耗時間。耗時對比如圖8所示。

圖8 耗時對比示意圖
由圖8可知,在同樣分析2 GB數據量信息時,本文系統耗時較小。隨著時間逐漸增多,本文系統表現出了明顯的技術優勢,耗費時間均比較少。因此,本文系統具有突出的技術優勢。
卷煙生產過程中,很容易出現多種數據信息。這些數據信息維度高、甄別困難。為了提高卷煙信息分析效率,本文以智能制造為背景、智能化制造為前提,實現了煙草數據信息的采集、傳遞和分析。本文在設計嵌入式數據采集系統時,將所有信息輸入至數據處理系統中,并將提取后數據以結構化的方式進行儲存。通過改進的局部矩陣重構檢測算法進行數據信息分析診斷和生產流水線異常位置的研判,有效地實現了高維度數據信息轉換為低維度數據信息,以便數據處理與計算。這大幅提升了數據分析能力。分析后的數據信息通過遠程數據傳輸端口傳遞到數據監控系統進行監控。通過試驗證實了本文系統的可行性,但在監測過程中發現信息采集裝置電源管理模塊存在供電不足的問題。未來會針對該問題作進一步優化與改進。