張 濤,張建曉,張林崗,劉方
(河南中煙工業有限責任公司 南陽卷煙廠,南陽 473000)
煙草生產企業在政策保護下,企業的經營思想較為落后、競爭意識不強、生產效率低、煙草質量較差[1-2]。為了使煙草生產企業能夠得到精心管理,增強自身的運營能力和質量控制能力,提高經濟效益,需要設計煙草生產制造控制系統。
目前相關領域學者針對煙草生產質量控制系統進行了研究。文獻[3]設計基于RFID 的智能化煙草生產自動控制系統,采用RFID 技術對控制因子的重要性進行識別,利用控制指標的一致性,求出各指標之間相關權值,與煙草生產的自動化控制方法相結合,實現煙草生產自動化控制。該系統控制效果好,但需計算每個控制指標的相對權重,計算過程較復雜;文獻[4]設計基于強化學習的煙草干燥過程控制優化系統,在PID 控制的基礎上,利用強化學習法構建智能系統模型,以數據為中心調整系統策略。該系統可有效控制煙草含水量,但未考慮對用戶權限進行管理,系統的安全性有待提升;文獻[5]提出基于熱分析圖譜的卷煙紙質量穩定性評價與分析方法,依據煙草的不同質量,采用NRMSE方法對煙草卷紙的差異程度開展評價,根據評價結果得知煙草內各個材料之間的差異度,通過對比不同的差異度得到影響煙草質量的主要因素,進而完成對煙草的分析及評價,該方法獲取的影響因素有限,評價性能有待提高。
為了解決上述方法中存在的問題,設計基于改進Apriori 算法的煙草生產控制系統。利用三維矩陣改進Apriori 算法,對數據集進行壓縮,提升系統的整體性能;對初始數據實行預處理操作,提升數據處理能力;采用改進Apriori 算法構建關聯規則,進行可信度計算,劃分煙草生產控制等級,完成基于改進Apriori 算法的煙草生產控制系統設計。
設計煙草生產控制系統之前,首先要設計一個用戶權限管理模塊,用戶進入系統前需要注冊,注冊后根據不同用戶設立不同權限,再在系統內實行不同的操作,設計的用戶權限管理模塊如圖1所示。

圖1 用戶權限管理模塊設計Fig.1 Design of user rights management module
依據圖1 可知,該功能模塊可以對系統內部的權限實行管理和設置,不同的用戶使用該系統時,系統就會自動給出不同的權限,根據不同的權限對應相應的操作流程,從而保障系統的安全性。
在整個煙草生產控制系統中,煙草生產制造數據管理模塊是該系統模塊設計的核心,主要具有2種功能,分別是對煙草生產制造數據的管理和用戶基本信息的管理[6]。在用戶權限管理模塊的基礎上,利用該模塊對煙草生產數據及用戶數據實行輸入和管理。若煙草生產數據在此期間發生變動,管理員可以利用自身權限對數據庫中的數據實行添加、刪除等操作[7],設計的數據管理模塊如圖2 所示。

圖2 數據管理模塊設計Fig.2 Design of data management module
設定規范且標準的質量檢測流程,以此確保檢測煙草生產制造質量的可靠性和精準性,具體的檢測設計圖如圖3 所示。

圖3 煙草生產制造質量檢測模塊設計Fig.3 Design of quality inspection module for tobacco production and manufacturing
完成煙草生產制造質量檢測后,需要對其制造質量實行評價。為了能夠更加精準地評價出煙草生產質量,在系統硬件中設計了質量評價模塊,具體設計結果如圖4 所示。

圖4 質量評價模塊設計Fig.4 Design of quality evaluation module
對質量評價前,首先要在數據庫中對煙草生產制造質量數據實行篩選,根據篩選結果設立最小支持度值與最小置信度值。再利用改進Apriori 算法對數據庫內的煙草生產制造質量數據的頻繁項集開展挖掘,根據獲取的數據關聯規則,挖掘質量評價數據,實現質量評價。
在煙草生產控制系統中有很多實際的項目,且各個項目內需要挖掘的數據有很多[8]。因改進Apirori算法可以通過一次性掃描數據集,達到對候選集Lk篩選的目的,具體過程如下所示:
設置煙草生產制造數據的元素體積為N,那么該元素的樣本方差[9-10]就標記為δ2。k 為樣本層級,假設在第k 層中包含Nk個煙草生產數據元素,那么各個煙草樣本的樣本均值為
依據式(1)抽取出大小為m 的煙草生產制造數據的隨機均值方差,標記為,方程表達如下:
基于煙草生產制造數據隨機樣本方差,采用改進Apriori 算法挖掘煙草生產制造數據,具體挖掘流程如圖5 所示。
基于改進Apriori 算法生成頻繁序列的具體流程如下所示:
優先對煙草生產制造質量關聯數據項集設置,標記為I={x1,x2,…,x8,y4,…,z1,z2,…,z8},而min_sup則為最小支持度閾值,煙草生產制造輸出數據I 中的頻繁序列標記為L。
(1)對煙草生產制造數據項集實行分塊處理,通過三維矩陣直接獲得頻繁數據集;
(2)根據得到的頻繁數據集,對劃分后的數據集開展掃描,從中取得煙草生產制造數據頻繁項集集合D 及其支持度;并對D 內的頻繁項開展支持度排序,且排序的順序為降序,排序結果為{L1,L2,…,Ln};
(3)集合全部頻繁項集,對其展開掃描,刪除關聯性小的數據,對數據庫進行精簡后,構成候選頻繁項集L,并從中尋找相應的關聯規則,提高頻繁項集的生成速度,為快速挖掘煙草生產制造數據奠定基礎。
依據Sup 最小支持度,采用改進Apriori 算法自動生成一個煙草生產制造的頻繁項目集,再通過最小置信度直接形成一個挖掘關聯規則,把獲取的煙草生產制造質量數據挖掘結果錄入到表格內,通過表格顯示出來,并生成數據報表。那么設計的改進Apriori 算法的數據挖掘具體工作流程如圖6 所示。

圖6 數據挖掘工作流程Fig.6 Data mining work flow chart
通過上述改進Apriori 算法挖掘流程,依據煙草生產質量評價管理研究成果,設置煙草中的總糖、總堿、糖堿比、氯、鉀5 種指標用作評價因子,而煙草初始化數據集為X={x1,x2,…,xn},x?N 關聯數據集為I={x1,x2,…,x5,y4,…,z1,z2,…,z5},特征向量為Y={y1,y2,…,yn},質量評價結果集為Z={z1,z2,…,zn},依據構建的關聯規則,對煙草生產制造質量進行可信度計算,將質量評價劃分成3 個等級,I 級單位代表最優質量,變量為Y1;II 級單位表示較優質量,變量為Y2;III 級單位表示較差質量,變量為Y3。通過改進Apriori 算法獲取煙草生產制造質量在不同支持度下的評價原則,將其劃分成不同的子集,以此對煙草生產制造質量樣本數據實行評價,完成基于改進Apriori 算法的煙草生產控制系統設計。
在Oracle 數據庫中選取500 個數據作為仿真數據,利用改進的Apriori 算法,對數據進行預處理。經過一次性掃描獲取煙草數據的頻繁項集,尋找對應的關聯規則,完成數據挖掘。采用改進Apriori 算法為方法1;文獻[3]中基于RFID 方法為方法2;文獻[4]中基于強化學習的方法為方法3,然后實行對比測試。
煙草生產制造過程中,它的化學成分對煙草的生產制造質量產生重要影響,其中,總糖、還原糖等指標與生產制造質量之間有著較強的相關性。為了能夠有效地驗證煙草化學成分與煙草生產制造質量之間的評價關系,選取總糖、總堿用作本次指標。
與上述指標相對應的評價函數分別表示為
式中:AS為平均值得分;A 為多次檢測后的算術平均值;AC為中心值;AV為閾值;e 為評價函數。
根據上述方程表達式,分別對還原糖與總堿的最佳范圍設定,再采用方法1、方法2 和方法3 獲取煙草還原糖及總堿的平均值,以此確認該方法的煙草成分是否處于最佳范圍內。若該方法的最終平均值在設定范圍內,說明該方法的質量評價效果強,反之則差。具體測試結果如圖7 所示。

圖7 不同指標的平均值對比測試Fig.7 Comparison test of average values of different indicators
通過圖7(a)中的數據發現,還原糖的最佳取值范圍在1.5~2.5 之間。從整體可以看出,隨著還原糖單位質量的不斷增加,方法1 的平均值在1.6~2.1之間,在設定的最佳范圍內,與方法1 相反的是,方法2 和方法3 的平均值范圍分別為1.0~3.1 和1.3~2.6,在測試期間的平均值忽高忽低,且在每項測試中均不處于最佳范圍內,由此可以看出方法1 的還原糖平均值最佳,也驗證了方法1 不會給煙草生產制造質量帶來影響。
分析圖7(b)中的數據發現,設置總堿的最佳范圍在2~3.5 之間,隨著總堿質量的增長,3 種方法的平均值都呈現出上升趨勢,方法1 煙草指標的平均值都處于最佳范圍內,這主要是因為方法1 設計了煙草生產質量檢測模塊,該模塊將煙草材料劃分成不同的種類對其實行檢測,使煙草材料都在最佳范圍,不會給煙草生產制造質量帶來影響,以此提升了系統的可靠性及檢測精度。
根據上述取得的煙草指標平均值,建立煙草質量評價方法,用方程表達式定義為
式中:Vi為指標一致性得分;V 為檢測標準偏差;VC為調整系數。
利用式(5)對3 種方法的煙草樣本數據實行計算,從中獲取3 種方法的煙草質量評價得分,利用獲取的得分與實際得分對比,以此驗證3 種方法的煙草質量評價效果,具體測試結果如圖8 所示。

圖8 三種方法的煙草質量得分與實際值對比測試Fig.8 Comparison test of tobacco quality scores and actual values using three methods
從圖8 中可以看出,3 種方法與實際評價得分之間的運動軌跡都存在一定的距離,但方法1 與實際值之間的距離最小,得分在80 分以上,同時方法1 的評價得分與實際值最貼近,而方法2 和方法3的評價得分范圍分別為40~55 分和50~65 分,兩種方法評價得分均與實際值相差較大。因為方法1 采用改進Apriori 算法,根據煙草生產制造的頻繁項目集,形成挖掘關聯規則后進行可信度計算,提高了煙草生產制造效果。
針對煙草生產控制系統設計方法存在的問題,設計了基于改進Apriori 算法的煙草生產控制系統。首先設計了系統硬件模塊,再利用改進Apriori 算法,挖掘煙草生產質量數據,以此實現煙草生產控制系統的整體設計。在仿真測試中,設計系統的還原糖、總堿平均值均在最佳范圍內,煙草質量得分與實際值相差最小,證明設計系統的煙草生產制造效果最好。