史成云 崔文波 崔汝念 鄒欣延
(紅塔煙草(集團)有限責任公司昭通卷煙廠,云南 昭通 657000)
通過PID 控制器和傳感器采集制絲生產線各工序中各生產要素數據。
1.2.1 刪除工序無關特征
根據采集到的數據,分析實際工藝流程中實際影響煙草水分控制的各因素。初步刪除對水分控制影響不大的部分特征,保留 “設備狀態”“設定加水流量”“設定熱風溫度”“A 組設定加料流量”“B 組設定加料流量”“循環風溫度設定”“A 組實際加料流量”“B 組實際加料流量”“實際循環風溫度”“實際加水流量”“實際熱風溫度”“加水累計量”“直噴蒸汽累計量”“直噴蒸汽實際流量”“直噴蒸汽設定流量”“批運行”“批次號”“配方號”“設定出口水分”“實際出口水分”“實際入口水分”“出口測溫儀溫度”“電子秤累計量”“電子秤實際流量”“電子秤設定流量”“A 模塊加料實際流量”“B模塊加料實際流量”“C模塊加料實際流量”“入口溫度”“入口濕度”“出口溫度”“出口濕度”“時間”“當前生產模塊號”共34 個特征。
1.2.2 刪除意義不明確,不具備解釋性的特征
進一步觀察數據,發現“批運行”特征只有1 個值,無意義;“作業號”取值為整數,表示當天的生產輪次,且存在19.29%的缺失值。刪除這兩個特征。
“A 組設定加料流量”“B 組設定加料流量”“A組實際加料流量”“B 組實際加料流量”“A 模塊實際加料流量”“B 模塊實際加料流量”“C 模塊實際加料流量”傳感器距離潤葉加料桶太遠,時滯不好計算,且加料過程是根據煙葉物料量、工藝要求和傳送帶速度等因素決定的一個均勻的添加過程,所以這些因素對煙葉生絲水分控制不產生直接影響,刪除這些特征。
“設定熱風溫度”“循環風溫度設定”“電子秤設定流量”的取值只有1 個,無分析價值。
“直噴蒸汽設定流量”雖然針對不同配方號的煙葉設定值不同,但對同一配方的煙葉在生產過程中設定值基本一致,且直接作用于煙葉的實際數值應該是“直噴蒸汽實際流量”,所以刪除“直噴蒸汽設定流量”特征,同理刪除“設定加水流量”特征。
1.2.3 刪除空采樣數據
每個批次的生產開始前,機器開機預備,控制器和傳感器此時亦會采集數據,此時的數據稱為空采樣數據。
空采樣:生產線未投入實際生產時,監測設備進行采樣稱為空采樣,此時獲取的數據稱為空采樣數據。
這些數據對后續分析會產生不必要的影響,刪除。
首先按照“配方號、批次號”將每一個生產輪次的數據分隔開,按照每一個生產輪次數據中“電子秤累計量”第1 個大于0 的數據作為標志,之前的數據看作是空采樣數據。
1.2.4 特征變化和添加
根據煙葉制絲生產的工藝原理,和傳感器實際作用,對部分會影響到煙葉生絲含水率并可以推算的特征例如“電子秤瞬時量”“加水瞬時量”“蒸汽瞬時量”特征,“入口溫度”“入口濕度”“出口濕度”“出口溫度”分別取其平均作為環境溫濕度數據。
對按照“批次號”和“配方號”分割后的數據分別進行計算。
為方便后續表達,對特征名稱進行簡化:
“實際加水流量”:“實際加水流量”。
“實際熱風溫度”:“實際熱風溫度”。
“加水累計量”:“加水累計量”。
“直噴蒸汽累計量”:“蒸汽累計量”。
“直噴蒸汽實際流量”:“蒸汽實際流量”。
“電子秤累計量”:“電子秤累計量”。
“電子秤實際流量”:“電子秤實際流量”。
“出口測溫儀溫度”:“出口溫度”。
“當前生產模塊號”:“當前模塊”。
1.2.5 時滯數據對齊
在回潮工序共產生了兩處時滯:一是煙葉物料從電子秤經過到進入滾筒開始噴水的時滯,此處的時滯通過判斷每個批次生產數據中實際加水流量和加水累計量均大于0 的第一個數據行作為標志,計算時滯[1];二是煙葉物料入滾筒后到出滾筒的時滯,從數據觀察很難找到統一的標志信息,根據現場多次人工實測定義該時滯[2]。
1.2.6 異常數據查找和刪除
設定條件:(1)整個生產批次的實際出口水分最大值小于10[3];(2)整個批次中采樣數據時間間隔超過2 秒;(3)整個生產批次均沒有實際加水流量和加水累計量均大于0 的記錄[4]。

圖2
符合以上三個條件中的任何一個批次的數據都屬于異常數據,刪除數據。
1.2.7 去除料頭料尾數據
料頭和料尾因為物料量不穩定,對應傳感器檢測值有較大誤差,會影響到數據分析。根據生產工藝相關要求前120 公斤物料看作是料頭,時移對齊后出現空值的行看作是料尾,加水瞬時量或電子秤瞬時量為0的數據也看作是料尾。
將上述清洗后的數據,重新拼接成一個大的數據集后考察特征之間的相關性、共線性等因素進行特征選擇[5]。
從總體數據來看,各特征和實際出口水分的相關系數如圖1。

圖1
按照不同配方分別分析不同特征和實際出口水分之間的相關性,可以觀察到不同配方的煙葉物料在生產過程中,環境溫濕度和實際出口水分的相關性有明顯變化。