


摘要:文中介紹的潤葉加料系統控制方法是利用機器學習中的線性回歸方法進行技術實現的,簡要說明了該控制方法的原理和結構。著重討論了潤葉加料系統的數據架構,以及機器學習的算法,詳盡地闡述了利用此設計的實用性,可靠性,能很好地滿足煙草工業生產要求,大大降低了人為干預,提高了設備的智能化與自動化。
關鍵詞:機器學習;線性回歸;潤葉加料系統;智能制造;數據建模;Python
一、引言
制絲線潤葉加料是卷煙的一道關鍵工序,工藝過程為煙葉進入潤葉滾筒期間,通過加料噴嘴,加水噴嘴,蒸汽管路對煙葉進行加料,加水,加溫工序,使煙葉滿足規定的工藝含水率,工藝溫度,工藝加料量后,進入下一步工序。然而,潤葉加料工序還處于人為控制的操作方法,含水率、溫度等關鍵工藝指標需要通過直接調整閥門開度進行調整,造成人員動作浪費、影響工藝質量等問題。
在潤葉加料工序中,煙葉含水率主要依靠設備的PLC控制系統,采用PID調節算法來進行控制,但在實際生產過程中仍然存在一些問題,例如PID調節速度過慢,無法在生產開始時快速計算出所需的各種閥門開度,導致干頭或濕頭等問題;例如控制調節不當,產生波浪形水分,大大影響標準偏差。
因此基于上述問題,在設備開機前,操作人員通過人為干涉閥門開度,通過手動開機方式對頭煙進行干預,待出口水分,出口溫度穩定后再將其切會自動生產,以保證工藝質量達到合格標準。
應用Python中的TensorFlow框架,對歷史數據進行機器學習,應用多元線性回歸對潤葉加料各關鍵參數進行建模,并通過劃分數據集對模型進行測試驗證,最后通過輸入實際參數,通過模型獲取閥門開度等輸出控制結果。
試驗表明了潤葉加料設備參數的可觀測性,能夠通過入口水分,料葉溫度,出口水分設定值,出口溫度設定值,煙葉流量,加料比例等輸入值精準快速定位加水閥門開度,增溫閥門開度等輸出值,充分實現智能化,自動化特性。現場應用后可以降低員工勞動程度,提高產品質量和穩定性。
二、對歷史數據進行整合
由于技改設計等原因,存在多個數據庫對歷史數據進行存放,因此我們需要對數據進行篩選提取,并匯總到自己的數據庫中,為方便建模,數據采用均值方式保存,其中的關鍵變量包含如下:牌號,開始時間,結束時間,入口水分,出口溫度,工藝流量,加料比例,料液溫度,出口含水率,加水PID控制值,加溫PID控制值,車間溫度,車間濕度。部分數據如表1所示。
三、獲取數據以及數據處理方法
本設計采用Python編程語言進行代碼處理,數據獲取方式使用pandas庫進行獲取,并將獲取的數據保存為DataFrame數據結構。DataFrame是一種表格型數據結構,既有行索引,也有列索引,它可以看作是由Series組成的字典,不過這些Series共用一個索引。對于表內存在的空缺數值Nan,直接使用dropna方法對其進行舍棄處理。
三、特征抽取及特征預處理方法
根據字典信息可以知道,牌號字段屬于文本特征,處理該特征方法可以使用One-Hot編碼。One-Hot編碼是分類變量作為二進制向量的表示。這首先要求將分類值映射到整數值。然后,每個整數值被表示為二進制向量,保證每個樣本中的單個特征只有1位處于狀態1,其他的都是0。其他字段如入口水分、出口溫度,則屬于有量綱表達式,需要進行無量綱化處理,采用歸一化將數據特征值轉換到同一量綱下把數據映射到[0,1],消除實際過程中的單位,從而簡化計算。代碼如下:
result_real = np.array(result_real)
transfer = MinMaxScaler(feature_range=(0, 1))#歸一化處理
result_real = transfer.fit_transform(result_real)
四、數據集劃分
為驗證模型的準確性,我們需要將數據集D按照比例劃分為兩個集合,其中一個集合作為訓練集S,另一個集合作為測試集T,即D=S∪T,S∩T=。在S上訓練出模型后,用T來評估其測試誤差,作為對泛化誤差的估計。通過調用sklearn中的train_test_split按比例劃分訓練集和測試集,通常為25%/75%分樣比例。代碼如下:
X = preprocessing.scale(X)
Y = cop[['出口溫度PID控制值']]
x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size=0.25, random_state=10)#劃分數據集
五、線性回歸建模
線性回歸基本公式為:y=w1x1+w2x2+w3x3…wnxn+bi,其中xi(i= 1,2... n)為每個樣本的n個特征值,w為權重系數,bi為偏置系數。把這些每一行的疊加起來就成了一個向量或者矩陣,所以引入矩陣的表示為:
根據公式可以得出,y1為加水PID控制值,y2為加溫PID控制值,x分別為牌號、入口水分、出口溫度、工藝流量、加料比例、料液溫度、出口含水率等,因此,本次建模目的為求出權重系數w與偏置系數bi。
六、構造損失函數
根據均方誤差表達式:
可以得到,損失函數:
Loss=
其中,y_ture 是真實值,y_predict是預測值。y_predict=wX+bi,既w與bi初始值為隨機數,得到損失函數后,則可以進行下一步優化損失,尋找最優的權重與偏置。
七、優化損失
首先根據數學公式:W1=W0+αJ(w),α表示學習率,J(w)表示求導函數。
優化損失顧名思義,就是找到最小損失量,如圖1所示。
最低點為損失最小點,只需求出該點即可得到最優的權重系數與偏置系數。
在TensorFlow框架中,通過GradientDescentOptimizer(learning_rate).minimize(loss_function)方法可以創建梯度下降優化器,尋找最優值,其中learning_rate為學習率取值0.01,loss_function為損失函數。通過多次迭代后求解(迭代次數train_epochs=50)。
部分代碼展示如圖2所示。
代碼運行結果如圖3所示。
通過計算損失函數可以看出,損失函數為2.132,說明損失不大,完全滿足建模需求,模型權重系數w與bi如程序輸出所示,并進行預測值與真實值進行參考比較,最后將結果反饋給PLC,達到控制設備的效果。
八、與PLC進行數據通信
本次使用的PLC為羅克韋爾ABPLC,型號為5573,采用1756-ENBT網卡進行通訊,Python可以通過下載PyLogix庫進行PLC訪問,安裝方法為-在Python命令行下輸入PIP3 Install PyLogix。通過調用庫函數可以對PLC標簽的讀寫,從而達到訪問PLC的目的。
九、結束語
針對制絲線增溫增濕類的工序,從理論上均可以采用線性回歸的模型進行分析預測,通過簡單的機器學習,可以建立相應的回歸模型,并用于指導生產,確定開機前的各類參數,以達到自動開機的效果。經過一段時間的生產驗證,人工參與率由原來的80%下降至20%,基本實現無人開機效果,對智能化,自動化生產有著重要的指導意義。
作者單位:李云豪? ? 廣西中煙工業有限責任公司 南寧卷煙廠
參? 考? 文? 獻
[1]梁魏峰.烘絲控制模式的建立與實現[J].煙草科技,2003(2):16 -17.
[2]張益鋒.GARBUIO烘絲機負壓穩定性控制優化[J].中國科技縱橫,2013(4):245.
[3]楊明權.改進HAUNI烘絲機控制模式降低烘絲干頭干尾量[J].煙草科技,2005(8) 6 — 7,9.
[4]王惠文,孟潔.多元線性回歸的預測建模方法[J].北京航空航天大學學報,2007(4):500-504.
[5]李永華,姜 麟,劉秀明,等.六西格瑪與多元線性回歸模型在煙絲含水率設計中的應用[J].科技和產業,2014(8).