王碧嶠 張梅 王靜 姜曉巍 李敏 王玲玲 張舒暢







摘要: 針對棉織物在靛藍染色時染色工藝條件對染色深度的非線性影響,導致染色深度難以控制,不符合客戶要求的問題,文章選取氫氧化鈉濃度、保險粉濃度和靛藍染料濃度三個主要影響因素作為輸入變量,表觀顏色深度(K/S值)作為輸出變量,采用Python語言進行編程,以混沌算法進行尋參,應用最小二乘支持向量機(LSSVM)算法建立了靛藍染色預測模型,并對模型的預測性能進行了驗證。結果表明:該模型對織物K/S值預測的平均絕對百分比誤差為1.759 7%,均方根相對誤差為0.029 4%,比網格尋參法的預測誤差更小,說明該模型具有較高的精度和良好的預測能力,可以為棉織物靛藍染色工藝的預測和優化提供參考。
關鍵詞: 混沌算法;最小二乘支持向量機(LSSVM);Python;棉織物;靛藍;染色預測模型
中圖分類號: TS190.9; TP181
文獻標志碼: A
文章編號: 1001-7003(2023)07-0041
作者簡介:
王碧嶠(1984),女,講師,博士,主要從事天然染料染色、功能性紡織品方面的研究。
靛藍作為一種還原染料,歷史悠久,應用廣泛。由于靛藍不能直接上染棉織物,在染色過程中通常要加入堿和還原劑,在堿性環境還原成可以上染的隱色體后進行染色。染料、堿和還原劑的用量對靛藍染色棉織物的表觀顏色深度(K/S值)的影響是非線性的,為了達到想要的K/S值,目前常用單因子實驗法和正交實驗法來確定最優工藝[1-2]。然而,這些方法有如下缺點:1) 雖然進行了多次實驗,但由于所取的工藝參數數值不連續,找到的最優工藝可能并非實際中真正的最優,而是所取工藝參數下的最優;2) 其最優工藝的標準是K/S值達到最大,即表觀顏色最深,但在實際生產過程中,最優工藝應該是盡可能貼近客戶所要求色深的工藝。因此,一個能夠通過染色工藝條件準確預測織物K/S值的模型對于降低成本、提高工藝變換效率具有重要意義。
目前,建立精確的預測模型一般采用機器學習的方法,如神經網絡[3]、支持向量機(Support Vector Machine,SVM)[4]和最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)[5]等。LSSVM是SVM的一種擴展,它降低了計算的復雜性,提高了機器學習的速度,在對小樣本、非線性數據的識別和預測中具有獨特的優勢,在電子、化工、電氣等領域的預測模型中得到了廣泛應用,但是在染色研究方面僅有幾篇應用于活性染料染色棉織物的報道[6-7]。
LSSVM的超參數對于模型的精確度有很大影響,因此選擇合適的超參數非常重要。目前常用的超參數尋優的方法有網格搜索法[7]、粒子群算法[8]、蟻群算法[9]等。網格搜索法簡單易行、應用廣泛,可以通過較大的搜索范圍及較小的步長,找到全局最優解,但較為耗費計算資源和計算時間,效率較為低下。因此,實際應用時一般先使用較大的搜索范圍和步長來尋找全局最優解的位置,再逐漸縮小搜索范圍和步長以確定最優值,這樣可以節省計算的時間和資源,但對于非凸函數很可能會錯過全局最優解。粒子群算法和蟻群算法能夠有效地提升模型精度,但也有容易陷入局部最優解的缺點。混沌算法全局搜索能力強、能有效避免陷入局部最優解,且搜索效率較高,有利于建立精確的LSSVM模型[10]。
本文基于Python語言及其擴展模塊,利用混沌算法進行超參數尋優,從而建立一個用較小樣本量也能夠快速、精確預測靛藍染色棉織物K/S值的LSSVM模型。
1 染色預測模型
1.1 輸入變量選取
靛藍染色過程中,影響染色織物K/S值的因素有很多,如果將所有影響因素都作為輸入變量,會大幅增加建模的計算量,所需樣本量也會增加,因此需要對輸入變量進行選擇。通過對靛藍上染棉織物機理的分析,再結合染色實踐的經驗,最終篩選出靛藍染料濃度、氫氧化鈉濃度和保險粉濃度這三個影響因素。
這三個因素既是影響靛藍染色棉織物的K/S值的主要因素,也有較強的交互作用:靛藍染料濃度直接影響氫氧化鈉和保險粉的用量;氫氧化鈉濃度太低會造成染液pH值太低,靛藍無法充分還原成單酚鈉離子型隱色體,若氫氧化鈉濃度太高則會導致染液pH值過高,保險粉消耗增加,靛藍被過度還原成上染率較低的雙酚鈉離子型隱色體;保險粉濃度太低會導致靛藍還原不充分,太高會導致染液pH值下降甚至變成酸性,靛藍無法充分還原[11]。因此,這三個因素直接影響染液中可上染的靛藍隱色體的濃度,進而影響染色織物的K/S值。
其他因素如染色溫度、染色時間等,雖然也對K/S值有影響,但對染液中靛藍隱色體的濃度影響不大,為了減少建模的計算量,未選擇這些因素,只選擇靛藍染料濃度、氫氧化鈉濃度和保險粉濃度這三個因素作為染色預測模型的輸入變量,染色后棉織物的K/S值作為輸出變量。
1.2 LSSVM染色預測模型
由于選擇了三個因素,且三個因素對染色后棉織物的K/S值的影響是非線性的,這要求建立模型的算法應該支持高維運算和非線性樣本。同時,為了節省工藝成本,提高工藝變換的效率,應盡可能以較少的樣本量達到較高的預測精度。LSSVM算法則能夠滿足這些要求建立預測模型。
將25組染色數據轉換為訓練樣本集{(xi,yi),xi∈Rn,yi∈R,i=(1,2,…,m)},其中x為n維輸入數據,在此模型中即為三個影響因素:氫氧化鈉濃度、保險粉濃度和靛藍染料濃度所組成的3維輸入數據;y為一維輸出數據,在此模型中即為K/S值;m表示訓練用樣本量,在此模型中m=25。建模用的LSSVM的算法[12]主要描述如下:
1.3 數據集制作
為對模型進行訓練并對模型的預測準確性進行驗證,用不同的實驗參數對棉織物進行染色,并測量染色后的K/S值。制作數據集時,在較小的樣本量下,樣本數據要有較好的覆蓋性,并具有一定的隨機性。首先,在靛藍染色常用的濃度范圍內,分別對氫氧化鈉濃度、保險粉濃度和靛藍染料濃度進行5水平的單因子實驗,并剔除重復的實驗參數,共得到13組染色數據。其次,根據靛藍染色的機理,靛藍染料濃度決定了染液中能夠上染的隱色體濃度的上限,也決定了被染織物K/S值的上限,而氫氧化鈉和保險粉的用量決定了有多少靛藍被轉化成隱色體,因此以靛藍染料濃度作為核心,確保每個水平的靛藍染料濃度都有5組染色數據,氫氧化鈉和保險粉的用量盡可能覆蓋整個區域,在此前提下,補充了12組實驗。最后,為使數據集有一定隨機性,隨機選擇了5組實驗參數,共得到30組染色數據。隨機抽取25組染色數據,作為訓練模型的訓練集,剩余5組染色數據用于驗證模型預測準確性的測試集。用于制作數據集的染色實驗和測試的具體方案如下:
織物:純棉平紋織物,經緯向密度分別為252、216根/10 cm,平方米質量為129.5 g/m2。
材料:植物靛藍粉(貴州繡娘文化有限公司),氫氧化鈉(分析純,天津市大茂化學試劑廠),保險粉(分析純,天津市福晨化學試劑廠),無水碳酸鈉(分析純,天津市天力化學試劑有限公司),皂片(商用,上海市紡織工業技術監督所)。
儀器:Datacolor 200測色配色儀(美國Datacolor公司),HZT-A+200電子天平(華志科學儀器有限公司),HH-S6數顯恒溫水浴鍋(常州國宇儀器制造有限公司)。
染色流程:靛藍還原(一定量的靛藍粉、氫氧化鈉、保險粉混合液,溫度40 ℃,還原20 min)→染色(40 ℃,20 min)→空氣氧化(10 min)→水洗→皂洗(皂片3 g/L,純堿3 g/L,浴比50︰1,溫度90 ℃,時間10 min)→水洗→自然晾干。
K/S值測試:使用Datacolor 200測色配色儀以CIE標準照明體D65光源,10°視角測試染色后棉織物在660 nm波長處的K/S值,在每個樣品的不同位置測試3次,取平均值。
1.4 染色預測模型的實現
染色預測模型通過Python語言編程實現。Python語言
是一種開源的機器語言,比起科研建模常用的Matlab,它具有免費、不受版權限制、可移植性好的特點,更適合在生產實踐中使用。使用Visual Studio Code編譯器運行Python 3.0,并導入Numpy、Random和Openpyxl模塊。其中,Random模塊用來產生(0,1)之間的隨機數,進而產生混沌變量;Numpy模塊用來將樣本轉化成高維數組并進行運算;Openpyxl模塊用來將輸出結果導出為“.xls”文件。
2 結果與分析
2.1 染色預測模型訓練
根據混沌優化算法,最終選擇的最優超參數(γ,σ)=(2 446.912 5,0.664 7),b=5.997 6。用訓練集的25組染色實驗數據作為樣本進行模型訓練,樣本的測試值和預測值見表1。其中,預測值保留4位小數。
從表1可以看出,測試值和染色預測模型預測值的相對誤差很小,相對誤差絕對值最大為0.345%,最小為0.004%。
模型的擬合程度與超參數γ和σ有密不可分的關系,因此超參數尋優非常重要。表2是網格尋參法進行超參數尋優和用混沌算法尋優后對應的超參數,以及對訓練集預測的平均絕對百分比誤差eMAPE和均方根相對誤差eMSE。由表2可以看出,兩種尋參法得到的模型都具有較小的誤差,其中網格尋參得到的超參數比混沌算法尋優得到的超參數誤差小,但誤差小并不代表對新樣本的預測準確度更高。這是由于γ越大,模型的擬合誤差越小,但過大會造成模型的過擬合,會使模型對新樣本的預測有很大的誤差;σ越小,模型的擬合誤差也越小,但過小同樣也會造成過擬合現象。因此,要用測試集對訓練出的模型進行驗證,從而檢驗模型的準確性。
2.2 染色預測模型性能驗證
用測試集的5組染色數據代入已經訓練好的染色預測模型進行預測,以驗證模型預測的準確度,預測結果見表3。其中,計算出的預測值有14小數,在表3中只保留4位小數。
從表3可以看出,雖然混沌算法尋參在訓練模型中表現的誤差比網格尋參法略高,但對測試集的預測結果的誤差明顯小于網格尋參法,說明網格尋參法找到的超參數不是全局最優解,而混沌算法尋到的超參數更接近全局最優。
綜上所述,混沌算法尋參LSSVM模型預測的eMAPE為1759 7%,eMSE為0.029 4%,預測誤差較小,預測效果較好,表明了采用該模型預測靛藍染色織物K/S值具有一定的可行性,對于降低靛藍染色生產成本、提高工藝變換效率具有應用價值。
3 結 論
本文為提高靛藍染色織物的實際色深與需求色深的匹配度,以Python語言為基礎,利用Numpy、Random和Openpyxl模塊,以靛藍染料濃度、氫氧化鈉濃度和保險粉濃度為輸入變量,染色織物的K/S值為輸出變量,運用混沌算法進行超參數尋優,用訓練集的25組染色數據進行訓練,建立了LSSVM靛藍染色工藝條件預測模型,并用測試集的5組染色數據驗證了模型的預測準確性。
1) 該模型對樣本具有很高的擬合度,模型的eMAPE為0061 6%,eMSE為0.000 1%,說明通過混沌算法尋優得到的超參數能夠有效減少模型的預測誤差。
2) 通過混沌算法進行超參數尋優,使模型展現了良好的預測能力,對染色棉織物K/S值預測的eMAPE為1.759 7%,eMSE為0.029 4%,比網格尋參法更有優勢。這表明該模型通過小樣本的訓練就可以達到較好的預測準確度,可用于靛藍染色棉織物工藝條件的預測和優化。
3) 該模型尚存在一定的局限性,主要體現在為了減少運算量,輸入變量的數量受到限制,后續將通過改進算法和模型,在不影響樣本量和預測性能的前提下,增加模型的可輸入變量,并將進一步擴展模型可預測的染色性能參數。
參考文獻:
[1]馬俊然, 胡敏干, 周嵐, 等. 棉纖維靛藍染料/液蠟體系染色工藝[J]. 染整技術, 2019, 41(10): 30-35.
MA Junran, HU Mingan, ZHOU Lan, et al. Dyeing process of cotton fiber in indligo dye/liquid paraffin system[J]. Textile Dyeing and Finishing Journal, 2019, 41(10): 30-35.
[2]李棟, 李鑫, 劉今強, 等. 棉纖維的靛藍染料/D5體系染色[J]. 印染, 2016, 42(4): 9-13.
LI Dong, LI Xin, LIU Jinqiang, et al. Indigo dye/D5 system for cotton fiber dyeing[J]. China Dyeing & Finishing, 2016, 42(4): 9-13.
[3]HUANG J H, LIU H. A hybrid decomposition-boosting model for short-term multi-step solar radiation forecasting with NARX neural network[J]. Journal of Central South University, 2021, 28(2): 507-526.
[4]YU X, WANG H. Support vector machine classification model for color fastness to ironing of vat dyes[J]. Textile Research Journal. 2021, 91(15/16): 1889-1899.
[5]李明飛, 吳軍超, 張一馳. 基于最小二乘支持向量機的組合模型在區域似大地水準面擬合中的應用[J]. 大地測量與地球動力學, 2022, 42(9): 971-974.
LI Mingfei, WU Junchao, ZHANG Yichi. Application of combined model based on LSSVM in regional quasi-geoid fitting[J]. Journal of Geodesy and Geodynamics, 2022, 42(9): 971-974.
[6]劉佳, 金福江. 基于LS-SVM的棉針織物染色上染率模型的研究[J]. 福州大學學報(自然科學版), 2010, 38(3): 446-449.
LIU Jia, JIN Fujiang. Study on the model of the uptake rate in dyeing of cotton fabric based on LS-SVM[J]. Journal of Fuzhou University (Natural Science Edition), 2010, 38(3): 446-449.
[7]陶開鑫, 俞成丙, 侯頎驁, 等. 基于最小二乘支持向量機的棉針織物活性染料濕蒸染色預測模型[J]. 紡織學報, 2019, 40(7): 169-173.
TAO Kaixin, YU Chengbing, HOU Qi’ao, et al. Wet-steaming dyeing prediction model of cotton knitted fabric with reactive dye based on least squares support vector machine[J]. Journal of Textile Research, 2019, 40(7): 169-173.
[8]周昆鵬, 白旭芳, 畢衛紅. 熒光光譜法檢測水質COD時溫度、濁度、pH的影響分析[J]. 光譜學與光譜分析, 2019, 39(4): 107-112.
ZHOU Kunpeng, BAI Xufang, BI Weihong. The temperature, turbidity and pH impact analysis of water COD detected by fluorescence spectroscopy[J]. Spectroscopy and Spectral Analysis, 2019, 39(4): 1097-1102.
[9]黃光群, 段宏偉, 何金鴻, 等. 基于紅外光聲光譜的農作物秸稈導熱系數定量分析[J]. 農業機械學報, 2018, 49(7): 342-347.
HUANG Guangqun, DUAN Hongwei, HE Jinhong, et al. Rapid quantitative analysis of crop straws’ thermal conductivity based on infrared photoacoustic spectroscopy[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(7): 342-347.
[10]王磊, 劉雨, 劉志中, 等. 基于IABC-LSSVM的瓦斯涌出量預測模型研究[J]. 傳感器與微系統, 2022, 41(2): 34-38.
WANG Lei, LIU Yu, LIU Zhizhong, et al. Research on prediction model for gas emission based on IABC-LSSVM[J]. Transducer and Microsystem Technologies, 2022, 41(2): 34-38.
[11]PAUK V, MICHALKOV J, JAGOOV K, et al. Origin of indigo colorants revealed by ion mobility spectrometry coupled to mass spectrometry followed by supervised classification[J]. Dyes and Pigments, 2022, 197: 109943.
[12]王建國, 張文興. 支持向量機建模及其智能優化[M]. 北京: 清華大學出版社, 2015: 32-33.
WANG Jianguo, ZHANG Wenxing. Support Vector Machine Modeling and Intelligent Optimization[M]. Beijing: Tsinghua University Press, 2015: 32-33.