茍 捷, 劉建立, 高衛東
(生態紡織教育部重點實驗室(江南大學), 江蘇 無錫 214122)
?
應用主成分分析的原棉可紡性指數構建
茍 捷, 劉建立, 高衛東
(生態紡織教育部重點實驗室(江南大學), 江蘇 無錫 214122)
為實現大容量纖維檢測(HVI)指標在原棉品質評價中的合理應用,并為配棉提供參考,提出了一種基于主成分分析的原棉品質綜合評價方法。首先選取不同產地、不同等級的284種原棉進行HVI檢測,為消除指標間存在的冗余信息,選擇了13項指標進行主成分分析;然后,利用提取的6項主成分因子構建原棉可紡性指數(FSI),實現了原棉品質的定量化評價;最后,討論了FSI與成紗強力之間的相關性。研究結果表明,FSI指數越高,成紗強力越高,對應原棉的可紡性能越好?;谥鞒煞址治龅脑拊u價方法能夠定量評價棉纖維的可紡性能,可為原棉品質管理及成紗質量預測提供參考。
原棉; 品質評價; 可紡性; 主成分分析; 紗線強力
配棉是紡紗工藝的最前期工作,其核心在于充分掌握原棉的各項品質參數,根據紡紗實際要求,合理搭配原棉,充分發揮不同原棉的特點,優劣互補,達到提高產品質量、穩定生產、降低成本的目的[1]。隨著國家棉花質量新標準的貫徹實施,原棉感官檢驗已逐步被儀器檢驗取代,大容量纖維檢測儀(HVI)可快速提供原棉的各項性能指標,為后續生產提供技術參考,因此,研究眾多HVI指標對原棉綜合品質的貢獻程度和對紗線質量的影響,對實現紡織企業信息化改造具有重要的技術經濟意義。
與傳統棉花檢驗方法相比,HVI儀器化檢驗可準確快速地提供原棉的17項性能指標:回潮率、馬克隆值、成熟度指數、斷裂比強度、斷裂伸長率、上半均長、長度整齊度、短纖率、反射率、黃度、色特征級、熒光度、雜質數量、雜質面積、雜質等級、棉結數以及紡穩參數SCI。經驗證,HVI指標間存在較強的相關性,例如:成熟度指數是由馬克隆值、斷裂比強度和斷裂伸長率經過推算得出的[2]。如果直接利用眾多HVI指標進行原棉綜合評價,必然導致信息重疊,影響評價結果的合理性,因此,本文對HVI指標進行主成分分析,盡可能消除指標間的相關性,達到剔除冗余信息的目的,然后通過構建可紡性指數,實現原棉品質的客觀評價。
本文研究以某紡織企業2012—2013年度購入的284種不同產地(美國、巴西、新疆、山東、河南等)、不同等級(1~4級)的原棉棉樣為研究對象,將所有樣品放置于溫度為(20±2) ℃,相對濕度為(65±2)%的環境中24 h,然后進行HVI檢測。
在進行主成分分析前,剔除了受溫濕度影響較大的回潮率以及雜質等級、色特征級等已經量化的等級指標,利用其余13項指標進行評價。為方便起見,標記各項指標:馬克隆值為X1,成熟度指數為X2,斷裂比強度為X3,斷裂伸長率為X4,上半均長為X5,長度整齊度為X6,短纖率為X7,反射率為X8,黃度為X9,雜質數量為X10,雜質面積為X11,棉結數為X12,紡穩參數為X13,檢測結果如表1所示(限于篇幅,本文僅列出部分數據)。

表1 原棉各項品質參數Tab.1 Quality parameters of raw cotton
主成分分析是一種基于統計學原理的描述系統低維模型的方法,其原理是通過對原始數據(本文為284種原棉的13項HVI指標)相關矩陣內部結構關系的研究,盡可能減少原始數據間的冗余信息,提取綜合指標(主成分因子),在保留絕大部分重要信息的基礎上較簡潔地對樣本進行綜合評價。
主成分分析的一般步驟[3]為:1) 確定研究變量,整理數據,對樣本數據進行標準化處理,消除量綱不同的影響;2)進行指標間相關性判斷;3)求數據的協方差矩陣;4)求特征值、特征向量和累積貢獻率;5)確定主成分因子;6)構建綜合評價指數。
2.1 HVI指標的相關性分析
選取284種原棉的13項HVI指標值為對象,進行相關性分析,結果如表2所示。
表2中的數值代表了變量間的相關程度,絕對值越大,則相關性越強??煽闯觯撼墒於戎笖?X2)與馬克隆值(X1)、斷裂比強度(X3)、斷裂伸長率(X4)的相關系數分別達到了0.740、-0.512、-0.653;紡穩參數(X13)與斷裂比強度(X3)、上半均長(X5)以及長度整齊度(X6)之間的相關系數分別為0.612、0.727、0.742,并且均在0.01水平上顯著相關。由此可見,眾多HVI指標間存在大量的信息重疊現象,因此,對其進行主成分分析可有效地剔除冗余信息,進而達到降低系統維數的目的,更合理地對原棉品質進行評價[4-5]。

表2 HVI指標的相關系數Tab.2 Correlations among HVI indicators
注:* 表示在 0.05 水平(雙邊)上顯著相關;** 表示在0.01 水平(雙邊)上顯著相關。
2.2 主成分分析
利用MatLab對284種原棉的13項HVI指標數據進行主成分分析,表3、4分別示出主成分分析的方差分解特征提取表和初始因子載荷。 表3反映了提取出的各項主成分包含原始數據信息量的情況,累積貢獻率表示前N個主成分合計提供的信息量占總體信息量的比例[6]。分析結果顯示,前6項主成分的方差已經達到了總方差的88.51%,包含了原始樣本的絕大部分信息,因此,選取前6項主成分作為原棉綜合品質的評價因素。

表3 方差分解特征提取分析表Tab.3 Total variance explained

表4 初始因子載荷Tab.4 Loading of initial factors
初始因子載荷實質是指各項原始變量因子表達式的系數,反映原始指標對提取的主成分的影響程度,數值越高,表明該主成分包含該項指標越多的信息[7-8]。如表4所示,主成分3在馬克隆值和成熟度指數上的載荷較大,說明主成分3對這2項指標具有較強的解釋性;同理,主成分6較好地反映了棉纖維上半均長和斷裂比強度這2方面特征。
將原始數據標準化后得到的矩陣與特征向量相乘,即可求得各項主成分的表達式[9-10]。通過對表3、4的數據進行分析,將表4的后6列分別與標準化后的數據相乘,得到的各項主成分表達式如下:
Y1=-0.363 3zx1-0.048 6zx2-0.241 9zx3-0.372 6zx4-0.214 7zx5+0.352 7zx6-0.415 2zx7+
0.322 9zx8+0.263 5zx9-0.169 6zx10-0.204 0zx11-0.261 1zx12+0.006 2zx13
Y2=0.294 5zx1+0.238 3zx2+0.063 2zx3+0.234 1zx4+0.418 5zx5-0.096 1zx6-0.019 7zx7+
0.170 1zx8+0.268 3zx9+0.030 0zx10-0.457 7zx11-0.425 6zx12-0.347 0zx13
Y3=0.301 2zx1-0.542 6zx2+0.581 6zx3+0.083 1zx4+0.111 5zx5-0.184 8zx6+0.032 3zx7+
0.295 7zx8+0.073 9zx9+0.250 7zx10-0.027 9zx11+0.018 1zx12+0.255 4zx13
Y4=-0.105 1zx1+0.128 4zx2-0.085 8zx3-0.213 1zx4+0.282 0zx5+0.117 1zx6-0.218 6zx7+
0.261 9zx8-0.526 3zx9+0.500 2zx10+0.079 3zx11+0.167 3zx12-0.385 4zx13
Y5=0.049 3zx1+0.003 8zx2-0.152 9zx3-0.064 3zx4+0.132 9zx5-0.278 8zx6-0.015 6zx7+
0.332 5zx8+0.061 8zx9-0.638 4zx10+0.272 1zx11+0.337 6zx12-0.405 6zx13
Y6=-0.165 3zx1-0.077 3zx2+0.015 8zx3+0.507 0zx4+0.058 9zx5-0.139 1zx6-0.729 1zx7-
0.215 4zx8+0.208 4zx9+0.108 4zx10+0.173 8zx11-0.146 3zx12-0.041 1zx13
式中zxi為xi(i=1,2,3,…,13)對應的HVI指標標準化后的數據。將各項主成分對應的特征值占總特征值的比例作為權重,加權求和6項主成分即可得到原棉品質綜合評價函數Y,將其稱為可紡性指數FSI,如下式所示。
Y=0.289 3Y1+0.278 6Y2+0.185 9Y3+
0.118 6Y4+0.07Y5+0.050 6Y6
式中,Y1,…,Y6分別表示由公式計算得到的6個主成分。本式中,可紡性指數可表示為6個主成分的線性函數,其系數值代表FSI與6個主成分Y1,…,Y6之間的相關性。
3.1 可紡性指數與原棉等級的關系
為客觀評價原棉品質,需要對可紡性指數FSI與原棉等級之間的關系進行研究,并與HVI指標中的紡穩參數SCI進行對比。其中,在HVI檢測指標中SCI是反映原棉紡紗穩定性的指標,可衡量棉纖維的成紗強力。一般情況下,SCI的數值越大,紗線強力和紡紗過程的穩定性就越好。
對284種原棉的等級與其對應的SCI值作散點圖,如圖1所示。圖中原棉等級與其對應的SCI值之間不存在直觀的函數規律,難以通過劃分SCI區間實現原棉等級的分類管理。同樣對284種原棉與其對應的FSI值作散點圖,如圖2所示,可以發現二者之間存在較高的相關性。

圖1 原棉等級與SCI散點圖Fig.1 Scatter of cotton grade and SCI

圖2 原棉等級與FSI擬合曲線圖Fig.2 Curve fitting diagram of cotton grade and FSI
觀察圖2可發現,隨著原棉等級的增加,FSI數值逐漸減小,二者之間的關系可采用二次多項式函數對數據進行擬合[11],擬合方程為
f(x)=-6.782x2+2.046x+42.31
式中所示曲線方程可有效地表達原棉等級與FSI之間的函數關系,其擬合系數為0.948 6,因此,在原棉樣本足夠大的情況下,原棉等級可由其對應的FSI直接計算,即可通過劃分FSI取值區間實現原棉等級的評定。
3.2 可紡性指數與成紗強力的關系
眾所周知,紗線強力是衡量紗線綜合品質的重要指標,因此有必要對可紡性指數FSI與棉纖維成紗強力之間的關系進行研究分析。
根據實際生產情況,從284種原棉中選擇了139種,制訂出45個配棉方案,并在環錠紡工藝下試紡18.2 tex(20個)和27.8 tex(25個)純棉紗。為研究FSI及SCI與成紗強力的關系,分別對試紡紗線的強力值和對應原棉組的SCI加權平均值、FSI加權平均值進行數據擬合。結果表明:當擬合函數為二次多項式時,SCI與單紗強力的擬合精度最高;而對于FSI與單紗強力,采用指數函數對數據進行擬合則可達到最佳擬合效果,擬合曲線如圖3~6所示。

圖3 SCI與18.2 tex紗線強力曲線擬合圖Fig.3 Curve fitting diagram of SCI and strength of 18.2 tex yarn

圖4 FSI與18.2 tex紗線強力曲線擬合圖Fig.4 Curve fitting diagram of FSI and strength of 18.2 tex yarn

圖5 SCI與27.8 tex紗線強力曲線擬合圖Fig.5 Curve fitting diagram of SCI and strength of 27.8 tex yarn

圖6 FSI與27.8 tex紗線強力曲線擬合圖Fig.6 Curve fitting diagram of FSI and strength of 27.8 tex yarn
由圖3~6可知,原棉組的SCI加權平均值、FSI加權平均值越高,棉纖維的成紗強力就越高,二項指標均能較好地反映成紗品質。4種情形下的擬合方程如表5所示。就環錠紡18.2 tex純棉紗而言,紡穩參數SCI、可紡性指數FSI與單紗強力之間擬合方程的擬合系數分別達到了0.923 4和0.957 6;對于環錠紡27.8 tex純棉紗,SCI、FSI與單紗強力之間擬合方程的擬合系數分別達到了0.898 3和0.952 5,這表明,針對18.2 tex和27.8 tex紗線的強力,FSI的擬合效果更佳。 上述研究表明,可紡性指數FSI與紡穩參數SCI一樣,均能夠對棉纖維成紗強力進行高精度預測。

表5 擬合方程及其參數Tab.5 Parameters of fitting equations
本文將主成分分析法運用于原棉品質綜合評價,利用包含絕大部分原始信息的主成分因子構建可紡性指數FSI,從而實現了原棉綜合品質的定量化評價。經分析,紡穩參數SCI與原棉等級之間的相關性極小,幾乎無規律可循,在實際生產中無法利用其對原棉進行分類管理。然而,可紡性指數FSI與原棉等級呈顯著相關,可為原棉品質管理提供參考。此外,通過對比不同紗線產品的強力指標與對應原棉組的FSI和SCI加權平均值之間的相關性可知,FSI的預測精度及穩定性均優于SCI,可為紗線質量預測工作提供更有價值的參考。
[1] 石洋, 張得坤, 徐玫. 基于HVI檢驗數據的配棉方法[J].西安工程大學學報, 2011, 25(4):470-471. SHI Yang, ZHANG Dekun, XU Mei. Cotton assorting based on HVI data[J]. Journal of Xi′an Polytechnic University, 2011, 25(4):470-471.
[2] 劉國松, 邱兆寶, 汪黎明. 基于HVI數據的配棉主體變量選擇[J]. 山東紡織科技, 2010(2):1-4. LIU Guosong, QIU Zhaobao, WANG Liming. Choice of main variables based on HVI data[J].Shandong Textile Science & Technology, 2010(2):1-4.
[3] 胡永宏.綜合評價中指標相關性的處理方法[J]. 統計研究, 2002(3): 39-40. HU Yonghong. Approach of indexes correlation in comprehensive evaluation[J].Statistical Research, 2002(3):39-40.
[4] 張務建.原棉綜合紡紗性能的模糊評判[J].五邑大學學報:自然科學版, 2002,16(4):64-66. ZHANG Wujian. Use of fuzzy mathmatics to appraise the spin capability of cotton [J]. Journal of Wuyi University: Natural Science Edition, 2002,16(4):64-66.
[5] 楊紅英, 原海波, 周金利. 采用主成分分析法建立經紗可織性評價模型[J]. 棉紡織技術, 2011, 39(2):85-86. YANG Hongying, YUAN Haibo, ZHOU Jinli. Establishing warp weavability evaluation-model through principle component analysis[J].Cotton Textile Technology, 2011, 39(2):85-86.
[6] 汪祥莉, 孫琳.數理統計及其在數學建模中的實踐[M].北京: 機械工業出版社, 2013:212-216. WANG Xiangli, SUN Lin. Mathematical Statistics and its Practice in Mathematical Modeling[M].Beijing: Machinery Industry Press, 2013:212-216.
[7] FENG Chung, KUO Jeffrey. The application of principal component analysis and gray relational method in the optimization of the melt spinning process using the cooling air system[J]. Textile Research Journal, 2013, 83(4):371-374.
[8] ZHENG Zhaohui, DU Hongbin. Muti-scale principal component analysis based on Matlab[J]. Journal of Dalian University of Technology, 2003, 43(4):428-430.
[9] 郭金, 董鎖拽, 周文龍. 亞麻紗線USTER測試結果的主成分分析[J].浙江理工大學學報, 2012, 29(1):23-25. GUO Jin, DONG Suozhuai, ZHOU Wenlong. On the principal component analysis of the USTER test data of linen yarns[J]. Journal of Zhejiang Sci-Tech University, 2012, 29(1):23-25.
[10] 陸慧琴, 高月紅.主成分聚類分析法在大學生綜合測評中的應用[J].科技信息, 2010(26):80-81. LU Huiqin, GAO Yuehong. Principal component-cluster analysis in the comprehensive evaluation of college students[J]. Science & Technology Information, 2010(26):80-81.
[11] 劉霞, 王運鋒. 基于最小二乘法的自動分段多項式曲線擬合方法[J].科學技術與工程, 2014(3):55-58. LIU Xia,WANG Yunfeng. Research on automatic segmentation based on least squares polynomial curve fitting method[J]. Science Technology and Engineering, 2014(3):55-58.
Construction of raw cotton spinnability index based on principal component analysis
GOU Jie, LIU Jianli, GAO Weidong
(KeyLaboratoryofEco-Textiles(JiangnanUniversity),MinistryofEducation,Wuxi,Jiangsu214122,China)
In order to realize the reasonable application of high volume instrument (HVI) indexes in the cotton quality evaluation and provide the guide for the cotton assorting, a comprehensive evaluation method of raw cotton based on principal component analysis was proposed. Firstly, 284 kinds of cotton from different areas and different levels were selected to subjected to the HVI detection. principal component analysis was performed on selected 13 indexes to eliminate the redundant information among the indexes. Secondly, the six extracted principal component factors were used for constructing the fiber spinnability index (FSI) to realize the quantitive evaluation of the raw cotton quality. Finally correlation on the FSI and yarn strength is discussed. The results showed that the FSI is higher, the higher yarn strength, and the better performance of the corresponding raw cotton. The comprehensive evaluation method of raw cotton based on principal component analysis achieved the quantitative evaluation of the cotton fiber spinnability, providing a reasonable reference for raw cotton quality management and yarn quality prediction.
raw cotton; quality evaluation; spinnability; principal component analysis; yarn strength
10.13475/j.fzxb.20140503206
2014-05-19
2015-04-14
國家自然科學基金青年科學基金項目(61203364);高等學校博士學科點專項科研基金項目(20120093130001)
茍捷(1989—),男,碩士生。主要研究方向為基于原棉品質參數的紗線質量預測。高衛東,通信作者,E-mail:gaowd3@163.com。
TS 104.1
A