閆鐵軍,陳思蒙,周紅審,許自成,龐 哲,劉文鋒,潘婷婷,邵惠芳
(1.湖北中煙工業有限責任公司,武漢 430040;2.河南農業大學煙草學院,鄭州 450002)
卷煙感官質量評價是煙草工業產品質量控制的依據和基礎,卷煙感官舒適性是其中重要的評價內容[1]。研究發現,消費者在抽吸卷煙時,對產品感官舒適度的關注程度普遍較高,因此,維持并提高卷煙感官的舒適性是目前行業內面臨的重要研究課題[2]。
卷煙感官舒適性具體體現在刺激性、干燥感和生津感3 個方面,其在很大程度上取決于煙葉的內在化學成分是否協調,以及致香物質是否代謝、積累完全[3]。化學成分與感官質量之間存在著復雜的線性及非線性關系,學者們對其做了大量研究[4],常見的方法有典型相關性分析[5]、聚類分析[6]等,其他方法,如主成分分析[7]可以對多個指標進行降維處理,得到數量較少、相關性較低的新變量,且新變量能夠有效解釋原始變量的信息;偏最小二乘回歸分析[8]可以有效解決試驗樣本的數量限制和數據間具有共線性等問題;逐步回歸分析[9]可以通過逐個引進變量,根據變量的顯著性及貢獻率對其進行保留,建立擬合度最高的方程。朱保昆等[10]采用復相關系數方法分析并驗證了烤煙主要內在化學成分與感官舒適性間的相關程度。胡建軍等[11]基于廣義可加模型對化學成分與感官指標間的非線性關系進行了研究。張強等[12]運用相似距離分析法對卷煙感官特征進行分析,對擁有相似內在品質的不同卷煙間進行了量化比較,消除其差異性。
截至目前,相關研究的分析指標較少,并且分析方法多為單一分析方法,僅分析了化學成分與感官指標間的相關性,少有預測模型[13]。當遇到大量具有自相關性或多重共線性的樣本數據時,若建立預測模型時也會大大降低模型的有效性和穩定性[14]。本試驗根據本次樣品指標的特性,并對比不同分析方法間的特點與優點,選取主成分分析和逐步回歸分析相結合的方法,對復雜數據體系進行有效降維,將相關性較高的變量轉換為相關性較低的主成分,再根據其顯著性和貢獻率逐一引入回歸方程中,由此建立最優回歸方程[15]。結合測定指標與主成分之間的逐步回歸分析模型,可以較為準確地預測烤煙的感官舒適性,為進一步提升卷煙產品感官舒適性提供技術支撐。
試驗樣品包含國內云南、四川、貴州、湖北、重慶、湖南、福建、廣東、江西、河南、安徽、山東、陜西、黑龍江、遼寧、吉林、湖南等地區的不同等級煙葉,由湖北中煙工業有限責任公司提供。其中,上部葉包含B2F 等級的煙葉43 份,中部葉包含C3F 等級煙葉44 份、C3L 等級煙葉40 份、C4F 等級煙葉42 份、C4L 等級煙葉1 份,樣品數量共170 份。
1.2.1 化學成分指標 選取煙草行業關注度較大的煙葉內在化學成分指標進行測定,包括煙堿、還原糖、總糖、總氮、氯、鉀以及多酚類化合物綠原酸、莨菪亭、蕓香苷。煙堿參考YC/T 160—2002 方法測定,還原糖、總糖參考YC/T 251—2008 方法測定,總氮、氯、鉀分別參考YC/T 161—2002、YC/T 162—2002、YC/T 217—2007 方法測定,多酚類化合物參考YC/T 202—2006 方法測定。
1.2.2 感官舒適性評價指標 煙葉感官質量舒適性評價指標包括香氣指標透發、甜潤、清晰,煙氣指標流暢、圓潤、醇和,口感指標干凈、清爽、濕潤,由評吸專家根據評分標準(表1)進行評吸打分,根據評分權重(表2)以及式(1)計算單項平均得分,結果精確至0.1。
式中,∑Xi為某單項得分加和;N 為參加評吸人數;Ki為某單項權重;Xi為某單項平均得分。
表1 煙葉感官質量舒適性評價各項指標評分標準
表2 煙葉感官質量舒適性評價各項指標評分權重
樣本數據以8∶2 建立訓練集與測試集,運用隨機取樣法選取136 個數據用于建立感官舒適性預測模型,其余34 個數據用于驗證該模型。
1.3.1 簡單相關性分析 簡單相關性分析采用Pearson 相關分析對全部170 個樣本進行分析。Pearson 相關分析是一種運用相關系數對變量間進行線性關系分析的方法,通過對樣本相關系數(r)的計算,對其線性關系顯著程度進行推算[16],數學公式如下。
式中,n 表示樣本數量,xi、yi表示兩樣本間的變量值。
顯著性檢驗采用t 檢驗法,公式如下。
1.3.2 主成分分析 主成分分析法(Principal component analysis,PCA)是一種通過線性降維來解決具有較多變量且高維復雜體系的數據分析方法。PCA在盡量保留原始數據信息的基礎上,將原始相關性較強的變量轉換為數量較少且不相關的變量,可以對原本相關性較高的變量信息有效地降維[17]。轉換公式如下。
式中,Xi為原始變量,i=1,2,…,p,p 為原變量個數;Fj為主成分,j=1,2,…,m,m 為線性合成的主成分個數。式中需滿足m 小于或等于p,且系數lj1+lj2+ lj3…+ lji= 1。
1.3.3 逐步回歸分析 逐步回歸分析是通過分析自變量對因變量(y)的作用、貢獻率以及顯著程度,保留影響顯著、剔除影響不顯著的自變量,并且每一次都對擬合優度(R2)進行檢驗,將擬合優度減小的引入變量篩除,由此建立滿足兩點要求的最優回歸方程[18]。
選取R2最大的變量Zj建立模型。
若R1<R2、F1<F2且Zj表現為顯著,表明引入Zi可優化方程,則引入Zi,否則刪除Zi。反復重復該步驟,直至所有變量全部經過篩選。
運用SPSS 21.0 統計學軟件對煙堿、還原糖、總糖、總氮、氯、鉀、綠原酸、莨菪亭、蕓香苷9 個指標進行描述性分析、簡單相關性分析、主成分分析以及逐步回歸分析,建立基于化學成分的煙葉感官舒適性預測模型。
化學成分指標的相關描述性統計見表3。如表3 所示,除還原糖、總糖、綠原酸和蕓香苷含量的標準差大于1 外,其他指標含量的標準差均小于1。其中,還原糖與總糖含量的偏度小于0,表現為左偏峰,其余化學成分指標均大于0,表現為右偏峰;所有指標峰度皆為正數,呈尖峭峰分布。
化學成分與感官舒適性的簡單相關分析見表4。結果表明,除透發外,煙堿含量與其他舒適性指標均呈負相關,大部分達顯著或極顯著水平。還原糖、總糖含量與所有舒適性指標呈正相關,大部分達顯著或極顯著水平。總氮含量與透發呈正相關,與其他指標均呈負相關;氯含量與圓潤呈正相關,與其他指標均呈負相關。鉀含量與所有舒適性指標均呈正相關,與圓潤、干凈、清爽、濕潤均呈顯著正相關。綠原酸含量與各指標均無顯著相關。莨菪亭含量與干凈呈顯著負相關,蕓香苷與透發呈顯著正相關,二者均與其他指標無顯著相關性。
表3 各化學成分含量描述性統計結果
表4 各化學成分含量與感官舒適性的Pearson 相關分析
采用主成分分析方法對化學成分指標進行因子提取,并運用最大方差旋轉方法進行旋轉,以便找出因子和研究項的對應關系。根據KMO 和Bartlett 的檢驗,可知KMO 為0.686,大于0.6,說明變量間存在相關性,可以進行主成分分析;Bartlett 球形度檢驗中的P 為0.000,小于0.001,說明本組數據進行主成分分析是有意義的。主成分分析解釋的總方差如表5 所示。為了使公因子間差距盡可能大,進行公因子旋轉。可知主成分的累計貢獻率達90% 以上時認為提取的變量較好,故針對主成分提取情況進行分析。本次主成分分析共提取出6 個主成分,6個主成分旋轉后的方差解釋率分別為28.294%、17.479%、12.603%、11.848%、11.589%、11.341%,累積方差解釋率為93.155%。旋轉后因子載荷系數矩陣如表6 所示。
表5 解釋的總方差
表6 旋轉后因子載荷系數矩陣
主成分分析成分得分系數矩陣見表7。主成分分析中解釋的總方差為93.155%,生成6 個新的解釋變量F1、F2、F3、F4、F5、F6,利用成分得分系數矩陣求得解釋變量與各指標之間的關系式如下:
表7 成分得分系數矩陣
式中,X1為煙堿,X2為還原糖,X3為總糖,X4為總氮,X5為氯,X6為鉀,X7為綠原酸,X8為莨菪亭,X9為蕓香苷。
根據權重得到綜合評分F 的計算結果如下。
F=0.304F1+0.188F2+0.135F3+0.127F4+0.124F5+0.122F6
綜合評分的得分越高,說明煙葉品質越好。
將主成分分析提取出的6 個新解釋變量作為自變量,將感官舒適性評價指標透發(Y1)、甜潤(Y2)、清晰(Y3)、流暢(Y4)、圓潤(Y5)、醇和(Y6)、干凈(Y7)、清爽(Y8)、濕潤(Y9)得分作為因變量進行逐步回歸分析,篩選出對因變量具有顯著性的變量。
建立的逐步回歸模型如表8 所示。在逐步線性回歸的模型中,Y 表示因變量,用F1、F2、F3、F4、F5、F6表示自變量。模型通過F 檢驗,F 變化量的顯著性均小于0.05,說明模型有效。另外,針對模型的多重共線性進行檢驗發現,模型中VIF 均為1,意味著不存在共線性問題;并且D-W 均在2 附近,表明樣本數據之間沒有關聯,模型不存在自相關性,說明模型較好。
表8 逐步回歸模型
由表9 可以看出,主成分-逐步回歸分析預測感官舒適性評價的預測模型的平均相對誤差最高為7.3%,最低為1.1%,均在誤差允許的范圍之內,因此采用主成分分析方法對煙草的化學成分指標進行選取,然后采用逐步回歸分析法進行優化選取,建立感官舒適性的預測模型,能夠較好地預測煙草的感官舒適性。
表9 感官舒適性真實值與預測值的誤差
煙葉感官質量擁有復雜的評價體系,體系的科學構建對煙草原料的采購以及卷煙配方的應用具有重要的指導意義。由于煙草品類繁多,內在化學成分也具有多樣性,因此,構建體系需要由簡到繁來逐步進行,提取與感官舒適性相關性較大的化學成分,進而構建評價模型。
煙葉內各化學成分會對煙葉感官舒適性產生不同的影響,從而影響煙葉的感官質量評價。煙堿在煙葉內呈游離態和結合態兩種形態,經燃燒進入煙氣后,會引起口腔中明顯的苦味刺激,進而影響感官舒適性。本研究的結果也表明了這一點,除透發外,煙葉煙堿含量與所有感官舒適性評價指標均呈負相關,這與王明鋒[13]的研究結果一致。煙葉內的糖類物質,特別是還原性糖在煙支燃吸時能起到使煙氣酸堿平衡,從而降低刺激性。在本研究中,還原糖、總糖含量與所有指標均呈正相關,說明在一定范圍內,還原糖、總糖含量對煙葉感官舒適性有積極作用。鉀與氯也是影響煙葉質量的重要物質,在本研究中,鉀與圓潤、干凈、清爽和濕潤呈顯著正相關,而氯僅與流暢呈顯著負相關。煙葉多酚類物質會在煙葉燃吸通過蒸發等途徑直接進入煙氣,因此對感官舒適性產生直接影響。在本研究中,莨菪亭與干凈呈顯著負相關,蕓香苷與透發呈顯著正相關。而王明鋒[13]認為酚類化合物與卷煙舒適性呈負相關,與本研究結果不完全一致,可能是因為對透發等指標的判定標準有差異。
本研究根據本次樣品指標的特性,通過采用主成分分析和逐步回歸分析相結合的方法,對復雜數據體系進行了有效降維。煙草化學成分指標的原始參數總共有9 個,運用主成分分析方法,選取前6 個累積貢獻率達到90% 以上的主成分。既降低維度,減少了原始變量個數,又盡可能多地反映了原始變量的信息,并且各個主成分之間彼此相互獨立,為建立逐步回歸預測模型奠定了基礎。基于主成分分析所得的6 個變量,利用測試集的數據通過逐步線性回歸的方法,對透發、甜潤、清晰、流暢、圓潤、醇和、干凈、清爽、濕潤9 項指標分別建立了預測模型。利用測試集的數據對預測模型進行驗證,發現預測誤差較小,表明該預測模型具有可行性。