王明鋒 ,趙建華 ,蘭海強 ,宮玉鵬 ,朱保昆*
1.紅云紅河煙草(集團)有限責任公司技術中心,昆明市紅錦路367號 650231 2.云南財經大學統計與數學學院,昆明市龍泉路237號 650221
卷煙感官評價是卷煙產品檢驗、開發與維護的常用手段。其評價過程通常由多個評價員組成的評價小組完成,以減小單個評價員帶來的隨機性誤差。為了統計小組得分,常用簡單平均法,即直接對小組中各評價員的評分求平均值。簡單平均法簡單易用,但當評價小組中存在評價不準確的評價員時,容易對最終評價結果造成影響。為了降低評價不準確的評價員帶來的影響,常用拉依達準則、格羅布斯準則、狄克遜準則等方法剔出感官評價異常值[1-4]。然而,這些方法應用于感官評分存在明顯缺陷:其一,從統計學角度來說,這些方法僅適用于一維數據,而感官評分是一個多維向量(由多個特征的評分構成),如將這些方法用于感官評分,只能對每個感官特征使用,這樣在每個特征上均存在錯誤的概率,在整個向量上累積的錯誤概率就變得較大[5];其二,從卷煙風格特征評價角度來說,卷煙樣品的鮮明特征/香韻相對較容易把握,評價結果可能較為一致,而某些特征相對較難把握,不同人的感受不同,這些特征的評分值是正常感受或是異常值較難區分。基于上述兩方面原因,更為科學的做法是在綜合多維向量整體上來做判斷,判斷評價員對樣品的整體評價結果是否異于大多數人,而不是孤立地判斷在某個特征上是否有異常值。因此,提出一種新的計算小組得分的兩階段統計法:階段一通過三因素方差分析和多重比較法先剔除與其他評價員不一致的評價員;階段二對剩下一致的評價員的評分計算平均值。兩階段統計法能夠消除異常評價員帶來的影響,得到準確的小組評價結果,從而為卷煙感官評價提供更為準確可靠的工具。本研究中以中式卷煙風格感官評價方法[6-9]為例演示兩階段統計法如何消除異常評價員帶來的影響,但該方法也適用于其他卷煙感官評價方法。
選取10個代表性品牌卷煙樣品作為研究對象,分別為:“白沙(硬)”、“紅旗渠(天河之星)”、“黃鶴樓(軟藍)”、“金圣(硬)”、“蘭州(硬珍品)”、“利群(長嘴)”、“云煙(軟珍品)”、“長白山(東方神韻)”、“中華(軟)”、“中南海(藍色風尚)”。
評吸小組由經過中式卷煙感官評價方法培訓的卷煙調香師班學員及項目組成員組成,共 9人,應用中式卷煙風格感官評價方法對卷煙樣品進行兩次不同時間的感官評價。中式卷煙風格感官評價方法是在香味輪廓評吸法的基礎上,從感官品質特征(包括12個指標)和風格特征(包括34個指標)兩個方面(共46個指標)對卷煙進行評價,全面涵蓋中式卷煙風格感官特征評價的各個部分,能夠對卷煙進行定性分析和定量比較。
針對每次的評吸數據,分別采用簡單平均法和兩階段統計法計算小組得分。計算過程采用MATLAB 2011完成。
對第一次和第二次評吸數據,用簡單平均法計算每次評吸小組得分,用三因素方差分析[10]和多重比較法[11]分析這兩次評價結果是否存在差異。其中因素一:感官特征(46水平);因素二:卷煙樣品(10水平);因素三:評價時間(2水平)。分析結果如表1和圖1所示。由表1可知,用簡單平均法計算第一次和第二次小組得分,兩次評價的P值遠遠小于0.001,說明簡單平均法得到的第一次和第二次評價結果存在極顯著差異;從圖1也可以非常直觀地看到,用簡單平均法得到的第一次和第二次評價結果存在明顯差異。

表1 簡單平均法得兩次評價小組得分的方差分析結果

圖1 兩次評吸小組感官特征評分多重比較圖(簡單平均法)
2.2.1 第一階段
第一階段主要通過三因素方差分析和多重比較法剔除與其他評價員不一致的評價員,3個因素分別為感官特征(46水平)、卷煙樣品(10水平)、評價員(9水平)。以第一次評價為例,通過三因素方差分析,先判斷各評價員之間的評價是否一致,結果如表2所示。由表2可知,對9位評價員評吸數據所計算的P值遠小于0.001,說明這9位評價員的評價存在極顯著差異。計算兩次評吸數據中品質特征和風格特征方差,結果分別為0.26和0.19,其中品質特征的方差明顯大于風格特征的方差,說明小組中各評價員在品質特征上的評價波動性較大。
接下來將品質特征和風格特征分開研究,通過方差分析和多重比較法,分別剔除在品質特征和風格特征不一致的評價員。通過三因素方差分析判斷各評價員在品質特征方面評價是否顯著不一致,結果見表3。由表3可見,評價員因素的P值遠小于0.001,表明在品質特征方面的評價顯著不一致。

表2 整體評吸結果方差分析結果

表3 品質特征評吸結果方差分析結果
采用多重比較法尋找哪些評價員的評價不一致,結果如表4所示。由表4可見,評價員1,6的評分與其他評價員明顯不同。若剔除評價員1,6后,其余評價員兩兩之間的置信上限和置信下限將均包括“0”,說明其余評價員兩兩之間的評價結果沒有明顯差異。由此可判斷評價員1,6與其余評價員不一致,故在計算小組得分時應將其剔除。
對余下的7位評價員組成的評價小組進行三因素方差分析,結果如表5所示。由表5可知,剔除不一致評價員1,6后,評價員因素的P值為0.16,大于0.05,說明余下的7位評價員評分已沒有顯著差異。
再對風格特征評吸數據重復以上過程,先利用三因素方差分析判斷是否存在評價員差異,若存在差異,再利用多重比較法找出差異來源,剔除評價不一致的評價員。經以上分析過程,可得評價員1,6的評分與其他評價員在風格特征上也存在著顯著的差異。因此,剔除了評分異常的評價員1,6。對余下的7位評價員組成的評價小組進行了三因素方差分析,結果如表6所示。這里的因素一為風格特征(34水平)。由表6可知,剔除不一致評價員1,6后,評價員因素的P值為0.10,說明余下的7位評價員評分已沒有顯著差異。
綜合品質特征和風格特征的分析結果,評價員1,6在這兩類特征上均與其余評價員存在顯著差異,說明評價員1,6可能還沒有較好掌握中式卷煙風格感官評價方法,應將其剔除。
2.2.2 第二階段
分別計算在品質特征和風格特征評價一致的評價員(即剔除了評價員1,6后,余下的7位評價員)評分的平均值,得到第一次評吸該小組的評價結果(即10個樣品,每個樣品46個平均特征值)。對第二次評吸數據也采用兩階段統計法計算小組評價結果。剔除不一致評價員評價結果后,對兩次不同時間用兩階段統計法計算的評價結果進行三因素方差分析和多重比較,結果如表7和圖2所示。由表7可知,用兩階段統計法計算第一和第二次評吸的小組得分,兩次評價的P值為0.47,大于0.05,說明用兩階段統計法計算的第一和第二次評吸的小組評價結果之間不存在顯著差異;由圖2也可看出兩次評吸小組得分均落在了[2.60,2.63]區間內,可以肯定第一和第二次評吸小組得分差異不顯著。兩階段統計法的結果表明中式卷煙感官評價方法在不同時間的評價結果一致,這也間接說明中式卷煙感官評價方法是一種穩定可靠的評價方法。相比之下,簡單平均法由于受評價不準確的評價員的影響,得到在不同時間的評價結果不一致的錯誤結論。

表4 品質特征評價結果多重比較

表5 剔除不一致評價員后的品質特征評價結果方差分析

表6 剔除不一致評價員的風格特征評價結果方差分析

表7 兩階段統計法的兩次評吸小組得分的方差分析結果

圖2 兩階段統計法的兩次評吸小組得分多重比較圖
簡單平均法得到的第一次和第二次評價結果存在極顯著差異。采用兩階段統計法對兩次評價結果進行了分析,即階段一通過三因素方差分析和多重比較法先剔除與其他評價員差異較大的評價員,階段二再對剩下評價員的評分計算平均值。通過該方法清晰地分析出兩次評價結果存在差異的原因,剔除了不一致評價員的評價結果后,第一和第二次評吸的小組評價結果之間不存在顯著差異。說明簡單平均法得到的結論有誤。兩階段統計法可作為一種分析方法應用于卷煙感官評價領域的統計分析中,以消除異常評價員帶來的影響,確保對卷煙產品感官質量進行客觀、公正的評價和分析。
[1] 謝劍平,宗永立,屈展,等.單體香料在卷煙中作用評價方法的建立及應用[J].煙草科技,2008(4):5-8.
[2] 申玉軍,鄧國棟,陳良元,等.一種煙草感官評價分析方法的建立及應用[J].煙草科技,2011(5):15-18.
[3] 楊春強,宗永立,馬 驥,等.基于平均值置信區間的卷煙感官評價數據分析方法及應用[J].煙草科技,2013(8):62-66.
[4] 謝劍平.煙草香料技術原理與應用[M].北京:化學工業出版社,2009.
[5] Johnson R A,Wichern D W.Applied Multivariate Statistical Analysis[M].北京:清華大學出版社,2008.
[6] 武怡,張虹,趙震毅,等.中式卷煙風格特征感官評價方法的建立與應用[J].中國煙草,2008(2):69-71.
[7] 邵干輝,袁慶釗,溫東奇,等.國內國際品牌卷煙香味特征和致香成分比較分析[J].廣東科技,2008(20):43-46.
[8] 翁昔陽,劉藝,許建銘,等.香味輪廓分析法在卷煙評香中的應用[C]//中國煙草學會工業專業委員會煙草化學學術研討會論文集.海口:中國煙草學會,2005:468-472.
[9] 武怡,曾曉鷹,朱保昆,等.中式卷煙風格感官評價方法區域適應性分析[J].煙草科技,2012(9):5-9.
[10] 袁衛,龐皓,曾五一,等.統計學[M].北京:高等教育出版社,2009.
[11] 袁志發,周靜芋.多元統計分析[M].北京:科學出版社,2002.