李焱
摘 要:文章針對葡萄酒的評價問題,利用統計分析的方法,建立了相應的數學模型,分析了葡萄酒感官指標與理化指標之間的聯系,論證了葡萄酒感官評價的有效性。
關鍵詞:t檢驗 主成分分析 聚類分析 相關分析 多元線性回歸 逐步回歸
中圖分類號:F222 文獻標識碼:A
文章編號:1004-4914(2014)09-203-03
一、問題的提出
在以往對葡萄酒進行評價中,主要是通過評酒員對葡萄酒的色、香、味的感官印象對葡萄酒進行打分從而評定葡萄酒的質量。但是由于評酒員間存在評價尺度、評價位置和評價方向等方面的差異,導致不同評酒員對同一酒樣的評價差異很大,從而不能真實地反映不同酒樣間的差異。所以需要建立更科學的評價體系對葡萄酒的質量進行定量評價。
聘請一批有資質的評酒員對葡萄酒進行品嘗對其分類指標打分,然后求和得到其總分,從而確定葡萄酒的質量。已知釀酒葡萄與所釀葡萄酒的質量有直接的關系,葡萄酒和葡萄的理化指標可以反映部分葡萄酒和葡萄的質量。某一年份一些葡萄酒的評價結果為已知,在給出了該年份這些葡萄酒的和葡萄的成分數據的基礎上建立數學模型討論問題:兩組評酒員的評價結果有無顯著性差異,哪一組結果更可信?
二、問題的分析
對于此問題,要分析兩組評酒員的評價結果有無顯著性差異,并判斷評價結果的可信度。可由不同組評酒員對不同類樣本的葡萄酒評分,對這些數據進行統計分析。考慮到紅、白葡萄酒之間的差異性,對這兩種酒分別進行顯著性差異檢驗。首先計算每組10位評委打分的均值作為對不同酒樣本的評價值,利用檢驗對兩組評酒員評價結果進行顯著性分析。在顯著性水平α=0.05下,建立檢驗模型,確定兩組評委評價的顯著性差異。
分析評價結果是否可信,主要依賴于兩個指標:一是評價得分偏離標準值的大小;二是評價結果的離散性。由于聘請的品酒師是有一定資質的,因此可以把專家的平均水平作為品評的標準值。但考慮到品酒師對某個酒樣品感官分析可能出現的失誤性(引注),剔除20個品酒師對每類酒樣品評分的異樣點。對于剩余的得分求均值作為標準評價值的無偏估計。再用評價得分與標準值的偏差代表每組評酒員評價結果與標準值的接近程度;用方差來反映每組評價結果的離散程度。在與標準值的偏差不明顯的情況下,比較評價方差的大小,作為綜合判斷每組評價結果的可信度的依據。
三、模型的假設與符號的說明
(一)模型的假設
1.假設評酒員對不同酒樣品的評價得分服從正態分布。
2.假設我們對附件二缺省的數據的補充是合理的。
(二)符號的說明
Es表示標準值期望向量;
Fj表示第j號評酒員的標準評價得分;
xij表示第i個酒樣品的第j項理化指標數據;
δj表示第j項理化指標的標準差。
四、模型的建立與求解
為了體現評委對紅、白葡萄酒評價得分的區別,分別對兩種酒建立顯著性差異檢驗模型。
(一)評價得分的描述性分析
由問題的分析,以白葡萄酒為例通過對評價得分的數據處理,得到兩組評酒員的檢驗數據表,如表1所示:
由該表可知:葡萄酒感官評價中,由于品酒員間存在評價尺度、評價位置和評價方向等方面的差異,同一評酒員對不同酒樣品的評分偏差較大;不同品酒員對同一酒樣品評分偏離平均值的分散范圍也較大。從而不能真實地反映不同酒樣品的差異,因此需要對評酒員評價結果做顯著性差異檢驗。
(二)t檢驗模型的建立
由假設一,評酒員對不同酒樣的評價得分服從正態分布。
設兩組評酒員(ξ,η)對不同酒樣的評分值為(ξ1,η1),(ξ2,η2),…,(ξn,ηn),ξ服從N(a1,σ1),η服從N(a2,σ2),σ1和σ2均未知。為了檢驗評價結果的差異性,即需檢驗假設 H0:a1=a2是否成立。
記Z=ξ-η,Zi=ξi-ηi(i=1,2,…,n),將Z看成一維的總體,Z1,Z2…,Zn為其樣本,Z服從N(a1-a2,σ),記a1-a2=a。此時,原來對品酒結果的差異性檢驗,變成了對總體Z的數學期望a是否等于零的檢驗。
(三)t檢驗的一般步驟:
1.建立假設H0:a=0,H1:a≠0。
2.構造檢驗統計量。
利用統計軟件SPSS19.0得到白葡萄酒檢驗的結果如表2所示:
由該統計指標sig<0.05得出第一、二組的白葡萄酒評價結果有顯著性差異。說明第一、二組的評酒師對于白葡萄酒的評價水平是不同的,需要對可信度進行分析。
(四)評價結果的可信度分析
由問題分析,評價結果是否可信,依賴于兩個指標:評價得分與標準值期望差的歐氏距離,每組評價結果的方差。
1.確定評價標準值。以紅葡萄酒為例,分析評酒員二和評酒員七對所有酒樣品評分的差異值,進而分析評酒員對某個酒樣品感官分析可能出現的失誤性,如圖1、圖2所示:
由圖1可知,評酒師二號對酒樣品的評價得分離散性較大,感官分析具有一定誤差性,評價得分的奇異點不利于標準評價值的確定。進而剔除20個品酒師對每類酒樣品評分的異樣點。對于剩余的得分求均值作為標準評價值的無偏估計。
生成標準值期望向量Es:Es=(E1,E2,…,En),其中,Ej表示第j號評酒員的標準評價得分。
2.確定可信度指標。分別取第i組(i=1,2)十名評酒員對白葡萄酒樣的評價結果構成m×n矩陣(m=27,n=10)。該矩陣列向量均值為Eaj(1≤j≤n),則評價結果的期望向量:
Em=(Ea1,Ea2,…,Ean)
定義兩向量的歐氏距離反映與標準評價值的偏差:
通過比較Ω大小即可確定每組評價結果和標準值的接近程度。如果Ω越接近0,說明此組評價結果與標準值很接近。進而初步判斷兩組評價結果的可信度。在評價結果可信度相差不大的情況下,利用評價結果的方差指標做進一步確定。
定義評價標準差向量:
定義標準差向量模為:
σ值越大,說明該組評價結果的得分離散程度越大,可信度越低。從而可以通過比較Ω接近0的程度,再結合σ大小,判斷該模型的可信性。如果Ω越接近0,σ值越小,評價結果越可信。反之,Ω越大,σ值越大,評價結果越不可信。
3.確定兩組評價結果的可信度。通過MATLAB編程計算分別得到第一組和第二組紅、白葡萄酒的可信度指標,如表3所示:
由該表可知表中數據偏離標準值的指標Ω的值比較接近,就是紅、白葡萄酒一、二組的期望與標準期望值差異不大,不能有效的辨別。需要進一步比較評價標準差向量模σ,而紅、白葡萄酒均為第一組評價結果方差大于第二組,說明整體水平相同的情況下第一組的水平波動性大、穩定性小,可以得出第二組的紅葡萄酒評價結果更可信。
五、結語
在此模型中,我們對兩種葡萄酒分別進行了顯著性差異檢驗,并在顯著性水平0.05下,建立了t檢驗模型,確定兩組評酒員評價的顯著性差異,并分析了造成顯著性差異的原因。綜合考慮評價的期望與標準值期望之差和方差,分析評價了結果的可信性。
在未來的研究中,還可對數據做多因子方差分析,此方法可以不必考慮評酒員對不同酒樣的評價得分是否服從正態分布。確定兩組評酒員評價的顯著性差異后,可以繼續對不同評酒員不同酒樣本的評分作描述性分析,確定單個評酒員差異性對評價結果的影響,并進一步深入分析。
[黑龍江省教育廳科學研究項目(12543073)]
參考文獻:
[1] 王文靜.感官評價在葡萄酒研究中的應用[J].釀酒,2007(4)
[2] 李記明.關于葡萄品質的評價指標[J].中外葡萄與葡萄酒,1999(1)
[3] 李華,劉曙,王華,張予林.葡萄酒感官評價結果的統計分析方法研究[J].中國食品學報,2006(2)
[4] 李運,李記明,姜忠軍.統計分析在葡萄酒質量評價中的應用[M].釀酒科技,2009(4)
[5] 李華,楊永鋒,郭明浩,劉樹文.影響干紅葡萄酒感官質量的因素分析[M].生物數學學報,2005(2)
[6] 李華,劉勇,強郭,安鵲,梁新紅,康文懷,陶永勝.運用多元統計分析確定葡萄酒感官特性的描述符[J].中國食品學報,2007(4)
[7] 韓中庚,郭曉麗,杜劍平.實用運籌學——模型、方法與計算[M]北京:清華大學出版社,2007
(作者單位:黑龍江科技大學理學院 黑龍江哈爾濱 150027)
(責編:賈偉)