毛園園
(東北石油大學數學與統計學院,黑龍江大慶163318)
葡萄酒評價的差異性及可信度研究
毛園園
(東北石油大學數學與統計學院,黑龍江大慶163318)
研究了兩組品酒員對葡萄酒評價結果有無顯著性差異及可信度。首先算出品酒員對每一類酒的每一項評價屬性的平均分,然后將每一項的平均分與相應的權重做乘積,以每位品酒員作為基本單位將10項屬性的分值相加得到的1個分值作為每一組的評價標準,即酒的質量。通過檢驗兩個獨立正態總體的關于均值是否相等的假設問題,得到葡萄酒評價結果有無顯著性差異。采用比較標準差的方法來判斷評價結果的可信度。
葡萄酒評價; t檢驗; 方差分析; 可信度
近年來,葡萄酒以其獨特的口感和較高的營養價值得到越來越多消費者的青睞,而對葡萄酒質量的評價也日益成為人們關注的熱點。評價葡萄酒的一般做法是由一批有經驗、有資質的品酒員進行評定,評酒員憑借自身豐富的經驗和敏銳的判斷力對葡萄酒進行分指標打分,然后求其總分,確定葡萄酒的質量[1-3]。但這種評價方式容易受到諸多主觀因素的干擾,比如品酒員所處的環境、當時的情緒狀態和個人的意愿喜好等差異均會對評價結果造成影響,對同一批次的葡萄酒的評價結果往往出現分歧。品酒員所做出的判斷應盡可能的客觀公正、準確穩定,因為其評價結果無論是對葡萄酒生產者的質量監督還是對葡萄酒購買者的選擇都具有重要的導向作用[4-5]。因此,為得到較為可靠的評價結果,需對品酒結果的差異性和可信度進行研究,以最終確定葡萄酒的質量。
根據相關數據可知,評酒員分別從葡萄酒的外觀、香氣、口感、整體4項對葡萄酒進行評價,總分值為100分。經觀察,我們發現數據中存在3個奇異數,第1組第4個評酒員對紅葡萄酒樣品20在色調項沒有評分,第1組第7個評酒員對白葡萄酒樣品3的持久性項的評分為77分,第1組第9號評酒員對白葡萄酒樣品8的持久性項的評分為16分,對這3個奇異值,我們均采用平均值來代替。
正態分布是一種最常見的連續型隨機變量的分布,在實際的生產和科學實驗中具有廣泛的應用。對于大量個體的特性統計分析,可以嘗試利用正態分布來估量。因此,可對葡萄酒樣本的評分數據進行正態性檢驗,以判斷該評分是否科學合理。
對每一個葡萄酒樣品每組有10個評酒員對它進行打分,這10個評酒員的得分的平均值作為該葡萄酒樣品的得分,即酒的質量,從而我們就得到總體Xi樣本(Xi1,Xi2,……,Xi27)的觀測值(i=1,2),同理,我們也得到總體Yi樣本(Yi1,Yi2,……,Yi27)的觀測值(i=1,2)。通過統計軟件SPSS中的P-P圖和單樣本K-S檢驗方法[6],對收集到的4組樣本數據分別進行紅、白葡萄酒正態分布檢驗,其結果見圖1、圖2。

圖1 第1組、第2組紅葡萄酒評價結果的正態P-P圖
從圖2可明顯看出,數據的散點分別近似為一條直線,且與對角線大致重疊,兩組品酒員對葡萄酒的評分數據符合正態分布,結果見表1—表4。

表1 第1組紅葡萄酒評價結果的k-s檢驗結果

表2 第2組紅葡萄酒評價結果的k-s檢驗結果

表3 第1組白葡萄酒評價結果的k-s檢驗結果

表4 第2組白葡萄酒評價結果的k-s檢驗結果
從表1—表4的k-s檢驗可知,雙邊檢驗結果均大于0.05,表明這4組樣本數據均服從正態分布。為此我們假設總體Xi~N(μi,σi2)、Yi~N(ai,bi2),其中,μi、σi2、ai、bi2為未知參數。
為分析兩組評酒員的評分是否科學和可信,需對評分結果進行顯著性檢驗[7]。即檢驗這樣一個假設:H0∶μ1=μ2,H1∶μ1≠μ2,是一個獨立兩個正態總體的關于均值是否相等的檢驗問題。
在檢驗假設H0∶μ1=μ2,H1∶μ1≠μ2之前,我們首先要討論兩總體方差是否相等[7]。?



于是,用t統計量表示兩總體均值差檢驗的檢驗統計量,表達式為:

當μ1-μ2=0(零假設),故可不考慮。在上述情?況(1)下(當時),t統計量服從自由度為n1+n2-2的t分布,t~tn1+n2-2;在情況(2)下(當時),服從定義如式(5)自由度的t分布,修正的自由度為[8]:

分別用F檢驗和t檢驗來判斷兩總體的方差和均值是否存在顯著性差異[7],并據此決定抽樣分布的方差和自由度的計算方法和計算結果。在顯著性水平a下,若F檢驗和t檢驗統計量的概率p值均小于a,則應拒絕原假設,認為兩總體方差和均值都有顯著性差異,此時t統計量的結果由式(2)和式(4)計算得出。相反,若兩者概率p值均大于顯著性水平a,則接受原假設,認為兩總體方差和均值都沒有顯著性差異,此時t統計量的結果由式(1)和式(2)計算得出。
進行獨立樣本檢驗,使用統計學軟件SPSS[9],結果見表5。

表5 紅葡萄酒的獨立性檢驗結果
兩總體方差有是否存在顯著性差異的F檢驗。由表5檢測結果可知,F統計量的觀察值為3.341,概率p值為0.073。在顯著性水平a=0.1情況下,可認為兩總體的方差存在差異。
檢驗兩總體均值是否相等,t統計量的觀測值為1.488,概率p值為0.143,在顯著性水平a=0.1情況下,由于概率p值大于0.1,則不能拒絕原假設,即此兩組評酒員之間的評價結果沒有顯著性差異。因此取兩組評酒員的得分的平均值作為紅葡萄酒的最終評分。
同理,通過對白葡萄酒樣本進行t檢驗,結果見表6。

表6 白葡萄酒的獨立性檢驗結果
由表6檢測結果可知,白葡萄酒兩組樣本數據的F統計量的觀察值為4.185,相應的概率p值為0.046。在顯著性水平a=0.1情況下,由于概率p值(0.046)小于0.1,故拒絕原假設,認為兩總體的方差存在顯著差異;再進行白葡萄酒兩組樣本數據均值差的檢驗,由式(3)和式(5)得t統計量的觀測值為-2.347,在顯著性水平a=0.1情況下,對應的雙尾概率p值為0.023,概率p值小于0.1,同樣拒絕原假設,即白葡萄酒兩組評酒員之間的評價結果存在顯著性差異。
可通過比較標準差大小的方法來分析兩組評價結果的可靠性。方差的大小反映了品酒員之間對于樣品酒評價的統一性,在無外界干擾的情況下,方差越小,說明評價越統一,進而說明結果越可信。由于每種酒的質量客觀上已經是確定的,所以我們首先分別算出兩組品酒員給出的每種酒樣的每個屬性20個分值的平均值,以此作為參考標準。再分別算出每一組品酒員對每一個屬性評分的標準差,同種酒樣的對應屬性的標準差進行比較,在兩組評酒員的評價結果無顯著性差異。
所有的屬性中統計標準差較小的那個屬性個數,哪組的所統計屬性多,我們判定該組品酒員對于此酒樣的評價更可靠。重復此工作我們可以得出兩組品酒員各自可靠酒樣的數量,比較大小,認為所含可靠酒樣數量多的組的評價結果更可靠。由于10屬性可能出現每組標準差比較之后出現每組5個的情況,我們將每個酒樣的總分也作為一個屬性進行比較。
兩組品酒員對紅葡萄酒評分的總平均值:

兩組品酒員對白葡萄酒評分的總平均值:

第1組品酒員對于紅葡萄酒每個屬性評分的標準差:

第2組品酒員對于紅葡萄酒每個屬性評分的標準差:

第1組品酒員對于白葡萄酒每個屬性評分的標準差:

第2組品酒員對于白葡萄酒每個屬性評分的標準差:

得到兩組標準差首先對于表示每種酒樣的屬性進行比較,11對標準差作比較,標準差小的屬性的數量越多的組,說明在此種酒中評分可靠,再對27種酒做整體比較,多數評分可靠,說明在整體中評分可靠。
結果分析:取第1種紅、白葡萄酒作為示例,見圖3、圖4。
由圖3可知,第2組的標準差較小的屬性有6個,故認為第2組的評價更為可靠。

圖3 紅葡萄酒樣品第1組、第2組的屬性標準差

圖4 白葡萄酒樣品第1組、第2組的屬性標準差
由圖4可知,第2組的標準差較小的屬性有8個,故認為第2組的評價更為可靠。重復該工作,統計每組可靠評價的酒樣,結果見表7。

表7 兩組可靠評價酒樣的個數
由表7可知,紅葡萄酒和白葡萄酒都是第2組的可靠評價酒樣數遠遠大于第1組,故認為兩種酒均是第2組的評價更為可靠。
現有的葡萄酒評價方法帶有很大的主觀因素,本研究在對兩組品酒員的評價結果進行分析與簡單處理之后,運用t檢驗和比較組內標準差的方法,分別探討兩組樣本數據的差異性和可信度,得到如下結論:首先,葡萄酒的樣本數據服從正態分布;其次,通過檢驗兩獨立正態總體的均值是否相等,得到紅葡萄酒的兩組品酒員的評價結果沒有顯著性差異,白葡萄酒兩組品酒員的評價結果有顯著性差異;最后,利用反映波動的標準差來評價兩組品酒員對葡萄酒打分結果的可信度,分析得出紅葡萄酒和白葡萄酒都是第2組評酒專家的打分相對可信一些,因此取第2組評酒專家的得分作為紅葡萄酒和白葡萄酒的最終評分。
[1]吳浩,靳保輝,陳波,等.葡萄酒產地溯源技術研究進展[J].食品科學,2014,35(21):306-314.
[2]王華,趙現華,劉晶,等.葡萄與葡萄酒生產可持續發展研究進展[J].中國農業科學,2010,43(15):3204-3213.
[3]李運,李記明,姜忠軍.統計分析在葡萄酒質量評價中的應用[J].釀酒科技,2009(4):79-82.
[4]高學峰,楊繼紅,王華.葡萄及葡萄酒生產過程中副產物的綜合利用研究進展[J].食品科學,2015,36(7):289-295.
[5]張苗苗,曹國珍,繆建順,等.物理方法在釀造酒催陳中的研究進展[J].食品工業科技,2015,36(12):395-399.
[6]何曉群.多元統計分析[M].3版.北京:中國人民大學出版社,2012.
[7]王創.統計假設檢驗中顯著性水平α的選擇[D].蘭州:蘭州商學院,2013.
[8]張鳳菊,劉曉娟,趙麗平,等.數據差異顯著性檢驗[J].農機使用與維修,2012(4):51-52.
[9]滕沖,汪同慶.SPSS統計分析[M].武漢:武漢大學出版社,2014.
Difference and Reliability of Wine Evaluation
MAO Yuanyuan
(School of Math and Statistics,Northeast Petroleum University,Daqing,Heilongjiang 163318,China)
The study aimed at investigating the difference and the reliability of wine evaluation between two groups of wine judges.Firstly,the average score of each item for each type of wine was calculated.Then the average of each item and its corresponding weight worked out the product.With each wine judge as the basic unit,the score of ten attributes were added up as the standard score of evaluation for each group(namely,the quality of wine).Through the verification of the hypothesis-whether the mean of the two independent normal subjects was equal or not,we reached the conclusion that there was no significant difference in wine evaluation.Besides,the standard deviation method was adopted to judge the credibility of wine evaluation results.
wine evaluation;t test;variance analysis;reliability
TS262.6;TS971;TS261.7
A
1001-9286(2017)12-0032-05
10.13746/j.njkj.2017265
黑龍江省自然科學基金青年科學基金項目(QC2016002)。
2017-09-29
毛園園(1992-),女,碩士研究生,研究方向:統計學,E-mail:18645994523@163.com。
優先數字出版時間:2017-10-17;地址:http://kns.cnki.net/kcms/detail/52.1051.TS.20171017.1002.001.html。
2016年中國葡萄酒銷量增幅全球第一
本刊訊:據《中國酒業新聞》報道,2017年11月13日,歐睿國際的統計數據顯示,2016年亞洲葡萄酒銷售達933億美元或61億公升,中國葡萄酒消費量初步統計達17.2億升,增幅位居全球之首。
預計2016—2021年期間,亞洲葡萄酒銷售額平均每年將增長8.5%,銷售量則增長3.9%。此外,根據國際葡萄與葡萄酒組織(OIV)公布的數據顯示,2016年中國葡萄酒消費量初步統計達17.2億升,增幅位居全球之首。(江源薦,黃筱鸝編輯)
來源:中國酒業新聞 2017-11-15