柯正友
(河南師范大學,河南 新鄉 453007)
基于逐步回歸方法的釀酒葡萄對葡萄酒理化指標的影響研究
柯正友
(河南師范大學,河南 新鄉 453007)
釀酒葡萄的質量在一定程度上可以影響葡萄酒的品質。為了分析釀酒葡萄與葡萄酒的理化指標之間的聯系,文章首先對兩者理化指標數據進行標準化預處理,消除量綱的差異,運用相關系數的方法,針對每個指標進行相關系數分析,得出其對于紅葡萄、花色苷、單寧、總酚、酒總黃酮、DPPH的線性相關性比較強,對于白葡萄、單寧、總酚、酒總黃酮的線性相關性比較強的結論。文章運用逐步回歸的方法進行分析,找出了釀酒葡萄的所有指標對葡萄酒指標的影響,從而確定兩者之間的聯系,可得出葡萄酒的理化指標是受釀酒葡萄中的一個或多個理化指標影響的。
相關系數;線性相關性;逐步回歸
為了分析出釀酒葡萄和葡萄酒的理化指標之間的聯系,分析實驗數據,葡萄酒所含的理化指標包含在釀酒葡萄的理化指標中,所以只對它們共有的理化指標進行分析,針對每一種釀酒葡萄和葡萄酒共有的理化指標求出釀酒葡萄和葡萄酒的相關系數[1],然后分析兩者的相關性。最后運用逐步回歸[2]的方法,對每一種釀酒葡萄的理化指標分析葡萄酒的理化指標對其的影響。
相關系數時變量之間相關程度的指標,樣本相關系數用r表示,|r|值越大,變量之間的線性相關程度越高。相關系數的計算方法為:

本文只對一級指標進行分析,對于某些指標測試多次的情況,對多次測試的值取平均值作為此指標的最后值,分析數據可知,葡萄酒所含的理化指標包含在釀酒葡萄的理化指標中,所以只對它們共有的理化指標進行分析,總后確定紅葡萄的分析需要9項理化指標,白葡萄的分析需要8項理化指標。
數據有不同的性質和不同的量綱,為了處理問題的方便,需要對原始數據進行標準化處理。
分別對每一個理化指標求出釀酒葡萄和葡萄酒的相關系數,在這里使用MATLAB中的corrcoef函數求相關系數,結果如表1所示。
由表中數據可知,對于紅葡萄、花色苷、單寧、總酚、酒總黃酮,DPPH的線性相關性比較強,對于白葡萄、單寧、總酚,酒總黃酮的線性相關性比較強。
逐步回歸分析,首先要建立因變量y與自變量x之間的總回歸方程,再對總的方程及每一個自變量進行假設檢驗,當總的方程不顯著時,表明該多元回歸方程線性關系不成立;而當某一個自變量對y影響不顯著時,應該把它剔除,重新建立不包含該因子的多元回歸方程,篩選出有顯著影響的因子作為自變量,并建立“最優”回歸方程。
MATLAB統計工具箱中提供了stepwise函數,用來作交互式逐步回歸分析,尋找最優回歸方程。下面調用stepwise函數分別對紅、白葡萄酒的每一個理化指標與紅、白葡萄的所有理化指標進行分析,可以得到多個逐步回歸交互式畫面(見圖1),結果如表2—3所示。

表1 各指標相關系數

表2 紅葡萄酒指標逐步回歸結果

表3 白葡萄酒指標逐步回歸結果

圖1 逐步回歸交互式畫面
Stepwise Regression窗口,顯示回歸系數及其置信區間和其他一些統計量的信息。綠色表明在模型中的變量,紅色表明從模型中移去的變量。在這個窗口中有Export按鈕,點擊Export產生一個菜單,表明了要傳送給MATLAB工作區的參數,它們給出了統計計算的一些結果。F為統計量,其值越大越接近真實值;intercept為所求的表達式的常數項;RMSE表示剩余標準差,表達式的系數用進入模型中的變量的coeff值表示。
如圖1所示x4,x24是在模型中的變量,其他的都從模型中移去; 在回歸過程中,RMSE的變化不大,只有x4,x24在模型中的時候F值最大。


[1]李宏彬,赫光中,果秋婷.基于皮爾遜相關系數的有機質譜相似性檢索方法[J].化學分析計量,2015(3):33-37.
[2]王冬梅,沈頌東.逐步回歸分析法[J].工業技術經濟,1997(3):57-60.
[3]肖華勇.大學生數學建模競賽指南[M].北京:電子工業出版社,2015.
Study on the in fl uence of wine grape on the physical and chemical indexes of wine based on stepwise regression method
Ke Zhengyou
(Henan Normal University, Xinxiang 453007, China)
The quality of wine grapes can affect the quality of wine to a certain extent. In order to analyze the relationship between wine grape and the physical and chemical indexes of wine, the article fi rst gave a standardized pretreatment to the physical and chemical index data of the two, and eliminated the dimensional differences, using the method of correlation coef fi cients, focuses on analysis of correlation coef fi cients for each index, the results showed that the linear correlation between red grape, anthocyanin, tannin, total phenolics, total fl avones and DPPH was strong, and the linear correlation between white grape, tannin, total phenolics and total fl avones of wine was relatively strong, and the linear correlation between total fl avonoids of white grape, tannin, total phenol and wine was stronger. This paper uses the method of stepwise regression to analyze, fi nding out the impact of all the indexes of wine grapes on wine indexes, so as to determine the link between the two, it can be concluded that the physical and chemical indexes of wine are in fl uenced by one or more physical and chemical indexes of wine grapes.
correlation coef fi cient; linear correlation; stepwise regression
河南師范大學2015年度國家級大學生創新創業訓練計劃項目;項目編號:201510476058。
柯正友(1995— ),男,河南信陽,本科。