曾祥燕 趙良忠 孫文兵 蔣盛巖
ZENG Xiang-yan 1 ZHAO Liang-zhong 1 SUN Wen-bing 2 JIANG Sheng-yan 1
(1.邵陽學院生物與化學工程系,湖南 邵陽 422200;2.邵陽學院理學與信息科學系,湖南 邵陽 422200)
(1.Department of Biology and Chemical Engineering,Shaoyang University,Shaoyang,Hunan 422000,China;2.Department of Mathematics and Information Science,Shaoyang University,Shaoyang,Hunan 422000,China)
產品品質的控制與預測對食品的生產具有重要的意義,可以減少原材料的浪費、降低生產成本和減少試驗誤差等。已有研究[1-4]表明,國外科學家已將人工神經網絡應用于農產品和食品品質的預測,取得了滿意的效果。中國學者秦萬廣等[5]模仿生物嗅覺系統,由氣敏傳感器陣列結合神經網絡模式識別技術構成了仿生鼻。用它對幾種白酒進行了分類和識別試驗,結果表明其不僅能識別不同的白酒,而且還可以識別真假白酒。任亦賀等[6]使用主成分分析、遺傳算法和神經網絡建立啤酒感官評價模型,該模型對50種啤酒的感官得分進行預測,預測最大相對誤差為16.08%,經過對感官評價的分析,最大相對誤差小于20%認為可信。結果表明,該方法能有效地預測啤酒感官評價。
葡萄酒具有抗氧化作用,能降低心血管疾病的發病率。但是葡萄酒質量的評價非常復雜,一般由專業的品酒師進行打分評價,以分數的高低來決定酒的質量,同一種酒因不同的品酒師給出的分數相差很大。在正常釀造的情況下,葡萄酒的質量與釀酒所用的葡萄的質量密切相關。文章以27種葡萄酒樣品、釀酒葡萄和葡萄酒的理化指標、品酒師對該葡萄酒的評分數據為依據,運用主成分分析和BP神經網絡,進行葡萄酒品質的預測,對減少人為誤差具有重要意義。
數據來源于2012年中國大學生數學建模競賽題目——葡萄酒的評價,題目提供了評酒員對酒的外觀分析(15)、香氣分析(30)、口感分析(44)、整體評價(11)的評分,釀造該葡萄酒所用葡萄的26種一級理化指標,以及葡萄酒的7種一級理化指標,共33種理化指標可能影響啤酒的質量。
1.2.1 主成分分析法 該研究共有27種葡萄酒樣品,33種理化指標,如果直接利用BP神經網絡進行分析,網絡的輸入層數多,網絡結構復雜,網絡收斂步數長,運行效率低,運用主成分和BP神經網絡相結合,能對以上問題進行簡化。主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉為少數幾個綜合指標;它把給定的一組相關變量通過線性變換轉成另一組不相關的變量,這些新的變量按照方差依次遞減的順序排列。在數學變換中保持變量的總方差不變,使第一變量具有最大的方差,稱為第一主成分,第二變量的方差次大,并且和第一變量不相關,稱為第二主成分,依次類推。主成分的分析方法主要有以下步聚構成:
(1)原始指標數據的標準化:

(2)對標準化陣Z求相關系數矩陣:標準化后的樣本相關矩陣為Z,然后計算R的特征值λk(k=1,2,…,a)以及各個特征值對應的標準化正交特征向量αk= (αk1,αk2,…,αkp)T。

1.2.2 BP神經網絡 BP神經網絡是一種多層前饋神經網絡,可以實現從輸入到輸出的任意非線性逼近,具有良好的自組織、自適應和容錯性,應用十分廣泛,其模型拓撲結構包括輸入層、隱含層和輸出層。BP網絡設計的最大特點就是網絡的權值是通過使用輸入與輸出樣本之間的誤差平方和達到期望值而不斷調整網絡的權值訓練出來的。因此BP網絡的設計過程是一個參數不斷調整的過程。以釀酒葡萄的26種一級理化指標和葡萄酒的7種一級理化指標,品酒師對該葡萄酒的評分為依據,通過主成分分析法,并利用SPSS軟件可以求出酒質量與各理化指標的相關系數矩陣,并確定它們之間的影響程度,找出方差的累積率達85%以上各主成分因素,進行網絡建模。本模型采用3層拓撲結構,以各主成分得分作為輸入層數據,每種葡萄酒的得分為輸出層數據,結構見圖1。
對27種紅葡萄酒的7種一級理化指標和釀造該葡萄酒所用葡萄的26種一級理化指標建立M27-33矩陣,運用SPSS19.5軟件對原始數據進行主成分分析,得初始特征值和解釋的總方差,具體見表1。由表1可知,前9個主成分,方差的累積率已達到86.577%,可以認為取前9個主成分已經能夠代表葡萄酒質量的絕大部分信息。

表1 主成分的特征值及方差貢獻率Table 1 Eigenvalues and variance contribution of principal components
對因子矩陣按照最大方差法進行正交旋轉,得旋轉成分矩陣見表2。由表2可知,第1個主成分代表葡萄酒中的花色苷、單寧、總酚、酒總黃酮、白藜蘆醇、DPPH半抑制體積和釀酒葡萄中的花色苷、DPPH自由基、總酚、單寧、葡萄總黃酮;第2個主成分代表葡萄酒中的花色苷、色澤和釀酒葡萄中的花色苷、蘋果酸、褐變度;第3個主成分代表,釀酒葡萄中的氨基酸總量、總糖、可溶性固形物、干物質含量;第4個主成分代表,釀酒葡萄中的p H值、總糖、可滴定酸、固酸比;第5個主成分代表,釀酒葡萄的果穗質量、百粒質量、果皮質量;第6個主成分代表,釀酒葡萄中的黃酮醇、果梗比;第7個主成分代表,釀酒葡萄中的酒石酸、檸檬酸;第8個主成分代表,釀酒葡萄中的VC含量、果梗比、多酚氧化酶活力;第9個主成分代表,釀酒葡萄中的黃酮醇、果梗比、VC含量。

表2 旋轉因子負荷矩陣Table 2 Cotation component loading matrix
使用主成分分析法提取其中9個主成分進行分析,可以用較少的變量解釋所有的變量,使相關性很高的變量轉換成相互獨立或不相關的變量。葡萄酒生產企業可以通過檢測這些主成分的質量指標,來評價葡萄酒的風味和質量,能對葡萄酒的生產和質量控制起到一定的指導作用。
2.2.1 神經網絡各層數和模型的確定 將原始矩陣通過主成分分析以后,提取出來的9個主成分得分作為輸入數據,即輸入接點為9,具體數據見表3,將評酒員對酒的綜合評分作為輸出數據,既輸出層為1,隱含層的單元數目選擇是個十分復雜的問題,往往需要根據設計者的經驗和多次試驗來確定,因而不存在一個理想的解析式來表示隱含層的單元數目,經選擇不同的隱含層的單元數目建模比較,隱含層的單元數選用35個單元,誤差小,模型較好,即建立9-35-1拓撲結構的神經網絡圖。輸入層到隱含層的α1采用Tansig作為訓練函數,隱含層到輸出層的α2采用purelin作為傳遞函數;網絡訓練函數為Levenberg-Marquardt;訓練函數trainlm;學習速率為0.01:net.trainParam.lr=0.01;動量系數為0.9:net.train-Param.mc=0.9;訓練次數為1 000:net.trainParam.epochs=1 000;訓練目標為0.01:net.trainParam.goal=0.01[7,8]。

表3 BP神經網絡的輸入和輸出數據Table 3 Input and output data of BP neural network
2.2.2 神經網絡分析 以1號到25號作為網絡的訓練數據,以26和27號數據作為預測樣品,以檢驗模型的準確性和可靠性。利用以上程序進行網絡訓練,PCA-BP神經網絡預測結果見表4。同樣以釀造該葡萄酒所用葡萄的26種一級理化指標,以及葡萄酒的7種一級理化指標,共33種理化指標作為輸入層,將評酒員對酒的綜合評分作為輸出層,其余的參數、函數同以上的模型一致,建立33-35-1拓撲結構的神經網絡圖進行網絡訓練。在相同的學習速率、迭代次數和誤差范圍,PCA-BP神經網絡19步就可以收斂,而BP神經網絡需要150步才可以收斂。用PCA-BP網絡模型不僅簡化了網絡結構,而且加快了網絡的收斂速度。

表4 PCA-BP神經網絡預測結果Table 4 Predictive result of PCA-BP neural network
在隱含層都為35,采用主成分和BP神經網絡模型比單純采用BP神經網絡模型收斂速度更快,運行20次就能滿足模型要求;由表4可知,模型絕對誤差的最大值為0.35,能完全滿足模型試驗誤差要求。基于主成分-BP神經網絡模型,不改變樣本的數據結構,能減少變量的輸入,消除網絡因子之間的相關性,能更好地提高網絡的學習速率和識別能力。
BP神經網絡有較好的泛法能力,主成分分析通過降維,把多指標轉為少數幾個綜合指標,兩種方法相結合,運用葡萄和葡萄酒的一級指標對葡萄酒質量進行評價,可以有效地克服品酒師的人為誤差,更能準確地反映葡萄酒的內在品質。從輸入層神經元的個數來看,BP網絡的輸入神經元個數是33個,基于主成分分析的BP網絡的輸入神經元個數為9個,減少了輸入層的層數,簡化了神經網絡結構;主成分分析方法與BP神經網絡方法相結合,建立的9-35-1拓撲結構的神經網絡,模型絕對誤差的最大值為0.35,能完全滿足模型試驗誤差要求;該模型利用已知信息,能減少變量的輸入,消除網絡因子之間的相關性,能更好地提高網絡的學習速率和識別能力,尤其對大量而非線性的樣品數據而言,該模型具有更優的性能,比單純采用BP神經網絡模型收斂速度更快,運行20次即可滿足模型要求。
1 Adnan Topuz.Predicting moisture content of agricultural prod-ucts using artificial neural networks[J].Advances in Engineering Software,2010(41):464~470.
2 Poonpat Poonnoy,Ampawan Tansakul,Manjeet Chinnan.Artificial neural network modeling for temperature and moisture content prediction in tomato slices undergoing microwave-vacuum drying[J].Journal of Food Science,2007,72(1):42~47.
3 Kamyar Movagharnejad,Maryam nikzad.modeling of tomato drying using artificial neural network [J].Computers and Electronics in Agriculture,2007(59):78~85.
4 S Lertworasirikul,Y Tipsuwan.Moisture content and water activity prediction of semi-finished cassava crackers from drying process with artificial neural network[J].Journal of Food Engineering,2008(84):65~74.
5 秦萬廣,趙成軍.基于神經網絡的仿生鼻及其在酒類識別的試驗研究[J].食品與機械,2005,21(5):33~35.
6 任亦賀,駱學雷,豐水平,等.基于主成分分析、遺傳算法和神經網絡對啤酒感官評價預測的研究[J].中國釀造,2010(2):50~53.
7 彭波,李旭宇.TCS230顏色傳感器結合BP神經網絡在顏色識別系統上的研究[J].食品與機械,2010,26(3):108~112.
8 黎移新.基于前饋神經網絡的臍橙糖度及有效酸度檢測[J].食品與機械,2009,25(2):78~81.