薛大為,楊春蘭
(蚌埠學院 機械與電子工程系,安徽 蚌埠 233030)
黃山毛峰茶有著悠久的歷史,是中國的名茶之一,因產于安徽黃山地區而得名。當前,對于黃山毛峰茶品質的評定,主要還是采用感官評定法。然而,感官評定法評價結果受主觀因素影響較大,評價具有不確定性[1],因此很多研究者都致力于研究更加客觀的評定方法來取代或輔助感官評定法。茶葉香氣是影響茶葉品質的重要因素,會隨茶葉品質的不同而產生相應變化。茶葉香氣是由多種揮發性物質共同作用而形成,構成復雜,很難通過單一或少數幾個傳感器進行檢測[2]。電子鼻技術的出現使得從較全面的角度對香氣信息進行檢測成為可能。
電子鼻是一種仿生物嗅覺功能的人工嗅覺系統,在氣味識別方面具有獨特的優勢,近年來,在食品、化工、飲料等工業得到廣泛應用[3-6]。電子鼻主要包括氣敏傳感器構成的傳感器陣列和模式識別軟件兩個部分。模式識別是電子鼻的核心技術,常用的方法有主成分分析法、人工神經網絡及線性判別法等。人工神經網絡由于具有較強的非線性映射映射能力,在電子鼻技術中越來越受到廣大研究者的關注。本文采用電子鼻對4種不同品質等級的黃山毛峰茶香氣進行檢測,根據傳感器陣列響應選擇合適的特征變量,通過神經網絡建立黃山毛峰茶品質等級預測模型,實現對茶葉等級的客觀判別。
采用德國Airsense公司生產的PEN2型電子鼻,該電子鼻包含10個金屬氧化物氣敏傳感器組成的傳感器陣列和數據分析軟件。電子鼻響應信號為傳感器陣列接觸揮發性氣體后的電導率G與經過標準凈化裝置處理后的電導率G0的比值,即G/G0。
試驗選擇R70,R100,R300,R600(數字代表茶葉的價格元/斤)4種不同品質等級的黃山毛峰干茶葉,每個等級各取35個樣本,共140個樣本,每個樣本為50 g。將樣本分別置于250 ml燒杯中密封,1 h之后進行電子鼻檢測。
特征變量就是能夠反映不同品質等級茶葉特征的量。電子鼻的10個傳感器對每個品質等級茶葉香氣作出響應,隨茶葉等級的不同,響應信號曲線發生相應變化。通過分析響應曲線的變化特點及趨勢,選擇各傳感器響應的最大值和穩態值作為表征茶葉品質的特征變量,因此每種品質的茶葉可以表示成如下20維的特征向量:
X=(x1,x2,........,x20),
(1)
其中x1,........,x10分別為第1~10個傳感器響應最大值;x11,........,x20分別為第1~10個傳感器響應穩態值。特征向量是后續模式識別神經網絡的輸入因子,應用中為了保證網絡收斂的快速性,對特征向量進行如下歸一化處理:
(2)
(3)

BP(Back Propagation)神經網絡最為典型的神經網絡模型之一,具有結構簡單、適應性強以及較好的非線性逼近能力等特點[7,8],是基于導師學習的前饋神經網絡,特別適合于模式分類識別。鑒于此,本文采用BP神經網絡對黃山毛峰茶的品質進行判別。
BP神經網絡由輸入層,1個或多個隱含層和輸出層組成,前層的輸出作為后層的輸入,各層內部神經元之間沒有連接[9]。單隱含層的三層BP神經網絡的模型如圖1所示。

圖1 三層BP神經網絡的模型
BP神經網絡的學習過程分為兩個階段,即信號的前向傳遞階段和誤差的反向傳遞階段。學習過程中,把訓練樣本輸入網絡,得到網絡輸出,當輸出值沒有達到預期值時,通過誤差反向傳遞不斷修正網絡的連接權值和閾值,學習過程直到網絡輸出達到預期值或網絡學習次數(訓練次數)達到設定的最大學習次數結束。BP學習算法中最常用是δ算法,但該算法存在收斂速度慢、容易陷入局部最小等缺點[10-11]。在實際應用中,常采用改進的附加動量項的δ學習算法,學習算法過程如下:
Step1:初始化網絡的連接權值、閾值、誤差精度及最大學習次數。
Step2:按照式(1)-(4)計算隱含層、輸出層的輸入與輸出。
(4)
oj(m)=fnetj(m),
(5)
(6)
ok(m)=fnetk(m)。
(7)
上式中,i,j,k分別為輸入層、隱含層和輸出層的神經元;ωij表示神經元i到神經元j的連接權值;netj為神經元j的輸入,bj為神經元j閾值,oj為神經元j輸出;f(·)為轉換函數。
Step3:按照式(8)-(13)修正連接權值和閾值(閾值可看作輸入為-1的連接權)。
ωjk(m+1)=ωjk(m)+Δωjk(m+1),
(8)
=-μδk(m)oj(m)+λΔωjk(m),
(9)
δk(m)=-(dk(m)-ok(m))f′(netk(m)),
(10)
ωij(m+1)=ωij(m)+Δωij(m+1),
(11)
=-μδj(m)oi(m)+λΔωij(m),
(12)
(13)
上式中,Δω為連接權值的修正量,0<μ<1為學習率, 0<λ<1為動量因子;e為誤差函數,表示為:
(14)
其中dk(m)為第m個樣本的期望輸出,ok(m)為第m個樣本的實際輸出,q為輸出層神經元數。
Step4:計算全局誤差E:
(15)
其中l為輸入樣本數。
Step5:當誤差達到設定的精度或學習次數達到設定的最大學習次數,學習結束。否則,返回Step2,進行下一輪學習。
理論上,3層BP神經網絡可以實現任意n維到m維的映射[12]。本文采用只有1個隱含層的3層BP網絡。輸入層神經元的個數由茶葉特征向量維數決定,本文設置為20。輸出層神經元數與待識別的茶葉等級的數目相對應,本文設置為4。為了確定最佳的隱含層神經元數,在網絡參數設置保存不變的情況下,通過選擇不同個數的隱含層神經元進行反復試驗,當到達誤差精度0.01時所需要的學習次數如表1所示。由表1的結果可以看出,當隱含層包含12個神經元時收斂速度最快,因此,BP神經網絡設計為20-12-4的結構。對于學習率μ和動量因子λ經過多次試驗比較,最終確定當μ取0.08,λ取0.5時,BP網絡具有較好的預測性能。隱含層和輸出層的均轉換函數都采用Sigmoid函數:

(16)
將140個茶葉樣本分成兩部分,其中112個樣本(每個等級28個)作為訓練集,28個樣本(每個等級7個)作為測試集。設BP網絡的輸出Y=(y1,y2,y3,y4),則4種品質等級R70,R100,R300,R600的茶葉對應的期望輸出分別為(0,0,0,1),(0,0,1,0),(0,1,0,0),(1,0,0,0)。如果網絡預測輸出滿足如下條件:
(17)
則判定為等級R70茶葉,否則判定無效。所有等級判別都依照此規則。
BP神經網絡的訓練曲線如圖2所示。由圖2可知,網絡經過2 950次訓練后,達到0.01的誤差精度。

圖2 BP神經網絡的訓練曲線
對所有4個等級的140個樣本都用BP神經網絡預測模型進行等級判別,評判結果如表2所示。可以看出,對于112個訓練樣本,網絡全部判別正確,識別率100%。對于28個預測樣本,由于R70與R100等級相近,特征差異不明顯,有2個R70樣本誤判為R100,1個R100樣本誤判為R70,識別率為89.3%。
本文提出了一種利用電子鼻技術檢測黃山毛峰茶品質的新方法。對4種不同等級茶葉樣本,首先通過分析電子鼻傳感器陣列對不同品質的茶葉氣味的響應曲線的變化特點,選擇能夠代表不同品質茶葉的特征變量,然后使用這些變量作為BP神經網絡的輸入,建立黃山毛峰茶品質等級的BP神經網絡預測模型。BP學習算法采用了改進的附加動量項的δ學習算法。實驗結果表明,設計的預測模型具有很強的預測能力,證明了電子鼻應用于黃山毛峰茶品質檢測的有效性。當然,當茶葉等級相近時,提出的BP神經網絡模型還還存在一定的判別誤差。在今后的研究中,如何選擇有效的茶葉品質描述特征和設計更有效的BP網絡結構將是研究的重點。

表2 BP網絡判別結果
[參 考 文 獻]
[1] 于慧春,王俊.電子鼻技術在茶葉品質檢測中的應 用研究[J].傳感技術學報,2008,21(5):748-752.
[2] 趙菁. 綠茶特征香氣成分及與品質的關系研究[D].杭州:浙江大學,2002.
[3] 尹芳緣,曾小燕,徐薇薇,等.基于電子鼻的芒果儲存時間預測方法研究[J].傳感技術學報,2012,25(9):1199-1203.
[4] 賈洪峰,鄧紅,梁愛華.電子鼻在芝麻油摻芝麻油香精識別中的應用[J].中國糧油學報,2013,28(8):83-86.
[5] 鄒小波,趙杰文.電子鼻在飲料識別中的應用研究[J].農業工程學報,2002,(18)3∶146-149.
[6] 胡志全,王海洋,劉友明.電子鼻識別大米揮發性物質的應用性研究[J].中國糧油學報,2013,28(7):93-98.
[7] 唐萬梅.BP神經網絡網絡結構優化問題的研究[J].系統工程理論與實踐,2005,25(10):95-100.
[8] 龍訓建, 錢鞠, 梁川.基于主成分分析的BP神經網絡及其在需水預測中的應用[J].成都理工大學學報:自然科學版,2010,37(2):206-210.
[9] 史麗萍,龔海霞,李震,等.基于BP神經網絡的電池SOC估算[J].電源技術,2013, 37(9):1539-1541.
[10] 劉彬,項前,楊建國,等.基于遺傳神經網絡的紗線質量預測[J].東華大學學報 :自然科學版,2013,39(8):504-508.
[11] 李 松, 劉力軍,解永樂.遺傳算法優化BP神經網絡的短時交通流混沌預測[J].控制與決策,2011,26(10):1581-1585.
[12] 王鶴,基于遺傳神經網絡的電子鼻系統研究[D].武漢:華中科技大學,2007.