程鐵轅,夏于林,張瑩
成都海關技術中心宜賓分部國家酒類檢測重點實驗室(宜賓 644000)
濃香型白酒是國內白酒產品中市場占有率最高的類別,深受國內消費者喜愛,同時,也是白酒摻假的重災區,受檢測手段和監管條件制約,白酒摻假的監管效率相對低下,在高額利潤的驅使下,白酒摻假成為不少中小型白酒企業的半公開化的操作模式,嚴重影響白酒交易市場的公平正義,該現象引起眾多國內學者關注與重視,并針對性采用多種研究方法,其中電子舌技術是該領域具有較好應用前景的分析檢測技術。近年來,電子舌技術發展迅猛,越來越廣泛地被應用于各類食品的感官評價研究,其中應用于各種酒類產品的研究主要有:賈洪鋒等[1]采用電子舌對啤酒進行區分識別研究;周紅標等[2]研究利用電子鼻和電子舌技術快速檢測白酒品質;李付麗等[3]將電子舌和測色儀應用于醬香型白酒質量檢測方面;郭壯等[4]基于電子舌技術對襄陽市售米酒滋味品質進行評價,并對市售與農家自釀孝感米酒滋味品質進行比較研究[5];門洪等[6]基于電子鼻/舌融合技術對白酒類別進行辨識;巴特爾達賴等[7]通過電子舌技術對真假兩種伊力老陳酒10年進行分析;馬澤亮等[8]采用電子舌法檢測橙汁及白酒的品牌及純度;Men等[9]利用E-Tongue and E-Nose挖掘啤酒風味信息分類中的數據融合特征;沈馨等[10]應用電子舌對柑橘酒滋味品質進行評價。從文獻來看,電子鼻和電子舌技術在白酒品質辨識方面應用較為廣泛,采用的數學分析方法主要有主成分分析、多元方差分析、K均值法、支持向量機法,按照學習方法的分類,大多數屬于無監督學習(如聚類問題等),極少數為監督學習(如分類問題等),總體來看,在分類及預測上應用的數學分析方法較為單一。鑒于電子鼻數據在白酒風味辨識上的數據刻畫效果略差,主要基于電子舌數據,選用并比較機器學習中KNN、決策樹2種分類器的效果,以期從數學分析角度豐富電子舌數據處理方法,為白酒品質鑒別等研究領域提供更多的可供選擇的數據處理方法。
樣品制備:濃香型白酒樣品共14個,編號為1~14,其中,1號為2009年一級原酒;2號為2018年一級原酒;3號為2018年優級原酒;4號為2019年一級原酒;5號為2019年優級原酒;6號為摻假白酒(高酯酒);7號為摻假白酒(己酸乙酯摻假);8號為30%己酸乙酯摻假酒+70% 2019年一級原酒(體積比);9號為50%己酸乙酯摻假酒+50% 2019年一級原酒(體積比);10號為70%己酸乙酯摻假酒+30% 2019年一級原酒(體積比);11~14號為同類別不同批次52°五糧濃香型成品酒。白酒原酒及成品酒購自川南地區白酒企業;摻假白酒中高酯酒及己酸乙酯為網上購買。
樣品前處理:分別量取30 mL各白酒樣品倒入250 mL燒杯中,加入60 mL純凈水稀釋混勻后待測。
味覺分析系統(簡稱電子舌,日本INSENT公司,型號TS-5000Z),該設備具有廣域選擇特異性的人工脂膜傳感器,可以模擬生物活體的味覺感受機理,通過檢測各種味物質和人工脂膜之間的靜電作用或疏水性相互作用產生的膜電勢的變化,實現對5種基本味(酸、澀、苦、咸、鮮)和甜味的評價。
測試用液:reference溶液(人工唾液)為KCl+酒石酸;負極清洗液為水+乙醇+HCl;正極清洗液為KCl+水+乙醇+KOH。
采用Python軟件進行數據處理。
白酒樣品的電子舌試驗數據如表1所示,所有數據均是以人工唾液(參比溶液)為標準的絕對輸出值,電子舌測試人工唾液的狀態模擬人口腔中只有唾液時的狀態。其中,tasteless為無味點,即參比溶液的輸出,參比溶液(reference)由KCl和酒石酸組成味覺值,故酸味的無味點為-13,咸味的無味點為-6,以此為基準,樣品的味覺值低于tasteless時,即認為樣品無該味道或者味道很弱,反之則有。
表1 白酒樣品的電子舌試驗數據
以參比溶液的輸出為“0”,除酸味和咸味外,其他指標的無味點均為0,將大于無味點的味覺項目作為評價對象。因基準液由氯化鉀與酒石酸配制而成,故基準溶液中含有少量的酸和鹽,酸味和咸味的無味點分別為-13和-6。無味點以下的項目可認為該樣品沒有此味道或者味道很弱,盡管白酒的咸味和澀味在無味點以下,但兩者在分類時仍可作為有效指標。圖1為白酒樣品有效味覺指標雷達圖。
2.3.1 苦味、澀味回味和苦味回味
通過味覺值可知,大部分白酒樣品的苦味值在無味點以下,苦味回味值略高于無味點,大部分數值位于0~1之間。其中,6號和7號白酒具有明顯的苦味,6號苦味值為1.38,7號苦味值為3.03,這種明顯的苦味可能與6號、7號白酒為完全摻假白酒有關。此外,對于8號、9號和10號部分摻假白酒而言,相較于4號樣品,摻假后的白酒中苦味回味有所降低,也與實際相符。由圖2可見,11~14號4個白酒在圖中聚集在一起,表明四者在苦味方面基本無差異。
將澀味回味與苦味、苦味回味共同分析可知,如圖3所示,圖中氣泡的大小反映澀味回味值的大小,結合味覺值可知,7號白酒的澀味回味在14種白酒樣品中最小,其他13種酒在澀味回味方面非常接近。大部分白酒的澀味回味值位于1.3~1.7,7號、9號和10號的澀味回味值低于1。
圖1 1~14號白酒樣品有效味覺指標雷達圖
圖2 1~14號白酒樣品苦味和苦味回味散點圖
圖3 白酒樣品苦味、苦味回味和澀味回味氣泡圖
2.3.2 酸味
測定結果顯示,白酒樣品會引起酸味傳感器較強烈的響應,如圖4所示,7號樣品的酸味最小,酸味值為-16,低于酸味無味點。其余13個白酒樣品的酸味均很大,酸味值均在10以上,其中,6號白酒的酸味相對較小,酸味值在15以下,其他12個白酒樣品酸味值均在15以上。
將白酒的酸味制成折線圖(圖5),其中未包含7號樣品。11~14號4個白酒樣品在酸味方面基本一致且酸味值較強,其余樣品在酸味方面的差異也比較明顯,酸味值相差1個刻度以上,樣品中酸味由小到大的的排列順序是7<6<10<4<5≤3<9≤1<2<8<11~14。
圖4 1~14號白酒樣品酸味散點圖
圖5 1~14號白酒樣品酸味折線圖
2.3.3 鮮味和豐富性
通常情況下,鮮味是由氨基酸、核酸等產生,豐富性是鮮味的回味,用于反映鮮味的持久性,又稱為鮮味持久度,常用于反映魚湯、海鮮類產品鮮味的持久度。測定結果顯示(圖6),多數白酒樣品具有相對較大的鮮味和豐富性,其中,11~14號4個白酒樣品在鮮味和豐富性方面非常接近,鮮味和豐富性均很小,且鮮味在無味點以下;7號和6號白酒樣品的鮮味和豐富性在14個白酒樣品中最大,表明完全摻假白酒的鮮味和豐富性均可能更高;其余8個白酒樣品的鮮味集中在0~2,豐富性集中在1~3。相較于4號樣品,白酒摻假后,其鮮味和豐富性均有所下降。
圖6 白酒樣品鮮味和豐富性散點圖
所有白酒樣品檢測4次,即4次循環,將第1次循環去掉后,取后3次的平均值,如圖7所示,傳感器響應穩定,有較好的重現性,因此,可以認為試驗數據有效。
測試分類器主要選用KNN、決策樹2種,經測試采用8個指標效果較好。未選用SVM(支持向量機法)分類器的原因是SVM主要是解決二分類問題;未選用樸素貝葉斯分類器的原因是每種指標都必須相互獨立,而試驗中部分指標具有相關性。具體過程:選擇最佳參數構建KNN模型,決策樹模型參數全部保持默認,不用傳入參數,如圖8所示,n_neighbors(最近鄰)=3時,模型效果最佳,所以選擇最優的n_neighbors(最近鄰)=3傳入模型;分別對2種分類器進行交叉驗證,交叉驗證是將原始數據集劃分為若干份(試驗中劃分為4份),進行4次訓練,每次取1份作為測試數據,剩余3份作為訓練數據,并將4個模型的預測值做平均。交叉驗證主要用于評估模型的預測性能,尤其是訓練好的模型在新數據上的表現,可在一定程度上減小過擬合,且可從有限的數據中獲取盡可能多的有效信息。KNN和決策樹2種分類器的準確率分別為0.900 0和0.866 7,通過對分類器準確率的比較,發現KNN的性能較高,綜合比較2種分類器的準確率后,選擇KNN作為最終分類器。使用KNN進行模型分類與預測,模型預測的準確率達到100%(12條作為訓練數據,2條作為測試數據,試驗結果即為2條測試數據都分類正確)。
圖7 白酒樣品的后3次循環折線圖
圖8 KNN模型準確率折線圖
圖9為散點圖,其中矩陣的對角線是每個特征的直方圖,可以直觀看出3個類別能夠明顯區分開。
圖9 散點圖
基于電子舌技術,采用味覺分析系統對14個白酒樣品的苦味等8個指標進行檢測分析,并根據原酒、成品酒和摻假白酒3類樣品,采用并比較機器學習中KNN、決策樹2種分類器,綜合比較后,發現KNN的性能相對更高,以KNN作為最終分類器,針對試驗數據,模型預測的準確率達到100%,表明機器學習和電子舌技術相結合在白酒摻假鑒別中具有一定的應用前景。由于選取的數據量較小,模型預測結果與現有樣本量關系很大,后續研究將選取更多樣本進行分析。