柳維生,柴蘭娟
?
基于支持向量機的葡萄酒品質鑒定系統開發
柳維生,柴蘭娟
(蘇州市立醫院(北區),江蘇 蘇州 215001)
為了改進葡萄酒生產、幫助對葡萄酒品質評估的建模和細分市場的口味。提出了基于支持向量機技術的葡萄酒品質分類機制,該方法通過對影響葡萄酒品質的硫酸鹽、酒精、殘糖關鍵理化參數進行分析,采用matlab的GUI編程技術和數據歸一化、PCA等多種數據處理手段,設計了支持該技術的品質鑒定系統,通過采用白色和紅色葡萄酒樣本對系統的算法思想進行了驗證。
支持向量機;葡萄酒;品質;GUI;鑒定系統
葡萄酒一度被視為一種奢侈品,如今越來越多的葡萄酒享有更廣泛的消費者。酒認證和質量評價在防止非法摻假酒(以保障人類健康),保證葡萄酒市場的質量起到了至關重要的作用。較好的品質評定機制,可以有效的提高釀酒(通過確定最有影響力的因素)工藝,以及酒的品質分層如優質品牌葡萄酒(可用于設置價格)。一般葡萄酒的認證評估分理化和感官測試。理化測試習慣以酒的特點,如密度、酒精或pH值來決定,同時依靠感官檢驗,但是隨著葡萄酒市場的擴大,這種評估很顯然不能大批量、精確的分類[1]。此外,理化和感官分析的關系是復雜的,還不完全清楚,因此葡萄酒分類是一項艱巨的任務。隨著信息技術的進步,使我們能夠收集、儲存和葡萄酒品質理化參數相關的高度復雜的數據集。應用這些數據通過神經網絡、支持向量機等方法進行處理,可以很好可用于葡萄酒的評估、預測、分類等方面[2-5]。本文就是以支持向量機為基礎完成分類,結合matlab來設計一個葡萄酒品質鑒定系統。
支持向量機是由Vapnik領導的AT&TBell實驗室研究小組在1963年提出的一種新的非常有潛力的分類技術,SVM是一種基于統計學習理論的模式識別方法,能非常成功地處理回歸問題(時間序列分析)和模式識別(分類問題、判別分析)等諸多問題,并可推廣于預測和綜合評價等領域[6]。SVM算法能不能夠夠很好的實現其主要在核函數的選擇上,其本質就是通過其建立的函數映射關系,將在低維度上難以劃分的空間向量,轉換為高維空間進行劃分,通常區分以后,再通過反變換映射返回到低維度,進行輸出,傳統算法上這會給計算帶來很大的困難,而在SVM中,核函數確能夠方便的解決這個問題,只要選取合適的參數,算法就能很好的對系統進行改進。
SVM的主要思想是建立一個超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化。訓練數據集到一給定的分割平面的最小距離為:

系統采用matlab軟件GUI設計,包含數據錄入、數據預處理、用戶管理、SVM核函數選擇、幫助等模塊,其中數據錄入包含外部數據的導入、數據的導出、數據的輸入。數據預處理包含主元分析、數據歸一化等,SVM核函數選擇將以上四種核函數進行變化選擇,測試系統的性能。

圖1 鑒定系統功能框圖
通過用戶接口將葡萄酒檢測的理化參數數據輸入到系統中,通過一定的數據預處理,系統通過與經訓練樣本訓練后成熟的模式進行比較,對測試樣本給出判別,輸出葡萄酒的品質等級。在設計中系統給出不同的核函數確定的分類器和多種模式庫。另外,一個好的分類器也不是一個好系統的唯一標準,參數的特征選擇、數據的處理等都對系統的總體性能有較大的影響[8-10]。因此設計中采用歸一化數據、主元分析等方法對系統進行評估改善。下圖給出了鑒定系統的流程圖。

圖2 鑒定系統流程圖
數據來自UCI,winequality樣本[11],樣本采集自葡萄牙米尼奧(北西部)地區的白葡萄酒和紅葡萄酒,數據對4898白葡萄酒和1599個紅葡萄酒樣本進行了評定,測試選擇輸入變量為:1.固定酸度 2.揮發酸3.檸檬酸 4.殘糖 5.氯 6.游離二氧化硫 7.總二氧化硫8.密度9 .pH值 10.硫酸鹽 11.酒精十一個理化指標,每個樣品,專家都進行了感覺評估(使用盲口味),將葡萄酒等級從0(極壞的)到10(優秀)個等級。下圖是樣本中數據品質的直方圖。

圖3 白葡萄酒樣本品質直方圖

圖4 紅葡萄酒樣本品質直方圖
算法仿真在臺灣林智仁開發的lib-svm工具箱中進行,將白葡萄酒和紅葡萄酒的各種品質的2/3樣本做訓練樣本,另1/3做為測試樣本。分別選擇不同的核函數進行測試,實驗表明,白葡萄酒的識別率不足50%,紅葡萄酒的識別率不足60%,正確率較低,為改善系統性能,對數據進行兩種歸一化數據的處理[12-14],系統改善不明顯,再將數據經主元分析后,通過對白葡萄酒的特征選擇硫酸鹽、酒精、殘糖等,對紅葡萄酒選擇硫酸鹽、pH、總二氧化硫含量等,重新訓練系統,性能大大改善。以下是以RBF為核函數非線性支持向量機[15-16]對白葡萄酒3類、4類和紅葡萄酒3類、8類樣本進行的仿真分析結果,兩類樣本點分別用加號和乘號表示。其分類正確率分別為98.62%和97.41%。

圖5 白葡萄酒測試數據分類圖

圖6 紅葡萄酒測試數據分類圖
系統開發是基于matlab中的GUI工具箱,Lib-SVM工具箱、圖像處理工具箱,并結合active控件。鑒定系統的主界面圖如圖7所示。
酒品質的鑒定對產品在消費者中定位和改進葡萄酒生產工藝至關重要,但傳統的酒品質主要對酒理化指標的分析和品酒師的感覺,在大規模生產中具有一定的局限性。本文對葡萄酒品質鑒定系統進行了研究,取得了較好的實驗效果,進一步說明了利用新的信息手段進行酒的品質評定是可行的。

圖7 鑒定系統界面圖
[1] Cortez P, Cerdeira A, Almeida F, et al. Modeling wine preferences by data mining from physicochemical proper-ties[J]. Decision Support Systems, 2009, 47(4): 547-553.
[2] 范開乾, 胡訪宇. 基于支持向量回歸的圖像超分辨率重建算法[J]. 電子技術, 2014, 4(2): 4-7.
[3] 范文兵, 方壟, 楊瀟楠. 基于稀疏字典學習和核稀疏表示的激光遙感圖像超分辨重建[J]. 激光雜志, 2015, 36(6): 52-58.
[4] 李馳. 基于支持向量回歸的圖像超分辨率重建算法[J]. 激光技術, 2016, 37(1): 138-140.
[5] 李桂來. Contour let變換在MRI圖像重建算法中的應用 [J]. 激光雜志, 2015, 36(1): 49-51.
[6] Chang C C, Lin C J. LIBSVM: A library for support vector machines[J]. 2011, 2(3): 1-27.
[7] Sch?lkopf B. Choosing multiple parameters for Support Vector Machines[J]. 2008.
[8] 王鵬, 朱小燕. 基于RBF核的SVM的模型選擇及其應用[J]. 計算機工程與應用, 2003; 39(24) : 72-73.
[9] 錢磊, 睢剛. 一種熱工過程RBF神經網絡模型辨識方法[J]. 自動化儀表, 2016; 37(1) : 14-15.
[10] 趙文可, 孫玉國. 彈性RBF神經網絡在人臉識別中的應用研究[J]. 軟件, 2018, 39(05): 203-206.
[11] Asuncion A. UCI Machine Learning Repository, University of California, Irvine, School of Information and Computer Sciences[J]. 2007.
[12] 黃瀏展. 指紋識別技術在IOS開發中的應用研究[J]. 軟件, 2016, 37(07): 55-60.
[13] 楊漫, 蘇亞坤. 采用模糊C-均值聚類的自適應圖像分割算法[J]. 重慶理工大學學報(自然科學版), 2015, 6: 85-86.
[14] 崔婭萍. 基于改進歸一化割的圖像分割算法研究[J]. 激光雜志, 2016, 37(2): 122-124.
[15] 何梓健, 時家明, 汪家春, 等. AOTF高光譜探測系統對偽裝目標的識別研究[J]. 激光與紅外, 2014, 44(7): 796-800.
[16] 胡燕燕, 李東生, 張詩桂. 凸組合核函數的支持向量機高光譜圖像分類[J]. 激光與紅外, 2016; 46(5): 627-630.
Development of Wine Quality Identification System Based on Support Vector Machine
LIU Wei-sheng, CHAI Lan-juan
(Suzhou Municipal Hospital (North District), Suzhou, Jiangsu 215001)
In order to improve wine production and help to model wine quality evaluation and taste of segment market, a wine quality classification mechanism based on support vector machine technology was proposed. By analyzing the key physical and chemical parameters of vitriol, alcohol and residual sugar that affect wine quality, this method designs the quality identification system supporting this technology by adopting the GUI programming technology of matlab and data normalization, PCA and other data processing methods. The quality identification system supporting the technology is also designed. The algorithm idea of the system was verified by using white and red wine samples.
Support vector machine; Wine; Quality; GUI; Identification system
U260.78
A
10.3969/j.issn.1003-6970.2018.10.036
柳維生(1980-),碩士研究生,主要研究方向:計算機應用技術; 柴蘭娟(1985-),碩士研究生,主要研究方向:信息工程。
柳維生,柴蘭娟. 基于支持向量機的葡萄酒品質鑒定系統開發[J]. 軟件,2018,39(10):192-195