童陽 艾施榮 吳瑞梅 何國泉 虞文俊 劉鵬 胡瀟 裴剛



摘要:為摒棄茶葉品質感官評審方法存在的主觀性和經驗性等缺陷,研究采用計算機視覺技術快速評價茶葉感官品質。依據碧螺春茶行業標準及茶葉評審師的評審結果,將20個不同品質碧螺春綠茶樣本分成4個等級。采用小波變換和灰度共生矩陣提取茶葉圖像的紋理特征,采用RGB[R表示紅色(red),G表示綠色(green),B表示藍色(blue)]和HIS[H表示色調(hue),I表示亮度(intensity),S表示色飽和度(saturation)]顏色模型提取圖像的顏色特征,利用遺傳算法優化神經網絡參數,建立茶葉感官品質的BP(back propagation,逆向傳播)神經網絡分級模型,并與其他模型結果進行比較。結果表明,當選用前5個主成分時,所建立的模型識別精度最高,該模型總體識別率為938%,Kappa系數為0.933,較PCA-BP、GA-BP、BP識別精度分別提高10.0、6.3、18.8百分點,Kappa系數分別提高0.133、0.066、0.233,模型穩定性得到提高。
關鍵詞:計算機視覺;茶葉感官品質;小波變換;神經網絡;遺傳算法
中圖分類號: TS207.3;S126? 文獻標志碼: A? 文章編號:1002-1302(2019)05-0170-04
收稿日期:2018-03-21
基金項目:國家自然科學基金(編號:31460315);江西省重點研發計劃(編號:20171ACF60004)。
作者簡介:童 陽(1993—),男,江西高安人,碩士研究生,主要從事計算機視覺研究。E-mail:tongyang_1@sina.com。
通信作者:艾施榮,碩士,副教授,碩士生導師,主要從事計算機視覺研究。E-mail:aisrong@163.com。
茶葉是一種深受消費者喜愛的保健飲料,但一直以來茶葉品質仍由品茶師評價,帶有一定的主觀性,易受品茶師經驗、生理狀況、外界環境等因素影響,難以監控茶葉市場,導致茶葉市場售價混亂、假冒偽劣等現象出現。
計算機視覺技術已被廣泛運用于茶葉品質快速檢測。Laddi等建立了茶葉品質的計算機視覺感官品質評價模型[1];Dong等采用基于與專家感官評分極顯著相關的特征變量,建立了茶葉外觀品質的計算機視覺評估模型[2];余洪等根據專家評審得分值,將72個茶葉樣本分成4個分級,通過提取干茶葉的紋理和顏色特征,建立了茶葉品質的計算機視覺分級評價模型[3];常春等運用計算機視覺技術提取茶樣圖像的紋理及幾何特征,建立了不同種類茶葉的人工神經網絡識別模型[4]。而目前的研究主要提取茶葉圖像的時域特征或區域特征,當分辨率較低時,圖像的紋理特征區別不明顯,且少量特征無法較完整地刻畫圖像特征,識別率較低,如要追求高識別率,須增大特征維度,這樣會增加模型的復雜度[5]。小波變換可實現多分辨率,在降低分辨率的情況下不丟失圖像的原始信息,已被成功應用于醫學影像診斷[6]、農作物病蟲害檢測[7]等來提高識別率,也有報道將其用于提取茶葉圖像紋理特征。Wang等利用小波變換提取干茶葉的紋理特征,結合顏色特征參數,建立了茶葉種類識別模型[8]。Borah等利用小波變換提取茶葉的紋理特征圖像,建立茶葉種類識別模型,其識別準確率高于使用基于統計矩的紋理特征的結果[9]。目前已有的研究的主要方法是基于提取的茶葉紋理統計矩特征建立茶葉品質評價模型。而小波分析較統計矩具有多分辨率分析以及在時域和頻域同時表征原始圖像局部特征信息的優點,被廣泛用于農業科技、生物信息等領域的模型建立。
本研究根據茶葉評審師對茶樣的評分結果,將茶樣分為4個等級。利用小波分析和灰度共生矩陣方法提取茶葉圖像的紋理特征,應用遺傳算法(genetic algorithm,簡稱GA)優化BP神經網絡參數,建立茶葉外形感官品質的計算機視覺分級模型,為茶葉品質的儀器化快速評價奠定基礎。
1 材料與方法
1.1 茶葉樣本及感官品質評價
試驗選用20個不同品質的蘇州洞庭山碧螺春茶葉樣本,每個樣本250 g。茶葉感官評價由安徽農業大學茶學系4位評茶師完成,根據碧螺春茶農業行業標準(NY/T 863—2004《碧螺春茶》)和茶葉感官審評標準(GB/T 23776—2009《茶葉感官評審方法》)進行評定,位于90~99分的為一級,位于 80~89分的為二級,位于70~79分的為三級,位于60~69分的為四級。
1.2 茶葉圖像采集
茶葉可見光圖像采集系統如圖1所示,該裝置由圖像采集卡、CCD(電荷耦合器件)攝像頭、采集暗箱、光源和計算機等組成。采集暗箱內部用黑色幕布密閉,采用飛利浦白熾燈為暗箱內部光源,其色溫為2 800 K左右,光源安裝在暗箱上部左右兩側,形成一個漫反射光照系統。分別從每個茶樣中稱取(10±0.5) g茶葉,將其均勻平鋪在自制茶樣盒中,茶樣盒規格為60 mm×60 mm×10 mm,內部為黑色,以消除光線反射對圖像采集的影響。從原始圖像中心位置截取200×200像素感興趣的區域為特征提取的目標圖像。以上圖像采集過程于2017年7月在筆者所在實驗室完成。
1.3 圖像特征提取
1.3.1 基于小波分析的圖像特征提取 小波分析是一種空間(時間)和頻率上的局部變換,具有多分辨率分析以及在時域和頻域同時表征原始圖像局部特征信息等優點,原始圖像經小波變換后,把低頻信息保存在圖像中,將原始圖像的高頻信息分水平、垂直和對角方向保存到另外3個獨立的圖像中,同時表征出圖像的時域和頻域特征信號。小波函數由1個小波基函數經過平移與尺寸伸縮得到,小波分析就是把信號分解成一系列小波函數的疊加。利用小波分析提取茶葉圖像特征的具體步驟如下:首先將茶葉原始圖像進行小波分解,得到原始圖像的子圖像,對子圖像用小波繼續分解成不同尺度的低頻和高頻子圖像,然后分別求出各分解高頻子圖像的平均灰度、標準方差和三階矩陣作為茶葉圖像的紋理特征信息。其中,紋理特征提取效果主要取決于小波基和分解層數選擇[10],參照文獻[7],本研究經多次分析,使用sym4和db4為小波基函數,兩者結合能較全面地提取茶葉的紋理特征。小波分解層數并不是越多越好,經多次反復試驗,第3層各分量能反映茶葉圖像紋理的整體概貌,但不能表達圖像的紋理特征。所以對原圖像進行2層小波分解。圖2是經過sym4和db4小波分解后的低頻和高頻分量,高頻分量分別表現了水平(HL)、垂直(LH)、對角(HH)3個方向的紋理細節信息,低頻分量表現圖像的主要信息,提取了48個小波紋理特征。
1.3.2 灰度共生矩陣紋理特征提取 灰度共生矩陣能很好地反映茶葉圖像的紋理特性[11]。參照文獻[3],采用灰度共生矩陣提取茶葉圖像的16個紋理特征值:0°慣性矩、45°慣性矩、90°慣性矩、135°慣性矩、0°相關性、45°相關性、90°相關性、135°相關性、0°能量、45°能量、90°能量、135°能量、0°同質性、45°同質性、90°同質性、135°同質性。
1.3.3 顏色特征提取 本研究選用RGB[R表示紅色(red),G表示綠色(green),B表示藍色(blue)]和HIS[H表示色調(hue),I表示亮度(intensity),S表示色飽和度(saturation)]這2種顏色模型表征茶葉的色澤特征[12],提取的顏色特征如下:基于RGB模型的紅體標準差、紅體均值、綠體標準差、綠體均值、藍體標準差、藍體均值以及基于HIS模型的色調標準差、色調均值、亮度標準差、亮度均值、飽和度標準差以及飽和度均值,共12個顏色特征。
1.4 算法原理
BP(back propagation,逆向傳播)神經網絡具有自我學習能力、自適應和并行處理等優點,能很好地處理從輸入到輸出的非線性復雜問題。但該算法的初始化權值是隨機的,容易陷入局部極小化[13],當網絡規模不斷增加時,學習時間顯著增加,且學習過程中隱藏層的節點數及其他參數憑經驗或通過大量計算得出,收斂時間長,魯棒性差。所以,模型建立前,對BP神經網絡參數進行必要的優化。
遺傳算法是一種模仿自然進化算法,在進化過程中,其后生代種群更能適應環境,且末代種群中的最優個體通過解碼后,可作為所求解問題的近似最優解。
本研究使用GA優化BP神經網絡參數值(初始權值和閾值),使優化結果不僅朝著全局最優方向進行迭代,還能在接近權值時,得到最優的網絡拓撲結構,如此往復,可跳出極值,加快收斂,達到最優解。
茶葉圖像特征共提取了76個特征,包括12個顏色特征和64個紋理特征(小波48個,灰度共生矩陣16個),這些特征相互之間存在冗余信息,在優化前,應用主成分分析法(PCA)對原始數據進行降維。用主成分分析法結合遺傳算法優化BP神經網絡算法,具體優化步驟如圖3所示。
2 結果與分析
2.1 茶葉感官評價結果分析
運用Pearson相關分析法對所有茶葉評審師的評審結果進行一致性分析。由表1可知,4位專業茶葉評審師的評審得分結果具有極顯著的線性相關性(P<0.01),表明4位茶葉評審師對茶葉品質的評價結果具有顯著的一致性。
參照碧螺春茶農業行業標準(NY/T 863—2004《碧螺春茶》),依據評審師的評分結果,將20個茶葉樣本分為4個等級,如表2所示,其中1,2,……,20分別表示每個茶樣的編號。將每個等級的茶樣隨機均分為6等份,其中4等份作為訓練集,剩余2等份作為預測集,即訓練集樣本數為80,預測集樣本數為40。
2.2 遺傳算法優化BP神經網絡參數
本研究采用輸入層、隱含層和輸出層3層BP網絡結構,將主成分因子數作為網絡的輸入,而主成分數的多少對模型結果影響很大。
研究采用不同主成分數作為BP神經網絡的輸入,比較不同主成分數所建模型的識別結果,模型識別精度高的為最優模型。選用雙極S型函數tansig()為網絡傳遞函數;雙極S型函數logsig()為輸出層函數;訓練函數選用trainlm();訓練最大迭代數為2 000次;學習率為0.1,訓練誤差為0.001,遺傳算法初始種群數為50個,最大遺傳代數為80,變異概率設為0.05,交叉概率設為0.85。
從圖4可以看出,當主成分數為5個時,網絡模型總體識別率最高。由圖5可知,當遺傳代數達到67代時,其權值和閾值不變,為最優值。
2.3 模型識別結果
利用優化結果建立茶葉等級的BP神經網絡分級模型,
模型對訓練集樣本和預測集樣本的識別結果分別見表3和表4。由表3、表4可知,模型對訓練集的總體識別率為95%,對測試集的總體識別率為92.5%,在訓練集中,1個一級茶樣被誤判為二級,2個二級茶樣被誤判為一級,1個二級茶樣被誤判為三級;測試集中1個一級茶樣被誤判為二級,1個二級茶樣被誤判為一級,1個二級被誤判為三級。根據碧螺春茶感官評語,一級是纖細卷曲成螺、白毫披覆、勻整、銀綠隱翠、勻凈;二級是緊細卷曲成螺、白毫披露、勻整、銀綠顯翠、勻凈;三級是緊細卷曲成螺、白毫顯露、勻尚整、綠翠、勻尚凈;四級是緊結卷曲成螺、白毫尚顯、尚勻整、綠潤、尚勻凈??梢钥闯?,一級與二級、二級與三級的評判術語相差甚微,且評茶師對茶樣品質的評判結果帶有一定主觀性,導致不同級別之間相互誤判。
2.4 模型性能比較
識別率和Kappa系數常用于衡量模型的性能,Kappa系數用于一致性檢驗,是衡量模型分類器穩定性的重要指標,Kappa系數越大,分類精度越高,表示分類器越穩定[14]。表5是建立的不同模型識別結果,可以看出,PCA-GA-BP模型的識別率和Kappa系數最高,未經任何優化的BP神經網絡的識別率和Kappa系數最低,效果最差。經主成分分析和遺傳算法優化后的BP神經網絡總體識別率達到93.8%,較其他3個模型分別高出10.0、6.3、18.8百分點。Kappa系數也位于0.81~1.00之間,分別高出其他3個模型0.133、0.066、0.233。由此可見,本研究所建立的PCA-GA-BP神經網絡模型具備較高的識別精度和穩定性。
3 結論
本研究運用小波變換和灰度共生矩陣提取茶葉圖像紋理特征,建立茶葉感官品質的計算機視覺分級模型。在模型建立過程中,使用遺傳算法優化BP神經網絡的參數。采用前5個主成分建立的BP神經網絡模型識別率和Kappa系數最佳,高于PCA-BP、GA-BP和BP神經網絡模型的,表明該方法具有較高的穩定性。研究結果可為茶葉品質的快速檢測儀器化研制提供參考。
參考文獻:
[1]Laddi A,Sharma S,Kumar A,et al. Classification of tea grains based upon image texture feature analysis under different illumination conditions[J]. Journal of Food Engineering,2013,115(2):226-231.
[2]Dong C W,Zhu H K,Zhao J W,et al.Sensory quality evaluation for appearance of needle-shaped green tea based on computer vision and nonlinear tools[J]. Journal of Zhejiang University-Science B:Biomedicine & Biotechnology,2017,18(6):544-548.
[3]余 洪,吳瑞梅,艾施榮,等. 基于PCA-PSO-LSSVM的茶葉品質計算機視覺分級研究[J]. 激光雜志,2017,38(1):51-54.
[4]常 春,陳怡群,肖宏儒,等. 基于神經網絡圖像分析的智能鮮茶葉分選機[J]. 中國農機化學報,2013,34(1):137-141.
[5]肖志云,劉 洪. 小波域馬鈴薯典型蟲害圖像特征選擇與識別[J]. 農業機械學報,2017,48(9):24-31.
[6]彭慶濤,吳水才,高宏建,等. 基于小波分析和灰度紋理特征的乳腺X線圖像微鈣化點區域的提取[J]. 北京生物醫學工程,2015,34(5):462-467,488.
[7]孔喜梅,木拉提·哈米提,嚴傳波,等. 基于小波變換的新疆地方性肝包蟲CT圖像分類研究[J]. 生物醫學工程研究,2016,35(3):162-167,174.
[8]Wang S H,Phillips P,Liu A J,et al. Tea category identification using computer vision and generalized eigenvalue proximal SVM[J]. Fundamenta Informaticae,2017,151(1/2/3/4):325-339.
[9]Borah S,Hines E L,Bhuyan M. Wavelet transform based image texture analysis for size estimation applied to the sorting of tea granules[J]. Journal of Food Engineering,2007,79(2):629-639.
[10]Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International Journal of Computer Vision,2004,60(2):91-110.
[11]Tang Z,Su Y C,Er M J,et al. A local binary pattern based texture descriptors for classification of tea leaves[J]. Neurocomputing,2015,168:1011-1023.
[12]吳瑞梅,吳彥紅,艾施榮,等. 茶葉外形品質的高光譜圖像量化分析[J]. 江西農業大學學報,2013,35(2):413-418.
[13]孫 麗. 基于遺傳算法BP神經網絡的多目標優化方法[J]. 激光雜志,2016,37(8):123-128.
[14]徐樹良,王俊紅. 基于Kappa系數的數據流分類算法[J]. 計算機科學,2016,43(12):173-178.陳玉梅,申允德,張成浩. 黃瓜自動化栽培系統研究進展[J]. 江蘇農業科學,2019,47(5):174-180.