999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于高光譜成像技術的祁門紅茶等級無損檢測

2021-09-02 06:45:50范婷婷陸江明康志龍牛新環穆青爽
食品工業科技 2021年16期
關鍵詞:分類模型

范婷婷,陸江明,康志龍,牛新環,穆青爽

(河北工業大學電子信息工程學院,天津 300401)

茶是世界上最有價值和最流行的飲品之一[1],茶葉不僅可以提高機體免疫力,而且可以對抗疾病[2]。紅茶在世界茶產品中是主流的消費產品,中國生產的祁門紅茶是世界三大高香紅茶之一,它具有獨特的果香氣味,受到很多人的青睞。隨著人們對紅茶需求的不斷增加,紅茶的品質越來越受到重視[3]。目前,茶葉市場存在以次充好的現象,但僅憑感官評價正確分辨茶葉品質好壞是比較困難的,而無損檢測具有快速、精確和評價標準穩定的特點,因此實現茶葉的快速無損鑒別是十分必要的[4]。傳統的鑒別方法是感官評價和化學試驗法,這些方法主觀性強、消耗時間、成本高昂、破壞性大和不易推廣[5]。電子鼻和電子舌是一種用于茶葉工藝分析和質量監測的無損檢測技術[6?7],但它們的缺點是會受到環境條件的影響,從而導致傳感器漂移[8]。視覺圖像技術[9]可以通過外部特征進行茶葉識別,但該方法不能得到茶葉的內部品質特征[10]。傳統光譜技術已廣泛用于茶產品的鑒別[11?12]、鑒定[13?15]和質量評價[16],其中近紅外光譜技術具有快速、無損和多成分同時檢測特點,但缺少空間信息。因此,結合各種鑒別手段,實現茶葉的快速、無損識別是一個新的研究方向[17]。

高光譜圖像同時包含光譜特征和圖像特征,可以對研究對象的內外品質進行快速、無損檢測。目前,已有學者使用高光譜成像技術對茶葉的成分測定[18?20]、質量鑒別[21?22]和地理來源進行研究。Hong等[23]利用光譜范圍為380~1030 nm和874~1734 nm的高光譜成像系統對龍井茶的6種地理來源進行鑒別,建立基于全光譜的支持向量機(Support Vector Machine,SVM)和偏最小二乘判別分析(Partial Least Squares Discrimination Analysis,PLS-DA)模型,校準集和預測集的準確率超過84%。Zhuang等[24]利用近紅外光譜對兩個地理來源的綠茶進行分類,結果表明偏最小二乘法(Partial Least Squares,PLS)的性能優于反向傳播人工神經網絡(Back Propagation-Artificial Neural Network,BP-ANN)和支持向量機,PLS的訓練集和測試集準確率都為100%。目前,利用高光譜技術對紅茶品質的研究較少,因此對紅茶內外品質的快速、無損檢測具有十分重要的意義。

本文利用近紅外高光譜成像系統(900~1700 nm)對祁門紅茶的6個等級進行分類,比較分析了PCA、MDS、t-SNE和Sammon四種不同降維技術,建立SVM和極限學習機(Extreme Learning Machine,ELM)模型并生成高光譜圖像像素空間分類圖。

1 材料與方法

1.1 材料與儀器

祁門紅茶 某大型茶市場,參考中國官方標準方法(DB34/T 1086-2009)選取了祁門紅茶6個等級,分別為一級(G1)、二級(G2)、三級(G3)、四級(G4)、五級(G5)和六級(G6)。每個等級的茶葉采集80個樣本,共480個樣本,每個樣本5 g。放在直徑為5 cm,深度為2 cm的黑色圓形塑料容器中。

近紅外高光譜成像儀(主要包括4個鹵素燈,功率為35 W,光強度可調范圍是0~100%)、ImSpector N17光柵光譜儀 光譜成像有限公司(芬蘭奧盧);Zelos-258GV線陣CCD相機 卡帕光電股份有限公司;PSA200-11-X移動平臺Zolix有限公司(中國北京);數據采集軟件V 10E五鈴光學有限公司(中國臺灣)。

1.2 實驗方法

1.2.1 數據采集 近紅外高光譜采集儀的光譜范圍為900~1700 nm,光譜分辨率為3 nm,共256個波段。在實驗中將茶葉樣本均勻的平鋪在直徑為5 cm,高為2 cm的圓形容器中,放在前進速度為1.68 cm/s的移動臺上進行圖像采集,曝光時間為20 ms,鏡頭與樣本之間的距離為32 cm。

為避免外部光線影響,高光譜圖像的采集過程在暗箱中進行。原始高光譜圖像噪聲較大,故對其進行圖像校正。本文采用黑白校正和最小噪聲分離變換(Minimum Noise Fraction,MNF)方法對原始數據進行去噪處理。使用ENVI 5.3軟件,提取50×50像素中心區域作為感興趣區域(Region of Interest,ROI),計算其平均光譜作為樣本的原始光譜。

各等級的茶葉樣本按照3:2分為訓練集和測試集,訓練集包含288個樣本,測試集包含192個樣本。

1.2.2 數據處理

1.2.2.1 數據預處理 圖像采集過程中受到暗電流噪聲、探測器靈敏度和光學傳輸特性等因素影響,導致采集的圖像質量受到影響,需要對采集圖片進行黑白校正。在相同的采集條件下,分別采集反射率接近100%的白幀圖像和反射率接近為0%的黑幀圖像。最后根據式(1),對采集的原始高光譜圖像進行黑白校正。

式中,W為黑幀圖像強度;B為白幀圖像強度;為I0原 始的高光譜圖像強度;I為校正后的高光譜圖像強度。本文中使用ENVI5.3和Matlab(R2018b)軟件進行高光譜圖像處理。

1.2.2.2 多維尺度變換 多維尺度變換(Multi-Dimensional Scaling,MDS)是線性的高維數據可視化方法[25],通過保持高維空間到低維空間的距離來執行轉換,利用計算多維空間中每個數據點的歐氏距離來捕獲轉換模式。歐式距離被定義為一個對稱矩陣(D),多維尺度變換嘗試尋找指定空間中的數據點,使數據點(D^)之間的歐氏距離與高維空間中的距離相似。最小化函數表達式為:

1.2.2.3 主成分分析 主成分分析(Principal Component Analysis,PCA)是一種線性的高維數據可視化方法。它構造了數據集的低維表示,保留了對方差貢獻最大的數據特征。假設X 是m行n列的數據矩陣(即有m個樣本,n個特征),主成分分析中試圖找到一個使TTCOVX?XˉTT 最大化的線性變換T,其中,COVX?Xˉ是數據 X 的零均值協方差矩陣。該線性映射是由零均值數據協方差矩陣的d 個主特征向量構成(即d 個主成分),其數學表達式為:

通過對d個主特征值的求解,特征值對應的特征向量構成了線性變換矩陣T的列。數據點xi映射到線性基T,得到低維數據yi其數學表達式為:

1.2.2.4 t分布隨機鄰域嵌入t分布隨機鄰域嵌入(t-Distributed Stochastic Neighbour Embedding,t-SNE)是一種非線性降維算法,用于可視化高維數據二維或三維散點圖[26]。t-SNE的主要目標是使用較近點的成對距離來建模相似點,使用較遠點的成對距離來建模不相似點。為了表示相似性,t-SNE使用高斯分布將數據點之間的高維歐氏距離轉換為條件概率。Pj/i正 比于數據點xi與 xj之間的相似度,條件概率公式為:

式中,參數σi對于不同的點 xi取值不同,通常取以數據點xi為中心的高斯均方差。此外,通過設置條件概率對稱性可減少數據異常值的影響,公式為:

在低維空間下,t-SNE使用了重尾學生t分布的聯合概率分布,它的優點是使高維度下中低等的距離在映射到低維空間后能夠有較大的距離,估計的聯合概率的公式為:

t-SNE最小化高維空間中的聯合概率分布P和低維空間中的聯合概率分布Q之間的Kull-leibler(KL)散度,公式為:

該算法通過梯度下降算法最小化KL散度,得到最終收斂結果。

1.2.2.5 Sammon非線性映射 Sammon是一種非線性映射的降維技術,它是一種尋找高維空間(D維)到低維(m=2或3維)非線性子空間(其中m

Sammon映射算法的本質是尋找映射:

該映射通過梯度迭代算法對目標函數進行最小化處理,來得到數據映射后的低維表示:

1.2.2.6 分類模型 采用支持向量機(Support Vector Machine,SVM)和極限學習機(Extreme Learning Machine,ELM)兩種方法建立分類模型。SVM是一種監督的機器學習模型,它利用超平面來定義執行分類的決策邊界[27]。SVM基于優化后關鍵參數懲罰系數c 和核函數 g 實現準確的預測結果,采用懲罰參數c 最小化訓練誤差,簡化模型復雜度。核函數系數g 表征輸入空間到某一高維特征空間的非線性映射。該方法的主要步驟簡述如下:使用RBF核函數,通過交叉驗證優化核心參數(c, g);采用網格搜索法確定最佳參數對(c, g);根據預測集中精確度輸出的最高值,建立最優的SVM分類模型。

極限學習機(ELM)是一種用于訓練單層前饋神經網絡(SLFN)的算法。在ELM中,需要學習隱含層和輸出層之間的參數。

本文中所有算法均使用Matlab(R2018b)軟件建立模型。

2 結果與分析

2.1 樣本光譜特征

由于鹵素燈在初始階段光照強度不均勻以及儀器噪聲影響,為了保證數據的準確性和實驗結果的可靠性,剔除900~980 nm和1650~1700 nm,選取光譜范圍在980~1650 nm的203條光譜帶作為祁門紅茶的原始光譜數據。所有樣本的原始光譜曲線如圖1所示,光譜數據受到隨機噪聲和散射效應的干擾,需要對其進行預處理。本文對原始光譜分別采用SG平滑濾波(Savitzky-Golay Filtering,SG)、標準正交變換(Standard Normal Variate,SNV)、多元散射校正(Multiplicative Scatter Correction,MSC)、SG-SNV和SG-MSC等算法對數據進行預處理。SG可以消除或減弱隨機噪聲,SNV和MSC用來校正散射現象,SG-SNV和SG-MSC對原始算法進行了優化。實驗結果表明,SG-SNV預處理效果優于其他算法。該算法有效地修正了光散射引起的光譜基線漂移問題,使光譜的吸收峰位置更加突出,光譜曲線如圖2所示。祁門紅茶6個等級的平均光譜曲線如圖3所示,不同等級的茶葉在三個峰處反射率差別較明顯。由此可知,高光譜成像技術可建立分類模型對6個等級的祁門茶葉進行識別。

圖1 樣本的原始光譜曲線Fig.1 Raw spectra of samples

圖2 SG-SNV預處理光譜曲線Fig.2 SG-SNV preprocessing spectral curves

圖3 樣本的平均光譜曲線Fig.3 Mean spectral curvesof tea samples

2.2 高維數據可視化

利用MDS、Sammon、t-SNE和PCA等算法對高光譜圖像進行高維數據的低維可視化。實驗結果如圖4所示,不同顏色的聚類代表不同的茶葉等級,只有t-SNE可以將6個等級的茶葉明確區分。如圖4(a)、圖4(b)、圖4(d)所示,MDS和PCA不能將G1和G4完全區分開,Sammon不能將G5、G6以及G1、G3完全區分開,主要原因是該樣本具有相似的光譜特征。與PCA和MDS相比,Sammon對6個等級祁門紅茶的可視化效果較差。由于Sammon映射沒有顯式地表示轉換函數,該算法只是提供了一種度量方法來衡量轉換結果,故分離簇的能力不強。PCA和MDS無法保持高維空間的數據結構,因其只利用了遠處數據點的信息,所以分離簇能力較弱。如圖4(c)所示,與其他算法相比,t-SNE能夠捕獲數據的非線性和鄰域信息,故可呈現較好的可視化效果。由實驗結果可知,t-SNE識別最大分離簇數的能力優于PCA、MDS和Sammon。

圖4 高維數據可視化Fig.4 Visualising high dimensional data

2.3 分類結果驗證

本文采用SVM和ELM建立判別模型,表1展示了SVM和ELM模型對經過預處理與未預處理光譜數據進行判別的實驗結果。其中,SVM模型懲罰系數 c 為1.2,核函數系數g 為2.8,ELM模型的隱層節點數為5。由實驗結果知,SVM和SG-SNVSVM模型,訓練集和測試集的準確率分別為100%。ELM模型的識別效果較差,ELM模型的訓練集和測試集準確率分別為90.27%和85.93%,SG-SNV-ELM模型的訓練集和測試集識別率分別為98.61%和96.35%。預處理之后的SVM模型分類精度沒有發生變化,而經過預處理的ELM模型分類精度顯著提高。由此可知,SG-SNV預處理對ELM得到有效應用。

表1 預處理前后模型結果Table 1 Model results before and after pretreatment

圖5是不同模型的混淆矩陣結果。圖5(a)混淆矩陣結果存在較多識別錯誤,G2中10個樣本和3個樣本被分別識別為G1和G4,G3中3個樣本被識別為G4,G4中3個樣本被識別為G3,G5中1個樣本和3個樣本被分別識別為G4和G6,G6中4個樣本被識別為G5。圖5(b)混淆矩陣結果出現少量識別錯誤,G3中1個樣本被識別為G1,G4中4個樣本被識別為G2,G6中1個樣本被識別為G5。圖5(c)和圖5(d)的混淆矩陣結果完全正確。

圖5 混淆矩陣結果Fig.5 Confusion matrix result

為了可視化6個等級祁門紅茶的差異,對不同等級茶葉的像素光譜信息建立SVM和ELM識別模型,實驗結果如圖6示。如圖6(a)所示,提取灰度圖像,如圖6(b)、圖6(c),祁門紅茶等級分類圖由上到下依次為一級、二級、三級、四級、五級和六級。由圖6(b)所示,SVM模型將6個等級的祁門紅茶識別為各自相應的等級,但也存在一些像素點分類錯誤,特別是圓形容器邊緣的誤分類尤為明顯。由圖6(c)所示,ELM模型的分類圖中不僅邊緣像素存在誤分類,而且各等級之間存在嚴重誤分類。除去邊緣分類錯誤,造成不同等級茶葉誤分類的主要原因是光譜的相似性。誤分類的另一個原因可能是茶葉的純度,例如,將低等級的茶葉摻入高等級茶葉中進行混合售賣盈利。SVM模型的識別結果優于ELM模型。因此,SVM有較好的識別效果和性能。

圖6 祁門紅茶識別預測圖Fig.6 Prediction map of Keemun black tea recognizing

3 結論

本文利用近紅外高光譜成像技術,結合SNV-SG、PCA、MDS、Sammon及t-SNE算法,基于光譜特征,分別建立祁門紅茶等級快速無損識別的SVM模型和ELM模型。結果顯示,t-SNE能更好地分離不同等級的祁門紅茶,其高維空間鄰近數據點的信息可以保持低維空間中的數據結構。基于光譜特征的SVM模型和ELM模型的測試集識別率分別為100%和96.35%。因此,近紅外高光譜成像技術結合機器學習在茶葉產品分類的應用領域具有很大潛力。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: www亚洲天堂| 97久久精品人人| 日韩免费视频播播| 日韩不卡高清视频| 欧美va亚洲va香蕉在线| 久久精品无码一区二区国产区| 日本一区二区三区精品视频| 国产剧情无码视频在线观看| 九九热视频在线免费观看| 九色在线视频导航91| 国产成人凹凸视频在线| 日韩在线1| 热思思久久免费视频| 91国内外精品自在线播放| 欧美精品一二三区| 亚洲性日韩精品一区二区| 日韩成人在线视频| 国产a网站| 日本AⅤ精品一区二区三区日| 欧美午夜网| 国产精品.com| jizz在线免费播放| 国产精品亚洲一区二区三区z| 色哟哟精品无码网站在线播放视频| 国产尤物视频网址导航| 国产色图在线观看| 一本大道东京热无码av| 国产黄色视频综合| 成人午夜在线播放| 国产精品久久久久久久伊一| 五月天香蕉视频国产亚| 无码专区第一页| 露脸真实国语乱在线观看| 国产成人一二三| 四虎影视8848永久精品| 欧美午夜理伦三级在线观看| 日韩在线第三页| 综合色天天| 天天综合色网| 伊人无码视屏| 黄色福利在线| 欧美在线视频a| 亚洲国产成人超福利久久精品| 一区二区三区在线不卡免费| 国产精品一区在线麻豆| 欧美成人手机在线观看网址| 欧美一道本| 亚洲天堂在线免费| 日本免费一级视频| 色网在线视频| 在线另类稀缺国产呦| 国产精品开放后亚洲| 国产91久久久久久| 久久成人免费| 久青草国产高清在线视频| 亚洲中字无码AV电影在线观看| 国产成人凹凸视频在线| 日韩成人在线视频| 亚洲欧美国产五月天综合| 国产激爽爽爽大片在线观看| 国产呦精品一区二区三区下载| 色哟哟国产成人精品| 成人看片欧美一区二区| 伊人成人在线视频| 亚洲精品爱草草视频在线| 亚洲天堂视频网| 欧美a在线看| 区国产精品搜索视频| 无码内射中文字幕岛国片| 国产精品视频999| 美女无遮挡拍拍拍免费视频| 91精品国产91久无码网站| 呦系列视频一区二区三区| 国产亚洲精品yxsp| 97se综合| 亚洲青涩在线| 伊人久久久久久久久久| 亚洲国产高清精品线久久| 国产91色在线| 免费国产在线精品一区| 欧美爱爱网| 91九色最新地址|