999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于高光譜技術(shù)和機器學(xué)習(xí)的半夏偽品鑒別

2023-11-17 02:25:42王昌隆路紹軍
安徽農(nóng)業(yè)科學(xué) 2023年21期
關(guān)鍵詞:特征模型

王昌隆,路紹軍

(延安大學(xué)物理與電子信息學(xué)院,陜西延安 716000)

半夏為天南星科植物半夏的干燥塊狀根莖,具有化痰止咳、降逆止嘔、消痞散結(jié)的功效[1-2]。作為臨床常用的中藥之一,半夏的臨床需求量也在日益增加,但是由于產(chǎn)量低,導(dǎo)致了很多不法分子使用水半夏或者南星冒充半夏,其市場價格遠遠低于半夏,且達不到半夏的藥用效果。市面上常售的半夏多以片狀居多,半夏、南星、水半夏切片后外觀相似,專業(yè)人員也很難通過肉眼去區(qū)分。目前,半夏鑒別主要有儀器分析法[3-4]和感官評價法[5]。然而這些方法檢測步驟煩瑣、時效性低、對檢測人員的專業(yè)要求高。因此,急需開發(fā)一種能夠快速高效檢測出半夏偽品的鑒別方法。

高光譜技術(shù)可以同時獲得檢測對象的光譜信息和空間信息,既可以用來檢測物體的外部品質(zhì),又可以檢測內(nèi)部品質(zhì)[6],已經(jīng)在食品安全[7-11]、生物醫(yī)學(xué)[12-14]、環(huán)境檢測[15-17]等領(lǐng)域被廣泛應(yīng)用。黃華等[18]采用最小二乘法對白胡椒粉中摻雜不同比例的面粉樣品進行近紅外高光譜圖像判別分析,識別了白胡椒粉末中摻雜的面粉。馮潔等[19]利用高光譜技術(shù)結(jié)合極限學(xué)習(xí)機等方法實現(xiàn)了金銀花和山銀花的鑒別,其訓(xùn)練集和預(yù)測集的識別率均為100%。可見,高光譜技術(shù)結(jié)合機器學(xué)習(xí)算法在物體鑒別領(lǐng)域具有較高的識別精度。鑒于此,筆者基于高光譜技術(shù)和機器學(xué)習(xí)算法對半夏、水半夏和南星進行鑒別,分析了不同的特征波長提取方法對模型性能的影響,找到了高效、準(zhǔn)確的半夏偽品鑒別模型;此外還比較了基于全光譜數(shù)據(jù)和特征波長光譜數(shù)據(jù)所建立的模型運行時間。

1 材料與方法

1.1 試驗材料試驗所用完整半夏、水半夏和南星均從本地藥店購買。同時考慮到樣品的外形不規(guī)則對光譜數(shù)據(jù)的影響,對半夏、水半夏和南星分別切片,切片時保持切面平整,然后干燥、去除雜質(zhì)各制備180份,共計540份片狀樣品。其中部分樣品如圖1所示。

1.2 試驗儀器樣本的高光譜圖像使用可見-近紅外高光譜成像系統(tǒng)采集。該高光譜成像系統(tǒng)(圖2)主要由GaiaField v10高光譜成像儀(四川雙利合譜公司)、兩臺50 W鹵鎢燈、暗箱、計算機組成。GaiaField v10高光譜成像儀的光譜范圍為400~1 000 nm;光譜分辨率為4 nm;設(shè)定曝光時間1.1 ms;物距20 cm;圖像采集速率7.2 mm/s。

圖1 樣品切片F(xiàn)ig.1 Sample cutting

圖2 高光譜成像系統(tǒng)原理 Fig.2 Schematic diagram of hyperspectral imaging system

1.3 光譜數(shù)據(jù)采集與黑白校正為了避免外部環(huán)境的干擾,需要在暗箱中進行高光譜圖像的采集,在采集之前,儀器需要預(yù)熱30 min使光照穩(wěn)定。且由于存在傳感器暗電流以及光照強度分布不均勻的問題,需要按公式(1)計算得到黑白校正后的圖像。

(1)

式中:I0為校正前的原始反射光譜圖像;W為白板參照圖像,采集標(biāo)定白板獲得;B0為全黑圖像,蓋上鏡頭蓋采集獲得;I為校正后的圖像。

1.4 感興趣區(qū)域(ROI)的選取在校正后的圖像中,利用ENVI 5.3軟件在每份樣本的中心區(qū)域手動選擇大小為100像素×100像素的感興趣區(qū)域(region of interest,ROI),將感興趣區(qū)域內(nèi)的所有像素的光譜數(shù)據(jù)平均值作為該樣本的光譜數(shù)據(jù),最后得到一個540×256的數(shù)據(jù)矩陣(540為樣本個數(shù),256為波段數(shù))用于數(shù)據(jù)分析。

2 光譜數(shù)據(jù)處理

2.1 光譜數(shù)據(jù)預(yù)處理由高光譜成像系統(tǒng)獲得的原始光譜數(shù)據(jù)中含有試驗環(huán)境所產(chǎn)生的噪聲,這些噪聲會影響模型的性能和效率,因此需要對原始光譜數(shù)據(jù)進行預(yù)處理以減小或者消除這些噪聲。該研究采用小波變換來對原始光譜數(shù)據(jù)進行預(yù)處理。原始光譜經(jīng)過小波變換處理后,可以得到低頻系數(shù)和高頻系數(shù),低頻系數(shù)能夠反映光譜曲線的明顯形狀,高頻系數(shù)能夠反映光譜曲線微小的特征變化和噪聲,通過去除高頻系數(shù)能夠減少由試驗環(huán)境所產(chǎn)生的高頻噪音。小波變換中小波基函數(shù)和分解尺度的選擇將會有不同的效果,該研究設(shè)置小波函數(shù)Daubechies的正交小波基Db4和分解尺度為7,采用軟閾值方法去噪。

2.2 特征波長提取高光譜數(shù)據(jù)的波段眾多,不同波段間的光譜信息大多存在冗余和共線特征,會使模型的復(fù)雜度加大。該研究采用主成分分析(PCA)、連續(xù)投影算法(SPA)、競爭性自適應(yīng)重加權(quán)算法(CARS)在全光譜中提取特征波長作為分類判別模型的輸入,以減少信息冗余和共線性信息的影響。

2.3 分類判別模型為了選出最優(yōu)的判別模型,采用K-S算法將樣本集按照2∶1的比例劃分為訓(xùn)練集和測試集之后,基于訓(xùn)練集采用BP、SVM、ELM共3種算法分別建立半夏偽品鑒別模型,使用所建模型鑒別測試集中的樣本,通過鑒別準(zhǔn)確率評估模型的性能。模型鑒別準(zhǔn)確率公式如下:

(2)

式中:E1為某種樣本的鑒別正確數(shù)量;E為該品種參與鑒別的實際數(shù)量;W為鑒別準(zhǔn)確率。

經(jīng)過反復(fù)調(diào)試,所選算法ELM采用“sigmoidal”作為激活函數(shù),隱含層神經(jīng)元個數(shù)設(shè)置為2(N-1),其中N為特征數(shù)。BP神經(jīng)網(wǎng)絡(luò)設(shè)定為單隱含層的3層神經(jīng)網(wǎng)絡(luò),輸入層神經(jīng)元個數(shù)由輸入變量的個數(shù)決定,隱含層神經(jīng)元個數(shù)經(jīng)過不斷調(diào)試獲得,輸出層為1個神經(jīng)元,BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練函數(shù)為Tansig和Purelin,學(xué)習(xí)函數(shù)為Learngdm;迭代次數(shù)為1 000次,學(xué)習(xí)速度為0.1;SVM選擇徑向基函數(shù)(RBF)作為核函數(shù)參數(shù),在采用徑向基函數(shù)時,懲罰因子(c)和核函數(shù)參數(shù)(g)是2個必須調(diào)整的參數(shù),該研究使用遺傳算法來尋找最優(yōu)的c和g,尋優(yōu)時參數(shù)設(shè)置為:最大進化代數(shù)200,種群數(shù)量20,交叉概率0.8,變異概率為0.2。

3 結(jié)果與分析

3.1 光譜預(yù)處理和原始光譜原始光譜數(shù)據(jù)一共有256個波段,波長范圍400~1 000 nm,由于存在噪聲干擾,剔除前15個波段,保留16~256波段(420~1 000 nm)的數(shù)據(jù)作為該研究所用光譜,共241個波段。

半夏、水半夏、南星共540份樣品原始光譜如圖3a所示,分別計算半夏、水半夏和南星的平均光譜數(shù)據(jù),其平均光譜曲線如圖3b所示。在全波段范圍內(nèi)半夏和南星、水半夏的光譜曲線走勢一致,在420~490 nm區(qū)間半夏的反射率值最大;在620~1 000 nm區(qū)間水半夏的反射率值最大,半夏的反射率值最小。利用小波變換預(yù)處理后的光譜如圖3c所示,對比圖3a和3c發(fā)現(xiàn),經(jīng)過小波變換處理后的光譜曲線與原始光譜曲線在總體變化趨勢上保持一致。在420~1 000 nm,3種不同類別樣本的曲線走勢相似,無法直接通過光譜去區(qū)分不同類別的樣本,需要進一步建模分析。

注:a.原始光譜;b.平均光譜;c.小波變換預(yù)處理后的光譜。Note:a.Original spectra;b.Average spectra;c.Preprocessed spectra by wavelet transform.圖3 半夏、水半夏和南星預(yù)處理前后的光譜分布 Fig.3 Spectral profiles of Rhizoma ternata and Rhizoma Typhonii Flagelliformis and Rhizome arisaematis before and after preprocess

3.2 特征波長的提取

3.2.1應(yīng)用PCA提取特征波長。利用PCA進行主成分分析,得到了半夏、水半夏、南星3類樣本前10個成分的方差貢獻率圖(圖4)。由圖4可知,前2個主成分已經(jīng)保留了原始光譜信息的98%以上,可以反映主要的原始光譜信息,為盡量減小有效光譜信息丟失的影響,最終選擇前10個主成分作為特征變量用作后續(xù)模型的輸入。

圖4 前10個主成分的方差貢獻率Fig.4 Variance contribution rate of the top 10 principal components

3.2.2應(yīng)用SPA提取特征波長。該研究將最大提取波長設(shè)定為25,運行SPA算法,根據(jù)預(yù)測均方根誤差(RMSE)最小的原則確定提取的特征變量的個數(shù),圖5是預(yù)測均方根誤差隨著提取變量個數(shù)的變化情況。由圖5可知,當(dāng)選取15個維度(圖中“□”對應(yīng)的橫坐標(biāo))時RMSECV處在較小的位置,此時RMSE為0.101 7,表明特征波長包含有原始光譜較多的信息。之后維度雖然增加,但RMSE降幅很小,類似于梯度下降中梯度收斂。原始光譜數(shù)據(jù)通過SPA降維最終生成了只有15個特征波長的光譜數(shù)據(jù)。

圖5 RMSE值隨特征波長數(shù)的變化Fig.5 RMSE changed with the number of characteristic wavelengths

3.2.3應(yīng)用CARS提取特征波長。設(shè)置蒙特卡洛采樣次數(shù)為50,交叉驗證的最大潛在變量數(shù)為40。圖6a表示采樣變量數(shù)隨采樣運行次數(shù)的變化,可以看出在采樣運行次數(shù)增加的過程中,采樣變量數(shù)在減小;在采樣前期,變量數(shù)下降速度較快,到了后期,變量數(shù)量下降速度變慢,表明在變量的篩選過程中存在“精選”和“粗選”2個過程。圖6b為RMSECV隨著采樣次數(shù)的變化,在采樣次數(shù)為25次時RMSECV達到最小值,而之后RMSECV增加,表明剔除了重要的光譜變量。圖6c是各變量變化的回歸系數(shù)的路徑,“*”號所對應(yīng)的位置表示此時RMSECV最小,保留了第25次采樣時的變量。CARS算法最終選擇了25個特征波長用作后續(xù)模型的輸入。

3.3 基于全光譜和特征波長的建模分析將模型的輸入分別設(shè)置為全光譜(FS)和特征波長的光譜數(shù)據(jù),建立了基于BP、SVM、ELM的半夏偽品鑒別模型,測試所建模型在訓(xùn)練集和測試集中的鑒別準(zhǔn)確率。由表1可知,基于3種特征波長提取方法建立的BP、SVM、ELM模型鑒別準(zhǔn)確率均大于95%,具有較高的鑒別準(zhǔn)確率,說明可以使用高光譜技術(shù)結(jié)合機器學(xué)習(xí)算法實現(xiàn)半夏偽品鑒別。對比3種模型發(fā)現(xiàn),基于全光譜和CARS提取的特征波長建立的BP、SVM和ELM鑒別模型對3種樣本的鑒別準(zhǔn)確率達到了100%。而基于其他2種特征波長提取方法建立的鑒別模型精度有所下降,且基于SPA方法提取的特征波長建立的鑒別模型的準(zhǔn)確率優(yōu)于PCA方法。同時基于Windows10(64位操作系統(tǒng)),Inter(R)Core i5-7200U@2.50GHZ處理器,利用MATLAB2019a對模型的運行時間還進行了對比。從表2可以看出,基于全光譜建立的鑒別模型的運行時間遠長于基于特征波長所建立模型的運行速度。所以在減小計算量同時不減小分類識別精度的情況下,使用CARS算法提取的特征波長作為鑒別模型的輸入能夠更加快速實現(xiàn)半夏偽品鑒別。

圖6 利用CARS提取特征波長的過程Fig.6 The process of extracting characteristic wavelengths by CARS

表1 基于全光譜和特征波長的BP、SVM和ELM模型分類的準(zhǔn)確率

表2 基于不同特征波長提取方法建立的ELM模型的運行時間Table 2 Runtime of ELM model based on different characteristic wavelengths extraction methods

4 結(jié)論

模型的復(fù)雜度分析顯示,PCA、SPA、CARS提取的特征波長數(shù)分別為10、15和25個,均能有效提取特征波長。比較了采用全光譜和特征波長作為模型輸入所建立的BP、SVM、ELM鑒別模型的分類準(zhǔn)確率,結(jié)果顯示在提取特征波長方面,CARS算法效果最優(yōu),其中使用全光譜和CARS算法提取的特征波長作為模型輸入所建立的BP、SVM和ELM鑒別模型對所有樣本的分類準(zhǔn)確率達到了100%。最后,比較了基于全光譜和不同方法提取的特征波長建立的ELM模型的運行時間,結(jié)果顯示基于特征波長建立的ELM模型能夠大大減少運行時間,為快速鑒別奠定了基礎(chǔ)。因此,使用高光譜技術(shù)并結(jié)合合適的機器學(xué)習(xí)算法能夠快速高效地鑒別出半夏偽品,為后續(xù)開發(fā)相關(guān)的便攜式檢測設(shè)備奠定了理論基礎(chǔ)。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學(xué)特征認(rèn)識
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 欧美精品亚洲精品日韩专| 日本精品影院| 国产女人18毛片水真多1| 麻豆精选在线| 午夜电影在线观看国产1区| www.亚洲一区二区三区| 亚洲一区网站| 欧美成人精品一级在线观看| 精品久久久久成人码免费动漫| 中文字幕1区2区| 亚洲男人在线天堂| 国产乱人视频免费观看| 欧美一区二区精品久久久| 中文字幕永久在线观看| 亚洲无码精彩视频在线观看| 伊人成人在线| 成人午夜福利视频| 女人毛片a级大学毛片免费| 无码粉嫩虎白一线天在线观看| 精品无码日韩国产不卡av| 福利姬国产精品一区在线| 国产成人调教在线视频| 色综合天天综合中文网| 国产精品深爱在线| 精品国产免费观看| 欧美日韩中文国产| 国产成人91精品免费网址在线| 在线看AV天堂| 精品福利视频导航| 免费看黄片一区二区三区| 超碰色了色| 狠狠色丁香婷婷| av在线人妻熟妇| 亚洲一区二区无码视频| 亚洲二区视频| 欧美成人日韩| a亚洲天堂| 91精品国产一区自在线拍| 美臀人妻中出中文字幕在线| 亚洲精品无码在线播放网站| 五月丁香伊人啪啪手机免费观看| 久久精品国产亚洲AV忘忧草18| 亚洲国产精品不卡在线| 午夜毛片免费观看视频 | 国产日韩av在线播放| 久草中文网| 精品福利国产| 77777亚洲午夜久久多人| 丁香婷婷久久| 国产乱人伦AV在线A| 精品人妻系列无码专区久久| 国产免费久久精品44| 色视频国产| 国产福利不卡视频| 欧美曰批视频免费播放免费| 男女男免费视频网站国产| 国内嫩模私拍精品视频| 亚洲精品视频免费| 国产女人在线观看| 欧美另类一区| 99久久这里只精品麻豆| 欧美日韩午夜| 99视频免费观看| 无码AV日韩一二三区| 91精品国产自产91精品资源| 免费一看一级毛片| 国产精品一区在线观看你懂的| 一级做a爰片久久毛片毛片| 制服无码网站| 日本亚洲成高清一区二区三区| 久青草网站| 一级一毛片a级毛片| 福利国产微拍广场一区视频在线| 国产欧美性爱网| 亚洲Av激情网五月天| 又大又硬又爽免费视频| 国产微拍精品| 少妇精品网站| 国产正在播放| 久久精品国产精品国产一区| 婷婷丁香色| 手机永久AV在线播放|