999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于高光譜圖像技術結合深度學習算法的蘿卜種子品種鑒別

2020-06-27 05:58:32杭盈盈李亞婷孫妙君
農業工程 2020年5期
關鍵詞:分類模型

杭盈盈,李亞婷,孫妙君

(江蘇大學電氣信息工程學院,江蘇 鎮江212013)

0 引言

蘿卜是一種重要的根菜類蔬菜作物,在我國栽培歷史悠久,分布廣泛且在中國民間一直有“小人參”的美稱[1]。蘿卜可增強肌體免疫力,對防癌、抗癌有重要意義。但我國蘿卜產業也存在著品種良莠不齊、栽培技術落后和生產模式分散等問題,種子品種不一樣,其價格也不一樣[2]。一些不良商家為了牟取暴利用廉價種子冒充高價種子販賣給農民,導致農民利益受到損失。

傳統的種子品種檢測方法如形態鑒定、顯微鑒定、微形態鑒定及微性狀鑒定,其操作簡單,但是由于種子的鑒定特征在各個科屬中存在的變異很難達到鑒別種子的目的[3]。而高光譜圖像技術作為一種能夠快速無損檢測的技術,它兼具機器視覺和光譜分析技術的優點且已經被廣泛地應用到種子的成分測定和品種鑒別等領域[4-5]。

但是由于高光譜技術得到的光譜數據信息量大、冗余性強,所以需要使用特征提取算法對光譜數據進行降維。成忠等[6]通過連續投影算法實現小麥近紅外光譜特征波長的選擇。傳統的特征波長選擇方法雖然獲得了更理想的效果,但是其模型有時存在一些干擾信息[7-8]。

近年來,深度學習發展前景廣闊,堆疊自動編碼器(SAE)通過對高維數據進行特征學習已被應用在各個方面[9-11]。孫俊等[12]通過將低秩矩陣與堆疊自動編碼器結合實現對茶葉品種的鑒別。深度學習可以提取數據深度特征并提高模型魯棒性,且目前結合深度學習與高光譜技術鑒別蘿卜種子品種的文獻較少。

為了探究應用可見近紅外高光譜技術結合深度學習算法對蘿卜種子品種鑒別的可行性,該文以6種蘿卜種子為研究對象,利用3種降維算法(SPA,VISSA,SAE)結合Softmax與SVM分類模型分別建立蘿卜種子品種鑒別模型,從而得到鑒別蘿卜種子品種的無損檢測方法。

1 材料與方法

1.1試驗樣本

本試驗所選取的6種蘿卜種子樣本是鎮江種子站提供的滿膛紅、胭脂紅、楊花白、揚州園白、短葉十三和南京紅。選取無外部缺陷的種子作為試驗樣本。從每種種子中選取適量樣本分別放入廣口試劑瓶,并做好標簽且密封保存。采用將每類種子選取5.4 g聚攏擺放在一個半徑1.8 cm、高0.8 cm的瓶蓋中的堆疊擺放方式進行光譜采集[13]。

1.2高光譜圖像采集與數據提取

本試驗所采用的高光譜成像系統,主要包括1臺裝有光譜成像軟件的電腦、分光模組(V10E,SPECIM,Finland)、成像相機(Zyla4.4,andor,UTKL)、光纖鹵素燈(3900E型,Illumination Technologies,USA)、電位移動平臺(MSI300,ISUZU OPTICS,TaiWan)和暗箱(DC1300,ISUZU OPTICS,TaiWan)。光譜儀為可見-近紅外光譜儀,光譜范圍400~1 000 nm,光譜分辨率2.8 nm,圖像分辨率2 048×2 048像素。采用半徑1.8 cm、高0.8 cm的塑料圓形器皿放置蘿卜種子樣品。在試驗中將相機的曝光時間設置為20 ms,同時電控位移平臺的移動速度設置為2.47 mms且進行黑白板校正。將種子樣品放在移動平臺上進行數據采集。

高光譜圖像數據的采集使用HSI軟件平臺,在每個樣本中選取20×20像素的矩形感興趣區域(region of interest,ROI)并計算各個像素點的反射率,將其平均值作為該樣本的反射率,每類種子選取60個樣本,共獲得360個樣本。

1.3算法介紹

1.3.1堆疊自動編碼器(SAE)

自動編碼器(auto encoder)是在1986年由RUMELHART DE等[14]首次提出并將其用于高維復雜數據處理,之后更是促進了神經網絡的發展。AE模型結構可以看作1個由輸入層、隱含層和輸出層3層結構組成的深度學習模型,自動編碼器常被用于降維或特征學習[15]。

堆疊自動編碼器(SAE)是將多個AE通過級聯方式堆疊構成的多層AE。SAE采用的是逐層非監督預訓練,其將上一層的隱含層作為下一層的輸入,同時在預訓練之后會執行細化調節,通過上一步預訓練得到的權重來初始化網絡,以獲得最優參數,并將最后一個隱含層輸出作為光譜數據的深度特征[16]。

1.3.2連續投影算法(SPA)

連續投影算法是一種使矢量空間共線性最小化的前向變量選擇算法,能夠提取波段中的特征波長,且消除原始光譜矩陣中冗余的信息,可用于光譜特征波長的篩選。連續投影算法的實現可分為兩個階段:第1階段完成p個波長分組各M個波長,選M的最大可能取值為M=min(n,p);第2階段借助多元定量校正模型完成m個(1≤m≤M)最優波長的選定[6]。

1.3.3變量迭代空間收縮方法(VISSA)

變量迭代空間收縮算法是一種基于模型集群分析的算法,其主要思想是在每次迭代的過程中逐步優化變量空間,最終實現對最優變量組合的選擇。其每次迭代過程滿足變量空間逐漸收縮和優化準則。用VISSA選出的變量建模,其主要優勢是考慮變量組合的影響和變量空間的軟性收縮[8]。

1.3.4Softmax模型

Softmax函數是Logistic函數在多分類問題上的推廣,將分類問題轉化為概率問題從而實現對多個類別的分類任務。Softmax作為一種有監督的神經網絡常與深度學習的方法結合進而用于分類識別問題中[17]。Softmax的訓練過程是首先通過對Softmax分類器進行訓練,然后檢查損失曲線收斂是否滿足要求;最后利用訓練好的分類器進行分類[18]。

1.3.5SVM模型

SVM算法是一種經典分類算法,是按監督學習方式對數據分類的分類器。SVM能夠無限逼近復雜系統,且在樣本數量比較少的情況下可以獲得最優的泛化能力。其主要思想是將輸入數據空間映射到高維空間,尋找一個最優分離曲面,使得數據的間隔盡可能大從而得到一個全局最優解,完成分類任務[19]。

2 結果與討論

2.1光譜數據分析

本試驗共獲得478個波段在400.68~1 001.6 nm的光譜信息,為提高分類效果,去除部分噪聲明顯的波段后共獲取了411個波段在480.46~1 001.6 nm的光譜信息作為原始光譜數據,如圖1所示。根據每個品種在每個波段內的反射率平均值得到每種蘿卜種子樣本的平均光譜曲線,如圖2所示。由于蘿卜種子屬于十字花科油脂類種子,不同品種的蘿卜種子樣品內部的有效成分(如抗真菌蛋白Rs-AFP1、Rs-AFP2和氨基酸等)的含量與比例存在差異,這些成分大多存在含氫基團(C—H、O—H和N—H等),能在某些特定波長下產生倍頻和合頻吸收,其表現為對光的吸收強度不同,即表現為不同的反射率[20]。由圖2可知,蘿卜種子的光譜特征差異明顯,重疊部分較少,在波長為930 nm時,滿膛紅的反射率最高,短葉十三的反射率最低,其光譜特征為蘿卜種子的品種鑒別提供了依據。

2.2光譜數據預處理

本次預處理算法在The UnscramblerX10.4中運行。

對光譜數據進行預處理可有效抑制和消除光譜數據中的噪聲,提高所建立模型的性能。采用Savitzky Golay(SG)平滑對光譜數據處理,使用SG平滑可以在一定程度上消除高頻隨機誤差,提高信噪比。同時將經過SG平滑處理后的數據通過多元散射校正(Multiple Scattering Correction,MSC)進行處理,MSC算法通過對每個波長點的光譜數據進行散射校正,能夠有效地消除散射影響,增強與目標成分含量相關的光譜信息[21]。光譜預處理后曲線如圖3所示。

2.3數據降維

通過改變SAE的隱含層個數及每層神經元個數來探究不同模型架構對最終特征學習結果產生的影響。通過將SAE最后一個隱含層輸出的數據輸入到Softmax分類器中,并通過訓練集和預測集的準確率來確定該隱含層的最優神經元個數。本試驗的SAE學習率為0.2,且激活函數為sigmoid函數。SAE的優化參數如表1所示。通過對比可以發現,改變SAE的隱含層個數及每層神經元個數對學習結果有一定的影響。當隱含層層數增加時,其最優模型的準確率反而在逐漸下降,其訓練難度與時間也增加。因此選擇了簡單的兩個隱含層的SAE,模型架構為[411-212-125],共獲得125個深度特征,其訓練集和預測集準確率分別為99.72%和96.22%。

表1 堆疊自動編碼器的優化參數

SPA模型的最優樣本集是通過計算不同樣本子集的多元線性回歸模型的均方根誤差RMSE值來選取的,當RMSE值最低時代表的子集就是最優樣本子集。圖4所示是不同子集模型的RMSE值,其中“□”代表最優樣本子集的樣本數,從圖4可知,當變量數<25時,RMSE值整體呈下降趨勢,當變量數≥25時,變化趨勢趨緩。因此,本文利用SPA共選取25個特征變量。圖5所示是具體變量的選取,“□”代表選取的變量,其中橫軸初始變量代表480.46 nm的波長,終止變量為1 001.6 nm的波長,縱軸代表反射率。

VISSA模型是通過不斷降低交互驗證均方根誤差(RMSECV)來獲取最佳特征變量組合,RMSECV值越低,則模型所選擇的變量組合越好[22]。本模型的Plscv偏最小二乘法的交叉驗證程序采用的是10折,潛在變量數設為10,交叉驗證為五折交叉驗證,二進制矩陣采樣的數量設為1 000,變量初始權重設為0.5。VISSA模型的運行結果如圖6所示,RMSECV值隨著迭代次數的增加在不斷地下降,經過45次迭代后,RMSECV值達到最小值0.721 0,且最終保留112個變量。

2.4分類結果

本試驗建模算法均在Windows 10系統下,利用Matlab R2016b軟件完成的。通過結合Softmax分類器對全光譜數據采用五折交叉驗證的方法進行驗證,其訓練集和預測集的比例為4∶1。原始光譜的訓練集和預測集的準確率分別為90.1%和85.0%。

將降維模型獲得的低維光譜數據通過五折交叉驗證處理,分別采用Softmax分類器和SVM兩種分類算法進行建模,各模型分類的預測集準確率和訓練集的準確率如表2所示。

表2 分類結果

對構建的3種降維模型進行分析,可以發現本文模型均改善了種子的分類效果。構建的SAE模型的訓練集和預測集的準確率相較于其他傳統的特征提取模型的準確率高一些,且SAE與Softmax分類算法結合的預測集準確率高達96.22%。根據本次試驗結果可以發現,SAE模型對于蘿卜種子的深度特征學習效果更好。而對Softmax和SVM兩種分類模型進行分析,可以發現兩類模型中分類效果較好的是Softmax模型。而分類的預測集準確率也由最初的85%提高到96.22%。

3 結論

(1)通過光譜采集儀器獲取蘿卜種子樣品的可見近紅外光譜數據。對進行預處理后的近紅外光譜數據分別采用SAE、SPA和VISSA進行數據降維,其維度分別為125、25和112。其中SAE提取的深度特征在Softmax和SVM分類模型中的分類預測效果都優于SPA和VISSA算法。因此本研究選取SAE,將光譜數據降到了125維。

(2)對選取的特征波長變量分別通過五折交叉驗證的方法進行Softmax和SVM分類建模。比較分類預測結果可知,SAE-Softmax模型的分類結果最優,其訓練集和預測集準確率分別達99.72%和96.22%。

綜上所述,結合可見近紅外高光譜技術與SAE-Softmax模型對于蘿卜種子品種的鑒別是可行的。同時,本研究也為快速檢測種子品種的裝置提供了理論基礎,具有一定的學術與實用價值。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 亚洲国产精品日韩欧美一区| 久操中文在线| 日韩国产 在线| 久久国产精品嫖妓| 久久久久88色偷偷| 国产手机在线ΑⅤ片无码观看| 欧美成人手机在线观看网址| 高h视频在线| 亚洲天堂日韩av电影| 中日韩一区二区三区中文免费视频 | 中文字幕欧美日韩高清| 亚洲黄网视频| 国产成人精品免费视频大全五级| 欧美乱妇高清无乱码免费| 国产成人免费高清AⅤ| 国产午夜无码片在线观看网站 | 中文字幕 欧美日韩| 99热国产这里只有精品9九| 欧美在线视频a| 99精品视频九九精品| 亚洲日产2021三区在线| 亚洲av无码专区久久蜜芽| 欧美自慰一级看片免费| 伊人久综合| 亚洲丝袜第一页| 一区二区三区成人| 成人日韩欧美| 欧美伦理一区| 亚洲人成影院在线观看| 国产精品无码翘臀在线看纯欲| 午夜丁香婷婷| 成人在线观看不卡| 免费一看一级毛片| 色婷婷电影网| 欧美在线导航| 国产精品对白刺激| 中文纯内无码H| 国产菊爆视频在线观看| 久久精品国产国语对白| 国产丝袜第一页| 成人免费网站在线观看| 色综合热无码热国产| 在线无码九区| 日韩成人午夜| 青草视频网站在线观看| 欧美亚洲国产精品第一页| 国模极品一区二区三区| 欧美精品啪啪一区二区三区| 日韩福利视频导航| 无码内射中文字幕岛国片 | 国产精品嫩草影院av| 色呦呦手机在线精品| 88国产经典欧美一区二区三区| 国内精品自在欧美一区| 日韩高清一区 | 超清无码一区二区三区| 真人高潮娇喘嗯啊在线观看| 亚洲AV一二三区无码AV蜜桃| 日韩在线第三页| 青青久视频| 精品少妇人妻av无码久久| 国产在线高清一级毛片| 国产久操视频| 五月天婷婷网亚洲综合在线| 亚洲人妖在线| 久久99国产视频| 巨熟乳波霸若妻中文观看免费 | 黑色丝袜高跟国产在线91| 人妻出轨无码中文一区二区| 亚洲看片网| 天天视频在线91频| 国产成人8x视频一区二区| 在线中文字幕网| 日本免费一区视频| 最近最新中文字幕免费的一页| 国产一级二级三级毛片| 无码精品国产dvd在线观看9久| 亚洲成a人在线播放www| 在线亚洲精品福利网址导航| 人妻91无码色偷偷色噜噜噜| 国产原创自拍不卡第一页| 97影院午夜在线观看视频|