999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BPSO和SVM的煙葉近紅外有用特征光譜選擇

2015-03-10 03:24:18趙海東申金媛劉潤杰劉劍君穆曉敏
物理實驗 2015年6期
關鍵詞:特征

李 航,趙海東,申金媛,劉潤杰,劉劍君,穆曉敏

(1. 鄭州大學 信息工程學院,河南 鄭州 450001;2.鄭州市煙草專賣局,河南 鄭州 450006)

?

基于BPSO和SVM的煙葉近紅外有用特征光譜選擇

李 航1,趙海東1,申金媛1,劉潤杰1,劉劍君2,穆曉敏1

(1. 鄭州大學 信息工程學院,河南 鄭州 450001;2.鄭州市煙草專賣局,河南 鄭州 450006)

為提高基于近紅外光譜識別煙葉等級的效率,利用BPSO聯合SVM對原始光譜數據進行有用特征光譜選擇. 利用BPSO將對分級影響不好或沒有影響的特征剔除,采用SVM對煙葉的等級進行識別. 結果表明:BPSO選擇的最佳特征光譜可減少特征光譜的數目,提高煙葉的正確分級率. 對于相同的光譜范圍,采樣間隔越大,經過特征光譜選擇后,原始光譜數據數目減少的比例越大. 此外,有用特征光譜的選擇可以有效地減少光譜數據的采集量,減少了分級模型的計算復雜度,提高煙葉分級的速度.

近紅外光譜;BPSO;支持向量機;煙葉分級

1 引 言

煙葉的近紅外光譜幾乎包含煙葉化學成分的所有含氫基團,可以映射煙葉的內部化學成分. 因此,很多學者通過光譜數據構建模型,對煙葉的化學成分和含量進行了研究分析[1-2]. 張建平等[3]利用近紅外光譜實現煙葉的產地和部位識別,從煙葉粉碎、篩選、壓制等制作過程中提取樣本,從樣本中獲取光譜,光譜數據不能反映煙葉的厚度信息,不能用于煙葉實時無損的智能分級. 章英等[4]依據近紅外光譜數據用最近鄰判別分析方法實現了煙葉的自動分組. 申金媛等[5-6]依據紅外光譜運用概率神經網絡、徑向基網絡等實現煙葉的自動分級.

光譜分辨率越高越能反映煙葉內部的信息,相應的儀器精確度要求也就越高,采集的成本也就越高,獲得的煙葉特征也就越多,光譜間的相關性就越大. 原始光譜數據中可能包含與煙葉分級不相關的特征,對近紅外光譜特征的提取就變得相當重要. 光譜有效特征的提取方法有小波分解[7]、主成分分析[8]、獨立成分分析[9]等,這些方法不能減少光譜數據的采集,而且每次分級時還首先需要對數據做相應的處理,額外增加的時間有可能比數據處理后所減少的分級時間還多,適得其反. 基于聚類分析[10]的方法可以將對分級影響不太好的數據有效地剔除掉,減少了原始數據的采集. 基于同樣的考慮,本文提出基于BPSO對原始的光譜數據進行特征光譜篩選,通過BPSO的方法從眾多優化過的粒子中選擇出最好的1組粒子,即“最佳特征組合”作為最后的有用特征光譜,本文采用具有良好推廣能力的SVM分類器對煙葉進行分級.

2 特征選擇及分級原理

2.1 BPSO原理

粒子群算法(PSO)是最初由Kennedy博士與Eberhart博士提出的進化算法,其概念來源于鳥類尋找食物行為的研究[11],可以用來解決系統優化的問題. 隨機選取1組解為系統初始解,通過進化迭代尋找最優解. 假設在搜索空間為α維中,由β個粒子組成的種群X=(x1,…,xi,…,xβ)T,其中第i個粒子的位置為xi=(xi1,xi2,…,xiα)T,其飛行速度為vi=(vi1,vi2,…,viα)T,該粒子當前得到的最優解為pi=(pi1,pi2,…,piα)T,整個種群當前的最優解pg=(pg1,pg2,…,pgα)T. 其迭代過程為

(1)

(2)

其中:i=1,2,…,β表示種群規模;d=1,2,…,α表示粒子群算法解的搜索空間;t為當前進化代數;r1與r2為均勻分布在[0, 1]之間的隨機數;c1與c2為學習因子,通常取c1=c2=2;pid為個體極值,pgd為種群極值;w為正數,稱為慣性權重,其值描述為粒子保持上一代速度的權重.

BPSO為二進制粒子群,將每一維的xid,pid,pgd限制為0或者1. 對于速度vid不做該限制,用速度的sigmoid函數表示位置狀態改變可能性,BPSO模型中,更新速度為(1)式,位置的更新為

(3)

其中sigmoid型函數為

(4)

2.2 BPSO有用特征光譜選擇

煙葉的近紅外光譜數據具有“線性不可分、維數高”的特征. 在依據煙葉光譜進行分級時,構建分級模型比較復雜并且會出現分級耗時長且難以實現實時分級. 刪減不利于分級的光譜(煙葉特征),降低數據維數,提取有利于分級的特征(有用特征光譜)變得非常必要.

BPSO運用于煙葉的光譜特征選擇時,每個粒子對應1種光譜特征的組合. 對光譜進行特征選擇時,粒子的每維對應1個波長,粒子的某維取值為1時,表示這個光譜的特征被選中在特征集中;取值為0時,表示這一維特征沒有被選中. 根據每維對應的取值,可以確定對應的光譜是否為有用特征.

初始隨機選擇β個粒子,迭代M次,共產生βM個粒子,從中選擇最佳粒子P(對應于適應度值最大的粒子),據此得到最佳特征光譜組合(剔除粒子中為0的光譜). 每個粒子的適應度值由適應度函數決定,適應度函數通常與所采用的分級模型有關,根據粒子的適應度值確定分級分類器的樣本輸入模式,利用訓練樣本建立分級模型,不同的粒子建立的分級模型不同,能夠正確識別樣本的數目也不同,即分類器的正確分級率不同. 本文將樣本的正確分級率定義為粒子的適應度函數,與粒子相對應的分類器的正確分級率為該粒子的適應度值. 適應度值越高,粒子包含的特征越有用;把適應度值最高的粒子定義為最佳特征組合,所對應的光譜組合為最佳特征光譜. 本文采用SVM作為煙葉分級分類器,SVM網絡輸出的分類準確率作為評價該粒子優劣的適應度函數.

2.3 SVM分類器

支持向量機是處理高維數據實現小樣本多分類的方法,在建立分類器時,不僅僅考慮經驗風險最小,而且考慮結構風險最小,具有優秀的推廣能力. 核心思想是將向量映射到較高維空間里,在高維空間上構造最優超平面,使不同類別樣本的間隔最大. 本文首先將輸入模式通過線性核函數實現向量的高維映射,然后在高維空間建立線性分類器,所采用的線性分類器的判決函數為

g(x)=sgn ∑ni=1αidiK(xi,x)+b,

其中K(xi,x)為核函數,完成輸入樣本的高維映射;xi是訓練樣本的支持向量,x為待分類的樣本,di取值為1或-1,對應輸入樣本的正確類型.

SVM是兩分類器,如果要進行多分類,則需要多個分類器組合完成. 有2種方法可以實現多分類, 第一種是采用樹杈結構如圖1(a)所示, 每次將1個級別分離出來,N分類則需要建立N-1個SVM二分類器. 如第一級分類器,將A1類和其他類分為2種類型,輸出1為A1類,分類結束,輸出-1則為其他類,進行第二個分類器分類,第二個分類器則將A2類和剩余其他類分開,以此類推. 如果輸入的樣本屬于第N-1類或第N類,則需要通過所有N-1個分類器才能得到最后的分類結果.

(a)樹杈式SVM分類器

(b)全并行投票式分類器圖1 2種分類器

第二個構成方法如圖1(b)所示,首先每2類建立1個SVM分類器,N類則需要建立N(N-1)/2個SVM分類器,然后將前級SVM分類器的輸出給予正確的標簽,最后根據標簽由投票表決器決定輸出類型.

3 實現結果及分析

煙葉樣本來源于鄭州市煙草公司(共642片),其中XL組163片、XF組173片、CF組84片、CL組103片、BF組119片. 采用島津公司生產的UV-3600型號分光光度計采集每片煙葉波長范圍為1 500 ~2 400 nm,采集不同采樣間隔的反射光譜. 為了減小基線漂移帶來的誤差,對數據進行下面預處理:

yi=xi-min (xi)max (xi)-min (xi) ,

(5)

其中xi為預處理前的反射光譜數據.

X2L和C2L預處理前后煙葉反射光譜如圖2所示. 由圖2得知,光譜數據在1 400 nm處存在較大吸峰,2 500 nm后波動范圍很大. 選取1 500~2 400 nm光譜之間數據作為實驗數據.

分別將采樣間隔為2,4,6,8,10 nm 煙葉反射光譜的數據作為初始數據,基于BPSO聯合SVM分類器進行特征光譜選擇. 初始隨機選擇20個粒子,利用這20個粒子確定相應的樣本輸入模式,然后通過訓練樣本建立20個SVM分類器,本文選擇投票式結構分類器. 根據測試樣本的正確分級率確定每個粒子的適應度值,粒子的每次迭代遵循式(1)和(3), 迭代50次,共產生1 000個粒子,從中選擇最佳粒子P(對應于適應度值最大的粒子),據此得到最佳特征光譜的組合(剔除粒子中為0的光譜).

選擇642片中的一半左右的樣本作為訓練樣本,其余的作為測試樣本. 特征選擇前后分級的吻合率、特征數目和分級耗時如表1所示. 表中的吻合率為測試樣本的正確分級率.

(b)X2L級別預處理后的反射光譜

(c)C2L級別的原始反射光譜

(d)C2L級別預處理后的反射光譜

間隔/nm吻合率/% 特征數目 分級耗時/s 前后前后前后293.994.14512250.400.131492.793.42261150.150.099692.492.9151790.120.045892.490.0113580.090.0371088.889.091500.060.033

從表1可以得出:

1)用BPSO方法選擇的最優光譜特征的分級準確率比原始全光譜數據情況下有一定的提高(除間隔8 nm時). 所以從正確分級率來看基于BPSO進行光譜數據的有用特征選擇是正確可行的.

2)從SVM分級消耗時間來看,隨著光譜特征數目的減少,SVM網絡所需要分級的時間也減少,少則短1/3,多則短2/3.

3)不論原始數據采用多大間隔,在不影響正確分級率的前提下,利用BPSO都可剔除近一半的數據. 原始數據越多,可剔除的比例越大.

4 結論與展望

通過以上工作可以得出以下結論:

1)煙葉近紅外光譜可以作為煙葉自動分級的特征;

2)投票式SVM分類器是一個很不錯煙葉分級模型;

3)利用BPSO可以選擇對分級有用的光譜,選擇后的光譜數據減少近一半,不僅可以減少SVM的分級計算量,使得分級占用時間減少1/3以上,而且可以有效地減少光譜的采集時間. 當采用的設備為串行獲取光譜數據時,減少數據采集量可極大地提高煙葉的分級效率,從而使得對煙葉的實時分級有了實用的可能.

還有很多其他的特征選擇方法和分級方法,煙葉的圖像特征主要包括有寬度、長度、長寬比、周長、面積、破損率、圓形度及RGB和HSI分量. 試想可以融合煙葉的圖像特征和光譜特征,兩者相結合盡可能的選擇出不影響正確分級率的最少特征數目,以及同時考慮正確分級率和分級速度的分級模型,為設計可實用的煙葉自動分級設備奠定基礎.

[1] 王東丹,秦西云,趙立紅,等. 應用近紅外光譜技術分析煙絲總糖和還原糖的研究[J]. 分析實驗室,2007,26(5):30-32.

[2] 杜閱光,崔登科,程小東,等. 聲光可調近紅外光譜技術用于打葉復烤片煙化學成分[J]. 紅外技術,2012,34(10):614-618.

[3] 張建平,陳江華,束茹欣,等. 近紅外信息用于煙葉風格識別及卷煙配方研究的初步探索[J]. 中國煙草學報,2007,13(5):1-5.

[4] 章英,賀立源. 基于近紅外光譜的烤煙煙葉自動分組方法[J]. 農業工程學報,2011,27(4):350-354.

[5] 張樂明,申金媛,劉劍君,等. 概率神經網絡在煙葉自動分級中的運用[J]. 農機化研究,2011(12):32-35.

[6] 彭丹青,申金媛,劉劍君,等. 基于徑向基網絡的煙葉光譜分級[J]. 農機化研究,2009(10):15-18.

[7] 田高友,袁洪福,劉慧穎,等. 小波變換在近紅外光譜分析中的應用進展[J]. 光譜學與光譜分析,2003,23(6):1111-1114.

[8] 郭文川,王銘海,岳絨. 基于近紅外漫反射光譜的損傷獼猴桃早期識別[J]. 農機機械學報,2013,44(2):142-146.

[9] 侯振雨,王偉,蔡文生,等. 基于獨立成分的局部建模方法及其在近紅外光譜分析中的應用研究[J]. 計算機與應用化學,2006,23(3):224-226.

[10] 趙海東,申金媛,劉潤杰,等. 基于聚類的煙葉近紅外光譜有效特征的篩選方法[J]. 紅外技術,2013,35(10):659-664.

[11] Kennedy J, Eberhart R. Particle swarm optimization [A]. Proceedings of IEEE International Conference on Neural Networks [C]. Perth, Australia, 1995:1942-1948.

[責任編輯:任德香]

Screening the effective features in the near-infrared spectroscopy of tobacco leaf based on BPSO and SVM

LI Hang1, ZHAO Hai-dong1, SHEN Jin-yuan1,

LIU Run-jie1, LIU Jian-jun2, MU Xiao-min1(1. School of Information Engineering, Zhengzhou University, Zhengzhou 450001, China;2. Zhengzhou City Tobacco Monopoly Bureau, Zhengzhou 450006, China)

To improve the classification efficiency of tobacco leaves based on near-infrared spectroscopy, the BPSO and SVM methods were applied to screening the effective features from the original spectra. The BPSO method was used to get rid of some features that had bad effect or no effect on the classification, and then the levels of the tobacco leaves were recognized by SVM. The experimental results showed that BPSO method could greatly reduce the number of characteristic spectral data and improve the recognition efficiency. For the same spectrum range, after screening, large sampling interval could reduce the numbers of characteristic spectral data. Moreover BPSO could effectively reduce the size of spectrum data collection and the computational complexity of the hierarchical model, thus greatly improve the classification speed.

near-infrared spectrum; BPSO; SVM; tobacco grade

2015-01-07;修改日期:2015-04-11

河南省煙草公司科技計劃項目(No.M201335)

李 航(1989-),男,河南開封人,鄭州大學信息工程學院2014級碩士研究生,研究方向為近紅外光譜分析和圖像處理.

指導教師:申金媛(1966-),女,山西晉中人,鄭州大學信息工程學院教授,博士,研究方向為數字圖像處理、光電信號與信息處理及應用、模式識別.

TN219

A

1005-4642(2015)06-0008-05

猜你喜歡
特征
抓住特征巧觀察
離散型隨機變量的分布列與數字特征
具有兩個P’維非線性不可約特征標的非可解群
月震特征及與地震的對比
如何表達“特征”
被k(2≤k≤16)整除的正整數的特征
中等數學(2019年8期)2019-11-25 01:38:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
詈語的文化蘊含與現代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 亚洲国产中文在线二区三区免| 精品欧美日韩国产日漫一区不卡| 国产一区二区三区在线观看免费| 国产91小视频| 国产成熟女人性满足视频| 最新亚洲人成无码网站欣赏网 | 日本AⅤ精品一区二区三区日| 国产一级二级三级毛片| 一本一道波多野结衣一区二区| 国产人成在线视频| 91精品视频在线播放| 性做久久久久久久免费看| 国产精品久久久久久久久| 中文字幕乱码中文乱码51精品| 国产自在线拍| 天天躁狠狠躁| 日本三级欧美三级| 55夜色66夜色国产精品视频| 日韩小视频在线观看| 亚洲精品自在线拍| 亚洲色图综合在线| 色一情一乱一伦一区二区三区小说| 中文字幕久久亚洲一区| 欧美精品1区| 国产精品午夜电影| 亚洲综合色在线| 欧美97色| 欧美色综合久久| 在线播放真实国产乱子伦| 日韩毛片基地| 亚洲无码视频一区二区三区| 香蕉久久永久视频| 在线国产欧美| av色爱 天堂网| 91色国产在线| 欧美在线精品怡红院| 正在播放久久| 免费一级毛片| 99久久精品久久久久久婷婷| 国产玖玖视频| 伊人91视频| 亚洲第一区在线| 精品無碼一區在線觀看 | 毛片在线播放网址| 免费看久久精品99| 亚洲中文无码h在线观看| 高清久久精品亚洲日韩Av| 亚洲色欲色欲www网| 国产精品亚洲αv天堂无码| 99在线观看免费视频| 99热这里只有精品国产99| 免费观看亚洲人成网站| 亚洲天堂福利视频| 五月婷婷综合网| 精品久久人人爽人人玩人人妻| 五月天久久综合国产一区二区| 国产精品亚欧美一区二区| 好吊色国产欧美日韩免费观看| 一本大道无码日韩精品影视| 美女裸体18禁网站| 日韩无码视频播放| 伊人久久综在合线亚洲2019| 亚洲第一视频免费在线| 国产三级国产精品国产普男人| 中文字幕亚洲精品2页| 亚洲精品欧美重口| 亚洲娇小与黑人巨大交| 9丨情侣偷在线精品国产| 国产午夜一级毛片| 免费无码AV片在线观看中文| 再看日本中文字幕在线观看| 88av在线看| 99re在线免费视频| 亚洲综合色婷婷| 婷婷综合亚洲| 天天综合亚洲| 日韩专区欧美| 爱做久久久久久| 亚洲综合精品第一页| 国产尤物视频在线| 亚洲美女AV免费一区| 中文无码伦av中文字幕|