999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ACO-SVM的光譜分類算法研究

2020-04-30 06:49:45于曉陽莫家慶呂小毅唐軍陳程陳晨
無線互聯科技 2020年6期

于曉陽 莫家慶 呂小毅 唐軍 陳程 陳晨

摘 ? 要:為了實現胡蘿卜汁品牌的快速無損鑒別,文章以市售兩種品牌的胡蘿卜汁為研究對象,通過采集拉曼光譜,并結合支持向量機算法,建立了快速判斷胡蘿卜汁品牌的分類模型。兩種品牌的胡蘿卜汁光譜主要在1 007 cm-1,1 157 cm-1,1 516 cm-1這3個譜峰存在差異。先對拉曼光譜進行預處理,再選用蟻群優化算法進行特征選擇,最后結合SVM構建分類模型。結果顯示,相比SVM直接分類,模型ACO-SVM的最優分類準確率為96.67%,提高了2.5%;其分類時間為7.17 s,縮短了163.31 s。研究表明,基于拉曼光譜分析技術和模式識別算法構建的分類模型能夠有效地鑒別胡蘿卜汁品牌。

關鍵詞:拉曼光譜;蟻群優化算法;胡蘿卜汁;特征選擇;支持向量機

假冒食品不僅損害了消費者的利益,而且也對正常的市場經濟秩序造成了極大危害。目前市售胡蘿卜汁品牌繁多,質量也參差不齊,市場上缺少一種能簡單、快速、無損地鑒別胡蘿卜汁品牌的方法,來打擊假冒胡蘿卜汁。為此,本研究將拉曼光譜分析技術同模式識別算法相結合,構造分類模型,鑒定胡蘿卜汁品牌。

目前,應用在食品品種、品牌鑒別方面的光譜分析技術主要有熒光光譜分析技術、紅外光譜分析技術、拉曼光譜分析技術。本研究采用拉曼光譜分析技術,原因如下:首先,作為胡蘿卜汁樣品中的一種主要成分,水在紅外區有強烈的吸收能力,而其拉曼光譜信號在一般感興趣的范圍內則非常微弱。其次,胡蘿卜汁樣品中的類胡蘿卜素能產生共振拉曼光譜而不能產生熒光。與紅外光譜分析技術[1]相比,這種技術結合模式識別算法在眾多的分類問題中都取得了更好的效果。國內外已有研究人員將拉曼光譜分析技術同模式識別算法結合對魚片種類[2]、奶酪真偽[3]和葡萄酒產地[4]等的鑒別進行了研究,有效地實現了食品分類。在眾多模式識別算法中,專門針對小樣本學習問題提出的支持向量機(Support Vector Machine,SVM)[5-6]不僅非常適合處理非線性問題,而且具有良好的推廣能力。

鑒于此,本研究結合拉曼光譜分析技術和SVM構造分類模型。為了在提高模型性能的同時避免出現過擬合現象,采用特征降維[7-8]簡化分類模型是十分必要的。常見的主成分分析法(Principle Component Analysis,PCA)降維后的特征集失去了原有的物理意義和一些有用的類間區分信息,而特征選擇通過選擇與分類密切相關的特征來降低所需特征維數,彌補了PCA的不足。特征選擇本質上是一個組合優化問題,相比其他優化方法,近年來迅速發展起來的智能優化算法具有通用性強、穩健、全局優化能力強等突出優點。因此,本研究選用極具代表性的智能優化特征選擇算法—蟻群優化算法(Ant Colony Optimization,ACO)[9-10]對光譜數據進行降維。

本研究對打擊假冒胡蘿卜汁具有一定的借鑒意義,為其提供了技術支持。在一定程度上加強了品牌保護,有利于維護市場的公平競爭、促進市場的良性循環。

1 ? ?實驗過程

1.1 ?實驗材料和方法

實驗以市售兩種品牌的胡蘿卜汁為實驗材料,研究胡蘿卜汁品牌的鑒別方法。一種是神內胡蘿卜汁,樣品個數為40個;另一種是農夫果園,樣品個數為50個。實驗使用共聚焦顯微拉曼光譜儀(LabRAM HR Evolution RAMAN SPECTROMETER,HORIBA Scientific Ltd.)在532 nm激光源下測其拉曼光譜。操作時,用毛細管吸取樣品放在載物臺上,先用10×鏡找到物像,再用50×鏡觀察,采集100~4 000 cm-1范圍內的拉曼光譜信號,數據采集的積分時間為5 s,積分次數為3次。本實驗共采集了兩種品牌的胡蘿卜汁共計90個樣品的拉曼光譜。需要注意的是,為了校正儀器以保證結果的準確性,光譜儀每次在使用前要測單晶硅片的拉曼光譜,使其峰位保持在(520.7±0.3)cm-1范圍內。

1.2 ?光譜數據處理

因為拉曼光譜信號本身就比較弱,而且存在很多噪聲,所以應對測得的拉曼光譜進行去噪處理,提高其信噪比。拉曼光譜中往往也包含較強的熒光背景(即基線)。其存在會影響后續的光譜歸一化等操作,需提前將其去除。考慮到以上兩點,首先,用FFT濾波器5點平滑法對各譜線進行去噪處理,可以去除大部分的噪聲,使光譜曲線較為平滑,并完整保存了胡蘿卜汁樣品的拉曼特征峰。其次,用自適應迭代重加權懲罰最小二乘(adaptive iteratively reweighted Penalized Least Squares,airPLS)法[11]校正基線如圖1—2所示。此方法能夠完整保留胡蘿卜汁樣品原始拉曼光譜的特征峰,并且提高了峰的對比度和辨識度。最后,將經去噪和基線校正處理后的拉曼光譜數據歸一化,進行特征選擇。

2 ? ?光譜分析

拉曼光譜技術早已被廣泛應用于類胡蘿卜素研究中。Rimai在20世紀70年代研究了一系列不同長度、結構類胡蘿卜素的拉曼光譜[12],解釋了拉曼活性模頻率隨分子鏈長度、結構的變化規律,并提出了大量重要的物理思想。作為一種典型的類胡蘿卜素,β-胡蘿卜素的拉曼光譜主要由反映化學鍵不同振動情況的3個拉曼峰(定義為υ1,υ2,υ3)組成,從圖3可直觀看到,在1 516 cm-1(υ1),1 157 cm-1(υ2),1 007 cm-1(υ3)處出現了明顯的β-胡蘿卜素的拉曼特征峰。其中,υ1帶與β-胡蘿卜素分子中多烯鏈的C=C鍵的伸縮振動有關[13]。υ2帶則較復雜,對于其指認有兩種觀點,一種觀點是υ2帶只反映分子C-C鍵的伸縮振動[14];另一種觀點將υ2帶指認為C=C,C-C伸縮振動與C-H擺動的混合。υ1帶和υ2帶與β-胡蘿卜素分子的分子結構相關。υ3帶與β-胡蘿卜素分子的對稱性和電子的分配有關,反映了-CH基團的彎曲振動程度[15]。此外,這3個峰的線性組合頻分散在2 300~3 500 cm-1之間[16]。

兩種胡蘿卜汁的拉曼譜峰在相對強度上存在明顯差異,而在峰位、半峰寬方面無明顯差異。譜峰相對強度的差異揭示了這兩種胡蘿卜汁的β-胡蘿卜素含量的差異。譜峰主要出現在1 007 cm-1,1 157 cm-1,1 516 cm-1處。在這3個譜峰處,相比于農夫果園,神內胡蘿卜汁的譜峰強度較高,表明在這兩種胡蘿卜汁中,神內胡蘿卜汁的β-胡蘿卜素含量比農夫果園高。3處峰位的情況皆從光譜上說明了胡蘿卜汁品牌的可分性。

3 ? ?ACO-SVM分類模型的建立

3.1 ? ACO特征選擇

因為胡蘿卜汁拉曼光譜數據的特征維數較高,為避免“維數災難”和過擬合現象,并提高模型的分類精度和效率,有必要進行特征選擇。特征選擇本質上是一個組合優化問題,故可用ACO算法降維。胡蘿卜汁拉曼光譜數據的特征選擇核心步驟如下:

(1)蟻群參數初始化。本文中蟻群優化算法的參數設置為最大迭代次數MaxIt=100;所選特征個數NF=10,群體中螞蟻數m=10,螞蟻循環一周所釋放的總信息素量Q=0.5,初始信息素τ0=1,信息啟發式因子α=1,期望啟發式因子β=1,信息素殘留系數ρ=0.2。

(2)確定轉移概率。每只螞蟻根據轉移概率決定前進方向,在第t次迭代時,螞蟻k從特征i轉移到特征j的概率為pkij(t),由跟蹤水平τα和期望信息ηβ這兩個參數決定。計算方法如式(1)所示:

(1)

(3)信息素更新。當所有螞蟻都死亡時,全部可行解中適應值最小的解即為此次迭代的最優解,并暫時將其作為全局最優解保存,螞蟻按式(2)更新信息素并進行新一輪迭代,若得到的最優解比全局最優解更好,則用本次最優解替代;否則,全局最優解保持不變:

(2)

其中,Δτkij為信息素增量,Δτkij=Q*Fkij,Q為總信息素量,ρ為信息素軌跡的衰減系數,0<ρ<1。

3.2 ?支持向量機

3.2.1 ?線性可分情況與線性不可分情況

訓練樣本集分為線性可分與線性不可分兩種情況。對于線性可分的樣本,最優分類超平面的求解就是求(w, b)的最佳值。可以將該問題轉化為式(3)所示的二次規劃問題(Quadratic Programming,QP):

(3)

稱式(3)所述問題為原始問題,可以應用拉格朗日乘子法構造拉格朗日函數再通過求解其對偶問題得到原始問題的最優解。構造拉格朗日函數后問題轉化為:

(4)

其中,αi≥0, i=1, 2, ... , n代表樣本xi對應的拉格朗日乘子。對于大多數情況,這些αi只有很少一部分不為零,不為零的αi所對應的樣本xi就是支持向量。式(3)的等價優化問題為:

(5)

根據拉格朗日對偶性,式(3)所述問題即原始問題的對偶問題是:

(6)

為了求得對偶問題的解,需要先求得L(w, b, α)對w和b的極小再求對α的極大。

(1)求:對拉格朗日函數求導并令其導數為0,可以得到:

(7)

將式(7)代入L(w, b, α),得:

(8)

所以:

(9)

(2)求對α的極大等價于式(9)取負數后對α求極小,即:

(10)

這意味著求解原始最優化問題式(3)可以轉換為求解對偶最優化問題(10)。不難發現,式(10)是不等式約束條件下的QP問題。解出式(10)的最優解α*后,求解式(7)得到最優分類超平面:

(11)

則分類的決策函數為

(12)

對于線性不可分的樣本,構建其最優分類超平面時,需要放松上述不等式中的約束條件,使之能用于線性不可分樣本的求解。在二次規劃問題的約束條件中增加松弛變量ξi可解決線性不可分問題,即:

(13)

當出現分類錯誤時,ξi大于零,ξi可以用來度量一個樣本點錯分的誤差,就是訓練樣本劃分錯誤的上界。為了使分類間隔和分類錯誤有一個折中,在原目標函數中加入一個錯誤懲罰因子C,C的大小代表了對分類出錯時的懲罰程度,則目標函數變為:

(14)

類似地,線性不可分樣本的最優分類超平面的求解幾乎與線性可分時相同,不同的只是約束條件變為0≤αi≤C, i=1, 2, ... , n。

3.2.2 ?非線性情況及核函數

SVM對無法用線性方法劃分的訓練樣本采用如下思想:在映射函數的作用下,將原空間的訓練樣本映射到一個高維特征空間,在該空間中樣本線性可分,然后在該空間中構建一個最優分類超平面。

高維特征空間中分類函數的求解只需計算訓練樣本之間的內積,從而避免了復雜的高維計算;滿足Mercer條件的核函數可代替內積運算,在不增加計算復雜度的前提下實現線性分類。

首先,選取適當的核函數和適當的參數C,構造最優化問題:

(15)

其次,利用現成的二次規劃問題求解算法或者SMO算法求得最優解α*。

再次,選擇α*的一個滿足0<α*j

(16)

最后,構造決策函數:

(17)

式(17)中,采用不同的核函數構造出的SVM是不同的。支持向量機分類的重點在于核函數的構建與選擇,合適的核函數可以巧妙解決高維空間維數災難問題,降低高維空間中計算的復雜度。SVM常用的核函數有4種:線性核函數、多項式核函數、RBF核函數和Sigmoid核函數。

4 ? ?實驗結果與分析

本文用ACO算法進行特征選擇,并結合SVM建立胡蘿卜汁品牌的分類模型,進行了對比仿真實驗:實驗將所選特征的個數設置為10,最大迭代次數設置為100,把分類誤差率作為適應度函數的適應值,用分類器SVM(采用網格尋優法計算最優參數值)和十折交叉驗證得到的適應值來評價特征選擇算法的性能優劣。適應值越低說明該特征選擇算法性能越好。ACO迭代次數與適應值的關系如圖4所示,其最優結果為0.025,最優結果最早出現的代數為39。若為了在優化效果不大幅下降的前提下減少計算開銷,將最大迭代次數設為50較為合適。

在使用ACO-SVM分類時,以分類準確率和分類時間作為評價分類模型的有效指標,為了使結果更接近其真實性能,采用網格尋優法和十折交叉驗證。觀察圖5可以發現,在分類精度方面,分類模型ACO-SVM在采用RBF核函數時的分類精度最高,且無論采用哪種核函數,相比于直接使用SVM分類,其分類精度都有所提高,具體來說,在采用Linear,Polynomial,RBF,Sigmoid核函數時,分類準確率分別提高了1.67%,3.34%,2.5%,2.5%。由表1可直觀看出,在分類效率方面,無論使用哪種核函數,模型ACO-SVM的分類效率都比直接分類時有顯著提高,說明使用分類模型ACO-SVM進行胡蘿卜汁品牌的分類是非常有效的。

5 ? ?結語

為了鑒定胡蘿卜汁品牌,本文將拉曼光譜分析技術同模式識別算法相結合,建立了分類模型ACO-SVM,實現了對市售兩種品牌的胡蘿卜汁的有效分類。首先,對光譜進行去噪、基線校正和歸一化處理;其次,進行特征選擇;最后,用SVM進行分類。經特征選擇,特征數由最初的2 710個縮減到10個,達到了去除冗余特征的目的,相比直接分類,ACO-SVM在提升分類精度的同時,大大提高了分類效率。研究表明,分類模型ACO-SVM能夠有效地將兩種品牌的胡蘿卜汁分開,實現了胡蘿卜汁品牌的快速鑒別,為打擊假冒胡蘿卜汁提供了技術支撐。

[參考文獻]

[1]張海紅,張淑娟,王鳳花,等.應用可見-近紅外光譜快速識別沙棘汁品牌[J].光學學報,2010(2):574-578.

[2]BO?IDAR R,RALF H,PETRA R,et al.The potential of raman spectroscopy for the classification of fish fillets[J].Food Analytical Methods,2016(5):1301-1306.

[3]KAMILA DE S,CALLEGARO L D S,STEPHANI R,et al.Analysis of spreadable cheese by Raman spectroscopy and chemometric tools[J].Food Chemistry,2016(3):441-446.

[4]MANDRILE L,ZEPPA G,GIOVANNOZZI A M,et al.Controlling protected designation of origin of wine by Raman spectroscopy[J].Food Chemistry,2016(5):260-267.

[5]楊倩,孫雙林.基于粒子群優化算法的雷達輻射源識別[J].激光雜志,2018(2):118-121.

[6]CHEN S G,WU X J,ZHANG R F.A novel twin support vector machine for binary classification problems[J].Neural Processing Letters,2016(3):795-811.

[7]EGHBAL G M,KHADIJEH S S.On fuzzy feature selection in designing fuzzy classifiers for high-dimensional data[J].Evolving Systems,2016(4):255-265.

[8]胡潔.高維數據特征降維研究綜述[J].計算機應用研究,2008(9):2601-2606.

[9]WANG G,HAICHENG E C,ZHANG Y X,et al.Multiple parameter control for ant colony optimization applied to feature selection problem[J].Neural Computing and Applications,2015(7):1693-1708.

[10]GONZ?LEZ P A,JUNG J J,CAMACHO D.ACO-based clustering for ego network analysis[J].Future Generation Computer Systems,2017(4):160-170.

[11]LIANG Y Z,CHEN S,ZHANG Z M.Baseline correction using adaptive iteratively reweighted penalized least squares[J].The Analyst,2010(5):1138-1146.

[12]RIMAI L,HEYDE M E,GILL D.Vibrational spectra of some carotenoids and related linear polyenes Raman spectroscopic study[J].Journal of the American Chemical Society,1973(14):4493-4501.

[13]MARTIN Q,MARC A,CELIN R,et al.β-carotene revisited by transient absorption and stimulated raman spectroscopy[J].ChemPhysChem,2015(18):3824-3835.

[14]里城祺,尚玉婕,孫琳,等.用高壓拉曼光譜方法研究β-胡蘿卜素相變[J].紅外,2018(11):34-38.

[15]楊宇,翟晨,彭彥昆,等.基于拉曼光譜的胡蘿卜中β-胡蘿卜素的快速無損檢測[J].食品安全質量檢測學報,2016(10):4016-4020.

[16]吳楠楠,歐陽順利,里佐威.高壓對β-胡蘿卜素分子結構及π-電子離域影響的拉曼光譜研究[J].光譜學與光譜分析,2013(9):2429-2432.

Research on spectrum classification algorithm based on ACO-SVM

Yu Xiaoyang1, Mo Jiaqing1*, Lyu Xiaoyi1, Tang Jun2, Chen Cheng1, Chen Chen1

(1.College of Information Science and Engineerin, Xinjiang University, Urumqi 830046, China;

2.Center for Physical and Chemical Analysis, Xinjiang University, Urumqi 830046, China)

Abstract:In order to achieve rapid and non-destructive identification of carrot juice brands, two types of commercially available carrot juice brands were used as research objects in this paper. A classification model for quickly determining carrot juice brands was established by collecting Raman spectra and using support vector machine algorithm. The carrot juice spectra of two brands are mainly different in the three peaks of 1 007 m-1, 1 157 cm-1, and 1 516 cm-1. Firstly, preprocessing the Raman spectra, then the ant colony optimization algorithm were used for feature selection, finally, the classification model was built with SVM. The results show that compared with direct classification by SVM, the optimal classification accuracy of the model ACO-SVM is 96.67%, which is an improvement of 2.5%; the classification time is 7.17 s, which is shortened by 163.31 s. Research shows that a classification model based on Raman spectroscopy and pattern recognition algorithms can effectively identify carrot juice brands.

Key words:Raman spectroscopy; ant colony optimization algorithm; carrot juice; feature selection; support vector machine

主站蜘蛛池模板: 97国内精品久久久久不卡| 国内熟女少妇一线天| 国产97区一区二区三区无码| 日本午夜精品一本在线观看| 久久国语对白| 久久精品日日躁夜夜躁欧美| 亚洲男人天堂2018| 99手机在线视频| 亚洲精品无码专区在线观看| 国产成人三级在线观看视频| 色综合五月| 久久国产V一级毛多内射| 成人欧美在线观看| a级毛片一区二区免费视频| 色老二精品视频在线观看| 亚洲男人的天堂久久香蕉网| 亚洲午夜综合网| 久久人搡人人玩人妻精品| 国产成人做受免费视频| 色综合色国产热无码一| 91麻豆精品视频| 91精品视频网站| 谁有在线观看日韩亚洲最新视频| 四虎成人免费毛片| 久久情精品国产品免费| 午夜a级毛片| 日本爱爱精品一区二区| 色哟哟国产成人精品| 久久精品国产精品青草app| 国产伦精品一区二区三区视频优播 | 免费人成网站在线高清| 五月婷婷激情四射| 5555国产在线观看| 欧洲成人在线观看| 本亚洲精品网站| h网站在线播放| 中文字幕亚洲综久久2021| 亚洲一区二区三区香蕉| 欧美亚洲日韩中文| 国产AV无码专区亚洲A∨毛片| 2022精品国偷自产免费观看| 亚洲成人高清无码| 天天色天天操综合网| 亚洲精品视频免费| 精品国产免费观看| 日本亚洲欧美在线| 国产成人做受免费视频| 亚洲欧洲国产成人综合不卡| 亚洲欧美在线综合一区二区三区| 91免费国产高清观看| 蜜臀AV在线播放| 久久久久久尹人网香蕉| AV在线天堂进入| 亚洲有无码中文网| 少妇精品网站| 欧美一区福利| 亚洲天堂777| 国产午夜福利片在线观看 | 国产美女免费| 91精品国产丝袜| 国产精品久久久久久久久| 亚洲天堂精品在线观看| 欧美成人国产| 精品国产污污免费网站| 亚欧乱色视频网站大全| 亚洲日本中文字幕天堂网| 亚洲第一区精品日韩在线播放| 女人一级毛片| 日韩精品一区二区三区免费在线观看| 国产麻豆福利av在线播放 | 无码精品一区二区久久久| 天堂av综合网| 久久久久免费看成人影片| 国产精品视频a| 国产高清不卡视频| 国产91特黄特色A级毛片| 欧美亚洲国产日韩电影在线| 亚洲国产午夜精华无码福利| 亚洲综合18p| 青青草国产免费国产| 亚洲一级毛片在线观播放| 国产在线麻豆波多野结衣|