999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機的X射線熒光光譜重金屬檢測模型的建立

2016-09-21 08:41:49陸安祥王紀華
分析儀器 2016年4期
關鍵詞:檢測方法模型

李 芳 陸安祥,3 王紀華,3

(1.北京農業質量標準與檢測技術研究中心,北京市農林科學院,北京 100097;2.農產品產地環境監測北京市重點實驗室,北京 100097;3.農業部農產品質量安全風險評估實驗室(北京),北京 100097)

?

基于支持向量機的X射線熒光光譜重金屬檢測模型的建立

李芳1,2陸安祥1,2,3王紀華1,2,3

(1.北京農業質量標準與檢測技術研究中心,北京市農林科學院,北京 100097;2.農產品產地環境監測北京市重點實驗室,北京 100097;3.農業部農產品質量安全風險評估實驗室(北京),北京 100097)

目的意義:建立土壤中As、Cr、Cu、Pb、Zn等5種重金屬的定量檢測模型,為土壤重金屬的快速檢測提供一種新思路。方法:利用X射線熒光光譜技術結合支持向量機對土壤中的5種重金屬元素進行定量檢測,在對檢測數據進行(-1,1)歸一化處理以及K折交叉驗證尋優的基礎上,討論了基于網格尋優算法、粒子群算法以及遺傳算法的支持向量機回歸模型,通過比較均方根誤差,得出采用遺傳算法進行優化后建模效果最佳。結果:將遺傳算法參數設為進化代數200次,種群數量20,交叉率0.4,變異率0.1,在此條件下建模并驗證模型準確度和精密度,得到5種重金屬檢測模型預測值與檢測值間決定系數r2分別為0.9821、0.958、0.9764、0.9673和0.9684,交叉驗證均方根誤差與模型訓練集、測試集均方根誤差數值較低。結論:模型預測精度高,相關性顯著,能夠很好的預測土壤中的5種重金屬含量,對于提高儀器的快速、準確測定有著重要的意義。

X射線熒光光譜重金屬支持向量機遺傳算法

1 引言

X射線熒光(X-ray Fluorescence,XRF)光譜是基于X射線激發元素并使其放射二次X射線原理的檢測方法,根據不同元素的二次X射線對應特征能量及波長進行定性、定量分析。XRF方法可檢測的元素范圍寬泛,從Na(11號)到U(92號)共有82種;利用XRF分析具有非破壞性、檢測效率高、樣品處理簡單等優點,因此目前已廣泛用于元素測定領域[1-3]。XRF在土壤環境中重金屬檢測方面的應用日益增加,土壤重金屬污染的誘因包括工農業發展迅猛、城市化進程擴張加速等,因此建立一種土壤重金屬快速檢測方法,能夠從宏觀上了解污染狀況,為進一步的治理和修復等工作奠定基礎。

支持向量機(Support Vector Machine,SVM)由Vapnik提出,是機器學習方法的一種,可被訓練,其原理構造分類超平面,使正例、反例二者間的隔離邊緣被最大化[4]。SVM方法是一種有效的、通用的、便于計算的具有魯棒性的方法,適用于處理非線性、高維模式識別領域中的小樣本問題,且可延伸至其它機器學習方法,如:函數擬合等[5]。遺傳算法(Genetic Algorithm,GA)于1975年由美國 J.Holland教授最先提出,建立在達爾文進化論的基礎上,模擬進化過程進行篩選確定最優結果,直接操作結構對象,沒有函數連續性、求導的制約;尋優方法建立在概率化的基礎上,自動得到并指導優化的搜索空間,自適應地調整搜索方向,無需明確的規則[6]。基于GA的這些性質,人們已將其應用在信號處理、機器學習、自適應控制、組合優化、人工生命等各個方面[7-11]。

本文提供一種基于SVM的XRF定量分析農田土壤中As、Cr、Cu、Pb、Zn含量的方法,并通過GA優化SVM的懲罰系數和核函數參數,實現對土壤中目標元素的定量分析。

2 SVM原理

SVM是一種針對有限樣本情況的機器學習方法,能夠實現結構風險最小化,解決凸二次規劃問題,可避免陷入局部極值,獲得全局最優解[12]。

已知一組訓練集D={(x1,y1),…(xl,yl)},l為樣本數量,xi∈Rn,yi∈R,i=1,2,…..l,n為xi向量維數,R為實數集。對于非線性問題可以通過非線性變換將輸入向量映射到高維特征空間,轉化為類似的線性回歸問題加以解決。這種非線性變換通過適當的核函數實現[13]。公式如下:

(1)

式中,δ是核函數參數,xp、xq是訓練樣品集的有效特征向量,p,q∈[1,n],最優分類問題轉化為求分類間隔函數φ(w,ε)的最小值:

(2)

式中,γ是誤差懲罰參數,ε是懲罰系數。

約束條件為:

yk[(Ψ(xk)×w+b)]≥1-ε

(3)

式中,xk是輸入層向量,yk是輸出層向量中的元素,Ψ(xk)是特征向量xk在特征空間S的映射,b是SVM模型的截距。

最后通過拉格朗日算法得到SVM模型為:

(4)

式中,αk為拉格朗日算子。SVM算法中,懲罰參數r和核函數參數δ對擬合結果影響較大,只有選擇合適的模型參數,才能發揮模型的預測能力。

3 材料與方法

3.1儀器與樣品

儀器選用北京農業質量標準與檢測技術研究中心自主研發的便攜式 XRF光譜儀,儀器主要性能參數為:Ag靶高性能微型 X 光管、Al+Mo濾片、探測器為電子冷卻Si-PIN,測試電壓30kV、測試電流30μA。

實驗中使用的標準物質購自國家標準物質研究中心,實際樣品分別采自北京、黑龍江、云南、江蘇和新疆的典型農耕土壤表層(0~20cm)。土樣中重金屬的分析測定均按照國家標準執行,其中As按照GB/T 22105.2-2008標準檢測,所用儀器為AFS- 830原子熒光分析儀,其余4種重金屬均使用美國Solaar- M原子吸收石墨爐進行檢測,所執行的標準分別為Cr:GB/T 17137-1997,Cu、Zn:GB/T 17137-1997,Pb:GB/T 17141-1997,檢測過程中加入國家標準土壤樣品(GSS- 1)進行質量控制,每個樣品檢測3次,采用將樣品填充進乙烯樣品杯(直徑×高:30mm×10mm)中進行XRF分析,樣品杯配有固定麥拉膜(美國 PremierLab Supply公司,厚6μm,XRF分析專用)的卡圈。

3.2特征提取

土壤成分的復雜性導致檢測光譜存在基質效應的干擾,影響檢測精度,因此在進行數據分析處理前,對光譜進行降噪、基線校正、歸一化處理和尋峰等前處理,提高信噪比,從而提高模型準確度。對光譜的前處理工作經Matlab軟件編程實現,剔除冗余信息。臨近的重金屬峰會有相互干擾,為提高準確性,以Ag(Kα線:22.16keV)為內標峰,歸一化處理特征峰強度及光譜積分強度,降低由于能量抖動造成的檢測誤差;最終檢測光譜經尋峰、能量定位后提取4.95、5.41、5.90、6.40、6.93、7.48、8.05、8.64、10.54、11.22、11.73、12.61keV等12個熒光峰強度值,建立XRF輸入矩陣。

4 SVM模型建立與結果分析

實驗所用土壤樣品共109份,建立As、Cr、Cu、Pb、Zn的定量檢測模型。建模時先采用濃度梯度法劃分訓練集、預測集,其中,訓練集樣本數據用來建立模型,預測集樣本數據用來對模型進行評價,對應的樣品個數分別為71、38。由于樣品中重金屬濃度差異大,因此對數據進行歸一化處理,歸一化至(-1,1)區間內,再進行建模分析,方法是建立在平均數方差法的基礎上[14],即:設x=x(x1,x2,…,xn),建立映射f(xk)=(xk- xmean)/xvar,xmean=mean(x)=mean(x1,x2,…,xn),xvar=var(x)= var(x1,x2,…,xn),將原始輸入譜矩陣和輸出矩陣進行歸一化處理至(-1,1)區間內,歸一化完成后再建立定量模型。

4.1不同參數尋優方法用于建模

SVM算法建模,在得到訓練集高正確率的同時無法確保測試集的高預測精度,針對這一問題,采用交叉驗證(cross validation,CV)法進行優化,常用的方法是k折交叉驗證 (k- fold cross validation,K-CV):將訓練集合分成k個大小相同的子集,其中一個子集用于測試,其它 k-1 個子集用于對分類器進行訓練[15,16](圖1)。這樣,整個訓練集中的每一個子集被預測一次,交叉驗證的正確率是 k 次正確分類數據百分比的平均值,可防止過擬合及欠擬合的問題的出現。

圖1 交叉驗證原理圖

對于SVM算法,懲罰參數r和核函數參數δ對擬合結果影響較大,但目前尚未有公認的參數優化標準方法,常用的尋優方法包括:實驗法、網格搜索算法(grid search,GS)[17]、遺傳算法(genetic algorithm,GA)[18]、粒子群算法(particle swarm optimization,PSO)[19]等.實驗法工作量大,耗時久,難以尋到最優值,因此實驗中選用另外3種方法進行試驗,并比較結果。試驗建立在K-CV基礎上,通過K-CV確定適應度函數后,再進一步尋優,分析流程見圖2。

圖2 基于GS/PSO/GA的定量分析流程圖

4.2結果與討論

4.2.1尋優方法的確定

均方根誤差(RMSE)可以衡量預測值與真值間的偏差,即回歸模型整體預測精度,計算公式為:

(5)

將K-CV方法運用于適應度函數的確定過程,計算均方根誤差CVMSE,分別采用GS、GA和PSO算法尋優,以r2和RMSE為評價指標,以Cr為例,建模結果見表1。分析表1中參數可知GA算法r2高于GS、PSO,MSE則較低,表明經GA算法尋優后建模,預測值與實際值更接近,模型準確度更高。另外,GA算法γ值較高,縮短了建模運算時間,因此整體比較后,選用GA算法進行參數尋優。Cr的參數尋優和預測結果見圖3。

表1 不同尋優算法建模結果

圖3 基于GA的Cr元素尋優結果(a)適應度曲線;(b)訓練集結果;(c)測試集結果

4.2.2模型精密度和準確度評價

選擇相對標準偏差(RSD)和相對誤差(RE)評價預測模型的精密度和準確度,二者可用于分析獨立預測點,計算公式為:

(6)

(7)

在K-CV優化,GA參數尋優的基礎上建立Cr、As、Cu、Pb、Zn五種重金屬的檢測模型。將遺傳算法的進化代數設定為200次,種群數量設為20,交叉率設為0.4,變異率設為0.1。經初步建模實驗后,將SVM模型懲罰參數γ的范圍定為0~100,核函數參數δ的范圍定為0~1,懲罰系數ε范圍設定為0~1,進行實驗。得到的數據結果見表2。由表2可知各重金屬模型r2均大于0.96,訓練結果與參考值大小相近,表明模型建立成功,該方法能夠很好的改進XRF光譜儀的檢測準確度。

圖4 5種重金屬的RSD、RE圖(a)相對標準偏差;(b)相對誤差比較圖(虛線為RE均值)

重金屬γδCVMSE訓練集測試集r2RMSEr2RMSECr19.85020.4009569.1560.98625218.430.95492164.84As19.93990.4690499.8370.98462236.430.99041170.91Cu19.97530.1126166.1120.98049127.310.974365.734Pb15.28910.0741751.2240.97382152.490.9606108.58Zn13.90060.1790364.7380.97149229.360.98112183.59

4.2.3回歸模型驗證

對所有樣品的檢測值和預測值進行相關分析,結果見圖5。從圖5中可以看出As、Cr、Cu、Pb、Zn對應的決定系數分別為0.9821、0.958、0.9764、0.9673和0.9684,預測值與檢測值系數接近1、說明模型預測進度較高。整體看來,該方法數據擬合效果較好,模型準確度高,進一步證實了GA算法尋優后建模的可行性。

圖5 SVM模型檢測值與預測值相關性

3 結果與討論

(1)在K-CV基礎上,比較GS、GA、PSO 3種參數尋優算法,結果顯示基于GA優化算法建立的模型準確性最高且耗時短,最終確定用該算法尋優建模;

(2)驗證獨立預測點重復預測的RSD、RE值,分別驗證單點以及整體模型預測準確性和精確度,結果表明模型具有較強的泛化能力;

(3)在選定的優化方法基礎上,設定GA算法參數:進化代數200次,種群數量20,交叉率0.4,變異率0.1,各重金屬整體r2較高,模型預測值與參考值接近,建模成功;對于提高儀器的快速、準確測定有著重要的意義。

(文中建模所用到樣品數量為109,涵蓋了我國典型農耕土壤類型,樣品具有代表性,參考其他現有文獻,本實驗所選用樣品數量合理)

[1]Kodom K,Preko K,Boamah D.X-ray Fluorescence (XRF)Analysis of Soil Heavy Metal Pollution from an Industrial Area in Kumasi,Ghana[J].Soil and Sediment Contamination:An International Journal,2012,21(8):1006-1021.

[2]Hutton L A,O’Neil G D,Read T L,et al.Electrochemical x-ray fluorescence spectroscopy for trace heavy metal analysis:enhancing x-ray fluorescence detection capabilities by four orders of magnitude[J].Analytical chemistry,2014,86(9):4566-4572.

[3]冉景,王德建,王燦,等.便攜式X射線熒光光譜法與原子吸收/原子熒光法測定土壤重金屬的對比研究[J].光譜學與光譜分析,2014,34(11):3113-3118.

[4]Aryafar A,Gholami R,Rooki R,et al.Heavy metal pollution assessment using support vector machine in the Shur River,Sarcheshmeh copper mine,Iran[J].Environmental Earth Sciences,2012,67(4):1191-1199.

[5]李曉婷,劉勇,王平.基于支持向量機的城市土壤重金屬污染評價[J].生態環境學報,2014,23(8):1359-1365.

[6]馬永杰,云文霞.遺傳算法研究進展[J].計算機應用研究,2012,29(4):1201-1206,1210.

[7]危濤.遺傳算法在雷達信號處理中的應用[D].西安電子科技大學,2010:13-33.

[8]趙天聞.基于機器學習方法的人臉識別研究[D].上海交通大學,2008:21-25.

[9]錢燈云.基于遺傳算法的高壓最小流量閥PID自適應控制研究[D].上海交通大學,2012:33-73.

[10]崔紅建.改進免疫遺傳算法在組合優化問題中的應用研究[D].大連海事大學,2012:24-41.

[11]周劍利,馬壯,陳貴清.基于遺傳算法的人工生命演示系統的研究與實現[J].制造業自動化,2009,31(9):38-40.

[12]Lv J,Liu X,Huang Y.Estimation of heavy metal concentrations in rice using support vector machines and particle swarm optimization from reflectance spectroscopy[J].International Journal of Applied Mathematics and Statistics,2013,50(20):257-263.

[13]王春龍,劉建國,趙南京,等.基于支持向量機回歸的水體重金屬激光誘導擊穿光譜定量分析研究[J].光學學報,2013,33(3):314-319.

[14]吳蕾.基于支持向量機的環境數據分析與處理[D].長沙:中南大學,2013:23-28.

[15]曹兆龍.基于支持向量機的多分類算法研究[D].上海:華東師范大學,2007:6-15.

[16]劉濤,賈進章.基于K-CV&SVM的工作面煤層瓦斯含量預測[J].世界科技研究與發展,2015,37(2):147-150.

[17]郭美麗,覃錫忠,賈振紅,等.基于改進的網格搜索SVR的話務預測模型[J].計算機工程與科學,2014,36(4):707-712.

[18] Devos O,Downey G,Duponchel L.Simultaneous data pre-processing and SVM classification model selection based on a parallel genetic algorithm applied to spectroscopic data of olive oils[J].Food chemistry,2014,148:124-130.

[19] Liu Y,Wang G,Chen H,et al.An improved particle swarm optimization for feature selection[J].Journal of Bionic Engineering,2011,8(2):191-200.

[20]Ch S,Anand N,Panigrahi B K,et al.Streamflow forecasting by SVM with quantum behaved particle swarm optimization[J].Neurocomputing,2013,101:18-23.

Establishment of X-ray fluorescence heavy metal detection model based on support vector machine.

Li Fang1,2Lu Anxiang1,2,3,Wang Jihua1,2,3

(1.Beijing Research Center for Agricultural Standards and Testing,Beijing 100097,China;2.Beijing Municipal Key Laboratory of Agriculture Environment Monitoring,Beijing 100097,China;3.Risk Assessment Lab for Agro-products(Beijing),Ministry of Agriculture.P.R.China,Beijing 100097,China)

An X-ray fluorescence spectrum quantitative detection models for five heavy metals(Cr,Cu,Zn,Pb and As)in soil were established based on support vector machine.The experiment results showed that the model had a significant correlation;the predicted values were close to the reference values,which indicated a good modeling effect for predicting heavy metals in soil.

X-ray fluorescence;heavy metal;support vector machine;genetic algorithm

國家公益性行業(農業)科研專項項目農產品產地重金屬污染安全評估技術與設備開發(201403014-04)資助。

李芳,女,1989年出生,2015年于吉林大學獲碩士學位,研究領域:農產品安全,E-mail:viki2069@126.com。

10.3936/j.issn.1001-232x.2016.04.015

2016-02-29

猜你喜歡
檢測方法模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
小波變換在PCB缺陷檢測中的應用
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 99在线观看精品视频| 国产成人精品三级| 亚洲色图在线观看| 91久久天天躁狠狠躁夜夜| 亚洲AⅤ综合在线欧美一区| 丰满人妻一区二区三区视频| 久久一日本道色综合久久| 91久久夜色精品国产网站| aaa国产一级毛片| 国产精品第页| 狠狠色综合网| 亚洲免费人成影院| 国产精品女在线观看| 一区二区在线视频免费观看| 国产真实乱人视频| 红杏AV在线无码| 欧美亚洲国产精品久久蜜芽| 欧美区在线播放| 日韩av无码精品专区| 国产欧美专区在线观看| 色综合久久综合网| 不卡视频国产| 欧洲av毛片| 日韩精品毛片| 自慰高潮喷白浆在线观看| 日韩激情成人| 亚洲精品黄| 超碰aⅴ人人做人人爽欧美 | 综合社区亚洲熟妇p| 色网站在线免费观看| 波多野结衣一区二区三区四区视频| 国产在线精品网址你懂的| 久久99热66这里只有精品一| 中文字幕在线免费看| 国产成人高清精品免费5388| 国产在线八区| 精品一区二区三区四区五区| 亚洲一区二区约美女探花| 亚洲欧美成人影院| 色悠久久综合| 久久黄色免费电影| 国产精品太粉嫩高中在线观看 | 国产熟睡乱子伦视频网站| 福利一区在线| 日本精品αv中文字幕| 中文字幕无码av专区久久| 性视频一区| 精品一区二区三区自慰喷水| 色老二精品视频在线观看| 91福利片| 亚洲精品va| 亚洲午夜福利精品无码| 成人亚洲国产| 亚洲美女高潮久久久久久久| 三上悠亚一区二区| 国产精品自拍露脸视频 | 亚洲成aⅴ人在线观看| 先锋资源久久| 国产微拍精品| jizz在线免费播放| 中文字幕欧美成人免费| 精品视频第一页| 国产内射一区亚洲| 国产精女同一区二区三区久| 亚洲午夜福利在线| 精品国产aⅴ一区二区三区| 91无码视频在线观看| 亚洲色偷偷偷鲁综合| 国产黑人在线| 538精品在线观看| 综合天天色| 欧美国产日韩在线| 秋霞午夜国产精品成人片| 日韩精品专区免费无码aⅴ| 久久精品无码一区二区日韩免费| 一区二区三区成人| 午夜天堂视频| AV在线麻免费观看网站| 99热最新网址| 在线观看免费人成视频色快速| 蜜臀AV在线播放| 国产性生交xxxxx免费|