劉 軍 ,吳夢婷 ,譚正林 ,李 威
1.智能機器人湖北省重點實驗室(武漢工程大學),湖北 武漢 430205;
2.湖北經濟學院烹飪與營養學系,湖北 武漢 430205;
3.武漢工程大學計算機科學與工程學院,湖北 武漢 430205
近紅外光譜無損檢測技術中數據的分析方法概述
劉 軍1,3,吳夢婷1,3,譚正林2,李 威1,3
1.智能機器人湖北省重點實驗室(武漢工程大學),湖北 武漢 430205;
2.湖北經濟學院烹飪與營養學系,湖北 武漢 430205;
3.武漢工程大學計算機科學與工程學院,湖北 武漢 430205
近紅外光譜無損檢測技術可用于品種鑒別與農產品的定性或者是定量的分析工作.本文介紹了近紅外光譜的基本原理及各類近紅外光譜分析方法.近紅外光譜無損檢測技術中數據分析方法是通過光譜定量分析找到光譜以及對應濃度的內在關系,建立相應的數學模型.這些方法主要有偏最小二乘回歸、主成分分析法、BP神經網絡算法、支持向量機、K最近鄰分類算法和線性判別分析法等.通過這些分析模型的對比,研究表明:支持向量機將是近紅外光譜數據分析方法未來一個重要的研究方向.
近紅外光譜;無損檢測;數據分析方法
近紅外光譜檢測技術的成本低,對于樣本無損傷、無污染、方便在線分析[1].在食品無損檢測中得到了廣泛的應用.
近紅外光譜技術是建立一個穩定可靠的定性或者定量模型來實現數據樣本的校準,常用于定性分析[2].定性分析中常用的方法有主成分分析法(principal component analysis,PCA)、模式識別方法等;定量分析中常用的方法主要是各種多元校正技術,如偏最小二乘回歸(partial least squares,PLS)、支持向量機(support vector machine,SVM)以及神經網絡算法(back propagation,BP)等.下面將對幾種常用算法的原理和應用進行比較分析,以便找到最適合對小樣本數據進行分類的算法.
紅外光譜又可以稱為分子振動光譜或者轉動光譜.近紅外光譜主要是通過投射光譜技術和反射光譜技術獲得.近紅外光譜主要采集樣品的含氫基團的伸縮振動的倍頻和合頻信息,其中包含了反映物質特性的化學成分、分子結構和狀態信息[3].由于近紅外光譜技術在檢測樣品的過程中,不會對樣品造成損傷[1],因此近紅外光譜分析技術可以被用于食品的無損檢測中.近紅外光譜通過合適的化學計量法對于樣本進行定性分析,可以將已知的樣品劃分為子集,用以提高校正模型的預測精度.定量分析是依據實驗中得到的數據,通過相應的算法建立數學模型,并且使用模型計算出分析對象各項指標以及其數值的一種方法.與其他的檢測方法相比,近紅外光譜技術便于實現在線分析和典型的無損分析技術[3].
偏最小二乘法(partial least squares,PLS)是一種新的多元校正方法,可以建立多元的回歸模型,主要是基于因子分析.偏最小二乘法的原理是首先將樣本的光譜矩陣X和光譜濃度矩陣Y進行分解,同時把包含在樣本中的信息引入進來,分解后提取出樣本中的m個主因子,如公式(1)所示:

式(1)中:測量矩陣 X和Y的得分矩陣分別是T和U;tk和uk分別表示光譜矩陣X的第k個主成分因子和濃度矩陣的第k個主成分因子;pk和qk表示主成分因子的載荷,m為成分因子的個數.
對于U和T進行線性關聯,如公式(2)所示:

在進行回歸預測時,首先求出未知樣品光譜矩陣的得分TX,再根據公式(3)得到組分濃度預測值,如公式(3)所示:

在該算法的整個運算過程中,矩陣的分解和回歸分析是同時進行的,計算新的主成分時,首先交換T和U,使X的主成分和測量矩陣Y直接關聯.
偏最小二乘PLS算法分析是通過建立光譜數據和品種分類之間的回歸模型來實現的[4].使用PLS分析得到的結果中,不僅可以建立更優化的回歸模型,還可以同時進行主成分分析來簡化數據結構,觀察變量之間的相互關系等研究內容,提供更多的建模信息[4].
所有的獨立變量都可以包含在最終建立的回歸模型中,PLS可以有效解決變量多重性問題.
目前,在光譜分析中多數應用都使用的多元校正方法.Mauer等[5]使用近紅外光譜和中紅外光譜對嬰兒奶粉中三聚氰胺的含量進行定量檢測,使用偏最小二乘法(PLS)建模可以快速檢測出三聚氰胺含量最低值.
主成分分析是一種線性投影方法,它主要被應用在多元統計分析中,在不損害樣本的原始信息的前提下,對高維數據進行降維處理,將其映射到低維空間中.PCA的基本思路是通過最優化方法簡化樣本的數據矩陣,降低維數,從原本樣本的指標中,得到幾個主成分,用來揭示樣本中包含的信息.
計算步驟首先是對原始數據矩陣X進行拆分,如公式(4)所示:

借助投影矩陣LT將X投影到多維子空間.T中的列向量和L中的列向量是相互正交的關系,如公式(5)所示:

重建后的數據變量相互獨立,各主成分按照方差順序進行排列,第一主成分包含了數據方差的絕大部分,排名越靠前的主成分,其所包含的的數據信息量越大[6].經過計算所得到的新的橫坐標是樣本原來變量的線性組合.第一主成分元素可以表示為如下形式:

主成分分析的對象減少,從而可以有效地降低分析的工作量和誤差.分析過程中只使用獨立變量,這樣可以達到消除噪音的目的.對數據進行降維處理可以幫助信息的提取和聚類分析.
在區分產于紹興和嘉善的中國米酒的實驗中,使用到近紅外光譜技術,在區分的過程中,同時使用到主成分分析法和偏最小二乘法建立判別模型,準確率高達100%[7].
BP算法又稱為誤差反向傳播算法,是人工神經網絡中的一種基于誤差反向傳播的監督式學習算法[8].在理論上,BP神經網絡算法可以逼近任意函數,基本的結構是由很多非線性變化的單元組成,具有實現輸入和輸出數據高度非線性映射能力.人工神經網絡是對人類大腦結構以及信息處理運作過程進行模擬之后,提出的信息處理系統.因此具有自學習和自適應的能力[9].
BP神經網絡的計算包括正向和反向兩個子過程.正向傳播過程中,是從輸入層逐層轉向傳出層.如果輸出和期望不同的時候,則進行反向傳播,把誤差沿著正向傳播路徑的原路徑反向傳播回去,經過各個神經元的修改,使得誤差達到最小.
BP神經網絡法的缺點是學習速度慢;在解決全局問題時,很有可能陷入局部最優化,使得訓練失敗;由于學習能力和泛化能力之間的矛盾,過程中容易出現“過擬合”現象[25].
Mutlu等[10]在預測面粉的蛋白質和水分含量等相關參數時,使用到近紅外光譜進行檢測和人工神經網絡進行數據處理,得到的相關系數分別為 0.952,0.948,0.933,0.920,0.917和 0.832,有效的證明了近紅外光譜結合神經網絡算法可以很好地解決此類問題.
支持向量機算法的優化原則是采用以結構化風險最小化取代我們常用的經驗風險最小化;基本思想是利用核函數代替向高維空間的非線性映射,對于樣本,若是非線性可再分,則構建一個或多個甚至無限多個高維的超平面,在經過變換后的高維空間,利用這個超平面來對樣本點進行分類.一個好的超平面要求離分類邊界最近的訓練樣本點的與分類邊界的距離越大越好,這個距離被稱之為間隔(Margin),這些樣本點被稱之為支持向量.SVM的目標就是要找出使間隔最大的分類超平面[11].
給定的樣本集,步驟一般如下:首先要將樣本集分為訓練集和測試集,訓練集是(x1,y1)(x2y2)…(xiyi),其中橫坐標 xi∈Rn為輸入變量的值,yi∈Rn為相應的輸出值.通過對訓練集進行機器學習,尋求最優化的模式M(x),要求這個模式不僅滿足訓練集輸入和輸出的對應關系,而且對于測試集的樣本輸入變量的值進行預測,同樣能得到效果較好的輸出.
在支持向量機算法中,使用不同的核函數會產生不同的算法[25],因為SVM具有優秀的泛化能力,所以是一種適合小樣本的學習方法.在SVM進行分類的時候,起到決定性作用的是支持向量.計算的復雜性取決于支持向量的數目,在實驗的過程中只需要抓住關鍵的樣本.SVM在運算的過程中很少涉及到概率測度及大數定律等規律,而且支持向量法整體具有較好的“魯棒”性[12].
在數據挖掘的實際應用中,一般要解決多類的分類問題[13].如:將SVM與粗集理論結合,形成一種優勢互補的多類問題的組合分類器[14].
攀玉霞等[15]在研究豬肉肉糜樣本,采用支持向量機回歸方法建立相應參數的模型模型.在這個研究中,實驗者以魚糜為研究對象,使用支持向量機(SVM)建立其水分和蛋白質的定量分析模型.
最小二乘支持向量機(least square support vector machines,LS-SVM)是支持向量機的一種類型[16],是在經典SVM的基礎上改進得來的.LS-SVM既可以進行線性,也可以進行非線性的多元建模,支持少量的訓練樣本中高維特征空間的學習,是解決多元建模的一種快速方法[17].
最小二乘支持向量機具有建模速度快、優化參數少、泛化能力強等優點,因此被廣泛應用于近紅外光譜技術檢測的定量分析中[17].最小二乘支持向量機同時具有很好的非線性處理能力,可以用于快速建立多元模型[18].
羅微等[4]在對白菜種子不同品種的鑒別的實驗中,建立最小二乘支持向量機(partial least squares discrimination analysis,PLS-DA)和偏最小二乘判別的模型.
在K最近鄰分類算法(K-nearest neighbor,KNN)算法中每個樣本都可以用它最接近的k個鄰居來代表.KNN算法的核心思想是在特征空間中,如果以一個樣本為中心,它周圍最相鄰的k個樣本,它們大多數屬于某一個類別,則這個樣本也屬于這個類別,并且具有這個類別上其他k個樣本的特性.
如圖1所示,有三類不同樣本,分別以方框、空心圓點和實心圓點表示.其中以“+”標記出的樣本,需要分析出它所屬的類別.在此圖中以該樣本作為圓心,畫出兩個圓,如果以小圓為界線,只有2個實心圓點落在小圓的范圍內,此時按照KNN原理應該將樣本劃分為實心圓點那一類.如果以大圓為界線,共有10個點落在了大圓的范圍內,其中有3個方框類,有8個實心圓點類,按照KNN理論,也應該被劃為實心圓點這一類.這說明K值的大小對判別的結果是有一定的影響的.如果K>1,則這K個最近鄰樣本不一定都屬于這一類.如果K=1,很自然這一個最近鄰樣本屬于哪類,那么未知樣本就屬于此類[19].

圖1 K最近鄰算法原理示意圖Fig.1 Schematic diagram of K-Nearest Neighbor algorithm
KNN分類算法的最大優點是其適合于屬性較多或者數據量很大的問題.在進行數據處理的過程中,不需要提前設計分類器對訓練樣本進行分類,而是可以直接進行分類,確定每個類的類標識號,不需要估計參數,無需訓練;在解決多分類的問題上KNN比SVM表現要好.
KNN在實際的應用中存在下面兩個問題:當對估計參數沒有相應的限制時,訓練集的數目又比較大,這時尋找最近鄰所花費的時間較長.其次,對于觀測集的增長速度有較高要求.
K最近鄰分類算法被廣泛應用于模式識別、數據挖掘、后驗概率統計、相似性分析、計算機視覺和生物信息學等各種人工智能領域[19].倪力軍等在鑒別真奶和假奶樣品中各成分的實驗中,使用近紅外光譜對所有的樣品進行檢測,并使用改進的K最鄰近結點算法和支持向量機法分別建立判別各類摻假物質的模型[20].
主要用來判斷樣品的類別,即可以對樣品中的成分進行定性分析,線性判別分析法(linear discriminant analysis,LDA)在醫學診斷、氣象學、市場預測、經濟學和地質勘探等領域中均已起著重要作用[20].
LDA算法的基本思想是通過特征向量將已經分組的數據向低維的方向投影,使得同一個組的數據關系更為緊密,不同組的之間盡可能的分開.LDA的目標是要根據樣本中的n個指標變量x=(x1,x2,…,xn)T建立一個最優分類判別函數,判別函數的建立最終是尋找一個矢量ω=(ω1,ω2,…ωn)T,那建立一個如下的判別模型,如公式(9)所示:

矢量ω是個常數,稱作閥值權,相應的決策規則則可表示為,如公式(10)所示:

f(ω,x)=0是相應的決策面方程,如公式(11)所示:

f(ω,x)也就是該決策面到d維空間中任一點ω距離的代數度量,根據其到該面距離的正負號,該決策平面將樣本分類,并且確定出相應的類別.ω(ω0≠0)表示的是決策面在特征空間中的位置,當其值為0時,表示這個決策面過原點.
線性判別分析算法是從訓練集中訓練出判別函數,當得到新的樣品時,根據相關的判別準則對其與判別函數之間的相似程度進行比較.由于線性判別分析算法在應用的時候需要樣本標簽,屬于有監督學習降維.
連續投影算法(successive projections algorithm,SPA)是在線性空間中,使共線性達到最小化的一種前向變量選擇算法[21].
設定標集中樣品個數為n,包含波長數為m,組成一個光譜矩陣 Xn×m,SPA從任選一個波長作為起始波長點,循環進行搜索,搜索投影中沒有被引入波長組合的部分,每次都將最大的投影方向不斷地引入,直到循環w(w<n-1)次以后,就可以形成一個波長鏈,使得此鏈中的任意相鄰兩個波長之間線性關系最小[22].算法如下:
初始化波長:令n=1,任取一個波長xj作為算法循環的起始點,記為xm(0).把剩下的沒有選擇到波長鏈中的所有波長,記為一個集合s={j,1 ≤j≤m,j?{m(0),m(1),…,m(n-1)}}
計算s中波長與xj的投影向量,如公式(12)所示:

選擇其中最大的投影,并且記錄下相應序號作為入選的波長,如公式(13)所示:

當n=w時停止循環,否則返回到第二步不斷地做投影優選波長.這樣總共得到w×m個模型.
連續投影算法的優點是:最大程度的降低了變量之間的共線性,提取最低限度的冗余信息變量組可以減少建立模型所需要變量的個數,提高建模效率和速度[23].
浙江大學[21]利用鮮肉的近紅外光譜中少量特征波長對其pH值進行預測,可以大幅度降低模型復雜性和計算量,通過連續投影算法(SPA)選擇特征波長,并且得到相應的多元線性回歸模型.
偏最小二乘法是一種新型的多元統計數據分析方法,通常被用于曲線擬合.主成分分析法是一種降維的統計方法,使用各主成分代替原有的變量進行回歸分析.偏最小二乘法在建模的過程中包含了主成分分析的特點,因此在這兩種算法中,偏最小二乘法的性能明顯優于主成分分析法.吳遠遠等人在老陳醋可溶性固形物定量分析的實驗當中,分別采用PCR和PLS建立SSC的定量分析模型,結果表明,采用5點平滑預處理后,利用PLS建立的老陳醋SSC的定量分析模型最優[24].
SVM最基本的應用是分類,求解最優分類面,然后用于分類.支持向量機可以較好的解決小樣本的分類問題,泛化功能好.張海云等人在對生鮮豬肉水分含量進行無損檢測的實驗中,對比了PLS和SVM的性能.實驗結果分析后得到,采用SVM方法建模要明顯好于PLS建立回歸模型法[13].
LDA是一種有效的特征抽取方法,能夠使投影后模式樣本的類間三部矩陣最大,同時保證類內散布矩陣最小.
BP和SVM是分類領域中的兩種重要的方法.神經網絡是模擬人腦神經系統的數學模型,具有高度并行性、較強的自學習自適應和聯想記憶功能特點[25].神經網絡算法具有強大的非線性處理能力,其中使用最為廣泛的就是前饋神經網絡[26].SVM算法在小樣本上表現明顯優于BP神經網絡.KNN分類算法則在多分類問題上表現比SVM要好.算法的優缺點對比,如表1所示.

表1 算法對比Tab.1 Algorithm comparison
由于所做實驗數據是小樣本,因此在選擇分類算法時會選擇SVM算法.今后的研究方向主要是使用改進的支持向量機算法對近紅外光譜無損檢測的數據進行分析.與其他分析方法相比,SVM能夠很好地克服其他算法中出現的訓練時間長,結果不準確等特點.其中LS-SVM可以降低支持向量數目,減少變量存儲空間和計算量,可以用來提高實際應用中定量分析的效率.
近年來,支持向量機結合近紅外光譜技術,被用于煤種分類、山茶油摻假鑒別、識別樹種和無損檢測的實驗中,均得到了相當不錯的結果.
[1] 黃瑞娟.紅外光譜技術在食品檢測中的應用[J].現代測量與實驗室管理,2015(1):9-14.HUANG R J.Application of infrared spectroscopy in food detection [J]. Advanced Measurementand Laboratory Management,2015(1):9-14.
[2] MODAREST F, ARAGHINEJAD S.A comparative assessment of support vector machines,probabilistic neural networks,and k-nearest neighbor algorithms for water quality classification [J].Water Resources Management,2014,28(12):4095-4111.
[3] 譚正林,金國粱,吳夢婷,等.奶油中人工色素檢測方法概述[J]. 食品安全質量檢測學報,2017,8(2):468-474.TAN Z L,JIN G L,WU M T,et al.Overview on detection methods of artificial pigments in cream[J].Journal of Food Safety& Quality,2017,8(2):468-474.
[4] 章海亮,羅微,杜焱喆.PCA和SPA的近紅外光譜識別白菜種子品種研究[J].光譜學與光譜分析,2016,36(11):3536-3541.ZHANG H L,LUO W,DU Y Z.Discrimination of varieties of cabbage with near infrared spectra based on PCA and SPA[J].Spectroscopy and Spectral Analysis,2016,36(11):3536-3541.
[5] MAUER L J,CHERNYSHOVA A A,HIATT A N,et al.Melamine detection in infant formula powder using near-and mid-infrared spectroscopy[J]. Journalof Agricultural and Food Chemistry.2009,57(10):3974-3980.
[6] 閻吉祥,王茜蒨,黃志文,等.基于主成分分析和人工神經網絡的激光誘導擊穿光譜塑料分類識別方法研究[J]. 光譜學與光譜分析,2012(12):3179-3182.YANJX,WANGQQ,HUANGZW,et al.Classification of plastics with laser-induced breakdown spectroscopy based on principal component analysis and artificial neural network model[J].Spectroscopy and Spectral Analysis,2012(12):3179-3182.
[7] 劉洪林.基于近紅外光譜技術(NIRS)對工夫紅茶含水率、游離態氨基酸、茶多酚品質成分評價研究[J].食品工業科技,2016,37(12):67-70.LIU H L.Research to moisture content,free form amino acids,polyphenols quality ingredients of Kungfu black tea by near infrared spectroscopy[J].Science and Technology of Food Industry,2016,37(12):67-70.
[8] 徐可欣,苗靜,曹玉珍,等.基于二維相關近紅外譜參數化及BP神經網絡的摻雜牛奶鑒別[J].光譜學與光譜分析,2013,33(11):3032-3035.XU K X,MIAO J,CAO Y Z,et al.Identification of adulterated milk based on two-dimensional correlation near-infrared spectra parameterization and BP neural network [J]. Spectroscopy and SpectralAnalysis,2013,33(11):3032-3035.
[9] WANG Y S,LI Q Y.Application study on assistive movement training using BP neural network[C]//Internation Conrerence on Computational Science and Engineering.Paris: Atlantis Press, zeger karssen,2015:274-277.
[10] MUTLU A C,BOYACI I H,GENIS H E,et al.Prediction of wheat quality parameters using near-infrared spectroscopy and artificial neural networks[J].European Food Research&Technology,2011,233(2):267-274.
[11] 白京,彭彥昆,王文秀.基于可見近紅外光譜玉米種子活力的無損檢測方法[J].食品安全質量檢測學報,2016,7(11):4472-4477.BAI J,PENG Y K,WANG W X.Discrimination of vitality of maize seeds based on near visible infrared spectroscopy[J].Journal of Food Safety and Quality,2016,7(11):4472-4477.
[12] 王小燕,王錫昌,劉源,等.基于SVM算法的近紅外光譜技術在魚糜水分和蛋白質檢測中的應用[J].光譜學與光譜分析,2012,32(9):2418-2421.WANG X Y,WANG X C,LIU Y,et al.Application of near infrared spectroscopy technique based on support vector machine in the measurement of moisture and protein contents in surimi[J].Spetroscopy and Spectral Analysis,2012,32(9):2418-2421.
[13] 張海云,彭彥昆,王偉,等.基于光譜技術和支持向量機的生鮮豬肉水分含量快速無損檢測[J].光譜學與光譜分析,2012,32(10):2794-2798.ZHANG H Y,PENG Y K,WANG W,et al.Rapid nondestructive detection of water content in fresh pork based on spectroscopy technique combined with support vector machine[J].Spetroscopy and Spectral Analysis,2012,32(10):2794-2798.
[14] 吳習宇,趙國華,祝詩平.近紅外光譜分析技術在肉類產品檢測中的應用研究進展[J].食品工業科技,2014,35(1):371-374,380.WU X Y,ZHAO G H,ZHU S P.Study on the application of near infrared spectroscopy in the meat quality evaluation[J].Science and Technology of Food Industry,2014,35(1):371-374,380.
[15] 陳彬,劉閣,張賢明.連續投影算法的潤滑油中含水量的近紅外光譜分析[J].紅外與激光工程,2013(12):3168-3174.CHEN B,LIU G,ZHANG X M.Analysis on near infrared spectroscopy of water content in lubricating oil using successive projections algorithm [J].Infrared and Laser Engineering,2013(12):3168-3174.
[16] ZHANG N,SHETTY D.An effective LS-SVM based approach for surface roughness prediction in machined surfaces[J].Neurocomputing,2016,198:35-39.
[17] 喬延江,徐冰,王星,等.基于遺傳算法的多目標最小二乘支持向量機在近紅外多組分定量分析中的應用[J]. 光譜學與光譜分析,2014(3):638-642.QIAO Y J,XU B,WANG X,et al.Genetic algorithm based multi-objectiveleastsquaresupportvector machine for simultaneous determination of multiple components by near infrared spectroscopy [J].Spectroscopy and SpectralAnalysis, 2014(3) :638-642.
[18] JI J,ZHANG C S,GUI Y L,et al.New observations on the application ofLS-SVM in slope system reliability analysis[J].Journal of Computing in Civil Engineering,2016(10):601-602.
[19] 劉應東,牛惠民.基于K-最近鄰圖的小樣本KNN分類算法[J]. 計算機工程,2011,37(9):198-200.LIU Y D,NIU H M.KNN classification algorithm based on K-nearest neighbor graph for small sample[J].Computer Engineering,2011,37(9):198-200.
[20] 倪力軍,鐘霖,張鑫,等.近紅外光譜結合非線性模式識別方法進行牛奶中摻假物質的判別[J].光譜學與光譜分析,2014(10):2673-2678.NI L J,ZHONG L,ZHANG X,et al.Identification of adulterantsin adulterated milksby nearinfrared spectroscopy combined with non-linear pattern recognition methods[J].Spectroscopy and Spectral Analysis,2014(10):2673-2678.
[21] 伍學千,廖宜濤,樊玉霞,等.連續投影算法在豬肉PH值無損檢測中的應用[J].農業工程學報,2010,26(增刊):379-383.WU X Q,LIAO Y T,FAN Y X,et al.Application of successive projections algorithm to nondestructive determination of pork PH value[J].Transactions of the Chinese Society of Agricultural Engineering 2010,26(Suppl.):379-383.
[22] CHENG J H,SUN D W,PU H,et al.Combining the genetic algorithm and successive projection algorithm for the selection of feature wavelengths to evaluate exudative characteristics in frozen-thawed fish muscle[J].Food Chemistry,2016(197):855-863.
[23] 應義斌,介鄧飛,謝麗娟,等.近紅外光譜變量篩選提高西瓜糖度預測模型精度[J].農業工程學報,2013,29(12):264-270.YING Y B,JIE D F,XIE L J,et al.Improving accuracy of prediction model for soluble solids content of watermelon by variable selection based on near-infrared spectroscopy[J]. Transaction of the Chinese Society of Agricultural Engineering,2013,29(12):264-270.
[24] 王福杰,吳遠遠,陸輝山,等.基于近紅外光譜技術的老陳醋可溶性固形物定量分析[J].中國釀造,2016(8):69-72.WANG F J,WU Y Y,LU H S,et al.Quantitative analysis of soluble solids content in mature vinegar based on near infrared spectroscopy technology[J].China Brewing,2016(8):69-72.
[25] 孫劍偉,王宏濤.基于BP神經網絡和SVM的分類方法研究[J]. 軟件,2015,36(11):96-99.SUN J W,WANG H T.Research on the classification method based on BP neural network and SVM[J].Software,2015,36(11):96-99.
[26] 馮先成,李寒,周密,等.基于前饋神經網絡的智慧城市空巢老人識別[J].武漢工程大學學報,2015,37(10):36-39.FENG X C,LI H,ZHOU M,et al.Recognition of empty-nest elders in intelligent city based on feedforward neural network[J].Journal of Wuhan Institute of Technology,2015,37(10):36-39.
Overview of Data Analysis Methods in Near-Infrared Spectroscopy Nondestructive Testing
LIU Jun1,3,WU Mengting1,3,TAN Zhenglin2,LI Wei1,3
1.Hubei Key Laboratory of Intelligent Robot(Wuhan Institute of Technology),Wuhan 430205,China;2.Department of Cuisine and Nutrition Education,Hubei University of Economics,Wuhan 430205,China;
3.School of Computer Science and Engineering,Wuhan Institute of Technology,Wuhan 430205,China
Near-infrared spectroscopy nondestructive testing technology can be used for variety identification and the qualitative or quantitative analysis of agricultural products.The basic principle of near-infrared spectroscopy and the methods of near-infrared spectrum analysis were introduced.The data analysis methods in near-infrared nondestructive testing technology aim at finding the relationship between the spectrum and the corresponding concentration through the quantitative analysisofthe spectrum,and establishing the corresponding mathematical model,which mainly include partial least squares regression,principal component analysis,back propagation artificial neural network,support vector machine(SVM),K-Nearest neighbor classification algorithm and linear discriminant analysis.The comparison result of these analytical models show that SVM method may be a future research direction in near infrared spectrum data analysis.
near-infrared spectroscopy;nondestructive testing;data analysis methods
2017-05-20
湖北省食品藥品監督管理局項目(201610+13);湖北省智能機器人重點實驗室開放基金(HBIR 201608);武漢工程大學研究生創新基金(CX2016063)
劉 軍,博士,副教授.E-mail:liujun@wit.edu.cn
劉軍,吳夢婷,譚正林,等.近紅外光譜無損檢測技術中數據的分析方法概述[J].武漢工程大學學報,2017,39(5):496-502.
LIU J,WU M T ,TAN Z L,et al.Overview of data analysis methods in near-infrared spectroscopy nondestructive testing[J].Journal of Wuhan Institute of Technology,2017,39(5):496-502.
R857.3
A
10.3969/j.issn.1674-2869.2017.05.001
1674-2869(2017)05-0496-07
陳小平