于宏威,劉紅芝,楊 穎,石愛民,劉 麗,胡 暉,王 強
(中國農業科學院農產品加工研究所,農業部農產品加工綜合性重點實驗室,北京 100193)
基于高光譜成像技術快速無損測定花生中水分含量
于宏威,劉紅芝,楊 穎,石愛民,劉 麗,胡 暉,*王 強
(中國農業科學院農產品加工研究所,農業部農產品加工綜合性重點實驗室,北京 100193)
花生中水分含量的高低直接影響花生及其制品的貯藏期,而現有的測定方法存在步驟多、時間長等問題。試驗利用高光譜成像技術對花生中水分含量進行快速無損檢測分析。通過采集120個花生樣品的圖像信息,從校正后的圖像中提取花生目標區域的平均光譜作為花生光譜信息進行分析;同時,優選最佳的光譜預處理方法和建模方法建立花生中水分含量全波段模型,在此基礎上利用回歸系數法,確定重要波長并建立模型。結果表明,二階導數(2nd-der)偏最小二乘法(PLS)全波段模型預測水分含量能力最佳,校正集和預測集的相關系數分別為0.91和0.84,標準偏差分別為0.28和0.38;回歸系數法確定的14個波長所建簡化模型的性能與全波段相當,校正集和預測集的相關系數分別為0.82和0.81,標準偏差分別為0.39和0.43。因此,高光譜成像技術可以快速無損測定花生中水分含量,其具有快速運算特點的重要波長模型可以更加方便地應用于花生加工產業中。
花生;水分含量;高光譜成像技術;偏最小二乘法;無損檢測
花生是世界第四大油料作物、第三大蛋白質來源,具有很高的經濟價值和營養價值,在世界食品市場地位舉足輕重[1]。據FAO統計,2014年世界花生總產量約4 238×104t,我國花生年總產量約1 578×104t,占全球總產量的37.23%,位居世界首位[2]?;ㄉ兴趾康母叩椭苯佑绊懟ㄉ捌渲破返馁A藏期,水分含量低的貯藏期較長,水分含量高的貯藏期較短[3],因此GB/T 1532—2000花生中要求花生仁的安全水分含量在9.0%以內。目前,測定花生中水分含量公認的方法是AOAC 950.46和GB 5009.3—2010中干燥法,該方法簡單、易操作,且結果準確,但是操作過程中破壞樣品,不能在線測定,恒質量需要花費大量時間。據估算,測定1個花生樣品中水分含量平均需要6 h,因此亟需一種快速無損檢測花生中水分含量的方法。
整合光譜和圖像優勢的高光譜成像技術是一門新興的快速無損檢測方法,其數據包括了某個波長下的圖像信息和圖像平面內某個像素點的光譜信息[4]。圖像信息是指像素點的分布情況;光譜信息是由物質中的分子從基態向高能級躍遷時,含氫基團(OH,CH等)振動所產生的[5]。隨著物質分子組成及含量變化,其產生光譜吸收峰的位置和強度都有明顯差異,其光譜特征也發生相應的變化[6]。因此,可以基于高光譜成像技術獲得光譜信息,并利用化學計量學定量分析物質的組分含量。目前,高光譜成像技術已經得到國內外許多學者的關注,并取得許多研究結果。其中,測定水分含量方法廣泛應用到脫水對蝦、羊肉、火雞火腿、蘑菇、鮭魚等農產品中[7-11]。隨著花生加工產業的迅猛發展,創建花生中水分含量的高光譜快速無損檢測方法也迫在眉睫。
以我國主要種植的花生品種為試驗材料,旨在建立花生中水分含量的高光譜檢測方法。采集了120個花生樣品的圖像信息,從校正后的高光譜圖像中,提取花生目標區域的平均光譜信息作為花生光譜信息進行分析,優選最佳的光譜預處理方法和建模方法建立花生中水分含量全波段模型。在此基礎上,利用回歸系數法確定重要波長并建立模型,從而簡便模型、減低運算復雜程度,為快速無損監控花生原料的品質提供先進手段。
1.1 材料
從我國11個花生主栽省份(河南、山東、廣東、新疆、遼寧、廣西、河北、江蘇、福建、江西和湖北等)收集120個花生品種(白沙1016號、?;?號、豐花1號、魯花11號、魯花9號、花育19號等)。高光譜成像系統每次可以同時掃描6個花生品種,因此以每6個花生品種為一組進行試驗,共計20組。從每個花生品種中挑選尺寸相同、正常飽滿的花生仁30粒,進行高光譜數據的采集和水分含量的測定。
1.2 高光譜成像系統和圖像獲取
試驗采用的高光譜成像系統是SisuCHEMA NIR(Spectra Imaging公司,芬蘭),包括成像光譜儀、照明系統、輸送單元、電腦控制單元及其他附件。其中,成像光譜儀由ImspectorN17E型光譜儀配有TE-cooled InGaAs photodiode array檢測器組成;照明系統是由10 W的鹵素燈(Osram公司,德國)和照明蓋組成;輸送單元由樣品盤和線性輸送平臺組成;電腦控制單元:I7處理器,16 GB內存,并配備有ChemaDAQ高光譜數據采集軟件;其他附件包括采集區域大小為20 cm×30 cm的OLE15鏡頭,以及對焦板和白參考板等。在掃描高光譜圖像前,先開機預熱儀器30 min。用表面皿盛放花生,每次采集圖像都需晃動表面皿,且重復采集3次。掃描參數:成像儀曝光時間5.6 s,電動機的移動速度8 mm/s。
SisuCHEMA NIR見圖1。

圖1 SisuCHEMA NIR
1.3 高光譜圖像分析處理
獲得的高光譜原始圖像需要進行校正,以減少環境光、檢測器暗電流和光譜儀物理結構對圖像信息的影響。圖像校正需要利用2個特別的圖像,分別是白參考板(Teflon)提供的100%反射圖像和蓋上鏡頭蓋得到的0%反射圖像。圖像校正公式如下:

式中:Rraw——高光譜原始圖像;
Rwhite——100%反射圖像;
Rdark——0%反射圖像;
Rnorm——高光譜校正圖像。
高光譜成像系統采集波長為884~1 735 nm的光譜圖像,但在波長884~900 nm和1 700~1 735 nm處有較大的噪音,僅有波長為900~1 700 nm的高光譜圖像可以用于光譜數據的提取。由于在采集花生圖像時,同時采集了大量的背景圖像和邊界圖像等無關信息,因此需要利用主成分分析 (Principle component analysis,PCA)將花生像素點和其他像素點區分開,以剔除這些無關信息。結合花生輪廓分割圖像,將相同花生品種當作目標區域(Region of interest,ROI)用于光譜數據的提取。同時,將采集的120個花生品種3次圖像平均光譜儲存為矩陣形式,用于下步分析。
利用Evince 2.7.1(UmBio公司,瑞典)進行圖像分析處理。
1.4 水分含量的測定
按照GB 5009.3—2010中干燥法測定花生中水分含量,將花生仁磨碎,裝入鋁盒中稱質量,然后放入烘箱。利用花生中水分的物理性質,在101.3 kPa,101~105℃下除去花生中水分,再通過干燥前后的質量變化計算出花生中的水分含量。
1.5 化學計量學
1.5.1 光譜的預處理
高光譜圖像提取的光譜除了含有花生自身的化學信息外,還包含有其他無關信息和噪聲,如雜散光、電噪聲和樣品背景。因此,在利用回歸分析建立花生中水分含量模型之前,需要采用光譜預處理方法消除光譜數據的無關信息和噪聲,以提高水分信噪比。常用的譜圖預處理方法有導數(Derivative,Der)、標準正態變量變換(Standard normal variate tranformation,SNV)、基線校正(Baseline)、矢量歸一化法(Normalization)等。試驗將考察不同預處理方法和復合預處理對模型的影響,從而確定最佳的光譜預處理方法。
1.5.2 全波段模型的建立
由于光譜各波長點處的信息重疊嚴重、譜峰寬,花生中水分含量定量模型的建立通常需要依靠相應的回歸分析方法。常用的建立定量模型方法有多元線性回歸(Multi-linear regression,MLR)、主成分回歸(Principal component regression,PCR) 和偏最小二乘法(Partial least squares,PLS),其中多元線性回歸是方程式中有2個或2個以上自變量的線性回歸模型;主成分回歸通過線性組合的方式重新組合成一組較少的線性無關的綜合指標來代替原來的指標,新變量能反映原變量的絕大部分信息;偏最小二乘法在考慮所計算的主成分方差盡可能最大的同時,還使主成分與濃度最大程度的相關[6]。模型驗證常用內部交叉驗證和外部預測集,考核的指標有校正模型的相關系數(RC)和標準偏差(Standard error of calibration,SEC)、內部驗證模型的相關系數(RCV)和標準偏差(Standard error of cross validation,SECV)以及預測模型的相關系數(RP)和標準偏差(Standard error of prediction,SEP)。相關系數越高且標準偏差越小的模型穩定性越好。
1.5.3 重要波長的確定及模型建立
全波段數據中僅有部分光譜與水分含量相關,連續光譜信息造成了數據的冗余,降低了預測的準確性和運算速度,因此需要選擇重要波長,簡化全波段模型,降低運算的復雜性。根據簡化模型,可以進一步開發低成本、快速運算的多光譜圖像系統。本研究將根據全波段模型的回歸系數(Regression coefficients,RC)確定重要波長,回歸系數絕對值越高的波長,其重要性越大。基于篩選出來的重要波長建立模型,考察其預測性能與全波段模型的關系。
利用Unscrambler 10.3(CAMO公司,挪威)進行化學計量學的分析。
2.1 高光譜圖像處理和光譜數據提取
利用PCA處理校正后的高光譜圖像,確定花生目標區域,并從中提取光譜數據,按此方法依次提取120個花生品種的光譜數據。各個花生品種的光譜數據在相同的波長處有吸收峰,但是相同吸收峰的數值不一樣,這主要是由不同花生品種組成含量差別所造成。
單一品種的光譜數據(a)和120個花生品種的光譜數據(b)見圖2。

圖2 單一品種的光譜數據(a)和120個花生品種的光譜數據(b)
2.2 花生中水分含量分析
將120個花生樣品按照水分含量從高到低依次排列,每隔3個樣品挑選1個樣品為預測集,校正集樣品共90個,預測集樣品共30個。其中,校正集水分含量范圍為4.11%~6.94%,平均值為5.46%± 0.69%,其水分含量分布范圍廣,能夠涵蓋絕大多數花生品種;預測集水分含量范圍為4.17%~6.85%,平均值為5.35%±0.70%。按照水分含量高低成比例挑選預測集,預測集水分含量能夠位于校正集水分含量分布內,有利于對校正模型進行驗證。
花生校正集和預測集的水分含量見表1。

表1 花生校正集和預測集的水分含量
2.3 化學計量學分析
2.3.1 光譜的預處理
不同光譜預處理的花生水分含量PLS模型見表2。
原始光譜建立的PLS水分模型,RC,RCV和RP分別是0.46,0.45和0.44,SEC,SECV和SEP分別是0.41,0.47和0.52,模型的穩健性具有較大的上升空間。因此,分別采用不同的單一預處理和復合預處理提高模型穩健性,其中2nd-der預處理是最佳的單一光譜預處理方法,RC,RCV和RP分別是0.91,0.81和0.84,SEC,SECV和SEP分別為0.28,0.43和0.39。無論是相關系數還是標準偏差,與原始模型相比,有了較大的改善。Baseline和Normalization僅對光譜進行簡單的校正,并沒有消除噪聲對光譜的影響,其所建模型的穩健性只比原始模型有了略微提高。

表2 不同光譜預處理的花生水分含量PLS模型
復合預處理中,2nd-der結合2nd-der方法最佳,其RC,RCV和RP分別是0.92,0.81和0.85,SEC,SECV和SEP分別為0.28,0.45和0.40。該方法雖然比單獨進行2nd-der預處理效果更好,但是光譜數據進行了2次預處理,加重了運算負擔,降低了光譜處理的速度,如果將該方法用于實際生產,必定會影響檢測效率。因此,確定預測水分含量最佳的光譜預處理方法為2nd-der。與國內外研究相比較,楊傳得等人[12]收集了116份花生于波長833~2 500 nm處的反射光譜,比對了單一預處理和復合預處理對水分模型的影響,結果表明未經任何預處理的光譜建模效果最好,但只進行的內部交叉驗證,SECV為1.37,遠高于本研究方法。Govindarajan等人收集了于波長1 000~1 800 nm處的反射光譜,確定了Normalization結合一階導數為最佳的預處理方法,建立的水分模型SEC為1.23,模型的準確性與本研究存在差距。
2.3.2 水分含量全波段模型的建立
不同建模算法花生水分含量全波段模型見表3,花生水分含量全波段校正模型(a)、內部驗證模型(b)和預測模型(c)見圖3。
3種建模算法中PLS結果最好,其校正模型和內部驗證模型穩健性明顯高于其他2種方法,RC和RCV分別是0.91和0.81,SEC和SECV分別為0.28和0.43;PLS預測模型與PCR預測模型相當,均優于MLR預測模型,RP和 SEP分別是 0.84和 0.38。PLS,MLR和PCR 3種建模算法相互連貫,PCR克服了MLR光譜信息不能充分利用的弱點,顯著提高了模型的預測能力;PLS則對光譜陣和濃度陣同時進行分解,并在分解時考慮二者之間的關系,從而保證獲得最佳的校正模型。PLS校正模型散點圖(圖3(a))表明,在4.11%~6.94%范圍內花生樣品的水分含量均勻分布回歸直線兩側。因此,確定PLS為建立水分含量模型最佳數學方法。

表3 不同建模算法花生水分含量全波段模型

圖3 花生水分含量全波段校正模型(a)、內部驗證模型(b)和預測模型(c)
2.3.3 水分含量重要波長的選取和模型的建立
采用回歸系數法選取β-coefficient絕對值最高的14個波長,分別為957,970,977,1 070,1 033,1 147,1 317,1 337,1 390,1 400,1 544,1 551,1 654,1 681 nm。根據Workman J J等人研究,水分中的重要波長是水分子對稱和反對稱伸縮振動的組合吸收,以及OH伸縮振動引起的倍頻吸收。分別比較了上述12,13,14個波長建模效果,隨著波長數量的增加,模型穩健性越好,采用14個波長建立模型穩健性最好,RC,RCV和RP分別是0.82,0.80和0.81,SEC,SECV和SEP分別為0.39,0.44和0.43。在14個波長的基礎上增加1個波長,模型的穩健性并沒有得到顯著提高,反而增加了運算復雜性。同時,與全波段中任意14個波長所建模型相比較,上述14個波長模型穩健性優勢明顯。結合回歸系數和模型性能,確定上述14個波長為重要波長,并建立花生中水分含量重要波長模型。與已建全波段模型相比,雖然重要波長校正模型的表現力略差,但其僅利用14個波長,計算的復雜性遠低于含有240個波長的全波段模型,因此可以利用重要波長模型代替全波段模型對花生中水分含量進行預測。
花生中水分含量重要波長模型與其他波長模型見表4,花生水分含量重要波長校正模型(a)、內部驗證模型(b)和預測模型(c)見圖4。

表4 花生中水分含量重要波長模型與其他波長模型

圖4 花生水分含量重要波長校正模型(a)、內部驗證模型(b)和預測模型(c)
本文建立了花生中水分含量高光譜快速無損的檢測方法,分別比較了單一光譜預處理和復合預處理,以及建模算法對模型的影響,確定了最佳的光譜預處理方法是2nd-der,最佳的建模方法是PLS,所建全波段校正模型(RC=0.91,SEC=0.28)、內部驗證模型(RCV=0.81,SECV=0.43) 和預測模型(RP= 0.84,SEP=0.38)良好。在此基礎上根據回歸系數和模型性能,確定957,970,977,1 070,1 033,1 147,1 317,1 337,1 390,1 400,1 544,1 551,1 654,1 681 nm為14個重要波長,所建重要波長模型預測花生中水分含量能力與全波段模型相當,其中RC,RCV和RP分別是0.82,0.80和0.81,SEC,SECV和SEP分別為0.39,0.44和0.43。重要波長模型僅利用14個波長建立模型,具有運算復雜性低的特點,可以更加方便地應用在花生加工產業中,為快速無損監控花生原料的品質提供先進手段。
[1]王強.花生加工品質學 [M].北京:中國農業出版社,2013:76-81.
[2]FAO.Statistical Yearbook[EB/OL].Rome:Food and agriculture organization of the united nations,2014.http://faostat3.fao.org/download/Q/QC/E.
[3]周瑞寶.花生加工技術 [M].北京:化學工業出版社,2012:43-56.
[4]Gowen A A,O'Donnell C P,Cullen P J,et al.Hyperspectral imaging-an emerging process analytical tool for food quality and safety control[J].Trends in Food Science &Technology,2007,18(12):590-598.
[5]陸婉珍.現代近紅外光譜分析技術 [M].北京:中國石化出版社,2007:126-134.[6]嚴衍祿.近紅外光譜分析的原理技術與應用 [M].北京:中國輕工業出版社,2013:219-238.
[7]Wu D,Shi H,Wang S,et al.Rapid prediction of moisture content of dehydrated prawns using online hyperspectral imaging system[J].Analytica Chimica Acta,2012,726:57-66.
[8]Kamruzzaman M,ElMasry G,Sun D W,et al.Non-destructive prediction and visualization of chemical composition in lamb meat using NIR hyperspectral imaging and multivariate regression[J].Innovative Food Science&Emerging Technologies,2012,16:218-226.
[9]Iqbal A,Sun D W,Allen P.Prediction of moisture,color and pH in cooked,presliced turkey hams by NIR hyperspectral imaging system[J].Journal of Food Engineering,2013,117(1):42-51.
[10]Taghizadeh M,Gowen A,O'Donnell C P.Prediction of white button mushroom(Agaricus bisporus)moisture content using hyperspectral imaging[J].Sensing and Instrumentation for Food Quality and Safety,2009,3(4):219-226.
[11]He H J,Wu D,Sun D W.Non-destructive and rapid analysis of moisture distribution in farmed Atlantic salmon(Salmo salar)fillets using visible and near-infrared hyperspectral imaging[J].Innovative Food Science&Emerging Technologies,2013,18:237-245.
[12]楊傳得,于洪濤,關淑艷,等.近紅外反射光譜技術預測花生種子含水量 [J].花生學報,2012,41(1):6-9.◇
Rapid and Non-destructive Determination of Moisture Content in Peanut Based on Hyperspectral Imaging Technology
YU Hongwei,LIU Hongzhi,YANG Ying,SHI Aimin,LIU Li,HU Hui,*WANG Qiang
(Key Laboratory of Agro-Products Processing,Ministry of Agriculture,Institute of Agro-Food Science and Technology,Chinese Academy of Agricultural Sciences,Beijing 100193,China)
Moisture content directly affects the storage period of peanut and its products.The existing methods of determination of moisture content are more steps and time-consuming.In this paper,moisture content in peanut is rapidly and non-destructively detected by hyperspectral imaging technology(HSI).Image information of 120 peanut samples is acquired,and average spectra of peanut of resign of interest are extracted from the corrected image as peanut spectral information to analyze.The whole wave-band model of moisture content in peanuts is established by selecting the best spectral pre-processing method and modeling method.Based on regression coefficient method,important wavelengths are identified and model is set up.The results show that 2nd-der-PLS whole wave-band model had best ability to predict moisture content with Rc of 0.91 and SEC of 0.28,Rp of 0.84 and SEC of 0.38.The performance of the simplified model established by the regression coefficient is equivalent to that of the whole wave-band with Rc of 0.82 and SEC of 0.39,Rp of 0.81 and SEC of 0.43.The research show that HIS could quickly and non-invasively determine the moisture content in peanuts,and the important wavelength model with the characteristics of fast operation could be more convenient for the application in the peanut industry.
peanut;moisture content;hyperspectral imaging technology;partial least square;non-destructive testing
S37
A
10.16693/j.cnki.1671-9646(X).2016.12.011
1671-9646(2016)12a-0039-05
2016-05-09
國家科技支持計劃課題(2012BAD29B03);中國農業科學院科技創新工程(CAAS-ASTIP-201X-IAPPST)。
于宏威(1991— ),男,碩士,研究方向為糧油加工與副產物綜合利用。
*通訊作者:王 強(1965— ),男,博士,研究員,研究方向為糧油加工與副產物綜合利用。