吳寶婷,賈柳君,張海紅*,蔣慧霞,李冬冬
(寧夏大學 農學院,寧夏 銀川 750021)
棗醋發酵液中pH值與總酸含量的高光譜圖像技術定量分析
吳寶婷,賈柳君,張海紅*,蔣慧霞,李冬冬
(寧夏大學 農學院,寧夏 銀川 750021)
利用高光譜圖像技術(HS-IT)對靈武棗醋發酵過程中pH值和總酸含量進行定量分析,并通過偏最小二乘法(PLS)建立定量分析模型,同時采用競爭性自適應加權算法(CARS)和遺傳算法(GA)對整個譜區進行特征波長篩選。以決定系數(R2)、預測均方根偏差(RMSEP)、相對分析誤差(RPD)以及最佳主因子數作為模型質量的評價參數,其中使用CARS進行的波長篩選法對模型的優化效果最佳,pH值和總酸含量的R2分別達到0.928 4和0.935 1,RMSEP分別為0.122 6和0.301 5,RPD分別為3.75和3.91。結果表明,CARS-PLS法可提高棗醋發酵液中pH值與總酸含量預測模型的準確度和穩定性。
棗醋;高光譜圖像技術;定量分析;波長篩選;偏最小二乘法
靈武長棗是寧夏地區獨有的紅棗品種,富含糖、酸、維生素、礦物質、蛋白質及多酚類等生理活性物質,營養價值極高[1]。由其釀造而成的棗醋既有獨特的棗香味,又具有食醋的保健功能,是集營養、保健于一體的綠色純天然生物發酵果醋,市場前景廣闊。以非商品棗開發靈武棗醋,在促進棗果深加工、延伸棗果產業鏈方面意義重大,具有較好的經濟效益和社會效益[2-3]。棗醋的品質與釀造過程中各項參數的變化密切相關,其中總酸和pH值的變化直接決定著棗醋的酸味質量與口感。目前這兩項指標的傳統檢測方法操作復雜耗時,對檢測人員的技術水平要求較高,不能滿足棗醋釀造過程中關鍵參數快速監測的要求。因此,在棗醋的釀造過程中,尋找一種快速、精準的檢測方法,實時監測這兩項指標以指導生產,已成為當務之急[4-5]。
高光譜圖像技術(hyperspectralimagetechnology,HS-IT)是一種新興的圖譜合一的技術。高光譜圖像系統獲得的灰度圖像是一系列連續波點下的二維圖像所組成的三維數據塊,圖像信息可以反映樣品的顏色和結構等外部形態特征的變化,光譜信息能夠充分反映樣品的化學組分、物理結構等內部品質的變化,具有分析速度快、精度高、無需前處理且綠色環保等優點,已應用到食品、藥品等多個行業[6-8]。朱瑤迪等[9]利用高光譜圖像技術結合化學計量學方法分析了鎮江香醋醋醅固態發酵中總酸、pH值、含水率在不同階段的變化規律,同時利用主成分分析和逐步多元線性回歸模型對醋醅高光譜圖像進行分析,結果表明,利用HS-IT快速預測醋醅的理化參數及其分布的辦法是可行的。申婷婷等[10]利用高光譜圖像技術檢測了鎮江香醋醋醅理化參數的分布,同時提取了理化參數分布的定量特征,達到了使醋醅理化參數的可視化分布檢測和分布特征的數字化描述的目的,為數字化、工業化監控鎮江香醋醋酸發酵提供技術性支持。鄒小波等[11]以鎮江香醋醋醅發酵過程中總酸含量和pH值為表征參數,利用HS-IT和化學計量學實現翻醅均勻性快速判斷。以翻醅前后的醋醅為實驗對象,使用遺傳算法(genetic algorithm,GA)和聯合區間偏最小二乘(section interval partial least square,SiPLS)進行特征波長的優選,采用最小二乘支持向量機(leastsquaressupportvector machines,LS-SVM)和偏最小二乘法(partial least squares,PLS)建立表達醋醅均勻性參數的快速預測模型,研究表明,利用HS-IT快速預測醋醅均勻性是可行的。
本研究擬對靈武棗醋液態發酵中總酸含量及pH值進行快速無損分析,采用競爭性自適應加權算法(competitive adaptivereweightedsampling,CARS)及遺傳算法(GA)對整個譜區進行光譜波長篩選,比較分析這兩種光譜波長篩選方法對棗醋pH值及總酸含量預測模型的影響,優選光譜波長篩選法,并在此基礎上建立棗醋pH值及總酸含量的最優模型,以期實現HS-IT對棗醋pH值及總酸含量的快速預測。
1.1 材料與試劑
靈武長棗(干棗):市售;果膠酶(5萬U/g):安琪酵母股份有限公司;釀酒酵母(Saccharomyces cerevisiae):寧夏大學生物實驗室保藏;醋酸菌(Acetobacter):河南雅大股份有限公司;白砂糖、檸檬酸、氫氧化鈉、酚酞等均為國產分析純。
1.2 儀器與設備
JYL-C022榨汁機:九陽股份有限公司;101-5A阿貝折光儀:德州潤興實驗儀器有限公司杭州綠博儀器有限公司;LRH-1SOB生化培養箱:杭州綠博儀器有限公司;DZKW-S-6水浴鍋:北京市永光明醫療儀器廠;PH211C pH計:北京哈納科儀科技有限公司;YXQ-SG46-280S高壓滅菌鍋:西化儀(北京)科技有限公司。ImspectorN17E圖像光譜儀:芬蘭奧盧光譜圖像有限公司;HSIA-LS-TDIF鹵鎢燈線光源(35W):北京卓立漢光儀器有限公司。
1.3 方法
1.3.1 棗醋發酵工藝流程及操作要點

原料處理:選取干凈均勻無腐爛的干棗,切塊、去核、洗凈后初步粉碎,加入一定比例的水,使得水料比為1∶5(mL∶g),添加0.1%果膠酶,50℃浸提2 h使其溶出物盡可能溶出,打漿成均勻的棗汁,用紗布過濾取得濾液備用。
調糖調酸:檢測棗汁的糖度、可溶性固形物含量,用白砂糖調整糖度至15°Bx,用檸檬酸調pH值為3.5。
殺菌處理:在進行發酵之前,放入高壓鍋內進行121℃高溫殺菌15 min。
酒精發酵:將備用的棗汁冷卻至室溫,接入0.2%已活化(35℃活化培養40 min)的液體酵母菌,于28℃密閉發酵瓶中發酵,同時每天檢測其發酵液的pH值和總酸含量。
醋酸發酵:以10%的接種比例在酒精發酵液中接入已活化的醋酸菌培養液,在40℃條件下進行醋酸發酵,同時每天測其發酵液pH值和總酸含量。當發酵液酸度不再上升時結束發酵,然后于80℃滅菌20 min。
靜置:將滅菌后的棗醋靜置,使棗醋變得澄清,取上清液進行檢測。
1.3.2 棗醋發酵液檢測方法
采用高光譜圖像技術對棗醋發酵液樣品進行檢測,每天取50mL發酵液樣品,加入50mL測量池中,進行圖像校正后,放到載物臺上進行測量,將得到的圖像進行處理,得到數據后進行模型建立。實驗采用波段范圍為400~1000nm,共有256個波段,像素為320×300 ppi。
總酸含量和pH值的測定:參考GB 18187—2000《釀造食醋》中的方法對棗醋的總酸含量(以醋酸計(g/L))、pH值進行測定[13]。
1.3.3 發酵液檢測圖像的校正
由于在不同的波段下光源強度分布不均勻以及箱體中暗電流的存在,導致在光源強度弱的波段下的圖像含有較大的噪音,對數據處理帶來了冗余的信息。所以,需要對捕獲的高光譜圖像進行標定[14]。首先進行白板校正得到全白的標定圖像W,然后蓋上相機鏡頭蓋進行圖像采集得到全黑的標定圖像D,然后按照下式[15]對原始圖像進行標定:

式中:R是校正后的漫反射光譜圖像;R0是樣本原始的漫反射光譜圖像;W是白板的漫反射圖像;D是暗圖像。
1.3.4 光譜處理
為了消除或減小無關信息、光、噪聲等對數據分析產生的影響,提高模型的適用性,實驗前進行預處理,將實驗室的燈、噪音儀器等暫時關閉[16]。為了剔除無效波長,簡化模型簡析難度,提升模型穩定性和預測精度,本實驗分別采用CARS和GA對全光譜125個波長進行優化選擇,同時采用PLS法建立模型。設定GA-PLS優化參量:初始群體為30,交叉概率為0.5,變異概率為0.01,遺傳迭代次數為100。選取決定系數(R2)、預測均方根偏差(root meet standard error of prediction,RMSEP)、相對分析誤差(relative percent deviation,RPD)以及最佳因子數來評價模型穩定性與預測能力[17]。R2越接近1,同時RPD>3時,則表明建立的模型效果越好[18]。
1.3.5 數據處理與分析方法
在隨機保留30個棗醋發酵液樣本作為獨立測試集的基礎上,采用Kennard-Stone(K-S)法[19]將80個樣品數據進行校正集和驗證集的劃分處理。選擇校正集樣本120個,驗證集樣本60個。
CARS、GA等程序通過軟件MATLAB分析完成,偏最小二乘計算應用Unscrambler X10.3光譜分析軟件實現,利用ENVI4.6軟件選擇合適的感興趣區域,提取平均光譜值。
2.1 數據統計結果

表1 校正集與驗證集統計結果Table 1 Statistical results of calibration set and validation set
由表1可知,樣本數據進行處理后得到標準差的驗證集數據均處于校正集范圍內,表明數據篩選剔除了無效波點波長,簡化了模型簡析難度,提升了模型的穩定性和預測精度。
2.2 光譜波段優選
2.2.1 競爭性自適應加權算法優選特征波長
CARS在進行波長篩選時,保留回歸系數絕對值大的波長,剔除回歸系數絕對值小的波長,重復運行篩選出最佳波長子集[20]。使用MATLAB軟件分析數據,使用CARS法進行波長篩選,優選特征波長。結果如圖1所示。由圖1(a)可知,pH值和總酸的波長個數均隨著運行次數增加而減少,且呈現先快速減少后逐漸平緩的變化規律,反映了CARS的先“粗選”和后“精選”的優化過程。由圖1(b)可知,pH值和總酸的交叉驗證均方根(RMSECV)值均隨著運行次數的增加先減少后增大。表明篩選之初,過程剔除了與樣本性質無關的波長,使RMSECV減少;隨著運行次數的進一步增大,可能剔除了關鍵波長,從而使RMSECV增大。由圖1(c)可知,與*相對的點為RMSECV的最低點,pH值的最低RMSECV值為0.1302,總酸的最低RMSECV值為0.3093。經CARS法篩選所得pH值和總酸的波長數分別為14、15個,僅占全光譜的11.2%、12.0%(高光譜中波長共125個),可有效降低模型的復雜程度,增大運算速度,提高預測效率。

圖1 CARS法關鍵波長選擇結果Fig.1 Selection results of key wavelength by CARS method
2.2.2 遺傳偏最小二乘波段選擇法優選特征波長
GA是基于生物進化論,模擬自然界進化機制的一種優化算法,通過選擇頻率最高的波點建模來挑選特征波長[21]。使用軟件MATLAB分析數據,使用GA法進行波長篩選,優選特征波段。pH值、總酸含量通過GA法篩選后的各波長選用的頻次圖結果見圖2。由圖2可知,以pH值篩選出的頻率>7的波點波長數為23個;以總酸篩選出的頻率>7的波點波長數為34個,分別占全光譜的18.4%、27.2%,可有效降低模型的復雜程度,增大運算速度,提高預測效率。

圖2 pH值(a)和總酸含量(b)通過GA法篩選各波長選用的頻次圖Fig.2 Frequency diagram of each wavelength selection of pH(a)and total acid content(b)by GA method
2.3 模型建立與評價
基于上述CARS、GA兩種方法的篩選,分別建立棗醋中pH值和總酸含量的全光譜-PLS、CARS-PLS、GA-PLS定量分析模型并對模型的決定系數(R2)、預測均方根偏差(RMSEP)、相對分析誤差(RPD)以及最佳主因子數進行比較,分析CARS法、GA法對預測模型精度的影響,評價建模效果,模型優化結果如表2所示。

表2 pH和總酸的不同模型及性能評價結果Table 2 Results of different models and performance evaluation of pH and total acid
由表2可知,與全光譜-PLS模型相比,采用CARS、GA兩種方法進行波長篩選后,建立的CARS-PLS、GA-PLS模型所用波長數均有不同程度的減少,R2增加,接近1的同時RMSEP和最佳主因子數相對降低,RPD相對增大,且RPD>3時,表明篩選波點模型預測效果均優于全光譜-PLS模型。CARS和GA在剔除無信息波長的同時,淘汰了光譜中共線性波長及受外界因素影響較大的波長,優選出最能表征目標信息的關鍵性波點,極大地減少了波長數,有效地降低了模型復雜程度,提高了模型預測效率。CARS、GA兩種方法相比之下,GA涉及的波點波長數較多,而CARS篩選所得特征波點波長更少,建模的計算效率得到極大提升的同時不失參數代表性,模型效果略優。采用CARS法篩選波點后所建立的棗醋發酵液中pH值和總酸的CARS-PLS定量分析模型所用的波長數最少,建模效果最佳,R2分別達到0.928 4和0.935 1,RMSEP值分別為0.122 6和0.301 5,RPD為3.75和3.91,最佳主因子數分別為7個和8個,模型的適應性、擬合程度和預測能力最為理想。
2.4 模型驗證
利用獨立樣本測試集中30個樣本的實驗數據對CARSPLS模型進行驗證,結果如圖3A、圖3B所示。由圖3可知,pH值、總酸含量的實測值與模型預測值基本分布在對角線兩側,且經過成對t檢驗,pH值、總酸含量的實測值與預測值無顯著差異。說明模型的預測精度較高,基于HT-IS的棗醋發酵液的pH值、總酸的定量分析是可行的。

圖3 pH值(A)和總酸含量(B)的CARS模型實測值與預測值分布Fig.3 Distribution of measured value and predictive value of pH(A)and total acid content(B)by CARS model
本研究分別采用競爭性自適應加權算法(CARS)、遺傳算法(GA)對光譜特征波點進行篩選,并結合偏最小二乘法(PLS),分別建立了棗醋發酵液中pH值和總酸的CARS-PLS定量分析模型。以篩選后的數據波點,建立的模型其質量均有所優化。波點篩選是優化模型的有效措施,不僅極大的減少了建模波長數,簡化了建模的復雜程度,同時大幅提升了模型的穩定性和預測能力。采用CARS法進行波段篩選后所建模型的效果優于GA法,在保留pH值和總酸含量特征波點的同時剔除了大量冗余無效信息,在保證模型準確度和穩定性的基礎上,提高了模型預測效率。pH值和總酸的CARS-PLS定量分析模型R2分別達到0.928 4和0.935 1,RMSEP值分別為0.122 6和0.301 5,RPD為3.75和3.91,表明高光譜圖像檢測技術可實現棗醋發酵液中pH值和總酸含量的快速、實時、準確檢測。
[1]徐 爽.基于高光譜圖像技術的紅棗品質無損檢測研究[D].銀川:寧夏大學,2013.
[2]楊小波,賀曉光,方海田.靈武長棗醋加工工藝的研究[J].中國釀造,2011,30(2):169-172.
[3]楊 博.寧夏特色農業產業化研究[D].北京:中央民族大學,2011.
[4]張戰國.食醋功能特性的研究與分析比較[D].楊凌:西北農林科技大學,2009.
[5]化志秀.棗醋加工工藝及性能比較研究[D].楊凌:西北農林科技大學,2013.
[6]吳龍國,王松磊,康寧波,等.基于高光譜成像技術的靈武長棗缺陷識別[J].農業工程學報,2015,31(20):281-286.
[8]石吉勇.基于高光譜圖像技術的設施栽培作物營養元素虧缺診斷研究[D].鎮江:江蘇大學,2012.
[9]朱瑤迪,鄒小波,石吉勇,等.高光譜圖像技術快速預測發酵醋醅總酸分布[J].農業工程學報,2014,30(16):320-327.
[10]申婷婷.高光譜圖像技術檢測鎮江香醋醋醅理化參數分布研究[D].鎮江:江蘇大學,2016.
[11]鄒小波,申婷婷,朱瑤迪,等.基于高光譜圖像的香醋醋醅均勻性快速判別[J].農業機械學報,2016,47(1):215-220.
[12]洪添勝,李 震,吳春胤,等.高光譜圖像技術在水果品質無損檢測中的應用[J].農業工程學報,2007,11(23):280-285.
[13]寧正祥.食品成分分析手冊[M].北京:中國輕工業出版社,1998:20-25.
[14]POLDER G,GERIE W,HEIJDEN V D.Calibration and characterization of imaging spectrographs[J].J Near Infrared Spec,2003,11(3):193-210.
[15]GAMAL E A,WANG N,CLEMENT V.Delecting chilling injury in red delicious apple using hyperspectral imaging and neural network[J].Postharvest Biol Tech,2009,52:1-8.
[16]劉文濤.基于高光譜成像技術的蘋果品質無損檢測研究[D].保定:河北農業大學,2015.
[17]褚小立.化學計量學方法與分子光譜分析技術[M].北京:化學工業出版社,2011:4.
[18]嚴衍祿,陳 斌,朱大洲.近紅外光譜分析的原理、技術與應用[M].北京:中國輕工業出版社,2013:165-174.
[19]HE K X,CHENG H,DU W L,et al.Online up-dating of NIR model and its industrial application via adaptive wavelength selection and local regression strategy[J].Chemometr Intell Lab Syst,2014,134(15):79-88.
[20]李江波,郭志明,黃文倩,等.應用CARS和SPA算法對草莓SSC含量NIR光譜預測模型中波長及樣本篩選[J].光譜學與光譜分析,2015,35(2):372-378.
[21]張 初,劉 飛,孔汝汝.利用近紅外高光譜圖像技術快速鑒別西瓜種子品種[J].農業工程學報,2013,29(20):270-277.

WU Baoting,JIA Liujun,ZHANG Haihong*,JIANG Huixia,LI Dongdong
(College of Agriculture,Ningxia University,Yinchuan 750021,China)
TS264.2
0254-5071(2017)11-0096-05
10.11882/j.issn.0254-5071.2017.11.021
2017-04-25
寧夏高校科學研究項目(No.NGY2016019);寧夏十三五重點專業建設項目
吳寶婷(1995-),女,本科生,研究方向為農產品無損檢測。
*通訊作者:張海紅(1967-),女,教授,碩士,研究方向為農產品無損檢測。