郭志明等
1引言
近紅外光譜區是指波長在780~2526 nm范圍內的電磁波,是分子振動光譜倍頻和合頻吸收譜,具有豐富的結構和組成信息,可用于碳氫有機物質的組成與性質的測量。與傳統分析技術相比,近紅外光譜具有無損檢測、分析效率高、成本低、重現性好、樣品測量一般不需預處理、適合于現場檢測和在線分析等優勢。隨著近紅外光譜分析技術、化學計量學和近紅外光譜儀器的快速發展,近紅外光譜分析技術已在許多領域得到廣泛應用。借助先進的近紅外光譜儀,研究者可快速獲取大量光譜數據。但物質在該譜區的倍頻和合頻吸收信號弱,譜帶重疊,解析復雜;且由于儀器所采集的數據除樣品的自身信息外,還包含了其它無關信息和噪音,如電噪音、樣品背景等,這些信息在預處理中很難全部消除;其次有些光譜區域樣品的信息很弱,與樣品的組成或性質間相關程度不高;另外,同一樣本的光譜數據內部存在共線性關系,易產生數據冗余[1,2]。如果將這些數據都參與建模,不但計算量大、模型復雜,而且精度也受到影響。因此,光譜特征變量優選方法成為提高建模質量的關鍵環節。
目前,近紅外光譜的特征變量選擇方面的大量研究主要集中在特征波段的選擇、特征波長的優選及波段和波長選擇相結合的篩選方法。在特征波段的選擇上主要有區間偏最小二乘法(iPLS)[3,4]、移動窗偏最小二乘法(MWPLS)、向前區間偏最小二乘法(FiPLS)、向后區間偏最小二乘法(BiPLS)和聯合區間偏最小二乘法(SiPLS)[5,6]等;在特征波長的選擇上主要有遺傳算法(GA)、無信息變量消除(UVE)、連續投影算法(SPA)[7]、模擬退火算法(SAA)[8]和粒子群優化算法(PSO)等[4,9]。近紅外光譜校正模型建立方法以偏最小二乘法(PLS)最為經典,且PLS應用廣泛,一般認為其具有較強的抗干擾能力,對非海量數據建模穩定性較好。蟻群優化算法(Ant colony optimization, ACO)由Dorigo等于20世紀90年代初提出, 是人工智能或群體智能的新發展,具有分布計算、信息正反饋和啟發式搜索的特征,已較好的解決旅行商、通訊、網絡路由和定量構效關系等組合優化問題[10~12]。目前已有學者采用ACO算法進行光譜變量的選擇[13~15],但信息素初始權值的分配有待進一步的研究。蟻群優化算法結合偏最小二乘法(ACOPLS)用于近紅外光譜的特征波長選擇,可實現光譜變量的全局搜索,建立精度高穩定性強的多元校正模型。
蘋果可溶性固形物含量的近紅外光譜檢測研究多選取同一產地同批次或多個批次的蘋果樣本[16~18]。同一品種不同產區,因土壤、海拔、光照、水量、晝夜溫差等氣候差異, 蘋果的外觀特征和風味不同。另外,可溶性固形物主要是可溶性糖類,包括單糖、雙糖,多糖等,難以直接確定其對應的特征波長,故需采用優化組合算法尋找光譜中最相關的信息。鑒于此,本研究利用蟻群算法啟發式全局搜索的特點,結合蒙特卡羅輪盤賭隨機選擇機制,選擇蘋果可溶性固形物含量的近紅外光譜特征波長,然后用偏最小二乘法建立不同產地蘋果可溶性固形物含量混合分析模型,以提高近紅外光譜預測模型的穩健性和適用性。
2實驗部分
2.1實驗材料
選用的富士蘋果為我國蘋果主產區山東、陜西和特產區新疆,選擇無缺陷、損傷或污染物的蘋果共207個,隨機挑選138個(40個陜西、48個山東、50個新疆)作為校正集,其余的69個(20個陜西、24個山東、25個新疆)作為預測集,將它們分別編號后置于4 ℃冰柜中貯藏。實驗前,將蘋果從冰柜取出置于實驗室中12 h,以使蘋果樣本整體溫度與環境溫度一致,試驗過程保持實驗室溫濕度基本不變。
2.2光譜采集與標準值測定
2.3.3目標函數選取在優化過程中,目標函數表明了個體生存能力和群體的優化程度。建立一個好的目標函數,可加快收斂速度,提高計算精度。近紅外光譜多元校正模型建立過程中,常采用交互驗證法來評價模型的預測能力,即采用預測殘差平方和、交互驗證均方根誤差、預測均方根誤差和待測組分預測值與實測值間的相關系數等作為目標函數。本研究以均方根誤差RMSE為評價指標,公式(4)中yi為樣本SSC的實測值,t為預測值。均方根誤差的值越小,對應校正模型的預測能力越好;并設置顯著性因子Q,Q為常數,用于調整目標函數的收斂效度。
2.3.4算法流程蟻群優化算法是一種迭代算法。首先初始化信息素向量等相關參數,設置最大變量數、最大迭代次數、最大循環次數、螞蟻群體大小,其中初始信息素向量值均置為1,即每個變量具有相同的被選擇概率;其次,啟動所有螞蟻,采用蒙特卡洛輪盤轉法隨機從變量集中選擇一個變量,直到變量數達到最大變量數,階段性完成變量選擇后建立偏最小二乘模型,輸出均方根誤差;再次,未達到最大迭代次數時,更新信息素向量,繼續進行變量選擇并建立偏最小二乘模型;最后,比較各次循環次數獲得的偏最小二乘模型結果,輸出最優解。
4結論
利用蟻群優化算法選擇蘋果可溶性固形物含量的近紅外光譜特征波長,建立穩健精細的偏最小二乘分析模型。與全光譜偏最小二乘模型和遺傳偏最小二乘模型相比,蟻群優化算法選擇的波長數最少,且模型預測能力最強,其校正集相關系數Rc和均方根誤差RMSEC分別為0.9830和0.4615,預測集相關系數Rp和預測均方根誤差RMSEP分別為0.9708和0.5144。研究選用3個富士蘋果主產地的樣本,建立不同產地蘋果可溶性固形物含量混合分析模型,最優模型具有較高的預測精度,應用近紅外光譜可以建立多產地蘋果品質混合分析模型,具有較好的穩健性和適用性。研究結果表明,自適應蟻群優化算法可以有效選擇近紅外光譜特征波長,簡化模型,提高計算效率,增強模型的穩健性。
References
1YANG HaoMin, LU QiPeng, HUANG FuRong. J. Infrared Millim. Waves, 2011, 30(6): 522-525
2JIN Ye, YANG Kai, WU YongJiang, LIU XueSong, CHEN Yong. Chinese J. Anal. Chem., 2012, 40(6): 925-931
3ZHANG DeQuan, CHEN XiaoNa, SUN SuQin, LI ChunHong, ZHANG BaiLin, LI Yong, LI ShuRong, LI QingPeng, ZHOU HongJie. Spectroscopy and Spectral Analysis, 2008, 28(11): 2550-2553
4WANG JiaHua, LI PengFei, CAO NanNing, HAN DongHai. J. Infrared Millim. Waves, 2009, 28(5): 386-391
5Zou X, Zhao J,Malcolm J W, Mel H, Mao H. Anal. Chim. Acta, 2010, 667(1): 14-32
6CHEN YongMing, LIN Ping, He Yong. Spectroscopy and Spectral Analysis, 2009, 29(3): 671-674
7CHEN Bin, MENG XiangLong, WANG Hao. Journal of Instrumental Analysis, 2007, 26(1): 66-69
8PAN Tao, WU ZhenTao, CHEN HuaZhou. Chinese J. Anal. Chem., 2012, 40(6): 920-924
9Sorol N, Arancibia E, Bortolato S A, Olivieri A. Chemometr. Intell. Lab., 2010, 102(2): 100-109
10Dorigo M, Maniezzo V, Colorni A. IEEE Trans. Syst. Man Cybern. B, 1996, 6: 29-41
11Bonabeau E, Dorigo M, Theraulaz G. Nature, 2000, 406: 39-42
12Shen Q, Jiang J H, Tao J C,Shen G, Yu R. J. Chem. Inf. Model., 2005, 45: 1024-1029
13WANG YuTian, LI YanChun. Chinese Journal of Sensors and Actuators, 2006, 19(2): 508-510
14GUO Liang, JI HaiYan. Spectrosc. Spect. Anal., 2007, 127(19): 1703-1705
15Franco A, Olivieri A C. Anal. Chim. Acta, 2011, 699(1): 18-25
16Ventura M, Jager A, Putter H, Roelofs F. Postharvest Biol. Tec., 1998, 14(1): 21-27
17Peng Y K, Lu R F. J. Food Eng., 2007, 82(2): 142-152
18Nicolai B M, Beullens K, Bobelyn E, Peirs A, Saeys W, Theron K, Lammertyn J. Postharvest Biol. Tec., 2007, 46(2): 99-118
2JIN Ye, YANG Kai, WU YongJiang, LIU XueSong, CHEN Yong. Chinese J. Anal. Chem., 2012, 40(6): 925-931
3ZHANG DeQuan, CHEN XiaoNa, SUN SuQin, LI ChunHong, ZHANG BaiLin, LI Yong, LI ShuRong, LI QingPeng, ZHOU HongJie. Spectroscopy and Spectral Analysis, 2008, 28(11): 2550-2553
4WANG JiaHua, LI PengFei, CAO NanNing, HAN DongHai. J. Infrared Millim. Waves, 2009, 28(5): 386-391
5Zou X, Zhao J,Malcolm J W, Mel H, Mao H. Anal. Chim. Acta, 2010, 667(1): 14-32
6CHEN YongMing, LIN Ping, He Yong. Spectroscopy and Spectral Analysis, 2009, 29(3): 671-674
7CHEN Bin, MENG XiangLong, WANG Hao. Journal of Instrumental Analysis, 2007, 26(1): 66-69
8PAN Tao, WU ZhenTao, CHEN HuaZhou. Chinese J. Anal. Chem., 2012, 40(6): 920-924
9Sorol N, Arancibia E, Bortolato S A, Olivieri A. Chemometr. Intell. Lab., 2010, 102(2): 100-109
10Dorigo M, Maniezzo V, Colorni A. IEEE Trans. Syst. Man Cybern. B, 1996, 6: 29-41
11Bonabeau E, Dorigo M, Theraulaz G. Nature, 2000, 406: 39-42
12Shen Q, Jiang J H, Tao J C,Shen G, Yu R. J. Chem. Inf. Model., 2005, 45: 1024-1029
13WANG YuTian, LI YanChun. Chinese Journal of Sensors and Actuators, 2006, 19(2): 508-510
14GUO Liang, JI HaiYan. Spectrosc. Spect. Anal., 2007, 127(19): 1703-1705
15Franco A, Olivieri A C. Anal. Chim. Acta, 2011, 699(1): 18-25
16Ventura M, Jager A, Putter H, Roelofs F. Postharvest Biol. Tec., 1998, 14(1): 21-27
17Peng Y K, Lu R F. J. Food Eng., 2007, 82(2): 142-152
18Nicolai B M, Beullens K, Bobelyn E, Peirs A, Saeys W, Theron K, Lammertyn J. Postharvest Biol. Tec., 2007, 46(2): 99-118
2JIN Ye, YANG Kai, WU YongJiang, LIU XueSong, CHEN Yong. Chinese J. Anal. Chem., 2012, 40(6): 925-931
3ZHANG DeQuan, CHEN XiaoNa, SUN SuQin, LI ChunHong, ZHANG BaiLin, LI Yong, LI ShuRong, LI QingPeng, ZHOU HongJie. Spectroscopy and Spectral Analysis, 2008, 28(11): 2550-2553
4WANG JiaHua, LI PengFei, CAO NanNing, HAN DongHai. J. Infrared Millim. Waves, 2009, 28(5): 386-391
5Zou X, Zhao J,Malcolm J W, Mel H, Mao H. Anal. Chim. Acta, 2010, 667(1): 14-32
6CHEN YongMing, LIN Ping, He Yong. Spectroscopy and Spectral Analysis, 2009, 29(3): 671-674
7CHEN Bin, MENG XiangLong, WANG Hao. Journal of Instrumental Analysis, 2007, 26(1): 66-69
8PAN Tao, WU ZhenTao, CHEN HuaZhou. Chinese J. Anal. Chem., 2012, 40(6): 920-924
9Sorol N, Arancibia E, Bortolato S A, Olivieri A. Chemometr. Intell. Lab., 2010, 102(2): 100-109
10Dorigo M, Maniezzo V, Colorni A. IEEE Trans. Syst. Man Cybern. B, 1996, 6: 29-41
11Bonabeau E, Dorigo M, Theraulaz G. Nature, 2000, 406: 39-42
12Shen Q, Jiang J H, Tao J C,Shen G, Yu R. J. Chem. Inf. Model., 2005, 45: 1024-1029
13WANG YuTian, LI YanChun. Chinese Journal of Sensors and Actuators, 2006, 19(2): 508-510
14GUO Liang, JI HaiYan. Spectrosc. Spect. Anal., 2007, 127(19): 1703-1705
15Franco A, Olivieri A C. Anal. Chim. Acta, 2011, 699(1): 18-25
16Ventura M, Jager A, Putter H, Roelofs F. Postharvest Biol. Tec., 1998, 14(1): 21-27
17Peng Y K, Lu R F. J. Food Eng., 2007, 82(2): 142-152
18Nicolai B M, Beullens K, Bobelyn E, Peirs A, Saeys W, Theron K, Lammertyn J. Postharvest Biol. Tec., 2007, 46(2): 99-118