周 密,馮 灝,劉 杰,皮江一,王會霞,周陶鴻,
彭青枝1,2,張 莉1,2
(1.湖北省食品質量安全監督檢驗研究院,湖北 武漢 430075;2.湖北省食品質量安全檢測工程技術研究中心,湖北 武漢 430075)
蜂蜜是蜜蜂采集植物的花蜜、分泌物或蜜露,與自身分泌物混合后,經充分釀造而成的天然甜物質[1]。隨著人們健康意識的提高,蜂蜜作為一種天然食品漸受青睞。自然界中分泌花蜜的植物種類繁多,不同植物來源蜂蜜所具備的活性功能也不盡相同[2],產品價格更是千差萬別。市場上部分不法商販受利益驅使,對蜂蜜進行摻雜使假,掩蓋或錯誤標識蜂蜜蜜源信息是常見的使假手段之一[3]。而我國作為蜂產品出口大國,此種違法現象不僅損害了消費者的合法權益,制約了我國蜂產業在經濟全球化中的進程,更是給國際蜂產業的健康、可持續發展留下隱患。因此,為了保護消費者利益和促進生產者的公平競爭,保障蜂產業的繁榮發展,對蜂蜜植物源進行鑒別研究意義重大。
蜂蜜富含多種礦物質元素,占比雖小,但提供了重要的樣品信息[4],能為蜂蜜屬性區分提供依據,如魏月等[5]分析了云南南部4種植物源蜂蜜中21種礦質元素,結合典型判別分析,對4種蜂蜜的植物源歸屬判別正確率達90%,表明在氣候和土壤環境相似的情況下,不同植物源蜂蜜之間礦質元素存在差異;陳輝等對蜂蜜產地[6]和植物源[7]的鑒別研究不僅能將來自河北、北京等地的荊條蜜進行產地溯源,還能有效鑒別來自不同地區的荊條、椴樹、洋槐、油菜蜂蜜,表明同種植物源蜂蜜產地之間的差異或小于不同植物源之間引起的差異,因此,利用蜂蜜中多種礦質元素對不同地區蜂蜜樣品進行植物源鑒別是可行的。
截尾數據(Censored data)指監測數據中污染物的檢測值小于檢出限或者定量下限的不完全數據[8],在食品化學污染物評價中不可避免。受限于植物生長自然環境、樣品狀態、儀器條件等因素,電感耦合等離子體質譜儀(ICP-MS)測定蜂蜜樣品時,截尾數據總是客觀存在的,世界衛生組織(World health organization,WHO)建議在對食品中低含量污染物進行暴露評估過程中,當低于檢出限的結果數據小于數據總量的60%時,所有小于檢出限的結果均以二分之一檢出限值進行替換參與計算[9]。如Hannah等[10]在評估土壤中鋅、錳元素含量時,比較了替換法(Substitution method)、最大似然估計法(Maximum likelihood estimation)、次序統計量回歸法(Regression on order substitution)、生存分析法(Survival analysis)4種不同截尾數據處理方法,發現使用替換法將截尾數據按二分之一檢出限值處理時能較好地計算樣本幾何平均值。盡管國內外有通過ICP-MS進行元素分析并建立判別模型鑒別蜂蜜植物源的報道[5,11],但并未涉及ICP-MS中截尾數據對模型判別能力的研究,且識別模型單一,缺少對模型參數的優化。因此,為提高蜂蜜植物源模型的鑒別能力,有必要建立蜂蜜中ICP-MS截尾數據和識別模型參數的研究。本文采用ICP-MS測定荊條、洋槐、葵花、油菜4種植物源蜂蜜中的16種金屬元素,再利用替換法按二分之一檢出限值處理截尾數據并建立支持向量機(Support vector machine,SVM)分類模型,并進一步通過網格搜索法(Grid search,GS)、遺傳算法(Genetic algorithm,GA)和粒子群優化算法(Particle swarm optimization,PSO)3種尋優算法優化模型參數,有效提高了判別能力,以期為規范蜂蜜市場秩序提供技術支持。
NexION 350X型電感耦合等離子發射光譜質譜聯用儀(美國PerkinElmer公司),檢測器帶電信號稀釋功能;Multiwave Pro型微波消解儀(奧地利Anton paar公司);BHW-09A24S型恒溫消解趕酸儀(上海博通化學科技有限公司);WNE29型恒溫水浴鍋(德國Memmert公司);Purelab Chorus型超純水系統(英國ELGA公司)。
硝酸(優級純,德國Merck公司);Na、Mg、Al、K、Ca、Ti、Cr、Mn、Ni、Cu、Zn、As、Se、Cd、Ba、Pb單元素標準儲備液(1 000 mg/L,國家有色金屬及電子材料分析測試中心);實驗室用水為去離子水。
1.2.1 樣品前處理 樣品收集:蜂蜜樣品來源于武漢市蜂產品質量工程控制技術研究中心,植物源屬性明確。其中,油菜蜜37例,荊條蜜36例,洋槐蜜13例,葵花蜜11例,共計97例,測試前于-20℃冷凍貯藏。
微波消解程序:設置微波消解儀最大工作功率1 500 W,在10 min內由室溫升溫至120℃,保持5 min;然后在10 min內由120℃升溫至180℃,保持20 min。
元素分析前處理:樣品分析前于水浴鍋內40℃恒溫水浴至樣品結晶完全融化,充分混勻后稱取約1 g(精確至0.001 g)樣品至聚四氟乙烯消解罐內,加入10.0 mL硝酸,放置過夜后于微波消解儀中按上述微波消解程序消解,消解完畢后145℃加熱趕酸至約1.0 mL消化液,轉移聚四氟乙烯罐中消化液至50 mL刻度離心管,用水多次洗滌聚四氟乙烯罐內壁,合并洗液至刻度離心管中,并定容至50 mL,待測。
參考GB 5009.268-2016《食品安全國家標準食品中多元素的測定》[12]中第一法(ICP-MS法)測定樣品中Na、Mg、Al、K、Ca、Ti、Cr、Mn、Ni、Cu、Zn、As、Se、Cd、Ba、Pb 16種元素,采用碰撞檢測模式消除Ca、Ti、As、Se元素的測定干擾,45Sc、72Ge、103Rh、185Re內標混合使用溶液由儀器在線加入,質量濃度均為200μg/L。
1.2.2 儀器測定條件 霧化器氣體流速0.96 L/min,輔助器氣體流速1 L/min,等離子體氣體流速17 L/min,碰撞池氣體流速(氦氣)5 mL/min,ICP射頻功率為1 500 W,脈沖電壓為875 V,掃描次數20次,重復次數2次,樣品沖洗時間13 s,讀數延遲7 s。
1.2.3 數據分析 方差分析采用SPSS Statistics 25.0(美國IBM公司)軟件,SVM算法優化和數據圖繪制采用Matlab 2014a(美國Mathworks公司)軟件。
對荊條、油菜、洋槐、葵花4種植物源蜂蜜中16種元素含量按“1.2”方法分析,97例蜂蜜樣品平行測定3次;連續測定11次空白(2.0%硝酸溶液),以儀器響應值的3倍標準偏差除以工作曲線斜率,按1.0 g試樣定容至50 mL計算得方法檢出限(LOD),結果見表1。
表1數據顯示,受植物源生長環境、蜂蜜樣品存儲條件等因素影響,部分樣品中Al、Ti、Cr、Ni、As、Se、Cd、Ba、Pb測試結果小于方法檢出限(Min

表1 4種不同植物源蜂蜜中16種金屬元素含量Table 1 Contents of metal elements in the four kinds of botanical source honeys (mg/kg,n=3)
支持向量機是Cortes等[13]基于統計學理論提出的一種新的核函數機器學習算法,在鑒別分類及回歸預測分析中應用廣泛[14-16]。數據處理采用Lin等[17]開發,李洋等[18]優化的LIBSVM工具箱建立SVM分類模型。首先選取合適的核函數類型,研究顯示,基于高斯徑向基函數(Gaussian radial basis function)的SVM模型表現出優秀的分類性能,且參數的優化過程簡單[19],因此本研究選擇高斯徑向基函數建立SVM分類模型。
2.2.1 樣品集的劃分 采用Kennard-Stone法將4種植物源蜂蜜共計97例樣品按2∶1劃分為訓練集和測試集[20],利用訓練集建立判別模型,并將測試集作為未知樣品代入模型檢驗,樣品集劃分如下:訓練集65例,其中荊條蜜24例,洋槐蜜9例,葵花蜜7例,油菜蜜25例;測試集32例,其中荊條蜜12例,洋槐蜜4例,葵花蜜4例,油菜蜜12例。
2.2.2 選擇輸入變量建立模型 通過單因素分析選出4種植物源蜂蜜間具有顯著性差異的13種元素Na、Mg、Al、K、Ca、Mn、Ni、Cu、Zn、As、Se、Ba、Pb,考慮截尾數據的存在,將輸入變量分為:①所有樣品均不含截尾數據的變量(7種):Na、Mg、K、Ca、Mn、Cu、Zn;②樣品中含截尾數據且按二分之一檢出限進行替換處理的數據變量(13種):Na、Mg、Al、K、Ca、Mn、Ni、Cu、Zn、As、Se、Ba、Pb。將訓練集和測試集數據標準化到[1,2]之間,尋優參數設置為默認參數(懲罰參數c為1,核函數參數g的默認值為1/k,k是類別數)[16],將訓練集進行K折交叉驗證(K=3),建立蜂蜜植物源SVM分類模型,將測試集代入模型驗證。判別結果表明,含截尾數據建立的SVM分類模型,其訓練集、測試集共計97例樣品的綜合判別正確率達91.8%,高于不含截尾數據所建模型的綜合判別正確率82.5%,表明客觀存在的截尾數據中同樣包含較為重要的樣品信息,在建立分類模型時,應充分考慮截尾數據,使用替換法按二分之一檢出限值處理,增加數據組輸入變量,以提高模型準確度。除葵花蜜在兩組變量輸入模型中判別正確率為100%外,其余植物源蜂蜜均存在歸類錯誤的情況。含截尾數據的訓練集中,65例樣品僅4例歸類錯誤,判別正確率達93.8%,而測試集中32例樣品的判別正確率僅為87.5%,可能由于樣品量較少,模型過擬合導致,因此,為進一步提高模型穩健性,有必要進一步優化SVM分類模型參數。
采用高斯徑向基核函數建立SVM模型時,懲罰參數c和核函數參數g對于控制模型的復雜度、逼近誤差及模型的測量精度有重要影響,可使用GS、GA、PSO算法對懲罰參數和核函數參數進行尋優分析[16]。GS法在log2c與log2g為[-8,8]區間尋優,GS法尋優結果見圖1A,隨著得到交叉驗證準確率的提高,log2c與log2g參數所形成的網格顏色由藍色變為黃色,搜索得最佳參數c=4.00,g=1.41,交叉驗證最佳正確率為90.8%,將其投影到二維平面得GS法尋優等高線圖(圖1B);設置種群數量為20,最大進化代數為50進行GA算法尋優,通過最佳適應度曲線發現,在迭代次數為0~15時,交叉驗證率不斷提高,20次迭代后達到最大值,最佳參數為c=5.10,g=1.86,交叉驗證正確率為90.8%(圖1C);設置種群數量為20,最大進化代數為100進行PSO算法尋優,經過80次迭代后交叉驗證正確率達最大值90.8%,最佳參數c=62.8,g=1.26(圖1D)。

圖1 SVM模型c、g參數尋優結果圖Fig.1 The parameter optimization results of c and gA:3D display of GS optimization results(GS尋優結果三維顯示);B:contour diagram of GS optimization results(GS尋優結果等高線圖);C:GA optimization results(GA尋優結果);D:PSO optimization results(PSO尋優結果)
將訓練集結合尋優參數建立SVM分類模型,并利用測試集進行驗證,結果見表2。3種尋優算法建立的SVM分類模型綜合判別正確率均有一定程度的提高,其中,采用PSO算法進行參數尋優后模型識別效果提升最為顯著,訓練集判別正確率為100%(圖2A),測試集有3例分類錯誤(圖2B),1例荊條蜜(分類標簽1)錯誤分類至油菜蜜(分類標簽4)中,1例洋槐蜜(分類標簽2)錯誤分類至荊條蜜中,1例油菜蜜分類至荊條蜜中,判別正確率為90.6%,且訓練集、測試集綜合判別正確率由91.8%提升至96.9%。

表2 優化參數SVM模型分類結果Table 2 Model classification results of SVM by parameter optimization

圖2 PSO-SVM分類標簽和真實標簽圖Fig.2 PSO-SVM classification label and the actual labelA:training set(訓練集);B:testing set(測試集)
本文基于荊條、洋槐、葵花、油菜4種植物源蜂蜜中13種顯著差異性金屬元素,結合替換法處理的截尾數據,有效建立了SVM蜂蜜植物源鑒別模型。方差分析結果表明,4種不同植物源蜂蜜中Na、Mg、Al、K、Ca、Mn、Ni、Cu、Zn、As、Se、Ba、Pb存在顯著性差異;采用替換法處理的截尾數據作為輸入變量較不含截尾數據的SVM分類模型識別率高;利用PSO算法參數尋優后建立的SVM判別模型對97例蜂蜜植物源屬性的綜合判別正確率達96.9%,可為食品屬性鑒別提供有益思路。