





摘要:利用混合蛙跳算法(SFLA)對最小二乘支持向量機(LSSVM)的參數進行優化,建立了一種基于混合蛙跳算法和最小二乘支持向量機的芹菜總黃酮提取預測模型。仿真結果表明,該預測模型提高了預測精度,性能更加穩定,為芹菜總黃酮提取的在線預估和優化控制提供了可靠的技術參考。
關鍵詞:芹菜;混合蛙跳算法;最小二乘支持向量機;總黃酮;預測
中圖分類號:TP301 文獻標識碼:A 文章編號:0439-8114(2015)06-1486-04
DOI:10.14088/j.cnki.issn0439-8114.2015.06.053
Abstract: Shuffled frog leaping algorithm (SFLA) was used to parameters of optimize least square support vector machine (LSSVM). The prediction model of extracting total flavonoids from celery based on shuffled frog leaping algorithm and least squares support vector machine was established. Simulation results showed that this prediction method had high accuracy and stable performance. It was conducive to achieve online estimation and optimal control.
Key words: celery;artificial bee colony algorithm; least squares support vector machines; total flavonoids; prediction
黃酮類化合物是一類存在于植物中的天然產物,屬于植物的次級代謝產物。現代醫學研究發現,芹菜的莖葉中含有豐富的黃酮類物質,其具有清除自由基、抗氧化、抑菌、抗病毒、抗癌和抗腫瘤等作用[1,2]。從芹菜中提取黃酮類物質,以開發新型天然黃酮類藥物為目標,促進芹菜的深加工,已成為資源高效利用的研究熱點[3,4]。
目前,對芹菜總黃酮的提取主要采用堿液法、微波法、超聲波法等,而對芹菜中總黃酮含量的測定,大多采用分光光度法、光譜法等方法。這些傳統的提取和測定方法容易受到人為操作及環境變化等不可預見性因素的影響,造成數據準確性降低。采用軟件方法實現芹菜總黃酮提取量的預測是解決此類生物量參數難以準確實時測量和控制的有效方法[5]。近年來,神經網絡、支持向量機等預測方法成為當前研究的熱點[6-8]。其中,神經網絡對訓練樣本數據要求高,對于小樣本數據應用受到一定限制;支持向量機適用于非線性小樣本數據,但泛化能力有限,對于異常樣本預測偏差較大。
本研究采用改進的混合蛙跳算法對最小二乘支持向量機的參數進行優化建模[9,10],避免了算法過早收斂陷入局部最優,提高了模型的預測精度,實現了芹菜總黃酮提取量的快速準確預測,為芹菜資源的高值化利用提供了技術支撐。
1 算法基礎
1.1 最小二乘支持向量機
最小二乘支持向量機(LSSVM)對支持向量機(SVM)進行了改進[11],很好地解決了小樣本、非線性和高維數的問題,提高了求解速度和泛化能力。將非線性問題轉化為高維特征空間的線性估計問題,構建了如下回歸函數:
其中,?滓為核寬度,對于最小二乘支持向量機,核寬度?滓和正規化參數?酌是其重要的兩個參數,它們的選取直接影響著算法的學習能力和泛化性能。
1.2 SFLA算法的改進
1.2.1 SFLA算法的種群初始化改進策略 由于標準SFLA算法采用隨機方式產生初始種群,導致個體分布缺乏均勻性,影響了種群的多樣性,算法的求解效率也受到限制。因此,在種群初始化階段,引入反向學習策略,確保初始種群具有多樣性,主要步驟如下所示:
1)隨機生成初始解,用集合形式表示解集為:
x=xij|xij∈[minj,maxj],其中j=1,minj,maxj分別為第j維的下界和上界。
2)計算每個初始解對應的反向解,公式如下所示:
其中,?孜為變異因子,N(0,1)為均值為0、方差為1的隨機量。
2 芹菜總黃酮含量的測定和預測建模
2.1 芹菜總黃酮含量的測定
將芹菜原料進行低溫烘干粉碎后,稱取芹菜干粉1.00 g于50 mL錐形瓶中,加入一定量的乙醇浸泡,然后將浸泡好的溶液進行超聲波提取,提取完成后抽濾、定容,作為待測液備用。取上述樣品液2.0 mL并以30%乙醇定容至5 mL,加入0.3 mL 15%NaNO2搖勻靜置6 min,再加入0.3 mL 10% Al(NO3)3,搖勻靜置6 min后加入4 mL 1 mol/L NaOH,再用蒸餾水定容,搖勻靜置15 min后測定吸光度。根據吸光度由下式計算樣品液中的總黃酮含量:
式中,m為總黃酮含量(mg/g);C為溶液中總黃酮的測定濃度(mg/mL);V1為芹菜總黃酮提取液總體積(mL);W為芹菜干粉質量(g);V為所取待測液體積(mL)。
2.2 預測模型的構建
采用紫外分光光度法測定芹菜總黃酮含量,測定過程復雜、時間長,制約了芹菜總黃酮的生產應用。因此,構建芹菜總黃酮含量的預測模型,減少測定次數,對實現在線實時預測尤為必要。基于SFLA和LSSVM的芹菜總黃酮含量預測步驟如下:
1)對芹菜總黃酮提取試驗中的數據進行歸一化處理;
2)參數初始化,設置蛙群個體總數、迭代總次數、子群數、每個子群內的蛙數、子群內的更新次數、變異因子及最大、最小變異概率;
3)按式(5)反向學習策略構建初始種群;
4)計算每只青蛙適應度值后按降序排序,并分成k個子群;
5)確定每個子群的最優解和最差解及群體全局最優解,反復更新每個子群的最差青蛙,直至達到設定的子群迭代總次數后,將更新后的子群進行混合,取代原來的群體;
6)按式(6)和式(7)計算群體的適應度方差,再按式(8)計算變異概率,并按式(9)對全局最優解進行變異操作,更新當前群體最優解;
7)當迭代次數達到設定的最大次數,則停止計算,輸出最優解,否則轉到第4步;
8)根據最優解優化LSSVM的參數,構建預測模型,并對測試數據集進行仿真和測試。
3 預測模型的應用
在芹菜總黃酮提取試驗中,設置了5種料液比(1∶10、1∶20、1∶30、1∶40、1∶50,m/V)、5種乙醇體積分數(0、60%、70%、80%、90%)和5個提取時間(10、20、30、40、50 min)條件,進行了芹菜總黃酮含量測定試驗。將上述試驗所得的24個數據作為樣本數據,在數據歸一化之后,選取前16個試驗樣本數據作為訓練樣本數據,構建基于SFLA和LSSVM的預測模型;再用后11個樣本數據作為測試數據,對該模型進行驗證。作為訓練樣本數據的16個原始樣本數據如表1所示。
在預測仿真試驗中,計算機配置為聯想雙核E5800@3.2 GHz,2 G內存,Windows XP操作系統,測試環境為Matlab 7.0。采用改進的混合蛙跳算法優化最小二乘支持向量機得到的最優化參數值為:核寬度σ=9.257 1,正規化參數γ=4.453 578。將基于SFLA和LSSVM的預測模型所得仿真數據與實際測量數據進行比較,其比較結果如表2所示。
由表2可以看出,基于SFLA和LSSVM的芹菜總黃酮含量預測模型得到的仿真數據與實測數據的最大相對誤差為4.49%,最小相對誤差為0.20%,平均相對誤差為2.12%。實測數據與仿真數據的對比如圖1所示。
為了更直觀地描述模型估計值與實際測試值的相對誤差情況,采用如圖2所示的相對誤差曲線圖。圖3為基于SFLA和LSSVM的芹菜總黃酮含量預測模型的進化曲線,所采用預測模型的收斂速度快、精度高、性能穩定。
4 小結
本研究提出了一種基于SFLA優化的LSSVM芹菜總黃酮預測模型,該模型在混合蛙跳算法的初始化階段引入反向學習策略,確保了個體分布的均勻性,同時為了避免算法陷入局部最優,根據適應度方差,動態調整蛙群的變異概率,提高了預測的精度和收斂速度,性能穩定。仿真試驗結果表明,該預測模型可以應用于芹菜總黃酮含量的在線測量,對芹菜黃酮類化合物的測定有著重要的應用價值。
參考文獻:
[1] 趙 進,尤婷婷,林丹英.超聲波提取芹菜總黃酮及鑒別[J].時珍國醫國藥,2007,18(6):1454-1455.
[2] 文開新,王成章.黃酮類化合物生物學活性研究進展[J].草業科學,2010,27(6):115-122.
[3] 包麗芹,韓德權.芹菜及芹菜黃酮的藥用價值[J].黑龍江醫藥, 2007,20(4):317-320.
[4] 陳欲云,劉春麗,邊名鴻.芹菜黃酮抗氧化作用的研究[J].時珍國醫國藥,2012,23(7):1718-1719.
[5] 俞金壽.軟測量技術及其應用[J].自動化儀表,2008,29(1):1-7.
[6] 袁 琦,黃建清,符 新.基于神經網絡的水產養殖水質預測模型研究[J].湖北農業科學,2013,52(1):143-146.
[7] 高丙朋,姜 波,南新元.基于LS-SVM的番茄產量在線預測[J].湖北農業科學,2012,51(5):1025-1027.
[8] 楊 瑋,孫 紅,鄭立華.基于土壤參數的冬小麥產量預測模型[J].農業工程學報,2013,29(23):118-123.
[9] 秦 業,袁海文,袁海斌,等.基于優化最小二乘支持向量機的電能質量擾動分類[J].電工技術學報,2012,27(8):209-214.
[10] EUSUFF M M,LANSEY K E. Optimization of water distribution network design using the shuffled frog leaping algorithm[J]. Water Resources Planning and Management,2003,129(3): 210-225.
[11] 陶新民,徐 晶,楊立標,等.一種改進的粒子群和K均值混合聚類算法[J].電子與信息學報,2010,32(1):92-97.