徐 利,周麗偉,郭文強,張亞萍,陳 彥,*(.安徽大學生命科學學院,安徽 合肥 3060;.安徽農業大學茶與食品科技學院,安徽 合肥 30036)
基于支持向量機-遺傳算法灰樹花發酵模型的建立及優化
徐 利1,周麗偉2,郭文強1,張亞萍1,陳 彥1,*
(1.安徽大學生命科學學院,安徽 合肥 230601;2.安徽農業大學茶與食品科技學院,安徽 合肥 230036)
對食用藥用真菌灰樹花發酵進行建模,獲得使目標發酵產物達到最大產量的培養條件。運用支持向量機(support vector machine,SVM)方法進行非線性擬合,并采用遺傳算法預測優化培養基成分,結果表明其能夠較好預測灰樹花發酵過程。運用此方法可在灰樹花發酵生產過程中根據所需產物控制發酵條件與時間,具有較高指導意義。
支持向量機;遺傳算法;發酵模型;灰樹花
徐利, 周麗偉, 郭文強, 等. 基于支持向量機-遺傳算法灰樹花發酵模型的建立及優化[J]. 食品科學, 2016, 37(11): 143-146. DOI:10.7506/spkx1002-6630-201611025. http://www.spkx.net.cn
XU Li, ZHOU Liwei, GUO Wenqiang, et al. Establishment and optimization of a predictive model for the growth and exopolysaccharide production of Grifola frondosa based on support vector machine and genetic algorithm[J]. Food Science, 2016, 37(11): 143-146. (in Chinese with English abstract) DOI:10.7506/spkx1002-6630-201611025. http://www.spkx.net.cn
支持向量機(support vector machine,SVM)是一種機器學習方法,由于SVM非線性擬合很強,且運算時收斂到全局最優解、處理小樣本時的泛化性能相對較好等優點,被廣泛應用于數學建模、智能控制等領域且使這些領域取得巨大的進展[1-3]。遺傳算法來源于進化論、物種選擇學說和群體遺傳學說,是模擬生物進化過程與機制解決極值問題的一種自組織、自適應人工智能算法[4]。其以高效、自適應及全局搜索的優勢得到廣泛應用。
灰樹花(Grifola frondosa)是珍稀食藥兩用真菌[5]。灰樹花多糖具有抗腫瘤等多種活性[6-10],其中灰樹花多糖D組分更是被美國食品和藥物管理局(Food and Drug Administration,FDA)批準直接進入二期臨床。液體發酵菌絲體與子實體藥用效果相當,且生產周期短、不受氣候和季節的限制、產品質量穩定、便于工業化放大生產等優點而日益受到人們的重視[11-13]。目前研究多偏重單獨進行培養條件優化或單獨進行發酵動力學研究,利用實驗數據建立指標與因素間的回歸方程,但是其模型粗糙,很難說明指標與因素之間的非線性關系,誤差大且不能預測發酵結果[14-17]。而本實驗所用方法則能夠有效克服以上缺點,使用SVM法建立模型,通過遺傳算法對SVM模型進行全局訓練,得到最佳方案,可以預測真菌液體發酵過程不同時間的產量,預測生物量的合成。
1.1 菌種、培養基與試劑
菌種灰樹花(Grifola frondosa)購自中國普通微生物菌種保藏管理中心;馬鈴薯為市售。
基礎培養基組成為每1 L培養基含蛋白胨5 g、葡萄糖30 g、MgSO4·7H2O 1.5 g、KH2PO43 g、VB11 mg。
葡萄糖、磷酸二氫鉀、七水硫酸鎂、VB1、苯酚、濃硫酸、氫氧化鈉、亞硫酸鈉、馬鈴薯淀粉、蛋白胨國藥化學試劑有限公司;3,5-二硝基水楊酸 天津市光復精細化工研究所;酒石酸鉀 上海埃彼化學試劑有限公司;以上試劑均為國產分析純。
1.2 儀器與設備
MLS-3750滅菌鍋 日本Sanyo公司;BCD-285WNMVS冰箱 韓國Samsung公司;電熱恒溫鼓風干燥箱 上海一恒科技有限公司;UV5100B紫外-可見光分光光度計 上海元析儀器有限公司;RE-52旋轉蒸發器 東京理化器械公司;TE612-L電子天平 北京賽多利斯儀器系統有限公司;ZHWY-2102C搖床 上海智城分析儀器制造有限公司。
1.3 方法
1.3.1 搖瓶發酵培養
將發酵培養基裝入搖瓶后滅菌備用,參考文獻[18]設計UL25(56)正交試驗,從液體種子搖瓶中以10%接種量接種在發酵培養基中,置于搖床中200 r/min、25 ℃條件下培養8 d,培養結束后測定胞外多糖生成量、菌絲體干質量等指標[19-20]。
1.3.2 模型測試集與模型驗證集的獲得
在考察因素的水平取值范圍內,使用Matlab內置的隨機數生成函數隨機生成2 組驗證實驗表格,并將其轉變成與UL25(56)正交試驗設計表編碼一致的形式。
函數調用:

按上述方法生成的Ttest與Tval安排發酵實驗,用于SVM模型的測試和驗證。
1.3.3 SVM模型的建立
參考楊海龍等[21]所述培養條件并稍作修改,以UL25(56)實驗中馬鈴薯淀粉添加量、VB1添加量、葡萄糖添加量、裝液量添加量的編碼值,以及時間編碼值的n 次冪,作為SVM的輸入變量,以菌絲體干質量、胞外多糖生成量2 個實驗值作為擬合目標變量Y1、Y2。使用Matlab平臺下的LS-SVM工具包訓練模型,n值為1~5以步長0.05變化,計算不同n值下所得模型對Ttest測試集預測的均方根誤差,通過枚舉尋找最優建模參數[22-23]。使均方根誤差(root mean square error,RMSE)最小的n值將被選擇用于模型訓練。
1.3.4 優化模型的預測精度
優化結果所述n值n_jst,n_bwt,對應得到2 個優化后模型OM_JST(預測菌絲體干質量)、OM_BWT(預測胞外多糖生成量)。繪制上述2 個優化模型對驗證集實驗值的擬合曲線,觀察模型預測效果,并比較2 種模型優化后對驗證集實驗值預測的均方根誤差。
1.4 遺傳算法優化發酵條件[24]
采用浮點編碼方式對發酵過程中馬鈴薯淀粉添加量、VB1添加量、葡萄糖添加量、裝液量、發酵時間5 個因素在其各自取值范圍內進行SVM模擬推算,并以模型擬合值作為遺傳算法的適應性函數,進行選擇、變異、交換操作。菌絲體干質量與胞外多糖量生成量越高,則適應度越高。程序通過Matlab 7.6軟件和其附帶的遺傳算法工具箱編寫完成。
2.1 正交試驗結果

表1 UL25(56)正交試驗設計及結果Table 1 UL 1 UL2525(5 (56) design and corresponding experimental results
灰樹花發酵是時間累積過程,在灰樹花正常培養范圍內,發酵時間對發酵的影響要遠高于其他因素,在此處如對該正交試驗(表1)進行方差分析,時間所造成的考察目標的變差將極有可能影響其他因素的顯著性分析,故在變量選擇中選取時間變量的n 次冪較為可行[25]。
2.2 SVM模型訓練與優化
以表1中的試驗數據作為SVM的訓練樣本,gam、sig2通過tunelssvm函數搜索獲得,alpha、b通過trainlssvm函數確定,根據試驗因素的個數和優化指標的個數設計SVM的結果,然后用試驗數據對SVM進行訓練。圖1反映了n值變化時,建立的SVM模型對測試集菌絲體干質量和胞外多糖生成量這2 個試驗值預測的均方根誤差大小。Matlab中記錄的n值最優結果為:菌絲體干質量最優n=2.10,胞外多糖生成量最優n=2.05。

圖1 歸一化的不同n值所得模型對測試集的RRMMSSEEFig. 1 Predicted root-mean-square error (RMSE) using the normalized models obtained from different n-values

圖2 SVM模型對驗證集胞外多糖生成量(a)和菌絲體干質量(b)的預測情況Fig. 2 Prediction of EPS production (a) and dry mycelial biomass (b) for validation set using SVM model
由圖2可知,在n值分別為2.05與2.10時,胞外多糖生成量和菌絲體產量模型模擬結果與試驗值的擬合度較好,兩者之間的相對誤差在5%以內,說明建立的SVM性能良好。由圖2還可知,當n值取1時,與實際過程存在極大差距,當把n的權重分別增加為n=2.10、n=2.05時,預測值與實際值接近,模型對菌絲體干質量、胞外多糖生成量等的預測能力較好,經計算其RMSE分別為0.421和0.139。
2.3 遺傳算法對發酵條件的優化
2.3.1 發酵周期內目標產物的日產出速率的優化

圖3 發酵物平均日產出速率的遺傳算法優化過程Fig. 3 Optimal generation determined using genetic algorithm for average daily production rate of mycelia and EPS
運用遺傳算法如圖3所示,在遺傳至53 代時,得到使每日平均產出菌絲體最多的發酵條件:馬鈴薯淀粉添加量51.68 g/L、VB1添加量1.50 mg/L、葡萄糖添加量5.00 g/L、裝液量112.80 mL、發酵時間6.28 d,菌絲體平均產出速率預測為3.67 g/(L·d)。以胞外多糖平均產出速率作為優化指標,遺傳算法運算至57 代時,產出胞外多糖最大為:0.45 g/(L·d),對應發酵條件:馬鈴薯淀粉添加量47.41 g/L、VB1添加量1.50 mg/L、葡萄糖添加量5.00 g/L、裝液量101.43 g/L、發酵培養5.54 d。
按上述2 組優化條件設置驗證實驗,重復3 次,最優菌絲體產出速率對應條件下菌絲體產率平均為20.27 g/L,故每天產出3.23 g/L,與預測值基本一致;最優化胞外多糖產出速率對應條件下胞外多糖產量平均值為2.45 g/L,每天平均產出量為0.44 g/L,證明運用遺傳算法可以很好地優化模型條件,當SVM與遺傳算法相結合使用時,則可以較好地實現對發酵條件的優化與產物的預測。
2.3.2 不同發酵時間下目標產物的優化
分別將培養時間固定在1~8 d,以最大菌絲體干質量為最優適應度函數,使用遺傳算法得到了最佳培養條件,以及菌絲體最高產量,結果如表2所示。前6 d菌絲體干質量迅速積累,之后菌絲體干質量變化趨于水平,符合其生長曲線,綜合考慮以培養時間為6 d最佳。

表2 不同發酵時間下菌絲體干質量的優化Table 2 Optimization of culture conditions for mycelium production at different fermentation times
分別將發酵時間固定在1~8 d,以最大胞外多糖生成量為最優適應度函數,使用遺傳算法得到了最佳培養條件、以及胞外多糖最高產量,結果如表3所示。

表3 不同發酵時間下胞外多糖生成量的優化Table 3 Optimization of culture conditions for EPS production at different fermentation times
按上述各組優化條件設置驗證實驗,重復3 次,所得各組數據與預測值相接近,證明優化與預測結果可行,模型擬合良好,SVM-遺傳算法能夠在發酵控制中良好運用。
灰樹花在液體發酵培養的過程是復雜且非線性,本實驗成功運用SVM聯合遺傳算法預測灰樹花發酵培養基與生物量的關系及得到最佳生物量的培養條件。另外,在建立SVM預測模型時,證明了采用冪函數方法對提高模型中某個因素的權重,以提高模型預測能力的方法是可行的。SVM-遺傳算法不僅能有效地預測生物量,極大降低培養成本,而且可以大大減少實驗工作量,縮短研究周期,與傳統固定培養時間方法相比具有更明確的指導意義,同時也為建立與優化其他真菌發酵模型提供了借鑒。
[1] HEIKAMP K, BAJORATH J. Support vector machines for drug discovery[J]. Expert Opinion on Drug Discovery, 2014, 9(1): 93-104. DOI:10.1517/17460441.2014.866943.
[2] LI G Q, WEN C Y, LI Z G, et al. Model-based online learning with kernels[J]. IEEE Transactions on Neural Networks and Learning Systems, 2013, 24(3): 356-369. DOI:10.1109/TNNLS.2012.2229293.
[3] NEGRI R G, DUTRA L V, SANT’ANNA S J S. An innovative support vector machine based method for contextual image classification[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2014, 87: 241-248. DOI:10.1016/j.isprsjprs.2013.11.004.
[4] 張文修, 梁怡. 遺傳算法的數學基礎[M]. 西安: 西安交通大學出版社, 2000: 2-3.
[5] 崔鳳杰. 灰樹花深層發酵條件優化及其菌絲體抗腫瘤糖肽的研究[D].無錫: 江南大學, 2006.
[6] SHIH L, CHOU B W, CHEN C C, et al. Study of mycelial growth and bioactive polysaccharide production in batch and fedbatch culture of Grifola frondoa[J]. Bioresource Technology, 2008, 99(4): 785-793. DOI:10.1016/j.biortech.2007.01.030.
[7] MIZUNO T, OHSAWA K, HAGIWARA N, et al. Fractionation and characterization of antitumor polysaccharides from Maitake, Grifola frondosa[J]. Agricultural and Biological Chemistry, 1986, 50(7): 1679-1688. DOI:10.1080/00021369.1986.10867644.
[8] 李小定, 吳謀成, 曾曉波, 等. 灰樹花多糖PGF-1對荷瘤小鼠免疫功能的影響[J]. 華中農業大學學報, 2002, 21(3): 261-263. DOI:10.13300/j.cnki.hnlkxb.2002.03.016.
[9] KUBO K, NANBA H. Anti-hyperliposis effect of maitake fruit body (Grifola frondosa). I[J]. Biological and Pharmaceutical Bulletin, 1997, 20(7): 781-785. DOI:10.1248/bpb.20.781.
[10] KUBO K, AOKI H, NANBA H. Anti-diabetic activity present in the fruit body of Grifola frondosa (Maitake). I[J]. Biological and Pharmaceutical Bulletin, 1994, 17(8): 1106-1110. DOI:10.1248/ bpb.17.1106.
[11] 李悅, 薛橋麗, 李世俊, 等. 響應面法優化小刺青霉16-7產纖維素酶液體發酵工藝[J]. 食品科學, 2014, 35(17): 137-145. DOI:10.7506/ spkx1002-6630-201417028.
[12] 趙俊杰. 香菇液體發酵及多糖提取工藝研究[D]. 鄭州: 鄭州大學, 2014.
[13] 葉文姣. 蛹蟲草多糖的發酵條件優化、結構及抗氧化活性研究[D].武漢: 華中農業大學, 2014.
[14] CHIMILOVSKI J S, HABU S, TEIXEIRA R F B, et al. Antitumour activity of Grifola frondosa exopolysaccharides produced by submerged fermentation using sugar cane and soy molasses as carbon sources[J]. Food Technology and Biotechnology, 2011, 49(3): 359-363.
[15] 鄧功成, 趙洪, 高禮安, 等. 灰樹花菌絲體液體發酵條件優化[J]. 江蘇農業科學, 2013, 41(9): 216-218. DOI:10.3969/ j.issn.1002-1302.2013.09.086.
[16] 武秋立, 安家彥. 羊肚菌胞外多糖發酵動力學模型[J]. 南開大學學報, 2005, 38(1): 44-48. DOI:10.3969/j.issn.0465-7942.2005.01.008.
[17] 方俊濤. 響應曲面方法中試驗設計與模型估計的比較研究[D]. 天津: 天津大學, 2011.
[18] 盧春曉, 吳朝霞, 徐亞平, 等. 響應面法優化黑豆皮花色苷提取工藝的研究[J]. 食品研究與開發, 2012, 33(9): 69-73.
[19] 顧廣州. 灰樹花深層發酵多糖、提取純化及抗氧化作用研究[D]. 揚州: 揚州大學, 2010.
[20] 張維杰. 糖復合物生化研究技術[M]. 2版. 杭州: 浙江大學出版社, 1999: 10-11.
[21] 楊海龍, 活潑, 肖彩霞, 等. 藥用真菌深層發酵生產技術[M]. 北京:化學工業出版社, 2009: 140-148.
[22] 黃煒, 黃志華. 一種基于遺傳算法和SVM的特征選擇[J]. 計算機技術與發展, 2010, 20(6): 21-24. DOI:10.3969/j.issn.1673-629X.2010.06.006.
[23] 郭新辰. 最小二乘支持向量機算法及應用研究[D]. 吉林: 吉林大學, 2008.
[24] 雷英杰. MATLAB遺傳算法工具箱及應用[M]. 西安: 西安電子科技大學出版社, 2005: 146-207.
[25] 熊偉麗, 王肖, 陳敏芳, 等. 基于加權LS-SVM的青霉素發酵過程建模[J]. 化工學報, 2012, 63(9): 2913-2919. DOI:10.3969/ j.issn.0438-1157.2012.09.038.
Establishment and Optimization of a Predictive Model for the Growth and Exopolysaccharide Production of Grifola frondosa Based on Support Vector Machine and Genetic Algorithm
XU Li1, ZHOU Liwei2, GUO Wenqiang1, ZHANG Yaping1, CHEN Yan1,*
(1. School of Life Science, Anhui University, Hefei 230601, China; 2. School of Tea and Food Science, Anhui Agricultural University, Hefei 230036, China)
To obtain the best medium constituents and culture conditions for maximum production of exopolysaccharides (EPS) by Grifola frondosa, nonlinear fitting was done using support vector machine (SVM) and the response variables, EPS production and mycelial biomass, were predicted using genetic algorithm. The results showed that the nonlinear model performed well in predicting the growth and EPS production of Grifola frondosa. The approach proposed in this study can provide a signifi cant guideline to control culture conditions and time for the production of desired products by Grifola frondosa.
support vector machine (SVM); genetic algorithm; fermentation model; Grifola frondosa
10.7506/spkx1002-6630-201611025
Q815
A
2015-05-05
安徽大學現代生物制造協同中心開放課題(20150455);安徽大學重點教學研究項目(ZLT52015038)
徐利(1990—),男,碩士研究生,研究方向為天然產物提取純化與發酵工程。E-mail:richuriluoxl@163.com
*通信作者:陳彥(1963—),男,教授,博士,研究方向為糖分子生物學與糖工程。E-mail:chenyan600@163.com