蘇玉玲,劉雯,田波,*,馮志彪
(1、東北農業大學食品學院,黑龍江哈爾濱 150030;2、東北農業大學理學院,黑龍江哈爾濱 150030)
乳清蛋白營養價值極高,是國際上公認的人體最優質蛋白質補充劑之一[1]。其不僅容易消化,且具有較高的生物活性。大量研究表明,通過酶解乳清蛋白,不僅可以改善其功能特性,且在水解過程中能釋放許多有著特殊生物活性的肽段。因此,有目的地控制乳清蛋白的水解進程,可獲得不同分子量的小肽,對于開拓乳清蛋白的應用具有重要意義[2]。
蛋白質的水解度(Degree of hydrolysis, DH)是衡量蛋白質水解程度的一個重要指標[3]和重要性狀參數,用于評價蛋白肽腱的斷裂的情況以及肽的平均分子量的變換。蛋白的水解程度與蛋白功能特性的改善或是釋放出某種生理功能的生物活性肽有很大關系。在實際應用過程中所有的水解并非要達到最大的水解度最有益,有限水解對改善含蛋白質體系質構特征的加工藝技術的研究有著較大的實用意 義。張雅麗[3]等人對大豆蛋白芝麻蛋白的合成類蛋白質研究中指出最佳的底物為水解度為 80%水解物,并非最大的水解度 90%的水解物。劉佳[4]也在大豆蛋白ACE抑制肽的研究中得出:水解度與ACE抑制活性之間存在一定的對應關系,水解度的較低和較高都會降低ACE的抑制活性。彭新顏[5]也指出,并不是水解度越大,所得產物的抗氧化效果越好,而是只有在特定的水解度下,水解物具有最大的抗氧化能力。因此,為了優化操作,縮短試驗時間,便于試驗條件選擇,需要對有限水解過程進行模型化研究。
神經網絡(Artificial neural networks,ANNs),是一種仿效腦的神經網絡行為特征的數據分析方法。神經網絡以神經元陣列來模擬生物體學習和記憶的方式,通過改變網絡的突觸鏈接點的連接關系對信息進行編碼。ANNs應用于一個實際問題通常需要五個步驟,在每個步驟中,研究者必須要選擇適當的網絡參數[6,7]。每個步驟的選擇都基于經驗以及現存的指導準則和應用實例。第一步,對于網絡拓撲結構和每層的神經元數量的選擇[8,9]。第二步,為隱藏的神經元選擇變換算符[6]。第三步是初始分配的權重。第四步是訓練過程,最常見的訓練技術是反向傳播技術。最后,是利用未被用于訓練的數據(測試集)檢驗所建立的神經網絡的效果。測試結果也可以預測網絡運行過程和監測系統的效力[7]。
ANNs的特點不僅可以處理嘈雜、不完整的數據和非線性問題,也可以在訓練過程之后立即進行預測和歸納[8]。即使反應的機理不明確這種技術仍可以準確預測[10,11];ANNs優于其他模型之處還在于可以一邊辨識網絡構造參數,一邊學習和適應樣本。在食品科學研究中,ANNs用于估計預測食品性質和加工中相關的因素,例如葡萄糖淀粉酶對淀粉的水解模型,酶失活的動力學模型,利用視覺技術及氣味分辨技術評價食品質量、品質等[12-14]。本實驗的研究目標是建立堿性蛋白酶促乳清分離蛋白水解的ANNs預測模型。
Alcalase堿性蛋白酶 丹麥NOVO公司;乳清分離蛋白WPI 美國HILMAR公司。
PHS-3C型pH計 上海雷磁儀器廠;磁力加熱攪拌器 杭州儀表電機廠。
稱取一定量的乳清蛋白,加入蒸餾水中,攪拌均勻,80℃加熱10min,作為儲備液。儲備液在恒溫磁力水浴鍋50℃水浴,加酸(HCl)或堿(NaOH)達到預定的pH值,加入試驗設計量的 Alcalase酶進行水解,水解時間為試驗設計的時間。水解過程保持不斷地攪拌,加入NaOH以維持pH值的變化在規定范圍的±0.05內,達到預定時間后,加入2mol·L-1HCl調節pH值至4.0,使未水解的蛋白沉淀下來,100℃水浴15min對酶進行滅活,然后迅速冷卻至室溫,置于離心機中,以4000r·min-1離心20min,分離出上清液[15]。
水解過程中通過從滴定管中連續的添加少量1mol·L-1NaOH保持pH為試驗設定值。添加量如下:第一次是水解5min后,隨后在120min內每次間隔10min,120min后每次間隔20min。水解度計算公式為[16]:

式中,B為NaOH用量(mL);
NB是NaOH的標定濃度(mol·L-1);
α是α-氨基基團的平均離解度;
MP是水解蛋白的質量(g);
htot是蛋白質總肽鍵數.
正交表L25(56)設計試驗,取四個主要因素pH值、酶用量、底物濃度、水解時間,每個因素設為五個水平,設一個誤差列考察試驗誤差,列出影響因素與水平表1,每個試驗重復三次。用Excel對正交試驗結果進行分析。

表1 L25(56)的影響因素與水平Table 1 Factors and levels of orthogonal experiment
在正交試驗的基礎上,對正交試驗所得到的的25組數據和驗證組7組數據,總計32組數據,使用Matlab的nnet工具包中的nftool建一個神經模型。實驗相關參數設定如下:一般屬性為 4個, 分別是乳清蛋白水解的pH值、酶用量、底物濃度、水解時間, 目標屬性是水解度(DH/%);將數據集隨機的分為三組:訓練集、測試集和驗證集(80%,10%,10%);在訓練過程中設定隱含層節點數為15。由于nftool包的初始值為隨機值,因此每次擬合的效果有一定的隨機性,因此需要多擬合幾次,從中選擇效果較好的擬合曲線作為訓練出的網絡。
根據表 1 的因素和水平進行正交實驗設計,按照設計的實驗點進行實驗,測得各因素水平組合下的水解度(DH),結果見表 2,結果進行3 次重復。

表2 正交試驗結果Table 2 Results of orthogonal test
預測乳清蛋白水解過程,采用擬動力神經網絡,見圖1。為了提高網絡模型性能,選用兩步反向結構,這種結構被用于神經網絡已經有很長的歷史了。本實驗設置了15個隱藏神經元,選用Levenberg-Marquardt訓練算法(8個訓練元;訓練過程從隨機初始權重值開始,并被重復 100次,以獲得最佳的解決方案)[17],采用隨機分配的權重值,本實驗數據庫中包含32個數據用于神經網絡模型訓練。

圖1 人工神經網絡的通用結構Fig.1 The general structure of applied neural model
誤差直方圖如圖2所示,縱坐標代表樣本點個數,橫坐標代表誤差區間。各樣本點與零誤差線之間差距代表樣本點與預測值之間的誤差。可見絕大多數樣本點分布在零誤差線的區間內。而由測試集的分布可知,首先,測試集樣本點在零誤差線左右都有分布,說明誤差分布均勻;再次,測試集有四個點分布在(±1.000)的范圍內。說明測試集中的樣本點與預測所得輸出值之間誤差較小,說明預測效果良好,數據基本分布在擬合的曲線附近。

圖2 誤差分布直方圖Fig.2 Error Histogram
人工神經網絡訓練乳清蛋白水解模型其擬合回歸系數R-value,表現輸出數據與目標數據之間的相關狀況。圖3可知,Training、Test與All圖中R-value分別為0.98536、0.96239和0.97995,圖中實線為擬合效果曲線,與R-value =1的標準曲線基本吻合,斜率接近45°,測試點和樣品點均勻的分布在擬合曲線附近,因此說明此模型具有較好的訓練效果、預測能力和整體擬合效果。Validation圖中R=1,說明當前設置的參數下,擬合結果隨機驗證效果優良。對于訓練數據,不僅相關系數據在0.9600~0.9999范圍內,而且該模型是在實驗數據的基礎上得到的,總是包含噪聲,例如測量誤差等。因此我們可以認為本實驗所建立的人工神經網絡的水解模型能夠準確地預測實驗結果。

圖3 擬合回歸及驗證測試圖Fig.3 Plotregression and verification figure
訓練好的網絡經過驗證可以判定其效果,5組數據的預測結果見表3。

表3 預測結果對比表Table 3 Comparison of prediction results to target
由表3可得,輸入的5組測試樣品與網絡輸出值之間的最大誤差不超過3%,說明神經網絡預測模型具有較高的預測能力和精度,模型可用于對水解程度的預測,對堿性蛋白酶有限水解乳清蛋白具有指導意義。
本實驗在正交試驗所得數據的基礎上,選用3層人工神經網絡,設置了15個隱藏神經元,選用ANN神經網絡方法建立了水解模型,迭代計算后最終整體R-value=0.97995,結果表明該神經網絡擬合效果很好,而對于測試集合的 R-value=0.96239,表明該水解模型有很好的預測能力,能夠完成實驗結果的預測。選用的測試組的實驗結果與神經網絡輸出值之間的誤差均在±3%以內,說明其具有良好的預測能力。從以上結果可知,在有限水解范圍內,神經網絡預測模型能夠很好的預測水解程度,可以用此模型進一步研究的蛋白功能特性和多肽的生理生物活性物質,并且更利于水解條件的選擇,還可以縮短必要的工藝時間。
[1]韓雪,孫冰.乳清蛋白的功能特性及應用[J]. 中國乳品工業, 2003,31(3):28-30.
[2]Pouliot Y. Fractionation of whey protein hydrolysates using charged UF/NF membrans[J].Membr.Sci, 1999,158:105-114.
[3]張雅麗,王鳳翼,宋世廉等.蛋白質酶法修飾的初步探討-大豆蛋白和芝麻蛋白的合成類蛋白質研究[J]. 食品與發酵工業, 1994,3:8-13.
[4]劉佳,大豆蛋白ACE抑制肽的研究[D]. 無錫: 江南大學, 2008.
[5]彭新顏 ,孔保華,熊幼翎.由堿性蛋白酶制備的乳清蛋白水解物抗氧化活性的研究[J]. 中國乳品工業, 2008,36(4):8-13.
[6]Patnaik P R.Applications of neural networks to recovery of biological products[J]. Biotechnol.Adv,1999,17:477-488.
[7]Baugham D R, Liu YA. Neural Networks in Bioprocessing and Chemical Engineering[D].Virginia: Virginia Polytechnic Institute and State University , 1995.
[8]Morris AJ, Montague GA, Willis M J. Artificial neural networks: studies in process modelling and control[J]. Trans. I. Chem. Eng,1994,72A:3-19.
[9]Patnaik P R.Preliminary screening of neural network con-figurations for bioreactor applications[J]. Biotechnol Tech,1996,10:967-970.
[10]Huang J,Mei LH,Xia J.Application of artificial neural network coupling particle swarm optimization algorithm to biocatalytic production of GABA[J]. Biotechnol Bioeng,2007,96:924.
[11]Liu HL,Yang FC,Lin HY,et al.Arti fi cal neural network to predict the growth of the indigenous Acidthiobacillus thiooxidans[J]. Chem Eng J,2008;137:231.
[12]Geeraerd A H, Herremans C H, LR Ludikhuyze, et al. Modeling the kinetics of isobaric-isothermal inactivation of Bacillus subtilis a-amylase with artificial neural networks[J].Food Engineering,1998,36:263-279.
[13]Bryjak J, Murlikiewicz K, Zbicin′ski I, et al.Application of artificial neural networks to modelling of starch hydrolysis by glucoamylase[J]. Bioprocess Engineering, 2000,23:351-357.
[14]Du C J, Sun DW. Learning techniques used in computer vision for food quality evaluation: A review[J]. Food Engineering , 2006,72:39-55.
[15]Spellman D, McEvoy E, O’Cuinn G, et al.Proteinase and exopeptidase hydrolysis of whey protein:Comparison of the TNBS,OPA and pH stat methods for quantification of degree of hydrolysis [J]. International Dairy, 2003, 13 (6):447-453.
[16]Buciński A. Modeling the tryptic hydrolysis of pea proteins using an artificial neural network [J]. LWT-Food Science and Technology, 2008, 41(5 ):942-945.
[17]Hagan M T, Menhaj M B.Training feedforward networks with the Marquardt algorithm[J].Neural Networks, IEEE Transactions on ,1994,5: 989-993.