周虎 張承明 張仁堂 楊曉霞 陳巖
摘 要 準確完整地模擬紅棗黑變過程中主要成分的連續變化過程,對于明確黑變過程中的變化機理、提高成品質量具有重要的意義。論文首先分析了黑變過程中主要成分變化的時序狀態特征,明確模擬過程中必須同時考慮狀態變化信息和數值變化信息,選擇能夠模擬時序狀態變化的長短時間記憶網絡(Long Short Term Memory networks,LSTM)作為基礎方法;然后根據實驗數據采集困難,狀態間相關性強的特點,構建卷積長短時間記憶網絡模型(Convolutional Long Short Term Memory networks,LSTM ,CLSTM),設計了模型的訓練方法,使新模型能夠較好地模擬黑變過程主要成分連續變化;選擇糠醛為實驗對象進行了數值模擬實驗,并使用最近插值法、為階梯插值、線性插值法、2階B樣條曲線插值、3階B樣條曲線插值法作為對比方法,實驗分析結果表明,本文提出的方法在平均方差、平均誤差、最大誤差、最小誤差等各個指標上增多明顯優于其它方法,能夠更好地捕捉黑變過程中主要成分的變化特征,對于揭示黑變過程機理,具有重要的參考和借鑒價值。
關鍵詞 紅棗 黑變過程 時序變化 卷積長短時間記憶網絡模型
中圖分類號:TS255 文獻標識碼:A
0引言
紅棗是我國所特有的果蔬資源,具有極高的營養價值,素有“木本糧食,滋補佳品”的美譽,具有藥食兩用價值,富含有糖、蛋白質、粗脂肪、粗纖維、磷、鈣、鐵、鉀、胡蘿卜素、硫胺素、核黃素、尼克酸等。紅棗中還含有18種氨基酸,包括8種人體必須氨基酸和嬰兒體內無法合成的精氨酸和組氨酸。另外,紅棗中含有環磷酸腺苷、多糖、三萜類化合物、黃酮等生理活性物質,對人體健康起到有益作用。但是由于紅棗本身的含糖量過高,造成了部分不耐糖及糖尿病患者不敢食用。研究者在對紅棗加工過程中,通過控制溫度和濕度,在不添加任何添加劑的情況下,使紅棗經過一段時間的高溫熟化,通過黑變過程形成黑棗。通過黑變這一深加工過程,能夠較明顯地降低了蔗糖含量,升高了還原糖、總酸、果糖、糠醛等有益成分,同時能夠使得到的黑棗具有較強的生理活性,更適合于糖尿病及高血糖、糖耐偏高人群及現代消費者的健康要求,顯著提高紅棗的附加值。
但由于紅棗黑變過程中各種物質變化復雜,其品質形成,特別是所含成分的變化機理尚不清楚,迫切需要研究影響黑棗品質形成的因素,成分變化規律及機理,以達到有效控制黑變過程,控制環磷酸腺苷的減少,促進其功能物質的生成,保證黑棗產品的品質、功能作用和安全性,提高人群適用范圍的目標。([1]張仁堂, 喬旭光, 谷端銀, 等. 固態發酵黑棗深加工技術研究進展及其產業發展趨勢[A]. 第四屆農產品產地初加工科技交流大會論文集[C], 2017年)
由于紅棗黑變是在密封的環境中進行的,直接獲取紅棗變化過程的成分含量的邊續變化極為困難,唯一有效的通途就是利用化學實驗手段,定期獲取黑變過程中主要成分的含量,在此基礎上通過數學模擬的手段,推測變化過程,捕捉變化的特征。數學插值是將離散量模擬得到邊續量的常用方法,主要有最近插值法、為階梯插值、線性插值法、2階B樣條曲線插值、3階B樣條曲線插值法等方法,但這些方法不能考慮樣本的狀態間的強關聯關系,得到的結果很難捕捉黑變過程中主要成分的變化特征,達不到揭示變化機理的目的。
隨著人們在深度學習方面研究的不斷深入,研究者提出并發展了能夠有效表征狀態間遷移關系的長短時間記憶網絡(Long Short Term Memory networks,LSTM),該模型最初是為處理時序信息提出來的,LSTM網絡模型最大的特點就是能夠在數據處理過程中有效地表達前后一段時間內的狀態間的遷移關系,使前一狀態對后一狀態的影響能夠充分表達,因而非常適合時序信號的處理。在研究者的不斷努力下,LSTM及其變形在時序信號處理上取得了明顯的成功。
目前,LSTM模型主要應用在語音識別、語言建模、網絡監測、文本識別等領域,已公開的文獻中尚沒發現將其應用于食品加工過程中成分變化模擬問題。從前面的分析可以看出,由于食品加工過程中成分變化的時序相關性強的特點,用LSTM模型作為工具是非常合適的。本文正是從這一思想出發,以LSTM模型為基礎開展紅棗黑變過程中主要成分連續變化模擬研究,以期能夠更好地捕捉糠醛、總酸、還原糖、果糖等主要成分的變化特征,揭示變化機理。進一步改善加工工藝,獲取質量更佳的黑棗產品。
1模擬方法
LSTM模型的基礎原理在文獻[1]中已經有非常詳細的介紹,本文重點是在LSTM模型的基礎上,根據黑變實驗過程的特點,搭建適宜的模型并制定訓練方法。
1.1 CLSTM模型構建
由于黑變需要在密封的環境中進行的,為了盡可能保持黑變過程的連續性,采樣的間隔應盡可能長,但過長的時間間隔可能會導致失去變化過程中的觀測點,本文實驗中,采取每6小時取樣一次,以盡可能多地獲取變化的細節信息。盡管如此,由于黑變的過程一般只有96個小時,樣本量仍然偏少,直接利用原始數據進行模擬的偏差仍然較大。
利用小波分析在信號處理方面的優勢,將原始的時間序列數據分解成低頻和高頻兩部分,其中低頻部分是信號的近似部分,代表了數據的整體特征,高頻部分是信號的細節部分,代表了數據的細節特征,例如信號的局部跳變等。對信息的低頻部分不再進行處理,直接作為LSTM的輸入;而高頻部分則通過卷積綜合樣本點的細節特征,形成全局化的特征描述信息,再作為LSTM的輸入;最后通過LSTM得到模擬結果。CLTSM模型整體結構如圖1所示。
CLSTM模型結構最大的優勢在于綜合利用了人工先驗知識和LSTM的自學習優勢,有效克服樣本點少的問題,保證能夠捕捉到樣本的全局分布特征和局部分分布特征。
1.2模型訓練方法
在構造CLSTM模型過程中,本文通過最小化模型輸出參數與檢驗點參數間誤差平方和方法進行模型訓練。對于結點數為M輸入序列L,其誤差函數定義為:
(1)
其中,和分別表示真實值與模型輸出
2模擬實驗
2.1實驗設計
實驗設計分為化學實驗和數值實驗兩個部分,其中化學實驗的目的是獲取時序的糠醛觀測值,每組實驗分三個獨立組進行,取平均值作為樣點值。(5-羥甲基糠醛(5-HMF)檢測方法:稱取5g黑棗泥于50ml燒杯中,加入10ml甲醇溶解,搗碎攪勻,加入少量水磁力攪拌10min,轉移至50ml棕色容量瓶中用水稀釋至刻度,充分混勻,超聲30min,過濾,棄去初濾液,后續濾液過0.45 m有機濾膜至進樣瓶,進行液相分析。重復以上操作三次,進行三個平行樣準備。)
數值實驗從化學實驗得到的實測數據中隨機抽取了20組作為數據源進行模擬。為了更好地觀測CLSTM模型的性能,對每一組數據同時選擇了最近插值法、為階梯插值、線性插值法、2階B樣條曲線插值、3階B樣條曲線插值法作為對比方法,選擇平均方差、平均誤差、最大誤差、最小誤差等4個指標作為考察指標。
2.2實驗結果與討論
圖2和圖3給出了其中一組對比實驗的情況。
圖3中, nearest表示最近插值法,zero表示階梯插值法,slinear表示線性插值,quadratic表示2階B樣條曲線插值,cubic表示3階B樣條曲線插值,表1給出了各組實驗的綜合對比分析情況(百分比)
表1:各組實驗的綜合對比分析情況
3結論
本文針對準確完整地模擬紅棗黑變過程中主要成分的連續變化過程的需要,從黑變過程的機理和樣點數據特點出發,以能夠模擬時序狀態變化的LSTM為基礎方法;構建了CLSTM。實驗表明,CLSTM方法在平均方差、平均誤差、最大誤差、最小誤差等各個指標上增多明顯優于其它方法,能夠更好地捕捉黑變過程中主要成分的全局變化特征和局部分變化特征,對于揭示黑變過程機理,具有重要的參考和借鑒價值,能夠進一步促進紅棗黑變過程的的質量。
基金項目:山東省重點研發計劃項目“紅棗微發酵工藝關鍵技術研究與產品開發”(項目編號:2016GNC113015);山東省2017年度農業重大應用技術創新項目“高附加值固態發酵黑棗深加工關鍵技術集成與產業化”。
參考文獻
[1] Graves,A.Supervised Sequence Labelling with Recurrent Neural Networks[J].Textbook,Studies inComputational Intelligence,Springer,2012.
[2] 舒帆,屈丹,張文林,等.采用長短時記憶網絡的低資源語音識別方法[J].西安交通大學學報,2017,51(10):120-127.
[3] 劉加,張衛強.低資源語音識別若干關鍵技術研究進展[J].數據采集與處理,2017,32(02):205-220.
[4] 張瑞茂,彭杰鋒,吳恙.融合語義知識的深度表達學習及在視覺理解中的應用[J].計算機研究與發展,2017,54(6):1251-1266
[5] 陽珊,樊博,謝磊等.基于BLSTM-RNN的語音驅動逼真面部動畫合成[J].清華大學學報(自然科學版),2017,57(03):250-256.
[6] 張亮,黃曙光,石昭祥.基于LSTM型RNN的CAPTCHA識別方法[J].模式識別與人工智,2011,24(01):40-48
[7] 黃步添,劉琦,何欽等.基于語義嵌入模型與交易信息的智能合約自動分類系統[J].自動化學報,2017,43(09):1531-1543.