鄭沫利 趙艷軻 汪芬 陳祺東 孫俊 劉雍容



摘要:對產后糧食損耗進行分析與研究,調查獲得10多個省份的糧食損耗問卷,對問卷進行統計分析得到影響損耗的各個因素變量,同時進行數據預處理作為模型數據集。最后,將該數據集應用于提出的RDPSO-BP模型中。將隨機粒子群(RDPSO)算法與BP神經網絡相結合,并優化神經網絡參數,從而得到糧食產后儲藏環節損耗率預測模型。通過MATLAB仿真實驗,發現優化后的RDPSO-BP模型相比傳統BP神經網絡,具有更高的預測精度,訓練與測試誤差分別降低了0.041%和0.055%。因此,該模型能夠更好地預測糧食產后儲藏環節的損失率,在實際糧食損耗分析中具有重要作用。
關鍵詞:RDPSO-BP模型;糧食產后儲藏;損耗預測
DOI: 10. 11907/rjdk.191274
開放科學(資源服務)標識碼(OSID):
中圖分類號:TP301
文獻標識碼:A
文章編號:1672-7800(2020)001-0032-04
0 引言
長期以來,糧食產后儲藏環節的損耗一直是困擾國家及相關企業的一大難題。我國作為糧食生產大國,由于儲藏設施不夠完備,相關專業知識不足,容易受到進出倉、蟲害、鼠害、霉變等因素影響,造成大量糧食損耗。這不僅增加了國家及企業負擔,同時對全球環境及經濟可持續發展造成了不可忽視的影響。因此,針對如何安全高效儲糧、降低糧食產后儲藏環節損耗[5-6],眾多學者進行了大量研究。隨著智能科技的迅猛發展,已有學者利用人工智能與機器學習方法[7-12]研究糧食產后儲藏環節損耗問題,對降低糧食損失率具有重要意義。
本文針對青海、湖南等10個地區的糧食作物,包括稻谷、大米等12類儲藏品種,對于管理區域信息、儲藏情況及進出倉情況等問題設計問卷并進行統計分析。同時,在SPSS中進行表格問題的數據轉換與預分析。可以看出,儲糧損耗與儲糧技術、儲糧設施、進出倉情況等因素密切相關。以此為基礎進行模型構建,發現BP神經網絡在非線性與高維問題上表現較為突出,但具有收斂速度慢、易陷入局部最優等缺點。本文利用隨機漂移粒子群的全局搜索能力彌補BP網絡的缺陷,使預測更為準確。通過對主要損失因素進行描述分析,為今后糧食產后儲藏損耗分析預測提供一定的理論基礎。
1 糧食儲藏損耗調查信息
1.1 調查問卷分析
通過對問卷的整理與分析,將影響儲糧損耗的因素分為4大類:管理信息、儲藏情況、進倉情況、出倉情況。其中,管理區域信息變量如表1所示。
管理區域主要是對各省份城市儲糧管理企業的信息統計與企業所在地信息描述。但在數據分析過程中發現,糧食損耗主要與3個屬性變量相關。
同樣在前期數據分析中,得出相關性較高的儲藏情況影響因素。
由于進、出倉變量一致,所以將其統一列出,如表3所示。
通過分析,初步篩選得出影響儲糧損失的各個因素。對于儲糧損失率,問卷設計中包含了進倉損失率、出倉損失率、蟲害損失率與霉變損失率。為了便于實驗設計,將各個損失率累加作為總損失率。因此,在模型訓練部分通過表1一表3中的變量對總損失率進行模型構建。
1.2 變量數據統計分布描述
由于儲存糧食品種較多,本文以稻谷品種為例,統計分析其數據分布情況。通過數據分析與預處理,同時將某些變量轉化為多變量,從而得到理想數據集。相關統計信息如表4所示。
2 RDPSO-BP模型
2.1 BP神經網絡
BP神經網絡[15-17]是一種按誤差逆向傳播訓練的多層前饋網絡,也是一種應用最廣泛的神經網絡。BP算法運行機制包括信號正向傳播及誤差反向傳播。BP神經網絡能夠學習與存儲大量輸入一輸出模式的映射關系,并對大規模數據進行并聯處理。通過使用最速下降法及反向傳播不斷調整網絡權值和閾值,從而使網絡誤差平方和最小。本文以三層BP網絡結構為基礎,介紹三層結構下的參數優化。三層BP神經網絡模型結構如圖1所示。
雖然BP算法可以通過自身的訓練學習某種規則,從而在給定輸入值時得到最接近期望輸出值的結果,但BP算法自身也存在較大缺陷,主要有以下3點:①BP算法學習過程中收斂速度慢,需要進行成百上千次訓練才能得出結果;②BP算法容易陷入局部最小值;③BP算法網絡推廣能力不強。
2.2 RDPSO算法
粒子群優化算法[18-21]( Particle Swarm Optimizatiom,PSO)是一種模擬群體行為的隨機優化算法,具有設定參數少、易于實現的優點,但在經過一定次數迭代后,由于粒子飛行速度逐漸減慢,種群收斂于某個滿意解。此時若環境發生變化,由于種群已經失去多樣性,很難對該變化迅速作出反應。因此,本文采用一種具有更強全局搜索能力的隨機漂移粒子群優化(Random Drift PSO,RDPSO)算法優化BP神經網絡。
RDPSO算法中粒子運動包含兩部分:一部分是定向漂移運動,表現為粒子局部搜索;另一部分是無規則隨機熱運動,表現為粒子全局搜索。粒子速度即為兩部分運動速度的疊加,如式(1)所示。
2.3 RDPSO-BP模型
針對前文所述BP神經網絡的不足,采用一種基于RDPSO算法的BP神經網絡,基本步驟如下:①構建BP神經網絡結構,給定輸人數據集及輸出數據集;②將BP網絡權值、偏置系數組織成RDPSO優化算法的粒子參數,同時初始化粒子群;③將第i個粒子參數映射到BP網絡中,訓練其網絡模型得到輸出;④此時對該粒子速度及位置進行計算更改,同時根據優化算法目標函數,更新該粒子的局部最優值,以及群體的全局最優值;⑤判斷步驟④中全局最優值是否達到算法結束條件,若滿足,進入步驟⑥,否則進入步驟③;⑥算法結束。
3 結果與分析
對于以上描述的10多個變量而言,由于有些品種樣本量相對較少,當選取相關變量進行模型訓練時,效果不太理想。根據綜合考量,本文通過降維獲取每個品種相關性較高的變量因素,實驗采用稻谷數據進行分析與測試。
3.1 相關性分析
根據相關性分析結果,得到“年份”、“企業所屬儲糧生態區域”、“你的儲糧技術是?_1”、“儲藏量”、“儲藏時間”、“儲藏形式”、“進倉工藝2_1”、“出倉工藝2_1”8個變量的相關性更強,因此將以上8個變量作為模型輸入變量,總損失率作為模型輸出變量。
3.3 實驗結果
在MATLAB平臺上進行仿真實驗,將207條數據分為訓練集與測試集,其中訓練集包括160條數據,測試集包括47條數據。對訓練集數據分別進行線性回歸、BP、RDP-SO-BP算法優化訓練,將輸出結果與損失率的真實值進行對比,對比結果輸出如圖2所示。
由圖2可知,相對于線性回歸,經過BP算法及改進RDPSO-BP算法得到的損失率輸出值與真實值誤差更小。線性回歸模型雖然簡單,但預測精度不高,故針對測試集不再采用線性回歸模型進行預測。
采用BP算法與RDPSO-BP算法對測試集進行預測,輸出結果與真實值對比如圖3所示,可以看出優化后的網絡效果優于傳統BP網絡效果。
通過擬合圖直觀給出了RDPSO-BP與BP算法效果對比,訓練與測試誤差率如表5所示,這里采用均方誤差。由表5可知,RDPSO-BP相比BP算法誤差率更小,訓練與測試誤差率分別降低了0.041%和0.055%,同時收斂速度更快。
4 結語
糧食損耗一直是國家關注的重點問題之一,本文通過調查獲得10多個省份的糧食損耗問卷,然后對問卷進行統計分析得到影響損耗的各個因素變量,同時進行數據預處理作為模型數據集,最后將該數據集應用于RDPSO-BP模型中。本文提出的RDPSO-BP模型可以較為精準地預測損失率,在實際應用中可通過該模型預測糧食損耗趨勢,作為一個損耗預防的基準值,從而為國家與相關企業制定糧食減損方案提供參考。
參考文獻:
[1]張歡歡,唐浩林,葉福康,等.糧食儲存損耗的原因分析及對策[J].糧食加工,2015,40(3):69-72.
[2]KUMAR D, KALITA P. Reducing postharvest losses during storage ofgrain crops to strengthen food security in developing countries [J].Foods, 2017, 6(1):8.
[3]XIE W. Analvsis of the influence of the barn duct design on controltechniques of pests in stored grain[C].International Conference on In-telligent Transportation, 2016.
[4] 農戶水稻收獲損失及影響因素的實證研究[D].無錫:江南大學, 2017.
[5]GURU-PIRASANNA-PANDI G,ADAK T, GOWDA B,et al. Toxico-logical effect of underutilized plant, cleistanthus collinus leaf extractsagainst two major stored grain pests, the rice weevil, sitophilus oryzaeand red flour beetle, Tribolium castaneum [J]. Ecotoxicol EnvironSaf. 2018. 154:92-99.
[6] 高利偉,許世衛,李哲敏,等.中國主要糧食作物產后損失特征及減損潛力研究[J].農業工程學報,2016. 32( 23):1-11.
[7]SHEN Y, ZHOU H,LI J,et al.Detection of stored-grain insects usingdeep learning [Jl. Computers&Electronics in Agriculture, 2018,145:319-325.
[8]SHI J F,JIAO H J.Application of the CRA and SVM for forecast ofChina grain production[J]. Advanced Materials Research, 2012,433-440:1106-1111.
[9]CHAKRABORTY A, MAZUMDAR B. MUKHOPADHYAY D.A prac-tical DPA on Crain vl using LS-SVM[C].IEEE International Sympo-sium on Hardware Oriented Security&Trust. 2015.
[10]程尚坤.基于深度學習的儲糧害蟲檢測方法研究[D].鄭州:河南工業大學,2017.
[11] CENG R. ZHANC D,CHAI J. Research on grain information classi-fication based on SVM decision tree[C].IEEE International Confer-ence on Granular Computing, 2012.
[12] 李貝.基于SVR的糧倉儲糧數量檢測模型與系統實現[D].鄭州:河南工業大學,2017.
[13] 張彩.散裝糧食平房倉外圍護體系研究[D].鄭州:河南工業大學,2015.
[14]ASTAPENKO N V. KOSHEKOV K T,PETROV P A.Design of thegranary technological process control subsvstem for monitoring of thegrain volume in a silo[ C]. Dvnamics of Systems, Mechanisms& Ma-chines.2017.
[15] 潘慶先,董紅斌,韓啟龍,等.一種基于BP神經網絡的屬性重要性計算方法[J].中國科學技術大學學報,2017(1):18-25.
[16]HECHTNIELSEN R.Theory of the backpropagation neural nenvork[ M]. New York: Harcourt Brace&Co. 1989.
[17]張宏,馬巖,李勇,等.基于遺傳BP神經網絡的核桃破裂功預測模型[J].農業工程學報,2014,30( 18):78-84.
[18]SUN J,WU X. PALADE V, et aI.Random drift particle swarm opti-mization algorithm: convergence analysis and parameter selection[J]. Machine Learning, 2015, 101( 1-3): 345-376.
[19]王夢.求解動態優化問題的隨機漂移粒子群優化算法[J].福建電腦.2018(1):109-111.
[20]COUCEIRO M S,RUI P R, FERREIRA N M F.A novel multi-ro-bot exploration approach based on Particle Swarm Optimization algo-rithms[C].Kyoto: IEEE International Symposium on Safety, 2011.
[21]SUN J,PALADE V, WU X, et al.Multiple sequence alignment withhidden Markov models learned by random drift particle swarm optimi-zationlJ].IEEE/ACM Transactions on Computational Biology&Bio-informatics. 2014. 11(1):243-257.
(責任編輯:黃健)
基金項目:國家糧食公益性行業科研專項項目( 201513004,201513004-6)
作者簡介:鄭沫利(1967-),男,國貿工程設計院教授級高級工程師,研究方向為糧食經濟學;趙艷軻(1987-),女,國貿工程設計院中級工程師,研究方向為糧食經濟學;汪芬(1995-),女,江南大學物聯網工程學院碩士研究生,研究方向為數據挖掘;陳祺東(1992-),男,江南大學物聯網工程學院博士研究生,研究方向為人工智能、機器學習、計算智能和生物信息學;孫俊(1971-),男,江南大學物聯網工程學院教授,研究方向為人工智能、機器學習、計算智能和高性能計算;劉雍容(1988-),男,國貿工程設計院工程師,研究方向為糧食經濟學。