李飛 蔣敏蘭



摘要:蛋雞產蛋率受生物、化學、物理以及人為等多方面因素影響,準確地預測蛋雞產蛋率的變化趨勢,建立蛋雞的產蛋率預測模型對蛋雞養殖具有重要的意義。將蛋雞采食量、蛋雞雞齡、體質量、溫度、光照時間以及是否服用營養素等6類影響因子進行處理,作為支持向量機(SVM)的輸入數據,對蛋雞的產蛋率進行預測,得到了一個穩定性好、適用范圍廣、預測結果準確的蛋雞產蛋率模型,且預測結果符合蛋雞的實際產蛋情況;同時為評估和分析SVM蛋雞產蛋率預測模型的性能,以同樣樣本建立BP神經網絡的預測模型,并用網絡訓練、測試用時、均方誤差MSE以及相關系數r作為預測模型性能的評價指標。結果表明,基于支持向量機的蛋雞產蛋率預測模型精度和耗時均優于神經網絡預測模型。
關鍵詞:蛋雞產蛋率;預測模型;支持向量機回歸;神經網絡
中圖分類號: S126 ?文獻標志碼: A ?文章編號:1002-1302(2019)13-0249-04
隨著“數字農業”[1]在中國的不斷推進,中國蛋雞產業化及規模化生產[2]有了較大發展,但與發達國家的蛋雞養殖相比,我國的蛋雞養殖不夠數據化和智能化[3],還處于傳統養殖階段向智能化過度階段。在國內,養殖戶關心的是飼料、雞蛋價格等淺顯的數據,卻忽略了一些更為重要的數據,如蛋雞雞舍的環境參數、產蛋率、料蛋比以及無法立即出售的雞蛋新鮮度的檢測等。這些數據不僅能反映某一階段蛋雞的養殖情況以及全局的效益,更是養殖企業下一階段生產投入的重要依據。其中,蛋雞的產蛋率是養殖企業最為關心的問題,準確地預測產蛋率的變化趨勢、建立蛋雞的產蛋率預測模型對蛋雞養殖具有重要的意義。
產蛋率是一個受生物、化學、物理以及人為多方面影響的復雜系統,產蛋率呈非線性的變化,傳統的方法很難建立一個精確的產蛋率預測模型。近年來,有不少學者研究并證明了外界的環境參數會對蛋雞的產蛋率有一定影響[4-7],溫度、光照等外界環境因素以及蛋雞的采食量、雞齡、體質量等都會影響蛋雞的產蛋率。因此,結合某些環境影響參數,產蛋率的變化是有規律可循的。然而,以往的研究也存在不足:一是偏重產蛋率與某單一參數的相關性,沒有系統地分析多方面因子對產蛋率的影響;二是沒有重視產蛋率的經濟價值和企業的效益性,建立蛋雞的產蛋率預測模型。隨著檢測技術的多樣化和精度的提高,通過對檢測數據的處理和分析,并借助近年來發展迅速的機器學習方法,建立基于機器學習的產蛋率非線性預測模型,使產蛋率的預測隨著上述多參數的變化成為可能[8]。
支持向量機(SVM)是Cherkassky等在統計學習理論的基礎上提出的一種機器學習方法[9-10]。迄今為止,SVM在金融、醫學以及圖像等領域[11-13]均有成果。上述研究表明,SVM在小樣本、高維度的情況下,對數據的分類和擬合能夠產出較優的結果。目前,SVM在農業領域的研究也逐漸興起[14-16],如農產品分類、水產養殖以及病蟲害預測等。本研究以SVM回歸理論為核心,針對產蛋率研究方面存在的不足,建立一種基于SVM回歸的蛋雞產蛋率預測模型。本研究記錄并處理了2批海蘭褐蛋雞從開始產蛋直至出售期間共378 d的產蛋率以及蛋雞采食量、蛋雞雞齡、體質量、溫度、光照時間以及是否服用營養素等6類影響因子的數據;隨后將第1批海蘭褐蛋雞的影響因子和產蛋率數據作為訓練樣本,帶入SVM的輸入端和輸出端,得到蛋雞產蛋率的預測模型;之后將第2批海蘭褐蛋雞用于驗證SVM預測模型的精度:將第2批蛋雞的6類影響因子數據作為測試樣本帶入訓練好的SVM模型的輸入端,得到第2批蛋雞共378 d 的產蛋率預測值;最后通過比較蛋雞產蛋率的實際值和預測值,反復調試SVM模型性能,得到一個穩定性好、預測精度高的蛋雞產蛋率模型。
1 支持向量機產蛋率預測模型
1.1 支持向量機回歸
2 基于SVM回歸的蛋雞產蛋率預測
2.1 試驗數據來源及處理
本研究探討的蛋雞產蛋率預測模型的數據來源于安徽省亳州市正大蛋雞養殖場。為保證預測模型的準確性和科學性,本研究記錄2批海蘭褐蛋雞從開始產蛋直至蛋雞售出期間,蛋雞每天的產蛋率以及各項影響產蛋因子的數據,第1批海蘭褐蛋雞作為訓練樣本,第2批作為測試樣本,采樣時間為2016年10月28日至2017年11月12日。其中第1批蛋雞為9 889羽,第2批為9 777羽。
由于2批蛋雞的數目不同,而且在研究的過程中2批蛋雞存在自然死淘,本研究采用1 d的蛋雞總產蛋量除以蛋雞總數,得出蛋雞的日產蛋率。本研究采集的6種蛋雞產蛋率影響因子樣本也須要處理:(1)蛋雞采食量,本研究用1 d的蛋雞總采集量除以蛋雞總數,作為采食量數據;(2)蛋雞體質量,由于養殖場體質量為1周采集1次,采用Lagrange插值法,得出蛋雞每天的體質量。Lagrange插值法是一種多項式插值法,可以給出一個恰好穿過二維平面上已知點的多項式函數,根據這個多項式,可以估計出蛋雞每日的體質量。(3)是否服用營養液,本研究將藥物混于水中,以保證服用營養液時,每羽蛋雞都能服用。(4)溫度,由于溫度的不穩定性以及平均溫度難以精確測出,用雞舍最低溫度和最高溫度表示溫度與蛋雞產蛋率的關聯性。光照時間可以準確監控、記錄。至此,處理完所有需要的數據,得出7組影響蛋雞產蛋率因素的數據(表1)。
2.2 支持向量機核函數選擇和參數優化
SVM回歸的關鍵在于核函數類型的選擇,避免了在實行非線性回歸時,低維空間樣本數據映射到高維空間的復雜度,且不同的核函數會導致SVM的推廣性能的不同[17]。本研究選取使用較為廣泛的多項式核函數和高斯核函數:
對于不同類型的核函數,產生的支持向量的個數變化并不大,但核函數的相關參數對模型的預測性能有重要影響。在使用多項式核函數時,須要設置懲罰因子C以及多項式核階數d 2個控制變量,而高斯核函數須要設置懲罰因子C和核函數寬度σ。為達到上述核函數參數的最優化,本研究使用網格搜索法和交差驗證結合的方法來尋找最佳的核函數參數。
網格搜索法具有較高的學習精度、算法簡單、容易實現并且可以搜索到劃定網格中的最優解。該方法將2個參數分別取M、N個值,對M×N個參數的組合,分別訓練不同的模型,再估計其學習精度,從而在這些組合中得到學習精度最高的一個組合作為最優參數。交叉驗證作為一種消除樣本隨機性產生的訓練偏差的統計學方法,將訓練數據分為K個子集,以其中任意一個子集作為測試集,將其他的(K-1)個子集作為訓練集從而得到決策函數。通過不重復循環直至每個子集都作為測試集被預測1次,最后取整體均方誤差的平均值作為最終預測誤差,從而規避了過擬合問題。綜合SVM仿真速度和預測模型的準確率,本研究采用十折交叉驗證尋找最優參數組合。多項式核函數及高斯核函數尋優結果詳見表2。
2.3 基于SVM的產蛋率預測模型
本研究預測模型和數據處理基于MatLab2016a環境編程
由圖1和圖2的預測模型可知,多項式核函數和高斯核函數的預測結果和實際樣本擬合度較高,且產蛋率上升下降的趨勢吻合,說明基于SVM建立的蛋雞產蛋率預測模型具有可行性和可信度,且具有很強的現實價值。由此可以看出,多項式核函數在產蛋率前期的預測性能并不是很好,波動性較大,此處與高斯核函數差距較大。
2.4 預測性能比較結果
為進一步評估和分析SVM蛋雞產蛋率預測模型的性能,本研究使用BP神經網絡建立產蛋率模型用來與SVM回歸預測的性能作對比,結果如圖3所示。
本研究在比較不同模型對同一蛋雞產蛋率樣本,采用了均方誤差MSE和相關系數r作為預測模型性能的指標,均方誤差的值越小,代表預測模型性能越好,相關系數的值越接近1,說明預測結果和實際值之間相關程度越高。計算公式為:
對比表3的不同核函數SVM和BP神經網絡預測結果,SVM的預測性能在各項指標上均優于BP神經網絡,尤其是在樣本的訓練時間上,SVM有著巨大的優越性。對比高斯核函數和多項式核函數可知,高斯核函數在該預測模型性能比多項式核函數高。綜上,SVM預測模型具有較高的預測精度以及推廣性。
3 結論
本研究基于SVM回歸理論,提出了一種蛋雞產蛋率預測模型,可歸納為以下幾個方面:(1)以往研究偏重產蛋率與某單一參數的相關性,多影響因子研究較少。本研究針對這一情況,建立了蛋雞產蛋率與溫度、光照、體質量、采食量等6個影響因子的映射關系。(2)結合SVM回歸理論,本研究提出了蛋雞產蛋率預測模型,從試驗結果可以得出結論,本預測模型預測精度較高,具有可信度和很強的推廣性。(3)為進一步評估SVM蛋雞產蛋率預測模型的性能,本研究以同樣的樣本用BP神經網絡建立產蛋率模型作為對比,并設置相關評價指標。性能比較結果證明,基于SVM的蛋雞預測模型性能優于BP神經網絡,本預測模型穩定性好、適用范圍廣、預測結果準確。
本研究提出的基于SVM的預測模型,不僅僅局限于蛋雞產蛋率的預測,其他禽類產蛋率同樣適用于本預測模型方法。本預測模型具有很強的實用價值,值得推廣并投入實際應用。
參考文獻:
[1]Karner E. The future of agriculture is digital:showcasting e-Estonia[J]. Frontiers in Veterinary Science,2017,4(4):151.
[2]楊 寧,秦 富,徐桂云,等. 我國蛋雞養殖規模化發展現狀調研分析報告[J]. 中國家禽,2014(7):2-9.
[3]何萬領. 蛋雞養殖數據化與智能化需求[J]. 農業知識:科學養殖,2015(8):27.
[4]于晶華,于晶芳,于 萍. 蛋雞產蛋性能的影響因素及解決辦法[J]. 現代畜牧科技,2017(3):33.
[5]Otwinowska-Mindur A,Gumulka M,Kania-Gierdziewicz J. Mathematical models for egg production in broiler breeder hens[J]. Annals of Animal Science,2016,16(4):1185-1198.
[6]時 凱,陳長寬,卞紅春,等. 不同養殖模式及光照度對蛋雞產蛋率的影響[J]. 江蘇農業科學,2016,19(2):254-255.
[7]嚴華祥,蔡 霞,徐志剛,等. 高產蛋雞100周齡生產性能觀察[J]. 中國畜牧雜志,2015,51(8):85-89.
[8]笪英云,汪曉東,趙永剛,等. 基于關聯向量機回歸的水質預測模型[J]. 環境科學學報,2015,35(11):3730-3735.
[9]Cherkassky V. The nature of statistical learning theory[J]. IEEE Transactions on Neural Networks,1997,8(6):1564.
[10] Cortes C,Vapnik V. Support-vector networks [J]. Machine Learning,1995,20(3):273-297.
[11]Chapellen O,Haffner P,Vapnik V N. Support vector machines for histogram-based image classification[J]. IEEE Transactions on Neural Networks,1999,10(5):1055-1064.
[12]Chen Y J,Liu Y Y,Zhao G Z,et al. Chinese traditional medicine recognition by support vector machine (SVM) terahertz spectrum[J]. Spectroscopy and Spectral Analysis,2009,29(9):2346-2350.
[13]Ding Y S,Song X P,Zen Y E. Forecasting financial condition of Chinese listed companies based on support vector machine[J]. Expert Systems with Applications,2008,34(4):3081-3089.
[14]Liu T L,Su Q Y,Sun Q,et al. Recognition of corn seeds based on pattern recognition and near infrared spectroscopy technology[J]. Spectroscopy and Spectral Analysis,2012,32(6):1550-1553.
[15]Tang J L. Maize seedling/weed multiclass detection in visible/near infrared image based on SVM[J]. Journal of Infrared and Millimeter Waves,2011,30(2):97-103.
[16]Deng X Y,Wang Q H,Chen H,et al. Eggshell crack detection using a wavelet-based support vector machine[J]. Computers and Electronics in Agriculture,2010,70(1):135-143.
[17]奉國和. SVM分類核函數及參數選擇比較[J]. 計算機工程與應用,2011,47(3):123-124,128.