張顧 任義方 肖良文 史瀟 羅曉春 敖意



摘要:在奶牛品種、生理因素以及管理條件相對穩定可控的情況下,氣象因素是影響產奶量的重要因素。利用主成分分析法研究氣象因素對產奶量的影響,并與相關分析法結果進行比較,確定影響江蘇地區荷斯坦奶牛產奶量的主要氣象因素和關鍵時期;在此基礎上,構建考慮氣象因素下基于BP(back propagation)神經網絡的產奶量預測模型。結果表明,產奶量與溫度、濕度呈明顯負相關,與風速、降水量呈負相關,與日照時長、能見度呈明顯正相關;主成分分析法得到的3個主成分因子(溫度因子、天氣因子、雨量因子)累積貢獻率達0.794 3;較相關分析法,主成分分析法充分考慮氣象因素的協同關系,分析結果更符合實際情況。考慮氣象因素條件下基于BP神經網絡的產奶量預測模型檢驗樣本的決定系數達0.65,相對誤差達9.48%,精確性、穩定性均較好。研究結果對江蘇地區奶牛管理和牛奶生產提供環境控制依據具有重要意義。
關鍵詞:荷斯坦奶牛;產奶量;氣象因素;主成分分析;BP神經網絡;預測模型
中圖分類號:S823.9+1;S811.1 ??文獻標志碼: A ?文章編號:1002-1302(2020)23-0150-05
奶業是江蘇現代農業和食品工業發展的重點產業,2018年末全省存欄13.4萬頭奶牛,生鮮乳年產量50.0萬t[1],產奶量是衡量奶牛泌乳性能的主要指標,為保障產奶量穩定,分析并控制其影響因素是基本途徑。影響產奶量的因素[2-4]主要包括內因(奶牛品種、生理因素等)和外因(氣象環境因素、飼養管理因素等),在奶牛品種、生理因素和管理條件相對穩定可控的情況下,氣象因素是影響奶牛產奶量的重要因素[5-6]。江蘇地區氣候特點顯著,夏季炎熱高溫,降水集中,雨熱同期;冬季寒冷干燥,降水較少;春秋短促,氣象條件多變。江蘇地區獨特的氣象條件給奶牛的生長發育和產奶帶來諸多影響。
有學者就氣象因素與產奶量的關系已進行了諸多研究。Trajchev等利用線性混合模型,發現高溫易導致產奶量大幅下降[7];West等基于數理統計法發現,溫度、濕度和溫濕度指數對產奶量影響較大[8];魏學占等利用相關分析發現,溫濕度、氣壓是烏蘭浩特地區春秋季節奶牛產奶量的主要影響因子[9];陳志英等基于多元線性回歸定量分析氣象因素對黑龍江地區產奶量的影響。結果表明,溫度、濕度和日照影響較大[10]。由此可見,學者大多利用相關分析和數理統計方法研究氣象因素對產奶量的影響,方法多側重于氣象單因素的影響及定性分析,但氣象因素之間存在協同作用,最終影響產奶量,因此有必要分析氣象多要素對產奶量的影響。
多數研究利用泌乳曲線分析奶牛個體泌乳規律,從而建立產奶量預測模型。Brody提出簡化指數模型擬合泌乳曲線,Wood考慮環境因素提出不完全伽瑪函數模型;王雅春等添加系數和校正值對Wood模型進行改進[11],此外泌乳曲線擬合模型還包括逆多項式模型[12]、多項式回歸模型[13]、Wilmink 模型[14]等。由此可見,學者主要是針對個體的泌乳規律進行研究,針對某牛場或某地區逐日或逐月產奶量的預測研究較少[15],考慮溫度、濕度等氣象因素下預測產奶量的報道較少。
綜上所述,本試驗從產奶量與氣象因素的角度,首先利用主成分分析法研究氣象因素對產奶量的影響,并與傳統相關分析的結果比較,確定影響江蘇地區產奶量的主要氣象因素和關鍵時期;然后基于氣象因素與產奶量的關系,構建考慮氣象因素下的基于BP(back propagation)神經網絡的產奶量預測模型,并分析模型預測準確度。研究結果對江蘇地區奶牛管理和牛奶生產提供環境控制依據具有重要意義。
1 材料與方法
1.1 研究資料
本研究選取南京衛崗乳業有限公司泗洪牧場2017—2019年奶量記錄資料,資料內容包括荷斯坦奶牛逐日信息數據、逐日牛奶總產量,并根據泌乳奶牛數量計算逐日產奶量(以下簡稱產奶量);選取泗洪氣象站(站碼58135)相應時間序列的氣象觀測資料,觀測要素包括日平均溫度、日最低溫度、日最高溫度、日平均相對濕度、日平均風速、日累計降水量、日最低能見度、日照時長、氣壓。為保證資料一致性、準確性,共保留775組數據。
1.2 研究方法
1.2.1 主成分分析法 主成分分析(principal component analysis,簡稱PCA)是一種將多指標問題轉化為較少綜合指標的統計方法,基本思路是借助正交變換,將分量相關的原隨機變量轉換為分量無關的新變量。在處理實際問題時,當變量個數眾多且變量之間關系復雜,分析問題難度增加,借助主成分分析法可重新組合成無關的綜合變量[16]。主成分分析法廣泛應用于動植物、生態等方面,近年來在奶牛飼養及其產奶量預測[17-18]上也有研究,方法可在不損失太多相關信息的基礎上進行全面多性狀分析,選擇效果突出。
本研究利用主成分分析法分析氣象因素對產奶量的影響步驟如下:
(4)求解相關矩陣R的特征方程,得p個特征根λ1≥λ2≥…≥λp。
確定主成分數量為m個,使累積貢獻率達80%左右,且各主成分特征根一般須大于1。
1.2.2 BP神經網絡模型 人工神經網絡(artificial neural network,簡稱ANN)利用非線性模擬技術擬合輸入輸出相互關系,BP神經網絡應用最為廣泛。BP神經網絡由Rumelhart和Celland于1986年提出,是一種按誤差逆傳播算法訓練的多層前饋網絡,算法基于Delta 學習規則,利用梯度搜索技術,通過反向傳播不斷調整網絡的權值和閾值,最終實現網絡的實際輸出與期望輸出的均方差最小化[19-20]。BP神經網絡結構簡單、仿真能力強、易于實現,為考慮氣象因素的產奶量預測提供了新的途徑[21]。
本研究采用3層網絡結構的BP神經網絡模型(圖1),其拓撲結構包括輸入層、隱含層、輸出層,每層由一定數量的神經元構成,能夠執行簡單并行運算。本研究輸入層為經分析后的主成分氣象因素,輸出層為產奶量,關鍵是確定隱含層層數與節點。若隱含層節點數過少,則BP網絡獲取有效信息少,容錯性差;若節點數過多,則BP網絡樣本中非規律信息,泛化能力下降,因此確定合適的隱含層節點數非常重要[22]。學者提出大量確定方法,如試湊法、奇異值法和經驗公式法等,本研究擬采用4種經驗公式,并對比選取結果較好的隱含層節點數,公式為:
2 結果與分析
2.1 氣象因素對產奶量的影響
氣象觀測數據經標準化處理、相關系數矩陣計算、特征根方程求解等,計算得出相關系數矩陣特征值和貢獻率(表1)。根據主成分因子選取原則,前3個成分特征根均大于1且累積貢獻率為79.43%,可反映氣象因素的大部分信息,因此將前3個成分作為主成分,并計算得出其特征向量。程序運行于MATLAB R2014a中。
由表2可知,在第1主成分中,日平均溫度、日最低溫度和日最高溫度載荷值較大且為負值,氣壓特征值也較大但為正值,江蘇地區長時間序列下溫度越高,氣壓越小,可知產奶量與溫度呈明顯負相關,這是由于荷斯坦奶牛耐冷不耐熱,最適宜溫度為10~16 ℃,當溫度超過25 ℃時,奶牛出現呼吸急促、食欲不振,產奶量受到影響,因此可將第1主成分作為溫度因子。在第2主成分中,日平均相對濕度較大且為負值、日最低能見度和日照時長較大且為正值,江蘇地區能見度與天氣良好相關性強,且產奶量與濕度呈負相關、與日照時長、能見度呈明顯正相關,這是由于氣溫超過25 ℃時,奶牛主要依靠蒸發散熱,濕度越大,與蒸發面水汽壓和空氣水汽壓之差越小,蒸發散熱量越小,奶牛產生劇烈熱應激,影響產奶量[23],因此可將第2主成分作為天氣因子。在第3主成分中,日平均風速和日累計降水量較大且為負值,可見產奶量與風速、降水量呈負相關,這是因為降水和大風過程常伴隨降溫、增濕,濕冷的天氣易導致產奶量下降,因此可將第3主成分作為雨量因子。
為對比傳統方法,本研究同時基于SPSS 22進行產奶量與氣象因素相關分析。由表3可知,溫度、濕度、降水量、能見度與產奶量的相關關系與主成分分析法所得結果一致,但相關分析中日照時長、氣壓與產奶量無明顯相關性,這與主成分分析得出的結果不一致,分析原因可知相關分析割裂了日照時長、氣壓與天氣、溫度的協同關系,而僅僅考慮了產奶量與其相關關系,這與實際情況不符;主成分分析法充分考慮了氣象因素之間的關系,分析結果更符合實際情況。根據3個主成分的特征向量,可得主成分與氣象因素的方程:
2.2 考慮氣象因素下的產奶量預測
本研究構建考慮氣象因素下基于BP神經網絡的產奶量預測模型,為排除時間因素對預測模型的影響,改進樣本選取方法。首先將775個樣本數據隨機打亂順序,然后選取其中700個作為訓練樣本,75個作為檢驗樣本。模型輸入層為經主成分分析后的氣象因素,輸出層為產奶量,隱含層節點數由經驗公式計算并經試湊法驗證取19個節點。為防止過度訓練,在設置訓練參數時,迭代次數設定為 1 000,學習率為0.01,以均方根誤差(root mean square error,簡稱RMSE)作為訓練停止指標,當RMSE小于0.01時停止訓練,完成BP神經網絡模型的建模,程序運行于MATLAB R2014a中,得到訓練樣本模擬結果和檢驗樣本預測結果。
由圖2可知,訓練集、驗證集和測試集的計算值與目標值之間的相關系數為0.78、0.67、0.73,700組訓練樣本相關系數達0.75,訓練結果優良。由圖3可知,在檢驗樣本中,考慮部分誤差較大值,相對誤差≤20%共有71個檢驗樣本,占比94.67%,相對誤差≤10%共有48個檢驗樣本,占比64%,75個檢驗樣本的預測值與真實值的決定系數達0.65,相對誤差達9.48%。由此可知,構建的產奶量預測模型結果精確性、穩定性均較好,同時操作性優良。
3 結論與展望
本研究利用主成分分析法研究氣象因素對產奶量的影響,并與傳統相關分析結果比較,確定影響江蘇地區產奶量的主要氣象因素和關鍵時期,最終得到3個主成分因子,分別為日平均溫度、日最低溫度、日最高溫度和氣壓所表征的第1主成分(溫度因子),日平均相對濕度、日最低能見度和日照時長所表征的第2主成分(天氣因子),日平均風速和日累計降水量所表征的第3主成分(雨量因子);產奶量與溫度、濕度呈明顯負相關,與風速、降水量呈負相關,與日照時長、能見度呈明顯正相關;與傳統相關分析法相比,主成分分析法更充分考慮氣象因素的協同關系,分析結果更符合實際情況。基于氣象因素與產奶量的關系,構建考慮氣象因素下基于BP神經網絡的產奶量預測模型,模型預測結果顯示檢驗樣本平均相對誤差達9.48%,考慮部分誤差較大值,產奶量預測模型精確性、穩定性均較好。
基于主成分分析法確定影響江蘇地區荷斯坦奶牛產奶量的主要氣象因素和關鍵時期,在實際生產中,可由牧場管理人員、工作人員與氣象服務部門交流對接,及時掌握影響關鍵時期和轉折天氣,更好制定和采取奶牛管理和牛奶生產的舉措。基于BP神經網絡的產奶量預測模型中,今后研究除考慮氣象因素外,同時可考慮人工因素和管理因素,進一步提高預測準確性。
參考文獻:
[1]孫宏進.推動江蘇奶業高質量發展[J]. 中國畜牧業,2019(14):40-41.
[2]朱 坤,劉佳佳,查滿千,等. 不同速度的音樂對奶牛血液激素水平和產奶量的影響[J]. 江蘇農業科學,2017,45(14):123-125.
[3]馬捷瓊,劉纏民,陳 宏,等. 徐州荷斯坦牛NRAMP1基因多態性與產奶量通徑分析[J]. 江蘇農業科學,2007(1):116-118.
[4]馬燕芬. 影響奶牛產奶量的因素[J]. 農家顧問,2008(7):48-49.
[5]姚焰礎,江 山,肖 融,等. 熱應激對荷斯坦奶牛體溫和呼吸的影響[J]. 中國畜牧雜志,2012,48(11):59-62,75.
[6]張志登,敬盈嘉,劉 影,等. 熱應激對泌乳奶牛生理指標及生產性能的影響[J]. 中國畜牧雜志,2020,56(4):169-172.
[7]Trajchev M,Nakov D,Andonov S.The effect of thermal environment on daily milk yield of dairy cows[J]. Macedonian Veterinary Review,2016,39(2):185-192.
[8]West J W,Mullinix B G,Bernard J K.Effects of hot,humid weather on milk temperature,dry matter intake,and milk yield of lactating dairy cows[J]. Journal of Dairy Science,2003,86(1):232-242.
[9]魏學占,唐紅艷,楊忠霞,等. 氣象條件對奶牛產奶量的影響及對策[J]. 內蒙古氣象,2009(3):23-26.
[10]陳志英,陰 妮,池相河.氣象因素對黑龍江省奶牛產奶量影響分析[J]. 現代畜牧獸醫,2017(7):44-48.
[11]王雅春,陳幼春,柏 榮,等. 奶牛泌乳曲線的擬合及其模型參數的遺傳分析[J]. 畜牧獸醫學報,1999,30(5):399-404.
[12]張文龍. 新疆三個品種牛泌乳曲線的分析及產奶量校正系數的制定[D]. 烏魯木齊:新疆農業大學,2013.
[13]Kocak O,Kiz B.Comparison of different lactation curve models in Holstein cows raised on a farm in the south-eastern Anatolia region[J]. Archiv fur Tierzucht,2008,51(4):329-337.
[14]Otwinowska-Mindur A,Ptak E,Jagusiak W,et al. Modeling lactation curves of Polish Holstein-Friesian cows.Part Ⅰ:The accuracy of five lactation curve models[J]. Journal of Animal and Feed ences,2013,22(1):19-25.
[15]李 欣,溫 萬,王新燕,等. 基于ARIMA模型對寧夏地區奶牛月平均產奶量的預測[J]. 黑龍江畜牧獸醫,2016(23):99-102.
[16]張 鵬. 基于主成分分析的綜合評價研究[D]. 南京:南京理工大學,2004.
[17]王新峰,劉云芳,李明強,等. 主成分分析在奶牛產奶量選擇中的應用[J]. 中國草食動物,2002,22(1):8-9.
[18]陸呈委,鄧廷賢,譚正準,等. 奶水牛乳房線性性狀主成分分析研究[J]. 中國牛業科學,2016,42(2):1-3.
[19]劉彩紅. BP神經網絡學習算法的研究[J]. 西安工業大學學報,2012,32(9):723-727.
[20]張永超,趙錄懷,王 昊,等. 基于環境氣體信息的BP神經網絡蘋果貯藏品質預測[J]. 江蘇農業學報,2020,36(1):194-198.
[21]李友坤. BP神經網絡的研究分析及改進應用[D]. 淮南:安徽理工大學,2012.
[22]蔡榮輝,崔雨軒,薛培靜. 三層BP神經網絡隱層節點數確定方法探究[J]. 電腦與信息技術,2017,25(5):29-33.
[23]古少鵬,高斌戰,袁建琴,等. 溫度風速對奶牛產乳量的影響[J]. 當代畜牧,2001(4):10-11.王裕玉,徐 跑,張志偉,等. 不同養殖模式對黑鯛生長、血清生化指標及抗氧化性能的影響[J]. 江蘇農業科學,2020,48(23):155-160.