







摘要:利用湖北省典型茶區2018—2020年綠茶不同開采期品質數據及開采前15 d氣象觀測數據,首先通過決策樹和隨機森林等機器學習方法分析了影響綠茶品質的關鍵氣象因子及其響應關系,然后基于模糊數學理論,構建了氣溫、日照時數、風速和相對濕度單因子隸屬函數模型,并采用綜合加權得到綠茶氣候品質綜合指數模型,最后基于遺傳算法對模型參數進行優化求解,并確定了等級評價標準。結果表明,符合實際等級的樣本占樣本總數的67.2%,相差一個等級的樣本占樣本總數的32.8%,說明綠茶氣候品質綜合指數模型能夠反映不同氣候條件下綠茶品質的差異。
關鍵詞:綠茶;氣候品質;評價模型;機器學習;湖北省
中圖分類號:S571.1" " " " "文獻標識碼:A
文章編號:0439-8114(2023)06-0046-05
DOI:10.14088/j.cnki.issn0439-8114.2023.06.009 開放科學(資源服務)標識碼(OSID):
Study on climatological quality evaluation model with comprehensive indexes for green tea" in Hubei Province
DENG Huan-huan1,2,3, QIN Peng-cheng1,2,3, WAN Su-qin1,2,3, DENG Ai-juan1,2,3, TANG Yang1,2,3
(1.Wuhan Regional Climate Center, Wuhan" 430074, China;2.Three Gorges National Climatological Observatory,Yichang" 443002,Hubei,China;
3.Key Laboratory of Basin Heavy Rainfall,CMA,Wuhan" 430205,China)
Abstract: Quality analysis data of green tea within different green tea-plucking periods and observation data of meteorological elements at 15 days before spring tea-plucking in typical tea-producing regions of Hubei Province from 2018 to 2020 was used. Firstly, the key meteorological elements affecting green tea quality and its response relationship were analyzed by using machine learning methods including decision tree and random forest model. Secondly, the single-factor subordinate function model for temperature, sunshine, wind speed and relative humidity was built based on fuzzy mathematics theory. In the meanwhile, a comprehensive index model for climatological quality of green tea was built by using the comprehensive weighted method. Finally, parameters in this model were optimized based on the genetic algorithm. Additionally, grade evaluation standard was also determined. The results showed that the number of samples corresponding and existing one grade difference to the actual grade of samples accounted for 67.2% and 32.8% of the total samples, respectively. The results indicated that this model for green tea could reflect its quality difference under different climate situations.
Key words: green tea; climatological quality; evaluation model; machine learning; Hubei Province
農產品品質主要取決于獨特的溫濕度、光照及降水等生態環境和氣候條件。前人對農產品氣候品質評價的技術方法主要有兩種,第一種方法是僅對氣象指標進行評價劃分,包括該作物的適宜性指標、災害指標等,將集成的指標直接作為評價模型,例如安徽東至金絲皇菊[1]、新疆庫爾勒香梨[2]、陜西獼猴桃[3]等農產品;第二種方法就是將氣象數據與農產品品質數據結合,探討氣象因子與農產品品質數據間的關系,建立氣候品質評價模型,例如浙江龍井茶[4] 、浙江湖景蜜露水蜜桃[5]、黃河故道碭山酥梨[6]、江西贛南臍橙[7]等農產品。相比較而言,將農產品品質數據與氣象數據緊密關聯起來更具有科學性和指導價值,是農產品氣候品質評價的主要發展方向。
湖北省為茶葉生產大省,2018—2019年全省茶園總面積、總產量穩居全國第三或第四位,但產值卻僅居全國第七位,產量與產值極不匹配,這是湖北省茶葉產業亟需解決的問題。因此,本研究應用模糊數學理論[1-14]及決策樹和隨機森林等機器學習方法 [15-21],在前人研究的基礎上,鑒于早春風速對綠茶品質有較大影響[22],增加了風速作為影響指標,構建了湖北省綠茶氣候品質綜合指數模型,可為湖北省綠茶氣候品質評價工作和優化綠茶生產布局提供科學依據,也有助于地方茶農或茶葉農企提高農業產值,增加收入,助力鄉村振興。
1 資料與方法
1.1 資料來源與處理
1.1.1 綠茶品質數據的獲取 選取湖北省恩施市芭蕉侗族鄉、宣恩縣萬寨鄉、麻城順河鎮、夷陵唐家壩、英山溫泉鎮5個典型茶區的綠茶基地茶園取樣,品種為灌木型小葉種綠茶,茶園經緯度及海拔見表1。在2018—2020年3月上旬至5月上旬逐旬旬初動態取樣,取樣時要求同一茶園取樣的海拔差距不超過100 m,標準為兩葉一心(部分樣品因未達采摘標準而放棄采摘)。樣品烘干后,送中國農業科學院茶葉研究所檢測茶多酚、氨基酸、咖啡堿、水浸物和含水量5項理化指標,計算氨基酸與茶多酚的比值(氨酚比),一般以氨酚比或酚氨比來表征綠茶品質的好壞[23]。
1.1.2 氣象數據的獲取及格點數據處理方法 來自湖北省氣象信息與保障中心76個國家氣象站2018—2020年3月上旬至5月上旬逐日平均氣溫、日照時數、相對濕度、風速等氣象數據以及5個綠茶基地茶園中的區域自動站(恩施芭蕉站Q5109、宣恩伍家臺站Q5514、麻城順河集站Q9109、英山國營長沖茶廠站Q9312和夷陵唐家壩站Q4136)的平均氣溫。
利用湖北省基礎地理信息和國家氣象站觀測數據,以海拔高度、經度、緯度為協變量,基于回歸克里金方法建立1991—2020年1 000 m×1 000 m細網格氣象要素序列(平均氣溫、平均日照時數、平均相對濕度和平均風速),用于綠茶氣候品質綜合指數的計算。插值過程通過R語言實現。
1.2 湖北省綠茶氣候品質綜合指數模型構建
1.2.1 建模氣象因子指標及隸屬函數確定 有學者在構建綠茶氣候品質模型時,將鮮葉采收前15 d的平均氣溫、平均相對濕度和平均日照時數作為影響茶葉品質的氣象指標[8,9,13]。除了日照時數、氣溫和相對濕度外,風對綠茶的品質也有較明顯的影響。早春低溫伴隨西北風,除了導致空氣相對濕度下降外,更易使茶芽受凍[22],從而影響綠茶的品質。利用R語言rpar和randomForest[16]程序包分別構建決策樹和隨機森林等機器學習模型[24],分析不同氣象因子對綠茶品質的影響,最高層的節點為根節點,根節點以平均風速≥1.5 m/s為判定條件,說明風速對茶葉品質的影響最大,根節點以下左側反映平均風速偏大的情況,當平均風速≥1.5 m/s時(34個樣本,占總樣本的51%),平均氨酚比為0.20,當平均風速<1.5 m/s時(33個樣本,占總樣本的49%),平均氨酚比為0.25,說明平均風速對綠茶品質形成有一定影響, 平均風速<1.5 m/s時樣本的氨酚比更大。根節點以下各分枝分析類推。結果發現,采收前15 d的氣象因子對綠茶品質的影響大小依次為平均風速、平均日照時數、平均氣溫、平均相對濕度(圖1)。綜合考慮,本模型構建選取鮮葉采收前15 d的平均氣溫、平均相對濕度、平均日照時數和平均風速4個氣象因子構建湖北省綠茶氣候品質綜合指數模型。
各氣象因子對綠茶品質的影響采用模糊數學理論中的隸屬函數進行量化評價。基于決策樹算法(CART)對春季綠茶氨酚比與采摘前的氣象因子進行擬合建模,繪制氨酚比與各氣象因子的偏依賴響應曲線(圖2)。
基于響應曲線,采用鐘型模型確定綠茶品質的氣溫、日照時數的隸屬函數,分別采用Lotistic模型和冪指數倒數模型確定相對濕度和風速的隸屬函數,建立綠茶品質的氣溫、日照時數、相對濕度以及風速指數。
1.2.2 綜合指數模型權重確定及關鍵參數優化 茶葉品質形成過程中,光、溫、濕、風相互作用決定茶葉品質優劣。因此,采用加權求和法構建綠茶氣候品質綜合指數。基于隨機森林模型分裂節點不純度下降量對各變量的重要性進行度量,確定各指數權重。
利用遺傳算法[23]對綜合指數模型的關鍵參數進行優化。結合茶葉生理特點,確定參數合理的取值范圍,以綜合指數模型預測的綠茶品質指數與實測氨酚比的相關系數最大為目標函數進行迭代求解。
1.2.3 湖北省綠茶氣候品質空間分布圖繪制 利用“1.1.2”得到的湖北省1991—2020年30年細網格" " "(1 000 m×1 000 m)歷史氣象數據,基于湖北省綠茶氣候品質綜合指數模型,計算湖北省網格點上3—5月逐旬綜合指數最大值30年序列,取80%保證率,依據綠茶氣候品質評價等級劃分標準繪制湖北省綠茶氣候品質空間分布圖。
1.2.4 湖北省綠茶最佳等級品質采摘期空間分布圖繪制 找出上述30年序列綜合指數值所對應的采摘期,計算湖北省網格點上每個采摘期的出現頻率,頻率最大的采摘期即為該格點最佳品質等級采摘期,從而繪制湖北省綠茶最佳等級品質采摘期空間分布圖。
2 結果與分析
2.1 湖北省綠茶氣候品質綜合指數模型
2.1.1 氣溫指數 根據綠茶氨酚比與氣溫的響應曲線,結合植物生長氣候適宜度理論,采用鐘型模型建立的綠茶品質氣溫指數模型如式(1)所示。
式中,[YT]為綠茶品質形成的氣溫指數;T為鮮葉采收前15 d的日平均氣溫;Ttop、Tbase、Topt分別為綠茶最佳品質形成的上限氣溫、下限氣溫和最適氣溫;Bt為形狀參數,計算式如式(2)所示。
2.1.2 日照指數 采用鐘型模型建立的綠茶品質日照指數模型如式(3)所示。
式中,[YS]為綠茶品質形成的日照指數;S為鮮葉采收前15 d的平均日照時數;Stop、Sbase、Sopt分別為綠茶最佳品質形成的平均上限日照時數、下限日照時數和最適日照時數;Bs為形狀參數,計算式如式(4)所示。
2.1.3 相對濕度指數 相對濕度對綠茶品質的影響采用Lotistic曲線形式來定量描述,建立的表達式如式(5)所示。
該Lotistic曲線是一個拉長的“S”形累積增長曲線,定義其一階導數為速度函數。當速度函數的二階導數值為0時,Lotistic曲線方程的增長速率出現拐點,如式(6)所示,此時相對濕度對綠茶品質的影響明顯。
兩個速度拐點將Lotistic曲線劃為漸增期(0,Hl)、快增期(Hl, Hr)和緩增期(Hr,+∞)3個區間。
式中,YH為綠茶品質形成的相對濕度指數;H為鮮葉采收前15 d的平均相對濕度;Hl、Hr為Lotistic曲線的兩個拐點,即綠茶最佳品質形成的相對濕度的上限值和下限值。
2.1.4 風速指數 以e的冪指數倒數形式建立綠茶品質風速指數模型,表達式如式(7)所示。
式中,YF為綠茶品質形成的風速指數;F為鮮葉采收前15 d的平均風速;f b為模型參數。
2.1.5 湖北省綠茶氣候品質綜合指數及等級劃分 影響綠茶品質的氣象因子重要性度量如圖3所示,日照時數、平均氣溫、平均相對濕度、平均風速對綠茶品質的影響重要性都在20%~30%,結合綠茶生長生理特性,確定4個指數為等權重。
利用綜合加權法得到綠茶氣候品質綜合指數計算式如式(8)所示。
式中,YT、YS、YH、YF分別為氣溫指數、日照時數指數、相對濕度指數和風速指數; cT、cS、cH、cF分別為YT、YS、YH、YF的權重,皆為0.25。
由遺傳算法優化求解的各氣象因子指數模型參數如表2所示,參數優化后的各氣象因子指數適宜度曲線如圖4所示。
依據模糊數學理論及茶葉氣候品質評價行業標準[8,9,13]確定綜合指數分級指標,綜合指數按照≥0.90、0.75~0.90、0.50~0.75、lt;0.50的斷點劃分為特優、優、良和一般4級,如表3所示。
2.2 湖北省綠茶氣候品質綜合指數模型檢驗
2.2.1 模型準確率檢驗 將實際檢測的氨酚比數據按照表3確定品質等級,與利用綠茶氣候品質綜合指數模型計算數據對應的等級進行比對檢驗,67個樣本中45個樣本符合實際等級,占樣本總數的67.2%,22個樣本相差一個等級,占樣本總數的32.8%。以上結果表明,湖北省綠茶氣候品質綜合指數模型能夠較好地反映不同氣候條件下茶葉品質的差異。
2.2.2 湖北省綠茶氣候品質等級空間分布 湖北省綠茶氣候品質空間分布如圖5所示。從圖5可以看出,湖北省特優綠茶產區面積最大的是恩施州,其次是宜昌市,再次是十堰市;另外黃岡市、咸寧市的山區有小部分茶葉產區可以達到特優茶葉的標準。恩施州特優茶葉產區主要在利川、咸豐、來鳳、恩施、宣恩、建始、鶴峰。宜昌市特優茶葉產區主要在宜昌、宜都、長陽、巴東、秭歸、五峰。十堰市特優茶葉產區主要在竹山、竹溪、房縣、鄖西、保康。黃岡市特優茶葉產區主要在英山。咸寧市特優茶葉產區主要在崇陽。湖北省內其他大部分茶區所產綠茶為優,無良和一般品質茶葉產區。上述分布與湖北省茶葉產區綠茶品質的實際情況較為符合[25-27]。
2.2.3 湖北省綠茶最佳品質等級采摘期空間分布 湖北省綠茶最佳品質等級采摘期空間分布如圖6所示。從圖6可以看出,湖北省綠茶最佳品質等級采摘期鄂西南武陵山及三峽茶區在4月上中旬,鄂西北除神農架以外的秦巴山茶區在4月上中旬,神農架茶區在5月下旬至6月上旬,鄂中大洪山茶區及鄂東北大別山茶區都在3月中下旬,鄂南幕阜山茶區在3月下旬。上述綠茶最佳品質等級采摘期也與實際情況較一致。
3 小結與討論
本研究在前人研究的基礎上,增加了風速作為影響指標,構建了湖北省綠茶氣候品質綜合指數模型。建模使用的茶葉樣品產地經度和海拔差異較大,具有一定代表性。模型計算出的省內綠茶特優及優質茶葉的分布情況以及綠茶最佳品質形成時的采摘期等結果都與實際情況較為符合,說明該模型在一定地理區域范圍內有推廣價值。
由于綠茶品質對采摘前氣象條件的變化十分敏感,故采摘前氣象條件對茶葉品質的影響較大。但通過英山2020年的樣本數據發現,2019年出現嚴重的氣象災害,對茶樹植株造成傷害,2020年綠茶品質亦受到影響。但考慮到茶樹是多年生植株以及模型的易用性,該指數模型僅考慮了采摘前15 d的氣象條件對茶葉品質的影響,未考慮2019年極端氣象災害對茶樹植株的影響而造成的品質影響,因此該指數模型僅適用于未出現極端氣象災害的情況。
由于茶樹是多年生植株,在湖北省不同區域取樣時無法完全統一品種,本研究中的研究對象是灌木型小葉種綠茶。由于不同區域種植的綠茶品種有差異,在篩選影響茶葉品質的氣象指標和建立評價模型時,應適當考慮品種的差異。因此,湖北省綠茶氣候品質綜合指數模型還需要在應用中不斷修訂和完善。
參考文獻:
[1] 楊春雷,徐 陽,程東兵,等. 菊花氣候品質評價技術初探與實踐[J]. 農村經濟與科技," 2017, 28(21):66-71.
[2] 吳新國,張仕明,李曉川,等. 庫爾勒香梨氣候品質認證模型設計[J]. 現代農業科技, 2018(15):231-233.
[3] 張向榮,何可杰,雷 雯,等.獼猴桃果品氣候品質認證技術研究[J]. 陜西農業科學, 2015, 61(10):65-68.
[4] 婁偉平,吳利紅,孫 科,等. 春季龍井茶葉氣候品質認證[J].氣象科技, 2014, 42(5):945-950.
[5] 楊 棟,金志鳳,丁燁毅,等. 水蜜桃氣候品質評價方法與應用[J].生態學雜志,2018, 37(8): 2532-2540.
[6] 李 德,高 超,孫 義,等.黃河故道碭山酥梨氣候品質評價模型研究[J].西北農林科技大學學報(自然科學版),2018,46(10):108-116.
[7] 張智勇,廖 芳,李秀山,等. 贛南臍橙氣候品質認證[J].中國農學通報, 2016, 32(34):149-152.
[8] 金志鳳,王治海,姚益平,等. 浙江省茶葉氣候品質等級評價[J]. 生態學雜志,2015, 34(5):1456-1463.
[9] QX/T 11—2017,中華人民共和國氣象行業標準[S].
[10] 王治海,金志鳳,楊 棟,等. 基于Arc Engine 的茶葉生產氣象服務業務系統的設計與實現[J].中國農學通報,2016,32(21):185-193.
[11] 李仁忠,王治海,金志鳳,等. 浙江省農產品氣候品質認證服務淺析[J]. 浙江氣象, 2015, 36(4):23-25.
[12] 車秀芬,張京紅,黃海靜,等. 海南芒果氣象災害監測及氣候品質認證系統研發[J].氣象研究與應用, 2017, 38(2):45-48.
[13] 劉瑞娜,陳金華,曹 雯,等. 基于氣候指數的安徽省茶葉氣候品質評價[J]. 生態學雜志,2019, 38(2): 612-618.
[14] 金志鳳,葉建剛,楊再強,等. 浙江省茶葉生長的氣候適宜性[J]. 應用生態學報,2014,25(4):967-973.
[15] 郭澎濤,李茂芬,羅 微,等. 基于多源環境變量和隨機森林的橡膠園土壤全氮含量預測[J]. 農業工程學報,2015,31(5): 194-202.
[16] 李欣海. 隨機森林模型在分類與回歸分析中的應用[J]. 應用昆蟲學報,2013, 50(4): 1190-1197.
[17] 秦鵬程,劉 敏,李 蘭. 有效降水指數在暴雨洪澇監測和評估中的應用[J]. 中國農業氣象, 2016, 37(1): 84-90.
[18] 秦鵬程,夏智宏,陳偉亮. 農業氣候年景評估指數構建及在江漢平原的應用[J]. 氣象科技進展,2018, 8(5): 40-45.
[19] 謝志清,杜 銀,高 蘋,等. 江淮流域水稻高溫熱害災損變化及應對策略[J]. 氣象,2013,39(6): 774-781.
[20] 張 雷,王琳琳,張旭東,等. 隨機森林算法基本思想及其在生態學中的應用[J]. 生態學報,2014,34(3): 1-10.
[21] 秦鵬程,劉志雄,萬素琴,等. 基于決策樹和隨機森林模型的湖北油菜產量限制因子分析[J].中國農業氣象,2016,37(6): 691-699.
[22] 駱耀平. 茶樹栽培學[M]. 第五版.北京:中國農業出版社,2016.88-104.
[23] 程啟坤. 茶葉品種適制性的生化指標:酚氨比[J].中國茶葉,1983(1):38.
[24] 郭桂義,嚴佩峰,文 宏,等. 安吉白茶與信陽群體種信陽毛尖茶化學成分和品質的比較[J].食品科技,2010,35(6):118-121.
[25] 安 哲. 開發名優茶 提升茶效益[J]. 中國茶葉,2015(4): 6.
[26] 李兆能. 湖北茶葉產業發展現狀及對策建議[J]. 調查與研究, 2007(1): 42-44.
[27] 譚文選. 湖北省茶葉標準與茶葉質量[J]. 茶葉通報, 1992(3): 43-44.
收稿日期:2022-05-07
基金項目:湖北省科技基金項目(2019Y05)
作者簡介:鄧環環(1980-),女,湖北鐘祥人,高級工程師,主要從事生態與農業氣象研究,(電話)18971382090(電子信箱)11662106@qq.com;通信作者,萬素琴,正高級工程師,主要從事農業氣象研究,(電子信箱)11662106@qq.com。