關鍵詞:Fisher判別;農事氣象;問答服務;技術與應用;浙江省
中圖分類號:P409;TP399 文獻標識碼:A
文章編號:0439-8114(2025)07-0182-04
DOI:10.14088/j.cnki.issn0439-8114.2025.07.031 開放科學(資源服務)標識碼(OSID):

Technology and application of agrometeorological Qamp;A service based on Fisher discriminant
CHENChong1,XIAOJing-jing2,LIJian1
(1.ZhejiangMeteorologicalServiceCenter,Hangzhou310o53,China;2.ZhejiangClimateCenter,Hangzhou310o3,Cina)
Abstract:TotthedemandforefcintagrometeorologicalservicsnagrometeorologicalQamp;AservicethologysedF erdiscrminantasproposd.Tesecificiplementationprocesoftistcholgyasescibed,indngdatacolltioatue extraction,modelconstructionandQamp;Asystemconstruction.Byintegratingthistechnologyintothe“Zhihui Qixiang”applicationreleasedbyZhejiang meteorologicaldepartment,theintellgentQamp;Ainteractionfunctionbetweenusersandteaplicationwasrealized. Testsandapplicationsshowedthatthisechologyhadertainefectsinimprovingtheficiencyofagrometeorologicalservices,enhancing service convenience and increasing user satisfaction.
Key Words:Fisher discriminant;agrometeorology;Qamp;A service;technology and application; Zhejiang Province
農業作為國民經濟的重要支柱產業,在推動區域經濟增長、保障糧食安全的同時,顯著提升了農戶收入水平,為鄉村振興戰略實施提供了關鍵支撐。傳統農業氣象服務渠道存在智能化水平不足、服務效率低與及時性差等問題,難以滿足農戶日益增長的多樣化需求[1-4],因此研究高效便捷的農業氣象信息對接技術顯得尤為重要,
Hua等5提出輕量化與低成本的分布式農業服務系統,通過整合社會與物理信息為農戶提供決策支持;Qian等創新性地將知識圖譜與自然語言處理技術相結合,構建了面向農業種植的智能決策支持系統,該系統能夠基于區域環境特征為農戶提供精準的種植建議和病蟲害防治方案。 Li[7] 設計了農業耕作技術的知識圖模型,基于現有的深文本匹配算法提出BERT ?+ DSSM算法,提高了農戶在相關知識問答方面的精準性;Zhao等8提出氣候智能型農業框架,通過技術創新與全球合作機制,提升糧食系統韌性,為農戶提供可持續農業發展途徑;Talwani等[9]提出農業智能技術整合框架,通過融合機器學習、物聯網、大數據與網絡技術,優化現有農業系統效能并強化安全性,為農戶提供精準化生產支持;Venkata等[10闡述了基于自然語言處理技術的對話式智能機器人的相關內容,通過集成物聯網智能農業系統,為大多數農戶提供種植指導與市場對接支持,實現降本增效。
本研究基于Fisher判別的統計模式識別算法構建智能問答系統。首先采集并預處理用戶提問內容,完成特征提取與選擇;然后進行模型構建與訓練,用于確定農事問題類別;最后通過問答系統在農業氣象服務知識庫中檢索相關知識并返回答案,以此實現高效便捷的農事氣象問答服務。
1 資料來源與處理
1.1 作物
農業氣象服務所涉及的作物主要針對南方地區廣泛種植的品類,其涵蓋了糧食作物、林果作物及經濟作物三大類型。糧食作物主要為雙季早晚稻與單季稻;林果作物主要為柑橘、楊梅和葡萄;經濟作物主要為茶樹等。
1.2 氣象數據
氣象數據分為監測數據和預報數據兩部分。監測數據來自浙江省多要素自動氣象站,采用插值法生成網格數據,其中,分鐘監測數據的更新頻率為每10min 1 次,小時監測數據為每1h1次,網格規格為5km×5km 。預報數據采用浙江省智能網格預報的多要素資料,預報更新頻次為 24h 內每1h1次, 24~ 72h 每 6h1 次, 72~168h 每 12h1 次,網格規格為2.5km×2.5km 。
1.3 Fisher判別
Fisher判別[11-14]是將高維數據投影到低維空間,通過計算各類別樣本均值向量、類內散度矩陣和類間散度矩陣求解廣義特征值問題,得到投影向量,構建Fisher判別函數。采用一對多或一對一策略處理多類別問題,依據判別值確定新樣本類別,最終將原始高維數據乘以投影矩陣完成投影,實現數據有效分類。在農事氣象問答服務場景中,用戶提問數據維度豐富且復雜,常涵蓋氣象要素數據、作物數據等,Fisher判別能夠有效處理這類多維數據,對問題分類能起到關鍵作用。
1.4 算法實現
1.4.1用戶提問與預處理農戶根據自身需求通過問答服務對話框輸入文字咨詢,包括氣象災害影響類、作物生長適宜度氣候類、農事操作建議類、農情應對措施類、作物病蟲害防治類、農業生產資料選用類、農產品市場信息類及農業政策法規解讀類相關信息。當農戶輸人農事問題時,對問題進行自然語言預處理,通過分詞、詞性標注等方法進行分析。首先將用戶提問文本切分為多個詞語;然后去除無實際意義的停用詞,獲取關鍵詞;最后對部分詞語進行詞形還原,以便后續處理,文本預處理流程如圖1所示。1.4.2特征提取針對不同類型的問題內容,采用多模態特征提取策略。對于常規氣象信息,如溫度、風速、壓強及濕度等,標準化處理后直接作為數值型特征;對于農業領域相關的作物信息,提取其關鍵農藝特征(作物品種、生育時期及生長狀態等);其他文本信息采用 TF-IDF(Term frequency-inverse docu-mentfrequency)加權[i5與文本嵌入相結合的方法進行特征表示。通過特征拼接融合生成最終的多維特征向量,該向量為氣象特征、農藝特征及其他文本特征的集合。
圖1文本預處理流程

1)氣象特征。將天氣現象描述(如陰天)轉換為國際標準天氣代碼體系的對應數值;對于溫度的相關表述,通過對比浙江省氣象局歷史同期溫度基準數據,計算溫度特征值,計算式如下。


式中 Ψ,fT 為溫度特征值; Tcur 為當前溫度; Tthr 為歷史同期溫度 ;fE 為其他氣象要素的特征值; Ecur 為當前其他氣象要素; Ethr 對應要素歷史同期值。
2)農藝特征。依據特定的作物名稱確定作物類型,根據作物生長狀態描述確定作物生長階段。對作物類型和生長階段分別進行編碼,問答服務涉及作物類型編碼 (v) 和作物生長階段編碼 (u) 。
3)其他文本特征。采用TF-IDF算法將處理后的文本轉化為數值特征向量。


TF-IDF(w,d)=TF(w,d)×IDF(w)
式中, TF(w,d) 為詞語 w 在文檔 d 中的標準化詞頻; nw,d 為詞語 w 在文檔中 d 出現的次數;
為文檔 d 中所有詞語的出現次數之和; IDF(w) 為逆文檔頻率; |D| 為文檔總數;
為包含詞語 w 的文檔數。 TF/-IDF(w,d) 為詞語 w 在文檔 d 中的 TF-IDF 值。提取關鍵詞和關鍵短語作為特征,將所有詞語的 TF/-IDF(w,d) 組合成一個特征向量 (vtext) 。
1.4.3 模型構建與訓練
1)模型構建。結合文獻[16,17]對農業氣象服務的研究,確立了8個農業氣象服務問題類別,分別為氣象災害影響類、作物生長適宜度氣候類、農事操作建議類、農情應對措施類、作物病蟲害防治類、農業生產資料選用類、農產品市場信息類及農業政策法規解讀類。基于Fisher判別構建農事氣象問答服務模型將經過特征提取和選擇的數據作為輸入,模型的輸出為對應的農事問題類別。模型結構包括輸入層、投影層和輸出層。輸人層接收特征向量,輸出層根據投影后的特征進行分類預測,得到問題的答案類別。
2)訓練。基于選定的特征訓練樣本并優化模型參數,生成判別函數(圖2);根據后驗概率最大準則對農業氣象服務問題進行分類。
圖2判別函數生成過程

1.4.4 問答系統實現
Step1:當用戶輸入農事問題時,系統對問題進行自然語言處理,將其轉化為機器能夠理解的特征向量。通過分詞、去除停用詞、詞形還原等技術提取問題中的關鍵信息。
Step2:從用戶提問中提取氣象特征、農藝特征、其他文本特征。
Step3:隨機選取部分農業氣象服務問題數據進行樣本訓練,確定判別函數。
Step4:根據問題分類結果,通過關鍵詞匹配,在農業氣象服務知識庫中檢索相關知識,篩選出最相關內容。
Step5:將生成的答案通過信息服務端反饋給用戶,完成問答服務流程
2 試驗結果與分析
針對農業氣象問題分類任務,基于約80000條用戶問題數據,從分類準確性和系統應用效果2個維度開展綜合評估。
2.1 準確性評估
從80000條問題中按8個類別(氣象災害影響類、作物生長適宜度氣候類、農事操作建議類、農情應對措施類、作物病蟲害防治類、農業生產資料選用類、農產品市場信息類及農業政策法規解讀類)進行抽樣,每個類別選取1000條樣本(共8000條)。基于構建的分類模型進行智能識別,分類結果如圖3、表1所示,其中零散點為未正確歸類樣本。結果表明,基于Fisher算法構建的農業氣象問答分類模型在測試集上的準確率達 86.5% ,充分驗證了訓練數據集的可靠性及該算法在本場景中的適用性。
圖3分類效果分布

對剩余72000條問題進行批量分類處理,從分類結果中選取 10% 的樣本(共7200條)開展可靠性驗證工作,將驗證結果繪制成ROC曲線(圖4)。結果表明,基于Fisher算法構建的農業氣象問答分類模型表現良好, .AUC 達 84% ,表明抽取樣本的分類效果達到預期標準。這一驗證過程充分證明了分類模型在實際應用中的可靠性。
表1分類模型識別結果 (單位:條)

注:1~8分別為氣象災害影響類、作物生長適宜度氣候類、農事操作建議類、農情應對措施類、作物病蟲害防治類、農業生產資料選用類、農產品市場信息類及農業政策法規解讀類
圖4樣本分類驗證的ROC曲線
圖5農事問答服務界面

2.2 應用效果評估
農事氣象智能問答系統在“智慧氣象”APP的“天氣小諸葛”模塊成功落地應用。自2023年系統上線至2025年3月,該模塊月均訪問量達46.7萬次,較技術應用前提升 32.6% 。問答服務界面如圖5所示。實證研究表明,農事氣象智能問答系統的部署提升了平臺用戶活躍度并優化了用戶體驗滿意度。
3 小結
Fisher算法在農事氣象問答服務領域展現出顯著優勢。通過數據采集與預處理、特征提取與選擇、模型構建與訓練以及開發問答系統等步驟,為農戶提供了高效的農事服務。該技術為農戶生產問題提供了智能答疑解決方案,有效提升了農事咨詢效率,但在實際應用中仍存在改進空間。當前系統對復雜語義問題的處理能力有待加強,且服務范圍主要局限于氣象相關的農業場景。針對這些局限性,未來研究計劃重點從三個方向進行優化升級,包括引入深度學習技術、提升語義理解深度,整合多模態數據、拓展應用場景覆蓋面及建立動態知識更新體系、保障信息時效性,從而全面提升系統的智能化水平和實用價值。

參考文獻:
[1]WANGC,GAOY,AZIZ A,et al.Agricultural disaster risk management and capability assessment usingbig data analytics[J].Big data,2022,10(3):246-261.
[2]付世軍,盧淞巖,李夢,等.基于B/S架構的智慧農業管理系 統的設計與實現[J].湖北農業科學,2025,64(1):154-161.
[3]CHARALAMPOPOULOSI,DROULIA F.A pathway towards climateservicesfortheagricultural sector[J].Climate,2O24,12(2): 18.
[4]陳沖,肖晶晶,王偉.基于LBS的農業氣象系統設計與實現 [J].農業工程,2024,14(7):37-41.
[5]HUAJ,WANGH,KANGM,etal.Thedesignand implementationofadistributedagricultural service system forsmallholder farmersin China[J].International journal of agricultural sustainability, 2023,21(1):2221108.
[6]QIANP,MAALLA A,WENHAIH,etal.Agricultural planting big dataqamp;a system technology research based on knowledge graph [A].2023 IEEE 3rd international conference on information technology,big data and artificial intelligence(ICIBA)[C].Chongqing,China:IEEE,2023.
[7]LI Y.A knowledge graph-based Q and A system for agricultural planting technology[A].Second international conference on electronic information engineering and computer communication(EIECC2022)[C].Xi'an,China:SPIE,2023.
[8]ZHAOJ,LIUD,HUANGR.A review ofclimate-smart agriculture:Recent advancements,challenges,and future directions[J]. Sustainability,2023,15(4):3404.
[9]TALWANI S,RAKHRA M,SARKART.Perspectiveson the futureofagriculture and recent developmentsinagricultural technology[A].2O24 11th International conference on reliability,infocom technologiesandoptimization(trendsand futuredirections)(ICRITO)[C].Noida,India:IEEE,2024.
[10]VENKATAR PS,NANDINIP KS,PUTTAMADAPPAC. Farmer’s friend:Conversational AIBoTfor smart agriculture[J]. Journal of positive school psychology,2022,6(2):2541-2549.
[11]ZHAO S,ZHANGB,YANGJ,etal.Linear discriminant analysis [J].Nature reviews methods primers,2024,4(1):70.
[12]LUCAAV,SIMON-VARHELYIM,MIHALYNB,etal.Fault type diagnosis of the WWTPdissolved oxygen sensor based on fisherdiscriminant analysis and assessment of associated environmental and economic impact[J].Applied sciences,2023,13(4):2554.
[13]AJITHAK M,INDRA NC.Fisher lineardiscriminantand discreteglobal swarm based task schedulingin cloud environment [J].Cluster computing,2022,25(5):3145-3160.
[14]XUE K,YANGJ,YAO F.Optimal linear discriminant analysis forhigh-dimensional functional data[J].Journal of the American statistical association,2024,119(546):1055-1064.
[15]JAINS,JAINSK,VASAL S.AneffectiveTF-IDF model to improve the text classification performance[A].2O24 IEEE 13thinternational conference on communication systems and network technologies(CSNT)[C].Jabalpur,India:IEEE,2024.
[16]HARINATHD,PATIL A,BANDIM,et al. Smart farming system-Anefficient techniquebypredictingagricultureyieldsbased onmachinelearning[J].Technische sicherheit(technical security)journal,2024,24(5):82-88.
[17]SOUSSI A,ZERO E,SACILER,et al. Smart sensors and smart data forprecision agriculture:A review[J].Sensors,2O24,24 (8):2647.
(責任編輯雷霄飛)