









摘要:針對(duì)農(nóng)業(yè)生產(chǎn)者對(duì)農(nóng)業(yè)知識(shí)的了解和學(xué)習(xí)的渠道少,新農(nóng)業(yè)技術(shù)和新農(nóng)業(yè)成果的推廣困難等問題,以農(nóng)業(yè)知識(shí)庫為基礎(chǔ),結(jié)合語言大模型、卷積神經(jīng)網(wǎng)絡(luò)提出了一種農(nóng)業(yè)專家系統(tǒng)。系統(tǒng)根據(jù)用戶提出文字的問題,通過語言大模型提取問題的詞向量,并在農(nóng)業(yè)知識(shí)庫中進(jìn)行相似性查詢,最后將查詢結(jié)果返回給語言大模型,由語言大模型生成問題的答案;對(duì)于用戶提出的病蟲害問題,系統(tǒng)根據(jù)用戶提供的圖像,通過卷積神經(jīng)網(wǎng)絡(luò)對(duì)病蟲害進(jìn)行分類,幫助用戶快速準(zhǔn)確地判斷病蟲害類型,同時(shí)提供知識(shí)庫中相關(guān)的防治方案。系統(tǒng)的實(shí)現(xiàn)為農(nóng)業(yè)生產(chǎn)者提供了一個(gè)快速準(zhǔn)確的輔助決策工具和一條便捷的知識(shí)獲取渠道。
關(guān)鍵詞:專家系統(tǒng);農(nóng)業(yè)知識(shí)庫;語言大模型;卷積神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2025)05-0015-04 開放科學(xué)(資源服務(wù)) 標(biāo)識(shí)碼(OSID) :
0 引言
數(shù)字技術(shù)是發(fā)展現(xiàn)代農(nóng)業(yè)和實(shí)現(xiàn)農(nóng)業(yè)可持續(xù)發(fā)展的關(guān)鍵技術(shù),20世紀(jì)70年代末,美國伊利諾斯大學(xué)開發(fā)了世界上應(yīng)用最早的農(nóng)業(yè)專家系統(tǒng),主要用于農(nóng)作物病蟲害的診斷[1],我國專家系統(tǒng)的研究起始于20 世紀(jì)80年代初期[2],在各領(lǐng)域相繼出現(xiàn)了大量專家服務(wù)系統(tǒng)。近年來,隨著計(jì)算機(jī)技術(shù)和人工智能技術(shù)的進(jìn)步,基于人工智能的專家服務(wù)系統(tǒng)成為了各領(lǐng)域的研究熱點(diǎn),即利用各領(lǐng)域?qū)<曳e累的知識(shí)和經(jīng)驗(yàn)構(gòu)建知識(shí)庫,基于人工智能算法構(gòu)建專家模型,最后結(jié)合知識(shí)庫與專家模型,實(shí)現(xiàn)模擬人類專家的推理和決策過程。例如在交通領(lǐng)域,曹楠等人針對(duì)地面軌道交通開發(fā)了地面專家診斷系統(tǒng),提高了車輛運(yùn)行的數(shù)字化水平和列車風(fēng)險(xiǎn)預(yù)知能力,從而保障了車輛安全[3]。在醫(yī)療領(lǐng)域,童江波等人通過構(gòu)建了基于規(guī)則的中醫(yī)藥專家系統(tǒng),系統(tǒng)利用數(shù)據(jù)挖掘技術(shù),為患者提供有效的新鮮止咳中藥治療方案[4]。黃承寧等人提出了一種面向患者就醫(yī)前自診的基于醫(yī)療知識(shí)圖譜的自動(dòng)問診系統(tǒng),有效解決了相關(guān)病癥咨詢專業(yè)缺乏問題,實(shí)現(xiàn)了患者自助[5]。賈李蓉等人以中醫(yī)藥學(xué)語言系統(tǒng)為基礎(chǔ),引入自然語言處理、知識(shí)庫、自動(dòng)問答、信息檢索等技術(shù),結(jié)合中醫(yī)藥信息領(lǐng)域?qū)<业慕?jīng)驗(yàn)知識(shí),構(gòu)建一套智能知識(shí)問答系統(tǒng),有效地幫助用戶在互聯(lián)網(wǎng)上獲取所需的中醫(yī)藥知識(shí)、獲得更便捷更準(zhǔn)確的網(wǎng)絡(luò)診療體驗(yàn)[6]。在水利領(lǐng)域,鄒遐邇等人通過對(duì)水質(zhì)檢測(cè)流程合理分析以及各監(jiān)控點(diǎn)反饋信號(hào)診斷,結(jié)合LabVIEW可視化編程技術(shù)、信號(hào)分析技術(shù)和測(cè)控技術(shù)設(shè)計(jì)了一種基于微試劑原位水質(zhì)檢測(cè)儀的多參數(shù)水質(zhì)微型站監(jiān)控系統(tǒng),現(xiàn)場(chǎng)應(yīng)用結(jié)果表明,采用診斷專家系統(tǒng)的水質(zhì)微型站監(jiān)控系統(tǒng)滿足水質(zhì)測(cè)控的需求, 極大提升系統(tǒng)的穩(wěn)定性、安全性[7]。王喆等人提出了融合GPT和知識(shí)圖譜的應(yīng)急決策智能問答系統(tǒng),實(shí)現(xiàn)洪澇災(zāi)害應(yīng)急處置過程中的在線輔助決策,提升了洪澇災(zāi)害應(yīng)急信息分析和決策效率[8]。
但由于農(nóng)業(yè)知識(shí)結(jié)構(gòu)復(fù)雜,且農(nóng)業(yè)具有鮮明的地域性,一個(gè)區(qū)域的品種、技術(shù)到另一個(gè)區(qū)域并不一定適用同一品種在不同區(qū)域,所以當(dāng)前的通用大模型無法直接用于農(nóng)業(yè)領(lǐng)域的問答,因此需要構(gòu)建一個(gè)適用于農(nóng)業(yè)的專家系統(tǒng),對(duì)農(nóng)業(yè)領(lǐng)域的專家模型進(jìn)行針對(duì)性優(yōu)化,從而較好地滿足農(nóng)業(yè)生產(chǎn)者的本地化、專業(yè)化、個(gè)性化的需求。
1 系統(tǒng)設(shè)計(jì)
依托農(nóng)業(yè)專家的知識(shí)、技術(shù)和服務(wù)體系,搭建農(nóng)業(yè)專家系統(tǒng),按數(shù)據(jù)層、支持層、應(yīng)用層來分層構(gòu)建,具體如圖1所示。
1)數(shù)據(jù)層是專家云系統(tǒng)全量業(yè)務(wù)數(shù)據(jù)的存儲(chǔ)、管理和服務(wù)中樞,以農(nóng)業(yè)科技服務(wù)為核心,提供數(shù)據(jù)匯聚治理的流程和工具,提供一站式數(shù)據(jù)資源管理服務(wù)。圍繞專家云服務(wù)業(yè)務(wù),構(gòu)建從數(shù)據(jù)匯聚到數(shù)據(jù)監(jiān)控的完整數(shù)據(jù)治理流程,匯聚服務(wù)數(shù)據(jù),建立農(nóng)業(yè)專家、農(nóng)業(yè)知識(shí)、產(chǎn)業(yè)主體、服務(wù)資源、政策法規(guī)、農(nóng)情監(jiān)測(cè)、生產(chǎn)管理、服務(wù)對(duì)接、供需匹配、運(yùn)營管理等專題數(shù)據(jù),支撐業(yè)務(wù)場(chǎng)景的數(shù)據(jù)需求。
2)支持層圍繞專家系統(tǒng)的業(yè)務(wù)需求和應(yīng)用特點(diǎn),融合了統(tǒng)一門戶、身份管理、信息推送、API接口、智能算法、語言模型多種能力,構(gòu)建統(tǒng)一的能力支撐,對(duì)外提供API接口,滿足系統(tǒng)用戶管理、信息服務(wù)、應(yīng)用管理、數(shù)據(jù)建模、數(shù)據(jù)可視化分析等場(chǎng)景應(yīng)用需求。
3)應(yīng)用層面向農(nóng)業(yè)專家、農(nóng)業(yè)企業(yè)、農(nóng)戶等提供專家咨詢、知識(shí)服務(wù)、農(nóng)事指導(dǎo)、服務(wù)對(duì)接等綜合應(yīng)用,促進(jìn)農(nóng)業(yè)科技成果轉(zhuǎn)化應(yīng)用。
2 系統(tǒng)關(guān)鍵技術(shù)
2.1 農(nóng)業(yè)知識(shí)庫技術(shù)
農(nóng)業(yè)知識(shí)庫是本系統(tǒng)的核心,既包括農(nóng)業(yè)知識(shí)庫本身,也包括對(duì)知識(shí)進(jìn)行管理和分析的系統(tǒng)工具。它匯集了來自關(guān)聯(lián)業(yè)務(wù)系統(tǒng)、內(nèi)部其他系統(tǒng)、互聯(lián)網(wǎng)開源數(shù)據(jù)等多類知識(shí)素材,進(jìn)行素材采集、數(shù)據(jù)匯聚、數(shù)據(jù)治理、模型構(gòu)建等處理,最終形成覆蓋各行業(yè)、各業(yè)務(wù)類型的農(nóng)業(yè)知識(shí)庫,發(fā)現(xiàn)蘊(yùn)含于大數(shù)據(jù)中的知識(shí)價(jià)值,實(shí)現(xiàn)知識(shí)的增值。
1)農(nóng)業(yè)知識(shí)分類。
匯聚各類農(nóng)業(yè)專業(yè)知識(shí),按知識(shí)類型、內(nèi)容建立知識(shí)分類樹,將對(duì)應(yīng)的圖片、文字、視頻等知識(shí)歸納其中,在云系統(tǒng)上展示知識(shí)樹,方便用戶按分類樹進(jìn)行檢索查詢。
2)智能檢索查詢。
提供智能檢索查詢功能,系統(tǒng)可以通過農(nóng)戶輸入的關(guān)鍵字、關(guān)鍵詞快速匹配相關(guān)知識(shí),協(xié)助農(nóng)戶快速篩選出所要查詢的農(nóng)業(yè)知識(shí)。
農(nóng)業(yè)知識(shí)庫部署后界面如圖2所示。
2.2 語言大模型技術(shù)
LangChain 是一個(gè)開源的大型語言模型(LLM)的編程框架,可將例如GPT-4、阿里通義千問等語言大模型與外部計(jì)算和數(shù)據(jù)來源結(jié)合起來,在農(nóng)業(yè)專家云系統(tǒng)中,首先將相關(guān)的農(nóng)業(yè)知識(shí)導(dǎo)入農(nóng)業(yè)知識(shí)庫中,然后將知識(shí)數(shù)據(jù)轉(zhuǎn)化為詞向量,最后將詞向量和通義大模型連接起來,以構(gòu)建一個(gè)適用于農(nóng)業(yè)領(lǐng)域的語言大模型,其主要流程如圖3所示。
首先將專家系統(tǒng)中農(nóng)業(yè)知識(shí)庫中的農(nóng)業(yè)知識(shí)數(shù)據(jù)劃分為詞向量,并存入LangChain框架中的向量數(shù)據(jù)庫中,然后根據(jù)用戶提問的內(nèi)容,對(duì)向量數(shù)據(jù)庫中的詞向量進(jìn)行相似性搜索,得到向量數(shù)據(jù),最后將用戶提問的內(nèi)容和向量數(shù)據(jù)輸入至通義大模型中,由通義大模型給出最終的回答。
本系統(tǒng)的語言大模型主要包括知識(shí)庫的匹配與管理、通義大模型的選擇與應(yīng)用兩個(gè)功能模塊。
1)知識(shí)庫的匹配與管理。
鑒于農(nóng)業(yè)知識(shí)數(shù)據(jù)的結(jié)構(gòu)復(fù)雜,數(shù)據(jù)來源也各不相同,且不同地理位置,農(nóng)業(yè)品種、農(nóng)技手段也不盡相同,因此需要將農(nóng)業(yè)知識(shí)庫進(jìn)行細(xì)分,即分為通用農(nóng)業(yè)知識(shí)庫、廣西農(nóng)業(yè)知識(shí)庫等,在用戶登錄系統(tǒng)使用時(shí),根據(jù)其定位信息自動(dòng)匹配對(duì)應(yīng)的農(nóng)業(yè)知識(shí)庫,在不影響模型問答的精度的同時(shí),降低服務(wù)器緩存壓力。
2)通義大模型的選擇。
當(dāng)前主流的通義大模型有百度的文心一言、阿里云的通義千問、騰訊的混元生文、OpenAI的ChatGPT等,通過其開放的API接口接入本系統(tǒng),從而確保通義模型的實(shí)時(shí)更新,用戶可根據(jù)其不同的需求和使用習(xí)慣,可從中選擇任意一款通義大模型作為系統(tǒng)的基礎(chǔ)問答模型。
使用ChatGPT通義模型和通用農(nóng)業(yè)知識(shí)庫部署后的語言大模型如圖4所示。
2.3 病蟲害自動(dòng)識(shí)別技術(shù)
卷積神經(jīng)網(wǎng)絡(luò)屬于一種人工智能算法,常被用于圖像處理,如圖像分類、目標(biāo)識(shí)別等場(chǎng)景,其主要原理是利用卷積核對(duì)圖像進(jìn)行特征提取,從而實(shí)現(xiàn)圖像的識(shí)別和分類。在農(nóng)業(yè)生產(chǎn)中,病蟲害是影響作物產(chǎn)量和品質(zhì)的關(guān)鍵因素,為了能夠準(zhǔn)確識(shí)別病蟲害,選擇ResNet-50卷積神經(jīng)網(wǎng)絡(luò)作為病蟲害自動(dòng)識(shí)別的算法模型,該網(wǎng)絡(luò)采用了殘差網(wǎng)絡(luò)結(jié)構(gòu),該結(jié)構(gòu)通過將網(wǎng)絡(luò)輸入與輸出線性相加的方式,有效緩解了卷積神經(jīng)網(wǎng)絡(luò)中梯度消失和梯度爆炸的問題,其具體結(jié)構(gòu)如圖5所示。
系統(tǒng)采用Pytorch框架,以知識(shí)庫中的病蟲害圖像數(shù)據(jù)作為訓(xùn)練集,對(duì)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,主要流程如圖6所示。
首先篩選出知識(shí)庫中的病蟲害圖像數(shù)據(jù),然后建立病蟲害類別和其索引關(guān)系表,具體如表1所示。
根據(jù)類別總數(shù),對(duì)各個(gè)類別進(jìn)行One-hot編碼,其次進(jìn)行數(shù)據(jù)增強(qiáng)和圖像的歸一化,最后輸入ResNet網(wǎng)絡(luò),根據(jù)隨機(jī)梯度下降算法更新網(wǎng)絡(luò)權(quán)重,訓(xùn)練網(wǎng)絡(luò)模型。
3 系統(tǒng)應(yīng)用場(chǎng)景
1)農(nóng)業(yè)知識(shí)的自動(dòng)問答。通過系統(tǒng)提供在線問答交互方式,用戶輸入想要的信息說明,系統(tǒng)基于知識(shí)庫中的知識(shí)數(shù)據(jù)以及最新科研成果等,結(jié)合LLM語言大模型,智能整合知識(shí)給出反饋和來源鏈接,并對(duì)用戶提出的農(nóng)業(yè)領(lǐng)域的問題進(jìn)行專業(yè)的回答,提高海量知識(shí)的檢索查詢和服務(wù)效率,解決前沿農(nóng)業(yè)技術(shù)普及推廣難的問題,具體問答樣例如圖7所示。
2)農(nóng)業(yè)病蟲害的自動(dòng)識(shí)別。系統(tǒng)根據(jù)知識(shí)庫中的病蟲害圖像數(shù)據(jù),通過卷積神經(jīng)網(wǎng)絡(luò)提取病蟲害圖像的特征,根據(jù)提取的特征實(shí)現(xiàn)農(nóng)業(yè)病蟲害的快速精準(zhǔn)識(shí)別,并匹配農(nóng)業(yè)知識(shí)庫中的相關(guān)內(nèi)容,為其提供有效的防治措施和手段,具體應(yīng)用如圖8所示。
3)農(nóng)情監(jiān)測(cè)預(yù)警。系統(tǒng)通過用戶在自動(dòng)問答系統(tǒng)中的咨詢反饋,結(jié)合實(shí)時(shí)的農(nóng)情數(shù)據(jù),分析當(dāng)前農(nóng)業(yè)生產(chǎn)總體現(xiàn)狀,針對(duì)重大病蟲害和局部地質(zhì)災(zāi)害進(jìn)行監(jiān)測(cè)、分析、預(yù)警和預(yù)報(bào),為農(nóng)業(yè)生產(chǎn)經(jīng)營主體提供指導(dǎo)。
4 結(jié)束語
綜上所述,農(nóng)業(yè)專家系統(tǒng)旨在解決農(nóng)業(yè)發(fā)展中新技術(shù)、新成果落地普及困難的問題,是實(shí)現(xiàn)農(nóng)業(yè)高質(zhì)量發(fā)展的有效手段,本文通過構(gòu)建農(nóng)業(yè)知識(shí)庫,結(jié)合LangChain語言大模型框架,卷積神經(jīng)網(wǎng)絡(luò)等信息技術(shù)手段,為農(nóng)業(yè)生產(chǎn)者提供響應(yīng)迅速、專業(yè)性強(qiáng)的農(nóng)業(yè)問答服務(wù),為相關(guān)使用者提供了極大的便利,并且降低了新技術(shù)和新成果的普及推廣難度。但因當(dāng)前系統(tǒng)中農(nóng)業(yè)知識(shí)數(shù)量較少,回答的精度還有提升的空間,未來將繼續(xù)收集農(nóng)業(yè)領(lǐng)域的相關(guān)知識(shí),同時(shí)對(duì)語言大模型的各項(xiàng)參數(shù)進(jìn)行微調(diào),對(duì)系統(tǒng)持續(xù)地優(yōu)化和改進(jìn),助力農(nóng)業(yè)的高質(zhì)量發(fā)展。
參考文獻(xiàn)
[1] 石琳,陳帝伊,馬孝義.專家系統(tǒng)在農(nóng)業(yè)上的應(yīng)用概況及前景[J].農(nóng)機(jī)化研究,2011,33(1):215-218.
[2] 田娜,楊曉文,單東林,等.我國數(shù)字農(nóng)業(yè)現(xiàn)狀與展望[J].中國農(nóng)機(jī)化學(xué)報(bào),2019,40(4):210-213.
[3] 曹楠,劉興陽,劉鐵良,等.城市軌道交通地面專家診斷系統(tǒng)研究[J].智慧軌道交通,2024,61(3):22-29.
[4] 童江波,朱嬌嬌,胡靈芝,等.基于專家系統(tǒng)為感染后咳嗽患者提供新鮮中藥止咳方案[J].現(xiàn)代中醫(yī)藥,2021,41(3):125-129.
[5] 黃承寧,殷曉磊,陳武.基于知識(shí)圖譜的醫(yī)療問答系統(tǒng)研究應(yīng)用[J].信息技術(shù)與信息化,2024(5):210-215.
[6] 賈李蓉,劉麗紅,劉靜,等.基于中醫(yī)藥學(xué)語言系統(tǒng)的知識(shí)問答系統(tǒng)的設(shè)計(jì)與構(gòu)建[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2019,28(5):11-14.
[7] 鄒遐邇,李新民,羅學(xué)科,等.基于LabVIEW的水質(zhì)微型站實(shí)時(shí)故障診斷專家系統(tǒng)[J].工業(yè)安全與環(huán)保,2021,47(1):84-88.
[8] 王喆,陸俊燃,楊棟梁,等.融合GPT和知識(shí)圖譜的洪澇應(yīng)急決策智能問答系統(tǒng)研究[J].中國安全生產(chǎn)科學(xué)技術(shù),2024,20(4):5-11.
[9] 竇鳳岐,胡珊,李佳隆,等.基于LangChain的RAG問答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn):以C語言課程問答系統(tǒng)為例[J].信息與電腦(理論版),2024,36(6):101-103.
【通聯(lián)編輯:朱寶貴】
基金項(xiàng)目:廣西創(chuàng)新驅(qū)動(dòng)發(fā)展專項(xiàng)資金項(xiàng)目(桂科AA22036002) ;廣西壯族自治區(qū)農(nóng)業(yè)科學(xué)院科技發(fā)展基金(桂農(nóng)科2023JZ09) ;廣西壯族自治區(qū)農(nóng)業(yè)科學(xué)院穩(wěn)定資助科研團(tuán)隊(duì)基金(桂農(nóng)科2021YT077)