999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

小麥紋枯病防治領域本體構建

2024-12-01 00:00:00劉珂藝崔運鵬谷鋼王末
農業(yè)大數據學報 2024年4期
關鍵詞:概念農業(yè)

摘要:小麥紋枯病是我國麥區(qū)常發(fā)的土傳真菌病害,在小麥整個生育期均可發(fā)生,對我國小麥產量和品質影響極大。通過構建小麥紋枯病防治領域本體,對領域知識進行建模,以期整合和共享小麥紋枯病防治領域的知識,為農業(yè)決策、病害防治等方面提供重要的支持和指導。本研究以小麥紋枯病防治領域文獻為數據源,采用KeyBERT關鍵詞提取算法挖掘本體核心概念,通過層次聚類提取本體概念間層次關系。最后利用Protégé對本體概念、概念間關系進行可視化表達。本研究提出了小麥紋枯病防治領域本體構建方法,闡述了通過構建小麥紋枯病語料庫來構建本體的基本方法,給出了領域本體構建的流程框架,詳細闡述了構建中所使用的算法和構建工具。本研究數據源主要為科技文獻,未來可進一步擴充數據源,對本體進行擴展。本體評估部分目前主要依靠領域專家評估,未來可增加量化評估。本研究所構建的小麥紋枯病防治領域本體包含了較完整的小麥紋枯病概念體系,符合本體評價標準和本體構建需求,可為領域本體的構建提供借鑒與參考,為小麥紋枯病防治領域的知識發(fā)現與智能問答、智能推薦等下游應用提供有力支持。

關鍵詞:小麥紋枯?。环乐危活I域本體;本體構建;關鍵詞提??;層次聚類

1 "引言

小麥紋枯病是由禾谷絲核菌(Rhizoctonia cerealis"Vander Hoeven)引起的一種世界性土傳真菌病害[1-2]。目前,該病害在我國近二十個省(市)均有不同程度發(fā)生,特別在江蘇、浙江、安徽、山東、河南、河北、陜西、貴州、湖北及四川等省份的麥區(qū)發(fā)病比較普遍。小麥紋枯病在小麥整個生育期均可發(fā)生,會造成爛芽、病苗死苗、花桿爛莖、倒伏等多種癥狀[3]。近年來,中國北方秸稈還田麥區(qū)的紋枯病發(fā)生程度逐年加劇,嚴重危害著小麥的產量和品質。小麥紋枯病對產量影響巨大,通常導致小麥減產10%至20%,嚴重情況下甚至高達50%左右,個別地塊甚至出現完全絕收[4]。農戶在防治小麥病害的過程中,大多依賴于經驗,盡管許多農民已經是小麥病害方面的專家,但由于知識水平參差不齊,且地域差異、氣候差異等因素造成病害防治難以精準化。大多依靠以往的經驗來施用農藥,在追求產量時忽略了糧食質量和安全性的問題,造成農業(yè)生態(tài)環(huán)境惡化,同時食用過多農藥糧食對消費者的身體健康也會產生很大的負面影響。因此通過構建面向小麥紋枯病防治領域本體,對領域知識進行建模,可以給生產者們提供更加科學的指導,使得農民們了解如何根據發(fā)病過程治理和防治小麥紋枯病,能夠自主使用專業(yè)的小麥紋枯病防治方法,提高小麥病害防治效率,降低病害帶來的損失。這對保護農業(yè)生態(tài)系統(tǒng)和消費者的健康、提高糧食生產的經濟效益、保障農業(yè)生產和糧食安全具有重要意義。

20世紀80年代,本體論被引入信息科學領域,后來逐漸延伸到知識工程和人工智能領域[5]。2001年,聯合國糧食及農業(yè)組織(FAO)推出了農業(yè)本體服務AOS(Agricultural Ontology Service),它為用戶提供了一種通過本體定義和描述領域知識的方法,并協(xié)助領域內的交流。基于AOS項目,構建了作物本體、食品本體和農學本體[6-7]。常春(2003)將AOS引入國內,是我國農業(yè)本體研究的開端[8]。自此,眾多學者開始闡述研究農業(yè)領域本體的構建原則、流程、方法等內容。除本體理論研究外,還被應用實踐到農業(yè)領域多個方面,如農作物生產栽培、病蟲害防治、種質資源等。其中,農作物病蟲害防治的本體研究最為廣泛,如水稻病蟲害[9-10]、玉米病蟲害[11-12]、棉花病害[13]等。在農業(yè)領域,常用的本體構建方法是半自動構建,通過農業(yè)敘詞表將知識分類轉化為本體。目前常用的農業(yè)敘詞表有中國農業(yè)敘詞表(Chinese Agricultural Thesaurus,"CAT)、AGROVOC(多語種農業(yè)主題詞表)、NALT美國國家農業(yè)圖書館敘詞表、農學與生物學敘詞表Centre Agriculture Bioscience International (CABI)。劉桂鋒等(2022)以國家農業(yè)科學數據中心的棉麻類作物病原真菌病害數據庫和微生物農藥數據庫為主要數據源,結合《中國分類主題詞表》《農業(yè)科學敘詞表》《漢語主題詞表》《中國圖書館分類法》中的分類和術語構建了“棉花病害防治”本體[13]。任妮等(2021)采用文本挖掘和機器學習的方法構建番茄病蟲害領域本體[14]。Deepa R等(2022)使用自然語言處理技術提取農業(yè)術語,結合文本相似性與樸素貝葉斯(NBM),提出了一種自動構建農業(yè)本體的方法[15]。在特定的垂直領域,敘詞表難以提供更細粒度的知識分類,本體構建更多依賴于領域專家,通過手動構建。許多等(2023)采用自頂向下的建模方法,由領域專家從最頂層的概念進行人工編制,農業(yè)專家進一步細化知識間的關系和層次,構建了水稻精準施肥本體模型[16]。農業(yè)本體研究在中國取得了一定進展,尤其在農作物病蟲害防治方面應用廣泛。然而,存在敘詞表局限性、自動構建挑戰(zhàn)、本體動態(tài)性和更新、缺乏標準化以及專業(yè)領域知識獲取與驗證等問題。這些不足之處包括敘詞表在細粒度分類上的不足、自動構建過程中的主觀因素、本體更新維護的挑戰(zhàn)、標準化缺失以及專業(yè)知識獲取和驗證的復雜性。為提升農業(yè)本體研究質量和可持續(xù)性,需探索更有效地構建方法、推動標準化。

本研究面向小麥紋枯病防治領域,旨在通過知識建模,整合小麥紋枯病防治領域的相關知識,構建一個有益于農業(yè)決策和實踐的小麥紋枯病防治本體,為農業(yè)決策、病害防治等方面提供重要的支持和指導。針對小麥紋枯病防治領域實際需求,提出適用小麥紋枯病防治的本體構建流程。對于人工方式構建本體存在效率低、受限于專家知識等問題,本研究將探索新的方法進行本體構建。特別關注本體核心概念挖掘的方法研究,以減少構建過程中的主觀性和局限性,使本體具備更廣泛的應用潛力。同時,本研究的方法和成果也將為其他領域本體的構建提供借鑒和啟示。

2 "本體構建方法和框架

2.1""本體的定義

本體一詞來源于哲學,在哲學領域中本體研究的是“什么是一般意義上真實存在”的問題。知識工程領域引入“本體”一詞來進行知識的表示和知識的組織,我們現在提到的本體,已被賦予了與它原有含義大不相同的技術含義。在本體工程領域,學者們對于本體給出了一系列定義,在這些定義中被普遍接受的是由Gruber提出、經改進的定義。在1993年,Gruber首次提出了“本體是概念模型的明確的規(guī)范說明”的概念[17]。之后,于1998年,Studer在綜合了其他學者的定義后,進一步完善了本體的定義,將其描述為“共享概念模型的明確形式化規(guī)范說明”[18-20]

2.2""本體構建流程

骨架法(Skeletal Methodology)、TOVE法、Methontology法、五步循環(huán)法和七步法是目前典型的本體建模方法。骨架法是由Mike Uschold 和"King于1995年在愛丁堡大學從企業(yè)本體構建中總結的[21]。TOVE法是由多倫多大學企業(yè)集成實驗室的Gruninger和Mark. S Fox于1996年在TOVE項目過程中提出的[22]。Methontology法是由馬德里大學工藝分校的Mariano Fernandez和Gomez Perez等人在1997年開發(fā)[23]。五步循環(huán)法是由Maedche和Staab于2000年專用于語義網本體學習的構建方法[24]。七步法是斯坦福大學醫(yī)學院Noy和McGuinness于2000年開發(fā)的領域本體構建方法[25]。五種方法的特點及用途比較見表1:

本文在評估以上建模方法后,針對小麥紋枯病防治領域實際需求,提出了適用小麥紋枯病防治的本體構建流程(圖1)?!靶←溂y枯病防治”主題具有系統(tǒng)性,涵蓋農業(yè)科學、植物保護、化學、生物、農藥學等多個領域。與小麥相關的知識極為龐大,本體構建不可能囊括所有。因此,本研究的重點是構建“小麥紋枯病防治”本體,剔除與此無關的子概念,保留整體的框架結構,并在此基礎之上,添加新的概念及其子概念,實現小麥紋枯病防治本體概念的整合、補充和完善工作,將概念層的框架結構建立完成。

2.3""本體構建需求與調研

與軟件工程一樣,本體的構建開發(fā)和應用都是由需求驅動的。本體在應用過程中產生了新的需求。新的需求使得本體工程得以延續(xù),繼續(xù)開發(fā)構建新本體,在這個過程中,本體進化、本體維護及本體評價貫穿始終,以需求驅動本體的構建開發(fā)。在本體的實際應用中又帶來新的需求,新的需求又驅動新的構建開發(fā),促進本體不斷進化[26-27]

本文面向小麥紋枯病防治領域構建本體,旨在為下游小麥紋枯病防治應用提供基礎,支持知識推理,以發(fā)現新的知識。用戶涉及農業(yè)生產者、農技推廣專家、學生等。構建本體的數據源為科技文獻,在本體構建完成后需要領域專家的評估,并結合領域專家意見進行完善。預期的本體應包含的信息有:小麥紋枯病發(fā)病機理、影響因素有哪些、如何在病害常發(fā)的生長階段防治小麥紋枯病、病害發(fā)生后通過什么措施來治療小麥紋枯病最有效。

調研小麥紋枯病防治領域相關的本體,首先考慮復用和擴展現有本體。通過調研,相關的本體有小麥本體[28]、植物病害本體PDO[29]、植物保護本體PPO[30,31](圖2)。小麥本體(wheat ontology)是作物本體項目的本體之一。小麥本體提供了小麥性狀的層次結構,包括表型和基因型數據的術語。植物病害本體由植物本體PO[7]開發(fā),將植物病害分為細菌、真菌和病毒。每種類型都包含水稻、小麥和玉米的病害,并定義了每種病害,指出引起該病害的病原體名稱。植物保護本體PPO是國際干旱地區(qū)農業(yè)研究中心(ICARDA)作為大麥病害診斷專家系統(tǒng)的一部分而開發(fā)。本文從中梳理了相關本體的核心概念,并從中提取可復用部分,或對其進行擴展。

小麥本體中表型概念下分為七個子概念:非生物脅迫、生物脅迫、農藝、形態(tài)學、物候學、生理、質量。其中可復用的概念為:物候學—生長階段。植物病害本體分為三大核心概念:致病病原、寄主植物和植物病害。致病病原分為非生物致病因子和生物誘因兩個子概念,生物誘因分為細菌生物致病因子、真菌生物致病因子和病毒生物致病因子。植物病害分為植物細菌病害、植物真菌病害和植物病毒病害。植物真菌病害可作為小麥紋枯病的上位概念。小麥紋枯病的寄主植物即小麥,本文將其擴展為“病株”概念。植物保護本體概念包括:異常、栽培措施、病害、環(huán)境條件、生長階段、物質、觀測、生物、植物部位。其中“紊亂”概念分為兩個子概念:非生物病害和生物病害。植物病害是生物病害的下級概念,包含三個子類:植物細菌病、植物真菌病和植物病毒病。其中可復用的概念為:異?!∽?、植物部位、環(huán)境條件、生長階段。

2.4""本體核心概念挖掘

通過復用相關本體概念,提取了部分概念,但對于小麥紋枯病防治本體的概念構建,還需進一步提取領域概念,擴展本體。本文在CNKI搜集小麥紋枯病防治領域文獻作為數據源,相較于結構化數據,可獲得更多的概念和關系,使所構建的小麥紋枯病防治本體更加全面、完整。科技文獻往往帶有固定的關鍵詞,但其關鍵詞數量不足以表征該領域的核心概念,對篇章級文檔進行抽取關鍵詞可以獲得更全面的概念。以“小麥紋枯病AND(防治OR防控)”為檢索式,查找共計1008篇文獻。對文獻進行格式轉置,對文本進行預處理,經過分詞、停用詞過濾等操作,得到小麥紋枯病防治語料庫。為了從科技文獻中挖掘出有價值的內容,需要從語料庫中抽取出具有代表性的關鍵詞,作為候選概念。

目前有多種基于統(tǒng)計的無監(jiān)督關鍵詞抽取方法[32],包括基于TF-IDF(詞頻逆向文檔頻率)的方法、YAKE算法、TextRank算法、TopicRank算法、MultipartiteRank算法、EmbedRank算法和SifRank算法等。TF-IDF方法是這些方法中最基本的。傳統(tǒng)的無監(jiān)督關鍵詞提取方法主要依賴統(tǒng)計特征或圖結構。它們通常從文本語料中提取候選關鍵詞,使用分詞和詞性標注,采用正則表達式或N-Gram方法。然后,通過統(tǒng)計特征或圖分析對候選關鍵詞進行評分,選擇排名前n的關鍵詞。然而,這些傳統(tǒng)方法存在一些問題。正則表達式方法在更改數據集時可能需要手動修改匹配規(guī)則,而N-Gram方法可能引入許多錯誤的關鍵詞,同時也受到分詞質量的影響。此外,常見的無監(jiān)督方法未能充分挖掘語料中的隱含語義特征。本文采用KeyBERT關鍵詞提取算法,使用BERT嵌入和余弦相似度來查找文檔中與文檔本身最相似的子短語。首先利用BERT計算文檔的embedding值,從而獲取文檔向量級別的表示。然后針對N-Gram提取詞向量,最后利用余弦相似度來確定與文檔最相似的關鍵字或關鍵短語,得到最能描述整篇文檔的關鍵詞。為了使結果多樣化,本文使用最大邊距相關性(MMR)來創(chuàng)建同樣基于余弦相似度的關鍵字/關鍵短語。具體公式如下:

式中:Q表示查詢語句;C表示所有文檔的集合;R表示已得到的一個以相關度為基礎的初始集合;arg maxk[?]表示給出集合K個最大元素的索引;simQ,di)代表的是di與Q的相關性;simdi,dj)代表的冗余性。

在關鍵詞的基礎上,結合小麥紋枯病防治本體需求,進一步篩選、凝練作為核心概念候選集。表2展示了其中五條數據。

明確領域范圍和核心概念候選集后,構建領域本體的首要任務是構建本體層次結構模型。本文使用BERTopic進行主題建模,它利用Transformer和c-TF-IDF 來創(chuàng)建密集的集群,可以獲得主題及重要詞。主要步驟如下:首先將整篇文檔輸入BERT中,得到文檔的詞向量;對這些詞向量運用UMAP進行降維,得到低維詞向量;對低維詞向量進行聚類,得到聚類后的文檔;對聚類后的文檔采用c?TF?IDF得到各個主題的主題詞;對這些主題詞進行采用最大邊際相關性算法進行篩選。通過對核心概念候選集進行主題聚類,得到50個主題,表3為排名前五的主題,Topic“-1”是最大的,它指的是沒有分配給生成的任何主題的離群文本,在本文中將其忽略。層次聚類的

結果見圖3。

3 "小麥紋枯病防治本體建模實例研究

3.1""小麥紋枯病防治本體概念定義

本文對主題與層次聚類的結果進行分析、凝練,將小麥紋枯病防治本體分為八類父類概念,分別是發(fā)病規(guī)律、小麥生長期、病因、病發(fā)區(qū)域、病害程度、癥狀和防治措施。依照OWL的結構要求,它們都是Thing的下位概念。本文選用了目前廣泛使用的開源本體論編輯器Protégé,由斯坦福大學基于Java開發(fā),用于本體編輯和知識獲取。Protégé具有可擴展的結構和多個插件,支持本體描述語言如RDF、RDFS、OWL,并提供圖形化界面,使用方便。利用Protégé根據數據內容及表示特征,結合領域專家的指導,按照本體設計原則:知識描述范圍平衡、概念精煉,在Protégé中的“Classes”中添加層級概念(圖4)。

3.2""小麥紋枯病防治本體屬性定義

本體的概念層級構建完成后,需確定概念與概念之間的關系,即定義本體屬性關系[33]。本體屬性關系是后續(xù)實現知識推理的基礎。Protégé工具中涵蓋了三種類型的屬性關系,即對象屬性(Object Properties)、數據屬性(Data Properties)和注釋性屬性(Annotation Properties)。其中,對象屬性用于表示概念之間的關系,數據屬性用于描述概念本身的屬性,而注釋性屬性則用于對概念屬性進行注釋。本文只考慮對象屬性和數據屬性。根據小麥紋枯病防治領域的特點,通過整理分析父類概念間的關聯,小麥紋枯病防治本體涉及的對象屬性關系,如表4所示。本文對小麥紋枯病防治本體定義了11個對象屬性,16個一級數據屬性,8個二級數據屬性。在Protégé中的Object Properties和Data Properties選項,分別添加對象屬性和數據屬性(圖5)。選擇每個對象屬性的特征信息(Characteristic)來定義對象屬性的性質,并填寫相應的描述信息(Description),并添加定義域、值域、逆屬性等約束信息[33]。

3.3""小麥紋枯病防治本體構建與評估

本文根據本體評價標準對構建的小麥紋枯病防治領域本體進行了評估和優(yōu)化,以確保本體的科學性和專業(yè)性,使其能夠充分表達小麥紋枯病防治領域的概念(表5)。本體評價的標準通常包括清晰性、一致性、完善性和可擴展性等[34-35]。清晰性要求所定義的類和屬性必須明確,沒有歧義;一致性要求類之間的關系在邏輯上保持一致[30];完善性要求所定義的類和屬性能夠完整地描述小麥紋枯病防治領域,并適用于主要數據源中的知識體系;可擴展性要求本體能夠在小麥紋枯病防治領域中擴展,以適應新的概念的出現。本體初步構建完成后,邀請植保領域專家對本體概要模型進行評價。本體概要模型(圖6)中將對象屬性的定義域和值域分別與關聯概念進行連接,羅列各個概念的數據屬性,并將概念與數據屬性的定義域進行連接。參照本體評估指標體系構建相關研究[36],制定了小麥紋枯病防治領域本體的評價指標,專家針對本體概要模型進行了評估。

專家認為本文所構建的小麥紋枯病防治領域本體包含了較完整的小麥紋枯病概念體系,符合上述評價標準和本體構建需求,可進行本體的知識表達與下個階段的應用。將經專家評價修正后的本體模型利用Protégé進行可視化表達(圖7)。

4 "討論

本文構建的小麥紋枯病防治領域本體的數據源主要來自科技文獻,未來可進一步擴充數據源,對本體進行擴展。如互聯網上可信的資源、專利數據庫、農業(yè)研究機構的報告和網站等,收集關于小麥紋枯病防治的最新進展和新發(fā)現。在本體實際應用過程中,需要不斷進行更新和完善,隨著研究的深入,可能會出現新的概念和關系,在收集新的科技文獻和數據時,要及時將這些新信息納入本體中,確保本體的完整性。GPT等大語言模型的出現,為本體擴展和應用提供了全新的可能性。大語言模型可以從海量的科技文獻、專利數據庫和其他農業(yè)研究機構的報告中提取關于小麥紋枯病防治的重要信息,整合領域術語、新的概念,實現本體的自動化更新、優(yōu)化和擴展。在生物學、醫(yī)學領域已有相關應用研究,如基于大語言模型的知識提取算法SPIRES[37]:使用GPT模型進行基因組匯總,作為標準富集分析的補充[38]。大語言模型在小麥紋枯病防治領域本體擴展方面的應用值得進一步探索與實踐。

本文的本體評估部分目前主要依靠領域專家參與評估,未來可增加量化評估,量化評估可以幫助我們客觀地衡量本體的質量和有效性。目前國外應用較為廣泛的四種本體評估工具包括ODEval[39]、OntoQA[40]、Core[41]和OntoManager[42]。使用這些本體評估工具,可以從不同的角度對本體進行評估,發(fā)現潛在問題,并量化地衡量本體的質量和有效性,幫助本體構建者更好地理解本體的優(yōu)勢和不足,并指導進一步的改進工作[43]。通過持續(xù)的本體評估,可以保證本體始終保持最新、準確和實用,以更好地支持小麥紋枯病防治領域的研究和應用。

5 "結論

本文以小麥紋枯病防治領域科技文獻為數據源,提出了小麥紋枯病防治領域本體構建方法,采用KeyBERT關鍵詞提取算法挖掘本體核心概念,將小麥紋枯病防治本體分為了八個父類概念,包括發(fā)病規(guī)律、小麥生長期、病因、病發(fā)區(qū)域、病害程度、癥狀和防治措施。通過層次聚類提取本體概念間層次關系,定義了小麥紋枯病防治本體的11個對象屬性、16個一級數據屬性和8個二級數據屬性。最后利用Protégé對本體概念、概念間關系進行可視化表達。本文通過構建小麥紋枯病語料庫來構建本體的基本方法,給出了領域本體構建的流程框架,詳細闡述了構建中所使用的算法和構建工具,為領域本體的構建提供了一定的參考價值。小麥紋枯病防治本體在農業(yè)領域具有廣泛的應用前景,將分散的信息結構化,從大量科技文獻中整理和組織小麥紋枯病防治領域的知識,可為小麥紋枯病防治領域的知識發(fā)現與智能問答、智能推薦等下游應用提供有力支持,通過結合本體中的知識和推理規(guī)則,模擬專家的決策過程,向用戶提供與小麥紋枯病防治相關的問題診斷和解決方案,幫助農民和農業(yè)從業(yè)者更好地應對小麥紋枯病,推動農業(yè)的可持續(xù)發(fā)展。

參考文獻

[1] BOEREMA G H, VERHOEVEN A A. Check-list for scientific names of common parasitic fungi. Series 2b: Fungi on field crops: Cereals and grasses[J].Netherlands Journal of Plant Pathology, 1977, 83(5):165-204."DOI:10.1007/BF01976647.

[2] 賈廷祥,吳桂本,劉傳德.我國小麥根腐性病害研究現狀及防治對策[J].中國農業(yè)科學,1995,28(3):41-48.

[3] 潘灝.小麥紋枯病的發(fā)生及其防治措施[J].河南農業(yè),2016(7):39.

[4] 姚麗瑾,王琦,付學池,等.小麥紋枯病生防芽孢桿菌的篩選及鑒定[J].中國生物防治,2008(1):53-57.

[5] 鄭泳智,朱定局,吳惠粦,等.知識圖譜問答領域綜述[J].計算機系統(tǒng)應用,2022,31(4):1-13.

[6] 李景. 領域本體的構建方法與應用研究[D].北京:中國農業(yè)科學院,2009.

[7] CONSORTIUM T P O. The plant ontology consortium and plant ontologies[J].Comp Funct Genomics, 2002, 3(2):137-142."DOI:10.1002/cfg.154.

[8] 常春.聯合國糧食與農業(yè)組織AOS項目[J].農業(yè)圖書情報學刊,2003(2):14-15+24.

[9] 戴才萍,黃義德,錢平,等.水稻病蟲草害本體的構建研究[J].廣東農業(yè)科學,2011,38(1):191-194.

[10] 于合龍,沈金夢,畢春光,等.基于知識圖譜的水稻病蟲害智能診斷系統(tǒng)[J].華南農業(yè)大學學報,2021,42(5):105-116.

[11] 齊紅,官瑩瑩,劉亞波.面向中文文本的玉米病蟲害本體學習研究[J].計算機工程與應用,2011,47(20):206-209.

[12] 張伶子,段青玲,李道亮.玉米病蟲害診治本體構建技術研究[J].農機化研究,2012,34(1):41-45.

[13] 劉桂鋒,楊倩,劉瓊.農業(yè)科學數據集的本體構建與可視化研究——以“棉花病害防治”領域為例[J].情報雜志,2022,41(9):143-149+175.

[14] 任妮,孫藝偉,鮑彤,等.農業(yè)領域本體構建方法研究——以番茄病蟲害為例[J].情報探索,2021(4):51-57.

[15] DEEPA R, VIGNESHWARI S. An effective automated ontology construction based on the agriculture domain[J]. ETRI Journal, 2022, 44(4): 573-587."DOI:10.4218/etrij.2020-0439.

[16] 許多,魯旺平,許瑞清,等.基于農業(yè)時空多模態(tài)知識圖譜的水稻精準施肥決策方法[J].華中農業(yè)大學學報,2023,42(3):281-292.

[17] 趙應秋. 基于本體的語義檢索模型的研究[D].重慶:重慶大學,2010.

[18] 李恒杰,李明.基于本體的Web分類技術研究[J].微計算機信息,2006(21):215-217.

[19] 徐亞軍.基于本體的軟件構件描述及其檢索研究[D].上海:東華大學,2010.

[20] 索俊鋒,劉勇,鄒松兵.基于地理本體的綜合語義相似度算法[J].蘭州大學學報(自然科學版),2017,53(1):19-27.

[21] USCHOLD M, GRUNINGER M. Ontologies: Principles, methods and applications [J]. Knowledge Engineering Review, 1996,11 (2): 14-17.

[22] GRüNINGER M, FOX M S. Methodology for the design and evaluation of ontologies[EB/OL]. [2011 - 08 - 09]. http://stl.mie. utoron-to. ca/ publications/ gruniger-ijcai95. pdf.

[23] FERNDANDEZ M, GORMEZ-PEREZ A, JURISTO N. Methontology: From ontological art towards ontological engineering[C]//Proceedings of the AAA197 Spring Symposium on Ontological Engineering. Stanford University, March 24 - 26th, 1997:33 - 40.

[24] MAEDCHE A, STAAB S. Ontology learning for the semantic Web LM. Boston: Kluwer Academic Publishers, 2001:8 - 13.

[25] NOY N F, McGUINNESS D L. Ontology development 101 : A guide to creating your first ontology[EB/OL].[2010-12-20]. http://www. sfu.ca/ marques/federation/ pdf/Noy-Ontology 101. pdf.2001.

[26] 張磊.基于敘詞表和文獻數據庫的農業(yè)領域本體構建方法研究[D].北京:中國農業(yè)科學院,2011.

[27] 李景.本體理論及在農業(yè)文獻檢索系統(tǒng)中的應用研究——以花卉學本體建模為例[D].北京:中國科學院,2004.

[28] CARLOS GUZMáN. Wheat ontology[EB/OL]. (2019)[2023]. https://"cropontology."org/term/CO_321:ROOT.

[29] Planteome.org. Repository for the plant disease ontology. https://github."com/Planteome/plant-disease-ont-ology,2016.

[30] Ontology-based Research Group@IITM. https://sites.google.com/site/"ontoworks/ontologies.[Online; accessed 8-2023].

[31] Ontology for Plant Protection."https://sites.google.com/site/ppontology/"home.[Online; accessed 8-2023].

[32] 杜軍平,王岳,薛哲,等.中文學術關鍵詞抽取方法,裝置和存儲介質:CN202110814460.8[P].CN113268995A[2023-10-06].

[33] 楊潔.基于本體的柑橘病蟲害知識建模及推理研究[D].武漢:華中師范大學,2014.

[34] 李景,孟連生.構建知識本體方法體系的比較研究[J].現代圖書情報技術,2004(7):17-22.

[35] 宋錦文.基于知識蒸餾的農業(yè)知識圖譜構建研究[D].哈爾濱:哈爾濱工業(yè)大學,2022.

[36] 賈君枝,劉艷玲.本體評估指標體系的構建研究[J].圖書情報工作,2009,53(12):100-103.

[37] CAUFIELD J H, HEGDE H, EMONET V, et al. Structured prompt interrogation and recursive extraction of semantics (SPIRES): A method for populating knowledge bases using zero-shot learning[OL]. 2023."ArXiv:2304.02711.

[38] JOACHIMIAK M P, CAUFIELD J H, HARRIS N L, et al. Gene set summarization"using large language models[OL]. 2023."arXiv.2305."13338.

[39] CORCHO ó, GóMEZ-PéREZ A, GONZáLEZ-CABERO R, et al. ODEval: A Tool for Evaluating RDF(S), DAML+OIL, and OWL Concept Taxonomies[C]//IFIP International Federation for Information Processing,"vol154."Springer,"Boston,MA."https://doi.org/"10.1007/1-"4020-8151-0_32.

[40] TARTIR S, ARPINAR I B, MOORE M, et al. OntoQA: Metric-based ontology quality analysis[C]//IEEE ICDM 2005 Workshop on Knowledge Acquisition"from Distributed, Autonomous, Semantically Heterogeneous Data and Knowledge Sources At: Houston, Texas. https://api."semanticscholar.org/"CorpusID:10753368.

[41] FERNáNDEZ M, CANTADOR I, CASTELLS P. CORE: A tool for Collaborative Ontology Reuse and Evaluation[OL]. 2006.

[42] LJILJANA STOJANOVIC,"NENAD STOJANOVIC, JORGE GONZALEZ, et al. OntoManager-A System for the Usage-Based Ontology Management"[C]//Springer, Berlin, Heidelberg. Lecture Notes in Computer Science (LNCS, volume 2888), 2003:858-875.

[43] 賈君枝,牛雅楠.本體評估工具的比較分析[J].圖書情報工作,2010,"54(6):87-90.

引用格式:劉珂藝,崔運鵬,谷鋼,王末.小麥紋枯病防治領域本體構建研究[J].農業(yè)大數據學報,2024,6(4): 485-496. DOI: 10.19788/j.issn.2096-6369.000011.

CITATION:"LIU KeYi1, CUI YunPeng, GU Gang, WANG Mo. Research on Ontology Construction in the Field of Wheat Sharp Eyespot Control[J]. Journal of Agricultural Big Data,2024,6(4): 485-496. DOI: 10.19788/j.issn.2096-6369.000011.

Ontology Construction in the Field of Wheat Sharp Eyespot Control

LIU"KeYi1,2, CUI"YunPeng1,2*, GU"Gang3, WANG"Mo1,2

1.Agricultural Information"Institute, Chinese Academy of Agricultural Sciences, Beijing 100081, China;"2.Key Laboratory of Big Agri-data, Ministry of agriculture and rural areas, Beijing 100081,China;"3.Inspur Software Technology Co., Ltd. ,Beijing 100094, China

Abstract: Wheat Sharp Eyespot is a soil-borne fungal disease commonly found in China's wheat areas, which can occur throughout the entire reproductive period of wheat and has a great impact on the yield and quality of wheat in China. By constructing a Wheat Sharp Eyespot control domain ontology and modeling domain knowledge, we aim to integrate and share the knowledge in the field of Wheat Sharp Eyespot control to provide important support and guidance for agricultural decision-making and disease control. The ontology construction process for Wheat Sharp Eyespot control is proposed to meet the actual needs of Wheat Sharp Eyespot control. For the problems of low efficiency and limited expert knowledge in constructing ontologies by manual methods, this study will explore new methods for ontology construction. Special attention will be paid to the methodology of mining core concepts of the ontology to reduce the subjectivity and limitations in the construction process, so that the ontology will have a wider application potential.In this study, used the literature in the field of Wheat Sharp Eyespot control as a data source, KeyBERT keyword extraction algorithm was used to mine the core concepts of ontology, and BERT embedding and cosine similarity were used to find out the subphrases in the document that were most similar to the document itself. Hierarchical relationships between ontology concepts were extracted by hierarchical clustering, topic modeling was performed using BERTopic, Transformer and c-TF-IDF were used to create dense clusters.Finally, Protégé"was used to visualize and express the ontology concepts and inter-concept relationships.In this study, the results of thematic and hierarchical clustering were analyzed and condensed to classify the ontology of Wheat Sharp Eyespot control into eight parent concepts, which were pathogenicity pattern, wheat growth period, etiology of the disease, disease area, disease extent, symptoms and control measures. According to the characteristics of the Wheat Sharp Eyespot control domain, 11 object attributes, 16 first-level data attributes, and 8 second-level data attributes were defined for the Wheat Sharp Eyespot control ontology by organizing and analyzing the associations among the parent concepts. Finally, Protégé"was used to visualize and express the ontology concepts and inter-concept relationships. This study proposed a method for constructing a domain ontology for Wheat Sharp Eyespot control, described the basic method for constructing an ontology by building a corpus of Wheat Sharp Eyespot , gived a process framework for constructing a domain ontology, and described in detail the algorithms and construction tools used in the construction. The data source of this study was mainly scientific and technical literature, and the ontology can be extended in the future by further expanding the data source. The assessment part of the ontology mainly relied on the assessment of domain experts at present, and quantitative assessment can be added in the future.The Wheat Sharp Eyespot control domain ontology constructed in this study contained a more complete conceptual system of Wheat Sharp Eyespot , meeting the ontology evaluation criteria and ontology construction requirements, and can provide reference for the construction of domain ontology, and provide powerful support for knowledge discovery and downstream applications in the field of Wheat Sharp Eyespot prevention and control, such as intelligent Qamp;A, intelligent recommendation, and so on.

Keywords: wheat sharp eyespot; prevention and treatment; domain ontology; ontology construction;keywords extraction; hierarchical"clustering

猜你喜歡
概念農業(yè)
國內農業(yè)
國內農業(yè)
國內農業(yè)
Birdie Cup Coffee豐盛里概念店
現代裝飾(2022年1期)2022-04-19 13:47:32
擦亮“國”字招牌 發(fā)揮農業(yè)領跑作用
新農業(yè) 從“看天吃飯”到“看數吃飯”
歐盟發(fā)布短期農業(yè)展望
幾樣概念店
現代裝飾(2020年2期)2020-03-03 13:37:44
學習集合概念『四步走』
聚焦集合的概念及應用
主站蜘蛛池模板: 久久精品娱乐亚洲领先| 免费一级毛片完整版在线看| 免费毛片在线| 日韩欧美高清视频| 最新国产你懂的在线网址| 精品人妻一区无码视频| 国产一级二级在线观看| 久久久久国色AV免费观看性色| 国产99免费视频| 天天躁夜夜躁狠狠躁躁88| 日本国产在线| 91香蕉国产亚洲一二三区| 任我操在线视频| 国产传媒一区二区三区四区五区| 麻豆精选在线| 91色老久久精品偷偷蜜臀| 亚洲欧美精品日韩欧美| 欧美精品在线免费| 久久精品人人做人人| 国产啪在线| 中文字幕不卡免费高清视频| 狠狠色丁婷婷综合久久| 亚洲一区色| 波多野结衣国产精品| 99精品伊人久久久大香线蕉| 999精品在线视频| 欧美黄网站免费观看| 四虎成人在线视频| 亚洲中文无码h在线观看| 91啪在线| 国产精品亚洲一区二区在线观看| 91啪在线| 国产精品无码翘臀在线看纯欲| 国产对白刺激真实精品91| 日韩免费毛片视频| 国产特级毛片| 99在线视频免费观看| 亚洲国产精品一区二区第一页免| 亚洲91精品视频| 亚洲国产日韩欧美在线| 欧美成人综合在线| 欧美一级大片在线观看| 色爽网免费视频| 日本高清免费一本在线观看| 中国国语毛片免费观看视频| 国产91无码福利在线| 国产美女叼嘿视频免费看| 波多野结衣一级毛片| 国产高清无码第一十页在线观看| 免费无码AV片在线观看中文| 五月婷婷综合色| 欧美激情,国产精品| 国产精品女主播| 成人无码区免费视频网站蜜臀| 久久精品日日躁夜夜躁欧美| 精品伊人久久大香线蕉网站| 欧美不卡在线视频| 欧美成人a∨视频免费观看 | 日本草草视频在线观看| 老司机午夜精品网站在线观看 | 成人噜噜噜视频在线观看| 成人国产小视频| 国产亚洲精| 欧美伦理一区| 免费看黄片一区二区三区| 久久频这里精品99香蕉久网址| 在线精品亚洲国产| 欧美日韩精品一区二区视频| 超薄丝袜足j国产在线视频| 伊大人香蕉久久网欧美| 国产精品人人做人人爽人人添| 在线亚洲精品自拍| 欧美精品亚洲日韩a| 99在线视频免费| 色婷婷亚洲十月十月色天| 无码中文字幕精品推荐| 一级毛片在线免费视频| 九九视频在线免费观看| 国产午夜无码片在线观看网站| 日韩国产另类| 亚洲第一视频免费在线| 免费人成网站在线观看欧美|