999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

我國蘋果產業知識圖譜構建研究*

2018-01-31 00:33:32陳亞東鮮國建寇遠濤郭淑敏劉現武
中國農業資源與區劃 2017年11期
關鍵詞:關聯語義資源

陳亞東,鮮國建,寇遠濤,郭淑敏※,劉現武

(1.中國農業科學院農業資源與農業區劃研究所,北京 100081; 2.中國農業科學院農業信息研究所,北京 100081; 3.中國農業科學院,北京 100081)

0 引言

蘋果是世界四大水果之一,栽培和生產已經遍布世界上93個國家和地區[1]。我國蘋果產業的發展歷史更為悠久, 4000余年的栽植過程中積累了豐富的數據[2],這些數據形成的“資源倉庫”能夠為科研提供基于數據支撐的科學決策。我國蘋果產業的數據資源雖然內容豐富,但多源異質且結構松散,數據資源的整合性和關聯性差[3],難以提供精確規范的行業數據和實現豐富的語義表達,用戶獲取精品知識的需求無法被滿足。因此,從海量數據中提取有用的知識,是蘋果產業數據分析的關鍵點。

知識圖譜具備強大的語義處理能力,可從海量文本和圖像中抽取結構化知識,將不同來源的數據進行融合,從而形成富含語義關系的知識網絡即結構化的百科知識[4-6],是解決我國蘋果產業知識表達和語義推理的有效手段。目前,國內外對于蘋果產業知識圖譜構建的研究鮮少報道,但在農業領域和其他垂直產業已引起關注和重視。劉家瑋等[7]通過對知識圖譜繪制工具進行分析比較,對農業知識圖譜的構建進行了設計。張德政等[8]基于本體工具,對中醫產業的知識圖譜表示及構建方法進行了研究,實現了中醫學領域知識的組織與整合。從構建的技術上來看,與早期的基于詞典和規則的知識抽取相比較[9],楊博等[10]研究發現,基于本體推理的抽取更有益于挖掘隱含的數據關系,通過本體和實例來進行知識融合,更有益于知識的融合[11]。基于農業領域和其他垂直行業知識圖譜構建的基礎以及相關技術,對我國蘋果產業知識圖譜的構建進行研究和設計,可以深入揭示蘋果產業知識之間的關聯、優化檢索和深度推理,為我國蘋果產業的知識組織提供理論框架,同時也為蘋果產業的發展提供資源支撐。

1 概述與圖譜架構

蘋果產業的知識圖譜是以蘋果產業語言為基礎建立起來的網絡知識體系,能夠發現蘋果產業數據之間的關聯關系和揭示多維語義關系。通過將零散分布的數據形成知識網格,融合生產數據、科研數據、市場數據等產業鏈條上的資源,深入發掘蘋果產業數據的整體性與關聯性。蘋果產業知識圖譜的架構如圖1所示,自下而上包括4個層級,分別是基礎資源層、知識單元層、知識組織層和知識表達層。通過將不同來源的數據進行知識抽取,形成蘋果產業的知識單元實體,再將抽取出的實體進行知識融合,發掘實體之間的關聯關系,可從語義的層面來實現蘋果產業知識的組織,發掘知識間隱含的關系,形成我國蘋果產業的知識網絡。

2 構建方法與解析

2.1 基礎資源層——蘋果產業知識來源

蘋果產業的數據資源是構建知識圖譜的基礎,深入剖析數據特點與來源組成是構建的必要條件。從數據內容來看,我國蘋果產業的數據資源可以分為8個類別,包括生產數據、種質資源數據、育種數據、栽培數據、病蟲害數據、采后加工數據、產業經濟數據和產業支撐基礎數據[12](科研文獻、成果專利、領域專家等支撐產業發展的數據); 從數據的結構上看,蘋果產業的數據資源包括結構化、半結構化和非結構化數據三大類。基礎資源為知識的提取提供了基礎,是架構的根基。

圖1 蘋果產業知識圖譜構建框架

2.2 知識單元層——蘋果產業的知識獲取

蘋果產業數據知識獲取的目的是從海量的基礎資源中抽取出有用的知識,為知識圖譜的構建以及關聯關系發現提供依據,是承上啟下的一個單元層。為更好地實現知識獲取,可以以蘋果產業的本體框架為組織工具。知識單元層要解決兩個問題,一是蘋果產業本體的構建; 二是以本體為基礎,進行知識抽取。

2.2.1 蘋果產業本體構建

基于蘋果產業的資源基礎與專業知識,對蘋果產業的知識結構進行分析,確定蘋果產業的核心概念,形成概念體系。通過對蘋果產業的類、屬性及其之間的關系進行分析,可形成類目結構圖(圖2),最終形成蘋果產業的知識邏輯體系,呈現出具有樹形結構的蘋果產業知識組織體系,即蘋果產業本體框架,蘋果產業的本體是開放集成的體系,在知識圖譜的構建過程中能夠從語義層面來實現知識的關聯、共享和重復利用。

圖2 蘋果產業本體類目結構圖

2.2.2 知識抽取

蘋果產業的基礎資源中包括3種結構的數據。為實現數據的關聯,首先要對知識單元進行抽取,抽取的內容包括數據中的實體、屬性與關系。基于蘋果產業的領域本體架構,可采用多策略學習方法來進行知識的獲取[13],其原理是利用不同知識之間的冗余關系,通過較容易抽取的信息來幫助不易抽取的信息。結構化的知識可通過D2R映射來轉化成知識圖譜中的知識單元; 對于半結構化的數據,可通過Wrapper(數據封裝器)來進行抽取[14]; 在抽取的過程中,將這兩類知識抽取的結果都加入到種子集中。對于非結構的純文本知識,可采用遠程監督和基于模式相結合的增量迭代抽取方式[15]。遠程監督是基于假設兩個實體存在某種關系,那么任何包含這對實體的句子都很有可能表達相同的關系[16],利用種子集自動標注文本數據,然后根據標注結果自動地生成高質量的模式。利用這些模式到文本中學習新的知識,并加入到種子集中。這一過程不斷迭代,直至沒有新的知識被學習出來,采用這種方式可完成蘋果產業知識單元的獲取,可實現知識的抽取。

2.3 知識組織層——蘋果產業知識融合

2.3.1 實體對齊

通過知識獲取可以得到不同數據源抽取出的知識單元,形成一個個孤立的抽取圖譜。為形成完整的蘋果產業知識圖譜,需要將這些抽取的結果集成和知識融合。由于數據來源廣泛,質量也未經校驗,還需要解決多種類型數據沖突的問題,包括一個短語對應多個實體、實體屬性名不一致、實體屬性缺失、實體屬性值不一致、實體屬性值一對多映射等。通過實體對齊可以發現具有不同標識但代表真實世界中同一對象的實體,并將這些實體合并為一個具有全局唯一標識的實體對象添加到知識圖譜中。目前,實體對齊主要采取基于聚類的實體對齊算法,將相似的實體盡量聚集到一起,再進行實體對齊[17]。

2.3.2 實體關聯構建

抽取出的實體(E1,E2……)都具有一定的屬性值,如蘋果品種的屬性包括品種名稱、親本、育種機構等(圖3),任何兩個實體間只要具有相同的屬性值,即可以通過兩者之間的行為描述或者屬性關系來構建關聯[18],多個關聯的實體聚合在一起,就會形成多維度的數據關系(圖4)。由于蘋果產業實體、實體屬性和關系的多樣性與專業性,一些較為復雜的關聯規則除了以蘋果本體模型為組織工具,還需人工推理等方法來手動輔助完成。深度的挖掘實體之間的關系和關聯,是知識圖譜構建的關鍵點。關聯關系構建后,數據資源會形成一個富含語義關系的知識庫,包括基礎數據、特色數據、生產數據等都會關聯和整合到一起,可以根據用戶的需求來提供各類知識服務。

圖3 實體屬性結構圖(以品種為例)

圖4 蘋果產業實體關聯結構圖

2.4 知識應用層——知識圖譜

通過知識融合,可以構建出富含語義關系的知識庫,蘋果產業的實體及其屬性之間的關系會最大程度地在知識庫中融合,支持不同形式的應用探索。

2.4.1 蘋果產業知識檢索

作為蘋果產業知識圖譜的基本檢索服務,可支持蘋果產業的術語查詢、術語之間的關系發現等服務,檢索結果會以可視化的知識地圖形式呈現給用戶。例如輸入“華紅”進行檢索,可以查詢到我國華紅蘋果的資源分布、文獻、育種信息、市場信息等,可以縮短用戶通過不同來源獲取不同類型數據的時間成本。

2.4.2 知識發現

輸入檢索詞后,基于知識圖譜可以實現將具有同一屬性關系的知識單元有序聯系在一起。如輸入專家名字,可以呈現以該專家為中心的知識地圖,呈放射狀分布,該專家發表的論文、合著者、工作單位、成果、專利等數據會被展示和發現,通過點擊論文合作者的發現,還能發現以合作者為中心的知識圖譜,以檢索詞為中心的知識都會被發現,不僅擴大用戶的知識檢索范圍,還能發掘用戶的潛在需求。

2.4.3 產業指導

基于蘋果產業的知識圖譜構建,還能實現產業發展相關的決策與指導,包括蘋果產業布局研究、生產服務和指導、產量統計、市場預警等,知識圖譜能夠以知識為單元重新組合,形成新的知識,發現更多的產業問題。知識圖譜的構建能夠將理論、實驗數據、市場信息、統計數據等進行關聯和統一,基于密集數據的分析來形成新的產業研究范式,發現和解決我國蘋果產業生產中的問題,同時為重要的決策提供科學依據。

3 結論與討論

該文旨在對我國蘋果產業知識圖譜的構建進行設計與研究,基于蘋果產業數據知識特點結合知識圖譜構建的技術方法,實現知識的抽取和知識融合,初步構建了輕量級的蘋果產業知識圖譜體系架構,從語義關聯的角度實現知識的關聯和發掘,為我國蘋果產業知識的組織提供科學的框架和奠定理論基礎。蘋果產業的知識結構隨著科學研究的深入不斷更新和變化,產業的數據也在不斷實時更新,所以本體結構和知識庫定期更新,才能保證與時俱進,實現知識圖譜的迭代更新。由于蘋果產業知識圖譜的構建還屬于初探,該文也存在不足,因研究目標是對整體的架構進行設計,其中各個層級的研究還不夠深入和完善,諸如蘋果產業本體的構建只是初步列出三級層級結構,語義關聯的組織和挖掘還不夠深入和詳盡,期望在以后的研究中能夠進一步深入。

知識圖譜的構建對我國蘋果產業知識服務、育種生產、市場貿易和戰略決策都具有重大的作用和意義,能夠為提升我國蘋果產業的競爭力提供科學的知識組織工具。通過蘋果產業知識圖譜的構建,將產業數據進行整合和復用,最終形成蘋果產業知識,從科技資源的角度為我國蘋果產業的決策提供支撐,如知識圖譜可以分析我國蘋果產業的生產布局、統計我國蘋果品種的分布,對我國蘋果品種結構調整和生產區域規劃具有重要的作用和意義; 知識圖譜還能夠從文獻檢索服務和論文詞頻分析的角度來滿足科研人員的知識需求,提供一站式的知識服務; 對于蘋果種質資源分布、生產指導、病蟲害防治等產業問題,知識圖譜還可以提供知識工具,助力我國蘋果產業的發展,服務于農戶和企業。上述的深度知識分析和產業指導功能都是基于知識圖譜的構建才能實現,因此,知識圖譜對促進蘋果產業的健康發展非常必要。該文所構建的知識圖譜架構,也可以應用于其他的產業,如小麥、玉米等,但前提條件是深入分析和挖掘產業數據的個性化關聯特點,構建出適合的領域本體,期望后續有更多的學者關注和加強不同領域的知識圖譜建設研究。

[1] 韓明玉,馮寶榮.國內外蘋果產業技術發展報告.楊凌:西北農林科技大學出版社, 2010.315

[2] 陳學森, 韓明玉,蘇桂林,等.當今世界蘋果產業發展趨勢及我國蘋果產業優質高效發展意見.果樹學報, 2010, 27(4): 598~604

[3] 陳亞東, 孟憲學,趙瑞雪,等.我國蘋果產業科學數據整合系統的設計與實現.中國農業科技導報, 2016, 18(3): 210~215

[4] 漆桂林, 高桓,吳天星.知識圖譜研究進展.情報工程, 2017, 3(1): 4~25

[5] 邱均平, 韓雷.近十年來我國知識工程研究進展與趨勢.情報科學, 2016, 34(6): 3~9

[6] 劉嶠, 李楊,段宏,等.知識圖譜構建技術綜述.計算機研究與發展, 2016, 53(3): 582~600

[7] 劉家瑋, 劉波,沈岳.知識圖譜在農業信息服務中的應用進展.軟件, 2015, 36(3): 26~30

[8] 張德政, 謝永紅,李曼,等.基于本體的中醫知識圖譜構建.情報工程, 2017, 3(1): 35~42

[9] Chinchor N,Marsh E.Muc-7 information extraction task definition//Proc of the 7th Message Understanding Conf.Philadelphia:Linguistic Data Consortium, 1998: 359~367

[10]楊博, 蔡東風,楊華.開放式信息抽取研究進展.中文信息學報, 2014, 4: 1~11

[11]Huber J,Sztyler T,N??ner J,et al.CODI:combinatorial optimization for Data integration-results foroa//international Workshop on ontology Matching,Bonn,Germany, 2011~10

[12]陳亞東, 孟憲學,趙瑞雪,等.我國蘋果產業科學數據建設初探.果樹學報, 2016, 33(6): 719~726

[13]孫杰, 吳慧中.一種用于知識自動獲取的多策略學習方法.南京理工大學學報, 1995, 2: 101~104

[14]王輝, 郁波,洪宇,等.基于知識圖譜的Web信息抽取系統.計算機工程, 2017, 43(6): 118~124

[15]丁玉飛, 王曰芬,劉衛江.面向半結構化文本的知識抽取研究.情報理論與實踐, 2015, 38(3): 101~106

[16]阮彤, 王夢婕,王昊奮,等.垂直知識圖譜的構建與應用研究.知識管理論壇, 2016, 1(3): 226~234

[17]莊嚴, 李國良,馮建華.知識庫實體對齊技術綜述.計算機研究與發展, 2016, 53(1): 165~192

[18]白海燕, 朱禮軍.關聯數據的自動關聯構建研究.現代圖書情報技術, 2010,(2): 44~49

猜你喜歡
關聯語義資源
基礎教育資源展示
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
一樣的資源,不一樣的收獲
語言與語義
資源回收
奇趣搭配
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
智趣
讀者(2017年5期)2017-02-15 18:04:18
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
主站蜘蛛池模板: 国产91小视频在线观看| 不卡视频国产| 99热这里只有精品在线播放| 免费一级毛片完整版在线看| 日韩经典精品无码一区二区| 欧美不卡视频一区发布| 1769国产精品免费视频| 91在线日韩在线播放| 在线无码av一区二区三区| 欧美不卡视频一区发布| 麻豆精品国产自产在线| 国产91九色在线播放| 国产自视频| 黄色网页在线观看| 亚洲成a人片7777| 日韩东京热无码人妻| 一本色道久久88亚洲综合| 欧美亚洲欧美区| 亚洲免费福利视频| 色丁丁毛片在线观看| 精品伊人久久大香线蕉网站| 亚洲av无码人妻| 青青久久91| 亚洲综合亚洲国产尤物| 91九色最新地址| 成人午夜免费视频| 国产亚洲男人的天堂在线观看| 伊人久热这里只有精品视频99| 毛片在线播放网址| 午夜无码一区二区三区在线app| 黄色片中文字幕| 国产精品一区二区久久精品无码| 国产女人在线观看| 国产SUV精品一区二区| 国产三区二区| 免费福利视频网站| 人妻丰满熟妇啪啪| 亚洲精品在线影院| 91精品小视频| 日本国产一区在线观看| 国产打屁股免费区网站| 亚洲国产精品不卡在线| 欧美日韩在线第一页| 四虎亚洲精品| 99视频在线观看免费| 日韩午夜福利在线观看| 欧美成人精品一级在线观看| 色首页AV在线| 亚洲国产综合自在线另类| 亚洲资源在线视频| 喷潮白浆直流在线播放| 99久久国产综合精品2020| 99成人在线观看| 美女一级免费毛片| 福利在线免费视频| 亚洲欧洲日韩综合色天使| 精品久久久久无码| YW尤物AV无码国产在线观看| 欧美精品1区2区| 幺女国产一级毛片| 日韩欧美视频第一区在线观看| 亚洲综合极品香蕉久久网| 日韩人妻少妇一区二区| 亚洲精品桃花岛av在线| 91精品伊人久久大香线蕉| 成人在线观看不卡| 免费va国产在线观看| 国产一区二区三区日韩精品| 国产女人爽到高潮的免费视频 | 国产精品私拍99pans大尺度| 亚洲欧美极品| а∨天堂一区中文字幕| 精品伊人久久久香线蕉| 天天摸天天操免费播放小视频| 精品一区二区三区水蜜桃| 91人妻日韩人妻无码专区精品| 国产精品久久自在自2021| 亚洲AV电影不卡在线观看| 久久综合亚洲色一区二区三区| 沈阳少妇高潮在线| 青青热久免费精品视频6| 亚洲AⅤ永久无码精品毛片|