彭秀媛++周國民



摘要:農業環境數據是農業應用系統、模型進行分析和決策的重要參數。經調查,目前農業應用系統、模型運行缺少農業環境數據支持,而基于物聯網技術采集的農業環境數據成為越來越不可忽視的重要資源,因此考慮搭建一座農業應用與農業環境數據之間的橋梁,集成共享基于物聯網技術采集的環境數據以滿足農業應用系統、模型的需求。針對實現過程中存在的集成、共享、實現設計等方面的問題,采用面向對象分層設計思想,提出了農業環境數據集成共享應用框架,基于該框架低成本地實現分散的農業環境數據集成共享和一站式在線數據服務與應用。該研究具有理論價值和實際意義,同時也為其他類型的農業科學數據共享應用提供借鑒。
關鍵詞:農業環境數據;共享;在線API服務;數據代理;元數據庫;元數據模型
中圖分類號: S126文獻標志碼: A
文章編號:1002-1302(2017)09-0192-03
農業不可須臾離開農業環境,沒有農業環境條件就沒有最基本的農業。本研究所指的農業環境數據包括土壤、農用水、農田大氣、農作物等相關數據,它們是農業應用系統、模型進行分析和決策所需的重要參數。目前農業應用系統、模型運行缺少農業環境數據支持,農業科研過程中使用的農業環境數據中的農田大氣部分一般從省、國家級氣象中心獲得,存在獲取數據元素單一、時效性差、獲取途徑少等問題,其他農業環境數據元素一般通過自行架設數據平臺或者數據購買等方式獲取。雖然百度API Store中提供了包括中國天氣數據集市、全球天氣等15個氣象數據的在線API服務[1],但遵循各自的API服務調用模式,且更傾向于氣象數據,包含部分生活相關氣象信息,對農業環境數據涵蓋不全,在線API調用也受訪問次數、購買套餐使用期限等限制[2]。
隨著農業物聯網技術的發展以及國家對農業物聯網技術的推動,物聯網的應用研究已深入到農業科學研究的方方面面,基于物聯網技術的農業環境監控設備也層出不窮,農業物聯網設備的使用量逐年上升[3-4]。目前,應用于設施農業生產的設備較多,應用于大田生產的設備量也逐年增加,且隨著設備使用范圍不斷擴大,該部分數據量、數據覆蓋面積逐年上升,數據監測項逐年增加。據不完全統計,目前在遼寧地區應用的農業環境數據監測平臺有20多個,此類平臺擁有的農業環境數據已經成為不可忽視的重要資源。
因此,考慮搭建一座農業環境數據與農業應用之間的橋梁,集成共享基于物聯網技術采集的環境數據來滿足農業應用系統、模型的需求。但實現過程中須解決以下問題:(1)基于物聯網技術采集的農業環境數據具有天然的在線特性,數據以數字格式存儲,但基本是獨立進行分析,很少進行共享或者與其他數據集進行融合使用;(2)基于物聯網技術采集的農業環境數據經常歸屬于不同的組織,且其采集的數據元素、接入方式、數據格式、時間間隔等方面均不同;(3)農業應用系統、模型采用的應用程序與數據庫緊密連接的開發方式,使得針對某個數據源開發的應用系統對另一個數據源并不可用,并且數據僅能夠內部使用,這就導致了由于需求而產生的重復開發工作,同時也縮小了應用系統的應用覆蓋范圍。同時考慮由于研究方法的轉變以及多種快速發展技術的相互融合,科學數據體量已經十分龐大,對科學數據更須要自動分析和共享[5]。因此本研究提出農業環境數據集成共享應用框架,低成本的實現分散的農業環境數據集成共享和一站式在線數據服務與應用,進一步發揮農業環境數據的價值,進一步突出農業環境數據對農業發展的重要作用。本研究具有理論價值和實際意義,能為其他類型的農業科學數據共享應用提供借鑒。
1農業環境數據共享應用框架
通過分析能夠提供在線API數據服務的農業環境數據特點、共享與應用的需求,提出基于在線API數據服務的農業環境數據共享應用框架,采用面向對象分層設計思想,圖1中該框架適用于集成數量多、更新頻繁并且不可預知用戶查詢需求的數據集成共享應用需求。
框架基于MVC設計模式,采用面向服務(SOA)架構,由服務提供者、服務請求者、服務代理者通過HTTP、XML、SOAP、UDDI、WSDL等基本Web服務組件協同工作,其工作原理如圖2所示。服務請求者即GIS系統、模型、農業應用系統等,可以通過站點訪問模式獲取選擇范圍內所有監測點中所需數據元素,也可以通過空間訪問模式獲取被選地理空間范圍內的所有監測點中所需數據元素。服務代理即數據代理中間件[6-7],其接受服務請求,從定位的數據庫中獲取數據,并將數據標準化為中間數據格式,進一步進行集成等數據處理操作,最后將數據返回給數據請求者,中間件隱藏數據提供方數據庫之間的異構,且對現有數據庫不作任何更改。服務提供者即異構的環境數據庫,通過REST接口提供Restful風格的數據在線API web service服務,并定期匯交本地數據庫的元數據[8]。
2農業環境數據共享應用框架關鍵技術
2.1數據代理中間件
數據代理中間件主要功能是智能定位和訪問透明接入[9]。數據代理中間件基于元數據庫面向客戶端提供可見數據目錄,并根據該目錄及用戶需求智能定位目標數據庫,通過數據驅動基于REST接口使用本地數據庫理解的接入方式透明訪問目標數據庫,并從數據庫中獲取可用數據,當有多個目標數據庫時可同時獲取,并將返回數據依據農業環境數據模型進行標準化,如須數據融合則根據圖3所示流程進行數據融合,之后將數據提供給共享應用端進行可視化顯示。
所有的應用程序和農業環境數據庫之間通過中間件進行連接,這樣即使添加新的數據庫,通過為該數據庫開發1個數據驅動并插入中間件,就能非常容易地將該數據源加入到該異構體系中,不須要對異構數據庫進行任何的更改[10],也不須要對現有的應用作任何修改;而且即使數據庫中出現了新的元數據元素,通過匯交元數據并更新農業環境數據元數據模型,即可實現對新元數據元素的擴展。
2.2元數據庫
元數據庫存儲的是數據代理中間件支持的所有數據源端匯交上來的元數據,元數據匯交工作是由每個數據源端的REST接口進行的,它定期搜集數據源端元數據并依據農業環境數據模型進行標準化后匯交到元數據庫進行全局統一管理。
2.3農業環境數據元數據模型
參考農業科技核心元數據標準(ASTICM)[11],從實際應用角度設計農業環境數據元數據模型,分為資源描述信息、核心信息、引用信息3個部分(圖4)。
其中,資源描述信息用于描述1個農業環境數據集的相關信息。引用信息主要由使用者在使用時產生,核心信息是模型的中心內容,其中元數據元素和標志信息定義如表1所示,表中元數據元素為當前常用的全部元素,關聯信息采用RDF/OWL進行描述,構建元素間語義映射關系,面向語義實現實例化的本地元數據與其他外部元數據、全局元數據的連接,同時也便于元數據元素的擴展。
元數據模型的制定過程實質是一個不斷完善、進步的過程,現有模型只是依據當前應用而設計,隨著技術的發展、新需求的產生、實踐的反饋,模型的修訂和維護工作將持續進行。
3結語
本研究提出了農業環境數據共享應用框架,為農業環境數據共享應用提供了新的解決方案。該框架整合分散的農業環境數據,并將數據共享應用于農業系統、模型建設應用中,解決部分數據處理工作,并加速農業系統、模型的建設周期。該框架中元數據模型、數據代理中間件以及控制邏輯方面的靈活性、可擴展性為農業系統、模型在線應用打下了基礎。共享的農業環境數據可采用基于Web系統、基于地理信息系統、封裝為插件等共享應用模式進行應用。下一步工作中,筆者將搭建實證研究環境,評估該框架模型的性能并進行優化,并基于該思想進一步開展農業環境數據與作物數據集成應用等研究。
參考文獻:
[1]林偉明,曾新紅. Onto Thesaurus Web Service API及其應用研究[J]. 圖書情報工作,2010,54(2):119-122.
[2]百度APIStore提供的氣象數據在線API服務[EB/OL].[2016-05-28].http://apistore.baidu.com/astore/servicesearch?word= %E5%A4%A9%E6%B0%94&searchType=null.
[3]張恩迪,張佳銳. 基于物聯網的農業蟲害智能監控系統[J]. 農機化研究,2015(5):229-234.
[4]臧賀藏,楊春英,景麗,等. 基于物聯網的農業環境遠程監測系統研究[J]. 河南農業科學,2015,44(12):144-147.
[5]魏銀珍,鄧仲華. 云環境下科學工作流的溯源手機和查詢框架研究[J]. 情報理論與實踐,2015,38(7):115-118.
[6]袁景凌,徐麗麗,苗連超. 基于XML的虛擬法異構數據集成方法研究[J]. 計算機應用研究,2009,26(1):172-174.
[7]李林,王竹,呼延正勇,等. 田間數據傳輸同步策略與中間件研究[J]. 農業機械學報,2016,47(1):279-288.
[8]Belqasmi F, Glitho R, Fu C. RESTful Web services for service provisioning in next generation networks: a survey[J]. IEEE Communications Magazine,2011,49(12):66-73.
[9]徐罡,黃濤,劉紹華,等. 分布應用集成核心技術研究綜述[J]. 計算機學報,2005,4(28):434-444.
[10]劉瑰,朱鴻宇,謝向輝,等. 數據網格中訪問代理中間件的設計與實現[J]. 計算機工程,2007,33(18):42-44.
[11]崔運鵬,錢平,蘇曉鷺. 農業科技信息核心元數據標準框架研究及其著錄信息管理系統[J]. 中國農業科學,2007,40(4):686-690.