陳 麗,王啟現,劉 娟,崔運鵬,王 末
農業科研試驗基地數據管理標準體系構建
陳 麗1,2,王啟現3,劉 娟1,2※,崔運鵬1,2,王 末1,2
(1. 中國農業科學院農業信息研究所,北京 100081;2. 農業農村部農業大數據重點實驗室,北京 100081;3. 中國農業科學院成果轉化局,北京 100081)
農業科學數據作為重要戰略性資源,在推動農業科技創新、增強農業科技競爭力方面發揮重要作用。農業科研試驗基地是一手科研數據的主要來源,其數據管理標準體系的建立不僅是試驗基地數據規范化管理的基礎,也是規范化數據管理工作的重要一環,對于提高數據可復用性,最大程度發揮數據價值有重要意義。該研究通過國內外涉農長期觀測網絡、試驗站數據管理標準體系內容梳理,以及對中國農業科研試驗基地數據特點、數據全生命周期管理流程調研,構建了農業科研試驗基地數據管理統一工作流;基于“霍爾三維結構”從標準適用數據管理階段、標準性質、標準專業領域3個維度構建農業科研試驗基地數據管理標準體系框架,并編制了農業科研試驗基地數據管理標準體系基本構成表,梳理出涵蓋數據全生命周期管理的標準20項,首期必建標準12項,以期為推進農業科研試驗基地建設和數據管理共享提供支撐。
科學數據;標準規范體系;農業科研試驗基地;數據管理
隨著新一代信息技術與科學研究過程的結合,數據密集型科學發現已成為繼“經驗科學(亦稱實驗科學)”、“理論科學”和“計算科學”之后的第四科研范式,推動科學研究由傳統的假設驅動向基于科學數據進行探索的科學方法轉變[1]。科學數據不僅是科研活動的產物,還是科研活動開展的基礎。到20世紀90年代,科學數據已被提高到科技發展“牽引力”的高度[2]。同樣,在農業領域,隨著農業信息化、數字化、智能化發展,農業科學數據面臨著爆發式的產生、衍變和積累。農業科學數據作為重要戰略性資源,在推動農業科技創新、增強農業科技競爭力方面也將發揮重要作用。
農業生產是自然再生產與經濟再生產相互交織的過程。與其他科研領域相比,農業科研具有試驗(或實驗)性農學研究的特點,必須依靠分布在全國各地的農業科研試驗基地,面向農業一線生產開展研究[3]。據不完全統計,目前全國各級各類涉農科研機構、院校建立的以科研用途為主的農業試驗基地1 000余個[4],有效支撐了國家重點研發計劃、國家自然科學基金、省級及地方、科研單位等的研究項目,成為科技創新、成果轉化、科技信息輻射和交流合作的重要平臺[5-8]。同時,隨著信息化和科研手段的提升,基于農業科研試驗基地的觀測、監測、實驗,產生并快速積累起一大批有價值的農業科學數據資源。然而,由于絕大多數數據的收集都是依靠相關科研項目的支持,造成數據采集不連續、保存分散、缺乏統一規范化治理,可關聯、可比較和分析價值大打折扣。
因此,本研究通過梳理國內外涉農長期觀測網絡、試驗站數據管理標準體系,基于中國農業科研試驗基地數據特點及全生命周期數據管理流程,從3個維度構建農業科研試驗基地數據管理標準體系框架,以期為推進農業科研試驗基地建設和數據統一規范治理與共享提供支撐。
目前,國內外涉農領域的“Experimental Station”、“Experimental Farm”、“Research Station”、“Observation and Research Station”、“野外觀測站”、“野外試驗站”、“試驗基地”、“實驗站”等表述各異的觀測/監測/試驗/實驗站點所獲取數據的標準化管理,多集中于生態系統、氣候、環境等反映自然現象動態變化的持續觀測數據方面,通過構建國家、區域性或全球性的長期觀測研究網絡實現統一標準下的數據規范化管理與共享。僅有少數如英國洛桑試驗站(1843年)這種集作物學、遺傳學、生化與分子生物學、生物統計學、昆蟲學、土壤學、植物營養學和植物保護學等諸多學科為一體的綜合性長期試驗站點,建有專門的數據管理分析團隊和企業、數據管理標準體系以及數據發布與共享網站[9]。中國農業科研試驗基地建設以及數據共享管理起步較晚,除部分納入長期觀測研究網絡中的農業試驗基地數據管理有標準可依外,大部分農業科研試驗基地數據管理標準體系不健全,處于無序、散亂、可用性差的原始數據管理階段。
通過表1梳理,也可以看出,國內外觀監測網絡雖然對其網絡內部試驗站數據的規范化管理制定了相關標準規范,但主要還是立足于觀監測網絡層級的數據統一匯交管理和促進數據共享,與試驗基地層級數據管理仍有一定區別[10-16]。各觀監測網絡數據管理標準規范可作為本研究標準體系建設內容的重要參考,若要提高各農業科研試驗基地自身的數據管理和利用水平,尚需結合中國農業科研試驗基地數據特點和數據管理流程,構建科學、有效的標準規范體系。

表1 國內外觀監測網絡數據管理標準規范
注:數據管理標準來自7大國內外長期監測網絡、數據中心的數據管理網站,未通過網站對外公布的標準未計入本表。
Note: The data management standards came from the data management websites of 7 major domestic and foreign long-term monitoring networks and data centers. The standards not published through the websites are not included in this table.
農業科研試驗基地是農業科技創新活動重要載體,根據功能定位不同,各有側重的從事科學(田間)試驗、科學觀測、技術集成和工藝優化試驗等科研活動及科研成果示范、展示、推廣活動[17],也有一些實力較強的綜合試驗站,承擔了科研實驗、長期科學觀測、監測以及技術集成示范等多項功能。農業科研試驗基地不僅是一手科研數據的主要來源,而且集聚了類型各異的海量科研數據。
農業科研試驗基地數據類型,根據學科領域[18-19]不同,分為農業氣象、土壤、農藝、園藝、植物保護、農業工程、畜牧、水產等方面的科研試驗數據;根據數據獲取方式[20]不同,分為觀測數據、實驗數據、試驗數據、監測數據、檢測數據以及調查數據等;根據數據類型不同,可以分為數值型數據、文本型數據、遙感數據、圖像及視頻數據;根據數據實際保存主體不同,可以分為試驗基地采集保存數據(也稱為自有數據)、科研人員或團隊依托試驗基地采集并保存數據(也稱為長尾數據)。由于長尾數據[21]通常由個人或小團隊為特定目的收集,數據多源、多尺度、時序性短、高度分散,雖然單個數據集體積小但整體數量龐大,通過科學制定農業科研試驗基地數據管理標準體系,疏通數據管理路徑,將這部分數據納入所依托科研試驗基地的整體數據管理體系,對于促進其廣泛利用共享,關聯分析、最大化其數據價值意義重大。
農業科研試驗基地數據特點:1)多源異構性。農業科研試驗基地數據的多源性,一方面體現在領域上,涉及農業氣象、土壤、作物栽培、種質資源、病蟲害測報、有害生物防治等多方面的數據;另一方面體現在獲取手段上,既包括傳統的觀測、調查數據,也包括各類科學儀器設備的監測、檢測、模擬、分析數據等。數據的涉及面廣而復雜,數據獲取手段的多樣性,也就造成了其異構性特點,數據類型、結構、存儲格式等各異,對數據進行描述的元數據標準也差異較大。2)小集中、大分散。數據多散落在各農業科研團隊或科研人員中,試驗基地作為一個科研試驗載體,在數據管理上沒有發揮應有的數據匯聚作用。全國尺度來看,也是如此,沒有形成一個有效的農業科研試驗基地數據匯聚管理和共享平臺,數據廣泛散落在全國各地、各單位機構和個人手中。此外,從數據量的角度看,無論是單個農業科研試驗基地還是立足全國,都是處于集中管理的數據少,分散管理的數據量大。3) 數據時序短、連續性差。除開展長期觀測研究獲取的數據外,農業科研試驗基地的大部分數據采集具有嚴重的項目跟隨特點,項目結束,數據采集也告結束。4)標準化程度低,共享不充分。基于農業科研試驗基地數據多源異構的特性以及當前數據小集中、大分散的現狀,導致農業科學數據不完整、質量參差不齊等問題非常顯著。除少數參與到國家某一長期觀測網絡中或項目有數據匯交要求的科研試驗基地采集數據有部分共享外,鮮有科研試驗基地建有數據庫和數據管理標準規范,支撐數據統一治理與共享。
通過對中國農業科學院新鄉綜合試驗基地、中國農業大學曲周試驗站等農業科研單位、高校試驗基地數據管理狀況調研,本研究梳理了當前農業科研試驗基地常規化數據管理的工作流模式(圖1a和圖1b),并基于數據的全生命周期管理[22-23],提出統一標準體系框架下農業科研試驗基地規范化數據管理工作流模式(圖 1c)。
目前,中國農業科研試驗基地數據基本處于圖1a和圖1b兩種割裂的管理模式下。圖1a模式下,研究人員依托試驗基地開展觀測、試驗、檢測、調查或監測等科研活動采集獲取數據,數據經過加工、分析后,一方面形成研究成果隨論文出版或直接數據出版;另一方面形成各類數據集,被研究人員保存管理。對于已經出版的數據,用戶可以直接通過網絡獲取;對于研究人員手中的各數據集數據,無論是外部用戶還是內部用戶均需向研究人員提出數據需求,并等待研究人員的反饋。由于此數據“申請-反饋”途徑非公開化,且研究人員沒有對外提供數據服務的義務,因此,與內部用戶相比,外部用戶往往很難通過此途徑獲取到數據,或只能獲取到很少量的數據。圖1b模式下,農業科研試驗基地數據采集、加工、分析、存儲、共享的全生命周期數據管理與圖1a模式基本完全相同,僅缺少了研究成果形成階段。這是由于絕大部分農業科研試驗基地獨自開展科研能力比較有限,主要還是承擔一些農業及相關領域的科學觀測、監測等任務,或協助研究人員開展科研試驗、調研等,幾乎沒有文章出版或數據出版環節。
在割裂的數據管理模式下,無論是研究人員的數據管理還是科研試驗基地的數據管理,一般都會制定簡單的數據管理計劃,數據也是掌握在采集者手中,由于缺乏專業、統一的農業科研試驗基地數據管理標準體系,數據共享、可復用率很低,數據價值難以得到充分挖掘和實現。而基于統一的數據管理標準體系,圖1c模式下可以有效解決數據“小集中、大分散”的問題,將研究人員和試驗基地采集數據匯交起來,形成規范的專業數據集和對應的統一數據治理,幫助用戶更好的發現數據、獲得數據、利用數據。用戶直接向分離出的專門的數據管理部門/組織提出數據需求,在統一的數據共享開放的原則下,獲得數據。相較于直接向數據所有者申請數據,提升了用戶發現數據的概率,而且由于有專門的數據匯交治理工具和人員,數據質量也可得到有效保障。

注:①內部用戶:指與數據所有者之間有研究項目、任務等紐帶聯系的其他研究人員,即同一科研項目或任務下,數據所有者以外的其他參與研究人員或團隊成員;②外部用戶:指與數據所有者之間沒有形成研究項目、任務等紐帶聯系的其他研究人員。
在國家《科學數據管理辦法》的指導下,參照《中華人民共和國國家標準(GB/T 13016—2018):標準體系構建原則和要求》中有關規定以及相關研究[24-25],結合農業科研試驗基地數據管理特點,確定標準體系構建原則。主要包括以下3個方面:
1)全面覆蓋、層次清晰原則。標準體系應覆蓋農業科研試驗基地數據全生命周期管理過程,根據標準性質、適用數據管理階段和標準之間的共性特點,體現一定的層次性。為便于理解、減少復雜性,標準體系的層次也不宜太多。
2)結構合理、有效銜接原則。科學數據管理不是簡單的數據標準化,還涉及從數據采集、加工、存儲、共享等工作業務流程和數據管理工作,標準體系構建既要滿足基本建設需要,又要形成結構合理的系統內容,涵蓋技術、工作、管理等多方面。此外,體系內部標準規范之間應相互銜接,避免內容重復或彼此脫節;與國內外數據監測、管理網絡/平臺數據管理系統之間,注重有效銜接,促進數據的開放共享。
3)循序漸進、重點突出原則。農業科研試驗基地屬于基礎數據采集管理單位,數據管理工作經驗不足、人員配備有限,標準體系構建應根據試驗基地開展數據管理工作的階段特點和實際情況,循序漸進、重點突出制定不可或缺的核心標準規范,以最小資源投入獲得最大的標準化效果。
本研究借鑒美國系統工程專家霍爾(Hall A D)[26]提出的系統工程方法論“霍爾三維結構”,即從時間維、邏輯維和知識維來解釋系統工程的一般過程,從農業科研試驗基地數據管理過程流和工作內容實際出發,通過建立“霍爾三維結構”下系統工程一般過程到農業科研試驗基地數據管理過程映射關系(表2),構建了適用于農業科研試驗基地數據管理的標準體系三維結構,如圖2所示。從標準適用數據管理階段維度看,農業科研試驗基地數據管理標準體系構建應圍繞的從數據采集到加工、匯交(存儲)、共享不斷推進的全生命周期管理流程,每個數據管理階段都應有相應的標準規范作為依據和指導;從標準性質維度看,農業科研試驗基地數據管理標準體系應包括技術標準、工作標準和管理標準,不同性質標準互為補充,保障數據管理工作規范有序開展;從標準專業領域維度看,指導類標準是基礎,數據類標準是核心,管理類標準是保障。

表2 “霍爾三維結構”到農業科研試驗基地數據管理三維結構映射關系

圖2 農業科研試驗基地數據管理標準體系三維結構圖
基于圖2,本研究采用主客觀相結合的方法對農業科研試驗基地數據管理標準規范進行篩選以及必要性的判斷,具體步驟如下:
步驟1:體系表內容初選。在農業科研試驗基地數據管理標準體系三維架構下,以國內外觀監測網絡數據管理標準規范和“國家科技基礎條件平臺中心”“國家生態系統觀測研究共享服務平臺”“國家地球系統科學數據共享平臺”“國家農業科學數據共享平臺”等制定的有關數據管理系列標準規范為參考,結合農業科研試驗基地數據管理標準體系建設基本情況和需求調研,進行標準規范體系表內容初步篩選。
步驟2:專家評議。根據評價目的,將標準規范的重要程度劃分為4個等級:不重要(建議剔除)、一般(非必建)、重要(必建)、非常重要(必建),分別用1、2、3、4來代表不同等級。評議專家由科學數據管理、科研試驗基地管理兩個領域的專家組成,專家可以在初步篩選結果基礎上新增標準規范,并進行評級。

本研究共進行了2輪專家評議,第1輪是針對步驟1初步篩選出的24項標準規范進行專家評議,第2輪是對第一輪新增標準規范和評議測算結果進行研討,確定出數據全生命周期管理需要建設的20項標準規范、標準規范內容描述以及首期必建標準規范12項,以指導農業科研試驗基地的標準體系建設工作落實(表3)。各農業科研試驗基地可以根據自身建設階段、數據管理要求和涉及階段在12項必建標準規范基礎上,不斷進行充實和完善。

表3 農業科研試驗基地數據管理標準體系表


農業科研試驗基地數據管理標準體系是一項系統工程,對于推動基層試驗基地數據規范化管理有重要支撐作用。本研究通過對國內外涉農長期觀測網絡、試驗站數據管理標準體系內容梳理,以及對中國農業科研試驗基地數據特點、數據全生命周期管理流程調研,構建了農業科研試驗基地數據管理統一工作流;基于“霍爾三維結構”從標準適用階段、標準性質、標準專業領域3個維度構建農業科研試驗基地數據管理標準體系框架,并編制了農業科研試驗基地數據管理標準體系基本構成表,以期為推進農業科研試驗基地建設和數據管理共享提供支撐。
1)通過分析總結,農業科研試驗基地數據在涉及學科領域、數據獲取方式、數據類型以及管理保存主體等方面均展示出了類型的多樣性,并具有:①多源異構性;②小集中、大分散;③數據時序短、連續性差;④標準化程度低、共享不充分的數據特點。制定科學合理的數據管理標準體系,疏通數據管理路徑,對于農業科研試驗基地規范化數據管理以及將長尾數據納入統一管理,有重要推動和促進作用。
2)在當前農業科研試驗基地自有數據與長尾數據割裂管理模式下,構建了集二者于一體的統一數據管理工作流,有效解決了數據“小集中、大分散”的問題,同時數據典藏共享作為一項專門的服務,從前端采集分析工作中分離出來,直接面向用戶,將大大提升用戶發現數據的概率,保障數據質量,并有效減輕數據所有者管理數據的工作量。
3)通過建立“霍爾三維結構”下系統工程一般過程到農業科研試驗基地數據管理過程映射關系,構建了適用于農業科研試驗基地數據管理的標準體系三維結構,并通過多輪專家評議形成了農業科研試驗基地數據管理標準體系表。該表以標準體系建立的三項核心原則為主旨,圍繞數據全生命周期管理,提出農業科研試驗基地標準體系建設基本標準規范20項,核心必建標準規范12項,用于指導不同農業科研試驗基地的個性化標準體系建設,實現以最小資源投入獲得最大的標準化效果。
本研究為農業科研試驗基地數據管理標準規范編制明確了方向,為農業科研試驗基地數據科學、持續、高效管理奠定了基礎,目前雖然尚未開展實例應用,無法評估該套標準體系的適用效果,但下一步將以農業科學院“試驗基地項目”為依托,開展部分試驗地基的標準體系落地應用和成效評價。
此外,標準體系建設是農業科研試驗基地數據規范化管理的基礎,也是規范化數據管理工作的重要一環,其能否在農業科研試驗基地數據管理工作中發揮良好的效用,還面臨一個巨大挑戰,即如何打通試驗基地生產數據的各匯集通道,將數據(尤其是長尾數據)集中管理起來,還需要建立一套完整的協作機制。
[1]鄧仲華,李志芳. 科學研究范式的演化:大數據時代的科學研究第四范式[J]. 情報資料工作,2013,34(4):19-23. Deng Zhonghua, Li Zhifang. The evolution of scientific research paradigm: The fourth paradigm of scientific research in the era of big data[J]. Information and Documentation Services, 2013, 34(4): 19-23. (in Chinese with English abstract)
[2]孫鴻烈,劉闖. 國際科學技術數據前沿領域發展研究[J]. 地球科學進展,2003,18(3):329-333. Sun Honglie, Liu Chuang. Frontier research of international science and technology data[J]. Advances in Earth Science, 2003, 18(3): 329-333. (in Chinese with English abstract)
[3]王啟現,潘燕榮,邱國梁,等.農業科研試驗基地在鄉村振興中的地位與作用[J]. 浙江農業科學,2019,60(2):180-183. Wang Qixian, Pan Yanrong, Qiu Guoliang, et al. The position and function of agricultural scientific research and experiment station in rural vitalization[J]. Journal of Zhejiang Agricultural Sciences, 2019, 60(2): 180-183.(in Chinese with English abstract)
[4]王啟現,位運糧,吳曉磊,等. 典型發達國家農業科研試驗基地管理的幾點做法及對我國的啟示[J]. 農業科技管理,2018,37(1):52-55. Wang Qixian, Wei Yunliang, Wu Xiaolei, et al. Experience of management of agricultural scientific research experimental base in typical developed countries and its enlightenment to China[J]. Management of Agricultural Science and Technology, 2018, 37(1): 52-55. (in Chinese with English abstract)
[5]王濤,徐秀娟,佘磊,等. 農業科研試驗基地服務鄉村振興戰略SWOT分析與路徑探究——以安徽省農業科學院為例[J]. 安徽農業科學,2018,46(36):212-213,224. Wang Tao, Xu Xiujuan, She Lei, et al. SWOT analysis and path exploration of agricultural research experimental base serving rural revitalization strategy—A case study of Anhui academy of agricultural sciences[J]. Journal of Anhui Agricultural Sciences, 2018, 46(36): 212-213, 224. (in Chinese with English abstract)
[6]戰徊旭,張忠鋒,許立峰,等. 農業科研試驗基地在鄉村振興中的引領作用:以中國農業科學院煙草研究所試驗基地為例[J]. 中國農業資源與區劃,2019,40(2):8-12,39. Zhan Huaixu, Zhang Zhongfeng, Xu Lifeng, et al. The leading role of agricultural scientific research base in rural vitalization: Taking tobacco research institute of case as an example[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2019, 40(2): 8-12, 39. (in Chinese with English abstract)
[7]鮑先巡,徐秀娟,佘磊,等. 農業科研試驗基地管理模式探討:以安徽省農業科學院為例[J]. 農學學報,2017,7(12):137-140. Bao Xianxun, Xu Xiujuan, She Lei, et al. Discussions on management model of agricultural scientific research base a case study of Anhui academy of agricultural sciences[J]. Journal of Agriculture, 2017, 7(12): 137-140. (in Chinese with English abstract)
[8]張志剛,馬賓生,李瑞云. 我國農業科研基地運行現狀及發展對策[J]. 農業科研經濟管理,2017(3):32-35. Zhang Zhigang, Ma Binsheng, Li Ruiyun. The current situation and development strategy of agricultural scientific research experimental base in China[J]. Management for Economy in Agricultural Scientific Research, 2017(3): 32-35. (in Chinese with English abstract)
[9]Rothamsted Experimental Station (RES)[EB/OL]. http://www. era.rothamroth.ac.uk/contact/
[10]International Long-term Ecological Research Network (ILER)[EB/OL]. https://www.ilter.network/
[11]UK Environmental Change Network (UK ECN)[EB/OL]. http://www.ecn.ac.uk/
[12]Long Term Ecological Research Network (LTER)[EB/OL]. https://lternet.edu/
[13]National Ecological Observatory Network (NEON)[EB/OL]. https://www.neonscience.org/
[14]Chinese Ecosystem Research Network (CERN)[EB/OL]. http://www.cern.ac.cn/0index/index.asp/
[15]National Soil Fertility and Fertilizer Effects Long-term Monitoring Network[EB/OL]. http://fla.cern. ac. cn/
[16]National Agricultural Data Center (NADC) [EB/OL]. http://www.agridata. cn/rules/regulars. aspx/
[17]王啟現,任德芹,邱國梁. 農業科研試驗基地的基本功能與主要分類[J]. 安徽農業科學,2018,46(5):215-217,222. Wang Qixian, Ren Deqin, Qiu Guoliang. Study on function and classification of agricultural scientific research experimental base[J]. Journal of Anhui Agricultural Sciences, 2018, 46(5): 215-217, 222. (in Chinese with English abstract)
[18]李俊清,宋長青,周虎. 大數據背景下農業數據資源分類及應用前景淺析[J]. 農業圖書情報學刊,2018,30(4):23-27. Li Junqing, Song Changqing, Zhou Hu. Analysis of agricultural data resource classification and application prospect under the background of big data[J]. Journal of Library and Information Sciences in Agriculture, 2018, 30(4): 23-27. (in Chinese with English abstract)
[19]中華人民共和國國家治理監督檢驗檢疫總局,中國國家標準化管理委員會. GB/T 13745—2009學科分類與代碼[S]. 北京:中國標準出版社,2009.
[20]邢文明. 我國科研數據管理與共享政策保障研究[D]. 武漢:武漢大學,2014. Xing Wenming. Research on Policy Guarantee of Scientific Data Management and Sharing in China[J]. Wuhan: Wuhan University, 2014. (in Chinese with English abstract)
[21]彭秀媛. 農業科學數據共享模式與技術系統研究——以遼寧省為例[D]. 北京:中國農業科學院,2018. Peng Xiuyuan. Research on Agriculture Science Data Sharing Mode and Technology System--Taking Liaoning Province as an Example[D]. Beijing: Chinese Academy of Agricultural Sciences, 2018. (in Chinese with English abstract)
[22]Austin C C, Bloom T, Dallmeier-Tiessen S, et al. Key components of data publishing: using current best practices to develop a reference model for data publishing[J]. International Journal on Digital Libraries, 2017, 18: 77-92.
[23]Leslie H, Raleigh L M, Brandon M, et al. Data management, sharing, and reuse in experimental geomorphology: Challenges, strategies, and scientific opportunities[J]. Geomorphology, 2015, 244: 180-189.
[24]中華人民共和國國家治理監督檢驗檢疫總局,中國國家標準化管理委員會. GB/T 13016—2018標準體系構建原則和要求[S]. 北京:中國標準出版社,2018.
[25]石彥琴,趙躍龍,李笑光,等. 中國農業工程建設標準體系構架研究[J]. 農業工程學報,2012,28(5):1-5. Shi Yanqin, Zhao Yuelong, Li Xiaoguang, et al. Infrastructure of standard system for agricultural engineering construction in China[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(5): 1-5. (in Chinese with English abstract)
[26]劉光盛,王紅梅,胡月明,等. 中國土地利用工程標準體系框架構建[J]. 農業工程學報,2015,31(13):257-264. Liu Guangsheng, Wang Hongmei, Hu Yueming, et al. Infrastructure of standard system for land use engineering in China[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(13): 257-264. (in Chinese with English abstract)
Establishment of data management standard system for agricultural scientific research and experiment station
Chen Li1,2, Wang Qixian3, Liu Juan1,2※, Cui Yunpeng1,2, Wang Mo1,2
(1.,,100081,; 2-,,100081,; 3.,,100081,)
Agricultural science data is an important strategic resource. As first-hand scientific research data producers, agricultural scientific research and experiment station gathers massive scientific research data of different types which are in a loosely managed state. So, the establishment of its data management standard system is not only a basis for standardized data management but also an important part of standardized data management work. And it is of great significance for improving data reusability and fully developing data value. In this research, by investigating the data characteristics and the whole life cycle management process of the agricultural scientific research and experiment station in China, we found that the data had four characteristics: 1) multi-source and isomerism; 2) Small data centralized management, big data decentralized management; 3) short time duration and poor continuity of data; 4) low data standardization and insufficient data sharing. And based on the problem of “small data centralized management, big data decentralized management”, we explored the workflow for routine data management in agricultural scientific research and experiment station, then designed a unified workflow. Under the fragmented data management workflow, it was usually a lack of professional and unified standard system in agricultural scientific research and experiment station, so the data sharing and reusability rate were very low, and the data value was hard to realize. But, based on a unified data management standard system, there were the specialized person responsible for data management and sharing and provided services for users, which effectively guaranteed the data quality, greatly improved the probability of the users to discover the data, and reduced the workload of the data owners to manage the data. Additionally, based on the “Hall three-dimensional structure”, we constructed the standard system framework for data management of agricultural scientific research and experiment station from three dimensions: standard application data management stage, standard features, and standard professional field. From the dimension of standard application data management stage, the data management standard system should focus on the life-cycle management process such as data collection, data processing, data archiving, data storage and sharing, and each data management stage should have corresponding standards as the basis and guidance. From the dimension of the standard features, the data management standard system should include technical standards, work standards, and management standards. And different types of standards complemented each other to ensure the orderly implementation of data management. From the dimension of the standard professional field, guidance standard was the foundation, data standard was the core and management standard was the guarantee. Based on the previous research and two rounds of expert review and discussion, the data management standard system table of agricultural scientific research and experiment station was compiled. It contained 20 standards covering the whole life cycle of data management of data. Among them, 12 standards were mandatory construction standards for the first construction phase. This table could be used to guide the construction of a personalized standard system for different agricultural scientific research and experiment stations, to achieve the maximum standardization effect with minimum resource input. This standard system was the basis of standardized data management of agricultural scientific research and experiment station and was of great significance to promote the construction of agricultural scientific research and experiment station. However, there is still a big challenge: how to get through the data collection channels to centralize the data (especially the long tail data) from different data producers? A complete collaboration mechanism is also needed.
scientific data; standard system; agricultural scientific research and experiment station; data management
陳 麗,王啟現,劉 娟,崔運鵬,王 末. 農業科研試驗基地數據管理標準體系構建[J]. 農業工程學報,2020,36(4):193-201. doi:10.11975/j.issn.1002-6819.2020.04.023 http://www.tcsae.org
Chen Li, Wang Qixian, Liu Juan, Cui Yunpeng, Wang Mo. Establishment of data management standard system for agricultural scientific research and experiment station[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(4): 193-201. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.04.023 http://www.tcsae.org
2019-11-21
2020-02-05
中國農業科學院基本科研業務費專項(Y2019PT27)
陳 麗,助理研究員,博士,主要從事科學數據管理、土地規劃和利用研究。Email:chenli02@caas.cn
劉 娟,副研究員,博士,主要從事農科學數據管理及農業領域應用研究。Email:liujuan@caas.cn
10.11975/j.issn.1002-6819.2020.04.023
F306.3
A
1002-6819(2020)-04-0193-09