溫希軍 周喜榮 王 瓊 王田田 李天斗 合斯萊提·斯馬依
新疆畜牧科學院畜牧業經濟與信息研究所 烏魯木齊 830011
創新作為引領發展的第一動力, 科技創新是贏得未來的第一關鍵。 隨著中國經濟邁入高質量發展階段,國家對科技創新工作越來越重視,對科技創新投入也逐年增加, 科學數據作為加強我國科技創新能力建設重要基礎性戰略資源[1],與經濟社會發展最具研究、開發利用潛力的科技資源,有著重要的研究意義與作用。
在試驗、檢驗、觀察、調研等類型的科研活動過程中, 通常會產生大量瑣碎、 分散與原始及衍生數據,即“科學數據”。這些碎小而原始的科學數據雖然不直接產生最終的科研結論或成果, 但它們或多或少通過間接或側面形式對科研結論或成果產生推動作用。 由于科研機構之前對這些科學數據研究與再利用的關注及重視不夠, 科學數據管理在我國還屬于“短板中的短板”,其主要原因有兩點:一是在科研活動中,未形成有效的科學數據保護機制,大量分散的、珍貴的科學數據白白浪費,得不到及時有效的保護、整理、研究與再利用;二是經常會因為科技人員變動或科研項目結題, 使得大量原始數據未被有效收集、整理和保存。 這些都造成科學數據的流失,致使這些科學數據寶貴的參考價值未能得到充分的體現[2]。
對此, 國家高度重視科學數據的管理與保護工作,于2018 年由國務院辦公廳發布了《科學數據管理辦法》,強調要規范科學數據的管理,并提出要加強國家科學數據中心的培育和建設。2020 年12 月,國家科技基礎條件平臺中心在召開的科技計劃項目科學數據匯交工作交流推進會上強調: 加強與各項目管理專業機構的交流與對接, 力爭將政府預算資金資助的各類項目產生的科學數據匯聚到國家科學數據中心。
1.1 國家層面 2001 年, 第一個科學數據共享試點---氣象科學數據共享試點, 由國家科學數據共享工程啟動。 迄今為止, 科學數據共享工作已在農業、資源環境、基礎與前沿等領域24 個部門開展。如今,科學數據共享理念不僅得到科技界普遍認可,而且促進了行業間的數據交換, 為國家開展重大項目與工程實施提供數據支撐的同時, 也對科技創新與社會發展事業的促進起到了很大作用[3]。
中國農科院信息所通過國家農業科學數據共享中心門戶網站和分中心網站, 實現了面向全社會的全天候農業科學數據共享服務, 為農業科技創新提供了良好的數據支撐。
1.2 國內部分省市發展情況 山東省科技廳聯合山東省教育廳、山東省工業和信息化廳、山東省農業農村廳、山東省人力資源和社會保障廳、山東省大數據局、山東省國資委等廳局聯合印發了《山東省科學數據管理實施細則》(魯科字〔2019〕116 號),對山東省各部門、 各地區和法人單位的具體職責進行了明確細化,確保山東省科學數據工作有章可循。 同時,山東省科技廳利用科技報告專題培訓會進行了政策解讀和宣講, 并申請了中央引導地方科技發展專項資金100 萬元,用于前期科學數據中心研究與建設[4]。
四川省于2020 年正式印發《四川省科學數據管理實施細則》,要求政府資助的科技項目所形成的科學數據由項目牽頭單位負責匯交到相關科學數據中心。同時要求,在項目合同簽訂時明確科學數據匯交責任,在項目驗收前先進行科學數據匯交。
青海省2021 年建成的國家青藏高原科學數據中心, 是國內唯一針對青藏高原及周邊地區建設的科學數據門類最全、最權威的科學數據中心。
畜牧科學數據是從事畜牧業科技活動所產生的基礎數據,以及相關的數據產品和相關信息。畜牧科學數據是畜牧科技創新的重要基礎性資源。 通過新疆畜牧科學數據資源共享服務平臺建設, 可以為畜牧科學研究、 科技創新與畜牧科技管理決策提供科學數據信息支撐和保障。
2.1 新疆畜牧科學數據資源共享服務平臺管理與服務標準規范體系建設 科學數據標準規范的制定與執行是新疆畜牧科學數據資源共享服務平臺數據資源建設科學化與科學數據服務常態化運行的基礎和重要保障。根據畜牧行業科學數據資源整合、共享與創新發展的實際需要, 研究制訂出新疆畜牧科學數據發現、處理、保存、組織、管理以及共享服務等方面的標準規范[5],科學數據元數據標準、科學數據標引規范、科學數據范疇分類規范等技術標準規范,以及科學數據匯交管理辦法、 科學數據質量控制管理與質量評價辦法、 數據共享管理辦法等科學數據管理服務辦法[6],這些科學數據標準規范所形成的框架體系在新疆畜牧數據平臺畜牧業科學數據收集、整理、共享中將發揮重要的作用。
同時, 為了最終與國家農業科學數據中心實現科學數據匯交, 新疆畜牧科學數據資源共享服務平臺在制訂科學數據標準規范時參考中國農科院農業信息研究所農業科學數據中心相關標準規范, 結合現有科學數據資源狀況, 制定相關科學數據標準規范,為將來的數據匯交奠定基礎。
2.2 新疆畜牧科學數據資源共享服務平臺建設體系 新疆畜牧科學數據資源共享服務平臺是基于完善的科學數據標準規范體系, 對現有畜牧科學數據庫資源以及分布式畜牧科學數據庫資源通過分布式集成訪問技術進行整合。 在新疆畜牧科學數據資源庫基礎上, 構建新疆畜牧科學數據元數據庫及新疆畜牧科學數據目錄數據庫, 通過科學數據元數據庫發現、定位數據[7],并采用異構數據檢索代理來實現分布式異構科學數據庫的訪問; 科學數據目錄數據庫則提供畜牧科學數據導航與跨庫檢索功能。
新疆畜牧科學數據資源共享服務平臺主要包括元數據管理、數據庫管理、目錄服務管理、數據安全管理、用戶管理等不同功能模塊,以實現網絡化的科學數據維護、發布、審核、共享與安全等管理,以及針對不同用戶提供按需供給的科學數據個性化服務等功能。
2.3 新疆畜牧科學數據資源共享服務平臺資源收集模式
2.3.1 分學科主題式存儲收集 新疆畜牧科學數據資源共享服務平臺通過不同學科不同主題的分類分級方式,以新疆畜牧業生產、科學研究、畜牧經濟等活動領域通過觀測、試驗、計算分析等手段形成的過程與結果科學數據為基礎, 形成新疆畜牧科學數據數據庫與資源的分類與存儲模式[8]。

圖1 新疆畜牧科學數據資源共享服務平臺總體結構示意圖
2.3.2 普查與監測資源整合匯聚 對新疆畜牧長期形成的不間斷的調查與監測數據整合匯聚。 其中包括新疆畜牧科學院畜牧業經濟與信息研究所2012 年與中國農科院農經所合作承擔“中國農村微觀經濟新疆農村數據調查”工作積累10 年的新疆農村微觀經濟數據;2016 年通過加入中國農科院海外農業研究中心成立的中國農業走出去聯盟組織,承擔與新疆接壤的哈薩克斯坦等國家畜牧業生產、市場、貿易等相關數據的收集、整理及形成報告任務,積累了大量國內外畜牧業生產、市場、貿易數據等。
2.3.3 紙質資料數字化 對于包含畜牧類科學數據資源的紙質介質圖書文獻資料, 通過掃描識別或人工轉錄等方式, 對科學數據進行整理、 加工與再呈現,拓寬科學數據的發現與關聯。
新疆畜牧科學研究工作經過多年的發展與積累, 形成了大量寶貴、 利用潛力巨大的科研數據資源。 通過將新疆畜牧業各類科學數據資源進行整合與匯交,構建了一個包含數據采集、數據整理、數據匯聚與數據分析的新疆畜牧業科學數據資源共享服務平臺, 在為新疆畜牧業現代化發展與科技創新提供數據支撐的同時, 也將有效地促進新疆畜牧業科學數據資源的開放共享范圍與水平。