張琳霞,張虹霞
(1.中國船舶集團有限公司第七〇五研究所昆明分部,云南 昆明 650032;2.云南省科學技術情報研究院,云南 昆明 650051)
2011年,美國咨詢公司麥肯錫最先提出了“大數據時代”概念。大數據具有海量數據規模、快速數據流轉、多樣數據類型、價值密度低等特征。隨著網絡時代的發展,各類數據快速增長。近年來,我國制定了《促進大數據發展行動綱要》,《國家科技資源共享服務平臺管理辦法》等政策文件,大力推動公共數據互聯開放共享,推進科技資源向社會開放。我國政府推動數據開放讓龐大的公共信息資源進入市場,為其開發與利用提供了更多資源。科技數據資源作為數據資源的重要組成部分在大數據背景下開發利用還面臨一定問題,有待進一步改善提升。
大數據時代,強調海量數據的存儲、分享和挖掘,目前科技資源的異構系統、異構數據導致了科技數據的割據。
科技部門在大數據建設和應用的過程中仍然感到數據不足,想用的、能用的數據無處可尋,可用、可信的數據相對匱乏,數據缺乏連續性,這種優質數據缺乏的現狀影響制約著科技業務的應用和科技數據產業鏈的形成。
科技數據包括科技管理日常文檔、科技政策、科技項目、科技人才、科技專家、科技成果、科技獎勵等多種類型,各類信息來源不同的業務工作和信息系統,數據結構和格式多樣,復雜多變。
早期開發的信息系統從單項工作或單個系統出發,只考慮有關數據的采集、處理、存儲,滿足當前工作需要或是達到系統開發目標即可,因此,缺乏有關數據采集、整理、存儲、應用的標準規范,形成數據孤島、碎片數據,這種現象既不能保障數據的有效存儲,同時對后續開展數據整合、匯總、統計、共享、利用時也造成不便。
由于缺乏數據規范和標準,在建設科技業務管理信息系統數據庫時,發生在填報或采集數據時,同樣的內容,例如學科、行政區劃、領域等,填報的數據不一致,影響數據質量和數據統計。
科技數據開發及管理人才匱乏,相關人員對大數據有關的知識學習不足,對有關的數據規劃和分析利用的思考和方法掌握不夠。
目前,我國還缺乏關于科技數據信息增值開發利用的法律和制度,因此需要加強有關法制建設和研究,開發諸如許可制等制度建設,為科技數據信息增值開發利用提供法律保障。
成立專門的科技數據信息資源建設管理和服務部門,負責科技數據信息資源共建與共享的具體工作。按照《政府信息公開條例》《促進大數據發展行動綱要》《科學數據管理辦法》等相關規定,并結合工作實際,制定相關制度,明確科技數據采集、存儲、加工、傳遞、檢索、分析等應用中的職責、分工、權利、義務和獎懲等內容。建立經費保障機制,保障相關工作的正常開展,同時加強資金管理,提高資金使用的規范性和有效性。
遵循統一規劃、統一管理、統一標準、分步實施、不斷完善的原則,按照政務信息資源目錄體系標準規范,圍繞科技數據的采集、存儲、檢索、分析等過程,基于云環境、參考大數據開發利用的技術和做法進行統一的服務平臺建設,面向各級科技管理部門、高校、科研院所、開展科研活動的企事業單位和個人提供數據服務。
組建專業的數據分析團隊,選拔培養懂業務、懂技術、懂設計、懂分析的專業隊伍,掌握大數據的新型處理技術,為科技管理數據的采集、整理、分析、研究、評估和預測提供技術支持。加強與有關高校、科研院所和企事業單位的合作,加強數據共建共享、合作培養專業人才、開展課題研究、實施工程項目,共同為科技管理數據的開發利用提供有力支持。
深化大數據應用是大數據技術參與到管理工作、決策過程中來的最終目的,對于科技部門來說,大數據將進一步提升科技管理的效率,因此,我們應圍繞科技應用需求開展科技大數據的收集、處理、分析,使科技數據信息資源的作用真正發揮出來,將科技大數據成果普惠于民。