周榮雙 周榮偉
摘 要 隨著E-research的發展,高校圖書館應創新工作模式,開展科學數據服務,本文從數據管理人員和研究者、技術應用于基礎設施、相關法規政策、元數據管理與標準制定四個方面研究了高校圖書館開展科學數據服務的模式,提出高校圖書館應從開展數據素養教育和培訓、探討科學數據管理與共享新技術、組建并參與數據聯盟等方面的建議。
關鍵詞 E-research 元數據 科學數據服務 科學數據素養
引言
全球數據量以每年60%的速度遞增,世界已經進入網絡化大數據時代,隨著E-research的發展,學術研究發生著本質的變化,高校科研人員的工作方式的改變,科研工作不再從頭開始,而是建立在對科學數據的重新認識、組織、解析和利用的基礎上,使用不同的工具和方法開展研究,科學數據的重要性突顯,同時,高校在科研過程中形成了海量的科學數據,但是,這些科研數據一般在研究結束和論文發表后,分散保存在科研團隊或者研究者個人存儲設備中,共享程度不高,還會帶來數據丟失、重復研究和科研資源浪費的風險。如何對高校科學數據進行有效的管理并開展相關服務值得深入研究的問題。高校圖書館具備學科服務館員,元數據編寫經驗和數字資源管理硬件設施和軟件環境等,具有開展科學數據服務的優勢,同時,隨著圖書館館藏資源的價值的降低,圖書館開展新的科學數據管理服務,是其發揮信息組織和傳播中心的職能和支持科研工作的必然要求,本文重點研究如何在高校中開展科學數據管理與服務。
1國內高校開展科研數據管理服務現狀
高校是科學研究和科技創新的主體,國內部分高校根據實際教學和科研需求,開展相關數據服務,實現科學數據的開放和共享,為我國其他高校開展相關服務提供了參考依據。2007年起,中國人民大學依據SDA開發了中國調查與數據中心,主要針對中國的經濟和社會數據,開展數據采集、存儲和開發工作,研究成果包含中國發展指數,中國大學生發展報告等,開創了我國社會科學數據開放與共享的先河。2011年武漢大學圖書館聯合學校人文科學科學、自然科學兩個部門共建,以開源軟件Dspace為基礎,開發了高??蒲袛祿芾砥脚_,研制了數據提交、組織、保存、共享、使用等規范,并以生命科學院蝎物種資源數據庫為試點,對圖片、文件和文獻進行管理,提供科學數據服務。2013年復旦大學經過充分的調查,基于開源軟件Dataverse開發了社會科學服務平臺,面向社會科學、自然科學和人文科學的開展數據研究服務,采集和匯集最新發布的社會科學研究數據資源,同時購買、交換外部的社會科學數據資源,為復旦大學打開數據交流和國際合作的窗口。2013年北京大學以開源軟件Dataverse為基礎研制了開放研究數據平臺,具備完整的數據提交、管理和發布功能,實現數據檢索、瀏覽、授權下載和評論等功能。2016年清華大學中國經濟社會數據中心以中國經濟社會數據為研究對象,開展數據分析、市場調查、決策支持和教育培訓等工作,為世界一流大學建設提供優質的數據服務。
2高校開展科研數據服務需要具備的條件
在高校開展科學數據服務,對其產生的科學數據進行的有效管理和利用,實現數據開放與共享。本文從科學數據管理人員和科研工作者、計算機技術和基礎設施、相關法律政策和元數據管理與標準制定四個方面展開研究。
2.1高??蒲腥藛T是科學數據生成者,也是科學數據服務的主體
由徐坤,曹錦丹抽取吉林省3所高校共46名科研人員針對科學數據管理需求情況的調查可知,科研人員具有數據管理的需求,需要學校提供科學數據管理服務,保證科學數據能被正確保存、檢索和共享。因此,高校在開展相關工作時,可充分考慮科研人員共享科學數據的意愿,認真核查其提供的數據的知名度和可信度,更新科研工作人員的理念,制定學校層面的管理政策和鼓勵措施,保證科學數據服務順利開展。另一方面,在圖書館增設數據圖書館館員職務,他們是科研數據服務的主導者,決定服務的廣度和服務質量,是協調科研人員與學校各部門、圖書館之間、數據中心及出版機構之間的紐帶,制定科學數據管理與服務的相關標準和政策,在工作過程中,可為科研人員提供科研數據支持,協助改善數據管理計劃、收集和管理科學數據、分析數據、存儲數據等專業服務。因此,高校在開展科學數據服務過程中,應設置數據館員專業崗位,發揮專長,為科研助力。
2.2計算機基礎設施和技術是科學數據服務開展的保障
高校師生在進行科學研究過程中,會產生海量的、格式多樣的、數字化形式的科學數據,對其進行管理需提供相應的信息管理方法和性能穩定的硬件設備來保證科學數據管理順利進行,這些基礎設施主要有高容量的數據存儲設備、網絡設備、數據備份構架、科學數據管理平臺,數據分析模型和軟件等。除硬件設備外,數據管理平臺是高校開展科學數據管理的先決條件,合理有效的科學數據管理平臺是科學數據服務開展的保障,其創建主要有兩種方式,一種是基于detaverse和despace等開源軟件創建的數據管理或開放平臺,另外,根據高校實際情況,自主研發的適合本校的數據管理平臺;數據管理計劃是科研數據服務中必不可少的組成部分,是研究人員在項目研究過程中和項目完成后如何處理科學數據的指導性文件,它能協助科研數據服務工作的順利開展,常用的數據管理計劃工具有英國數據監護中心研發的DMPonline、加州數字圖書館開發的DMP Tool等,根據機構要求,設定的數據管理計劃模板,研究人員根據研究情況填寫和上交。在此期間,圖書館可以起到橋梁的協調作用,協助研究人員制定數據管理計劃,并提出數據管理建議;對科學數據進行在線實時分析,可提高數據被利用的效率和更易被檢索,使用合適的數據分析工具可使數據更明確的被展示出來,便于讀者利用,常見的數據分析工具有在線分析軟件SDA的分析功能、dataverse和Nesstar等,分析結果可以按表格、條形圖等多種方式展開,也可以單獨跳出到瀏覽器窗口的形式展示,便于科學數據服務工作的開展。
2.3國家、科研資助機構和學校制定的數據管理政策是高??蒲袛祿芾矸臻_展的有效保障
2018年4月,國務院下發了《科學數據管理辦法》,文件規定了使用國有資金開展科研項目,產生的科研數據必須在所在單位交割后,才能在國外期刊發表論文,文件從宏觀方面規定了強制數據交割政策,但沒有從微觀上明確數據類型、數據標準、數據獲取與共享詳細細節。因此,個科研資助機構和高校應指定詳細的管理政策,進而有效管理本單位的科研數據。清華大學、武漢大學,北京大學和復旦大學在開展科學數據管理過程中,都制定了校級科學數據管理方案和管理的具體要求和措施,這些都為高校開展科學數據服務政策的指定提供參考。因此,高校在開展科學數據管理過程中,必須依據本校實際,縝密考慮本校學科特點和產生科學數據的類型,從科學數據服務整體設計和工作流程出發,制定切合實際的數據政策,保障科學數據服務工作順利開展。
2.4元數據是科學數據管理服務的重要工具和技術保障
科學數據管理計劃制定、數據倉儲的設計與運作、科學數據的出版與共享等工作都離不開元數據。依據開源軟件Despace為基礎開發的科學數據管理服務平臺,采用DC元數據作為其元數據標準,以Dataverse為基礎開發的科學數據服務平臺以DDI元數據作為其元數據標準。北京大學和復旦大學在制定元數據標準時分兩套方案,對于通用的元數據,引入DDI元數據標準,對于專用數據,設置元數據設計按鈕,不同學科不同作者,均可設計自己的元數據方案,高校在開展科學數據服務過程中,涉及元數據管理時,可充分考慮元數據建立與管理、元數據標準制定等的通用性,滿足數據共享、交換和整合需求。
3對我國高校開展科研管理與服務的建議
3.1積極開展數據素養教育和培訓
科學數據素養是指科學研究中收集、加工、管理、評價和利用數據的知識和能力,提高科學數據素養能力,需針和科研人員開展科學數據素養教育和培訓,數據管理人員具備怎樣的數據統計分析能力?如何評定數據的可信度、完整度和權威度?如何根據數據重要性對數據分類保存?何時將適合的數據提供給研究人員等?都將直接決定著一個機構開展數據管理與服務的質量,對數據管理人員展開專門的培訓和輔導,提高科學素養水平。數據管理和服務的目標在于數據被合理使用,研究人員的數據再利用意識和獲取數據、分析數據、評價數據的能力能助推數據管理和服務工作的開展,可總結各種常用數據分析軟件和模型,針對具體的科研活動,開展培訓工作。
3.2積極探討科學數據管理與共享新技術
開展科學數據管理和服務,在數據采集、標引、提交、歸檔、發布與使用的各個環節都離不開相關的計算機軟件和基礎設施。隨著計算機、網絡和大數據技術快速發展,各種新技術、新工具更新速度加快。因此改善科學數據管理方式,重視計算機軟件及工具的研發,對本體技術和元數據的創建進行探討,為科學數據服務工作的開展提供技術支撐。
3.3積極組建并參與數據聯盟
組建科學數據機構庫聯盟,有利于推進高??蒲袛祿墓芾砼c共享,圖書館在聯合編目、聯合采購和圖書管理系統使用過程中非常注重與其他高校與機構的合作,使用同樣的標準開展工作,可減少資源浪費,擴大知識使用范圍,科學數據管理模式類似,開展校際合作,積極組建和參與數據聯盟,對數據實現交換、購買和共享,可擴大科學數據使用范圍,減少研究成本,提高科學數據再利用效率。
參考文獻
[1] 肖瀟,呂俊生.圖書館嵌入式學科化科學數據服務研究[J].圖書館學研究,2012(21):73+85-89.
[2] 徐坤,曹錦丹.高校圖書館參與科學數據管理研究[J].圖書館論壇,2014(05):92-98.
[3] 左志林,李瑞萍.國外高校圖書館數據館員發展現狀研究[J].農業圖書情報學刊,2018(08):164-168+封3.
[4] 張連分.大學圖書館開展科學數據管理服務的實踐和成效評析[J].圖書館建設,2018(10):45-51+58.
[5] 科學數據管理辦法[EB/OL].http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htmcid=303,2018-04-02.
[6] Qin J.D Ignazio J. Lessons leamed from a two-year experience in science data literacy education[EB/OL].http://docs.lib.purdue.edu/cgi/eiewcontent.cgiarticle =1009&context=iatul2010,2012-10-07.