周淑云 伍 丹
(湘潭大學公共管理學院,湖南湘潭 411105)
?
基于信息生命周期的高校圖書館數(shù)據監(jiān)護流程分析
周淑云伍丹
(湘潭大學公共管理學院,湖南湘潭 411105)
[摘要]科研數(shù)據作為科研創(chuàng)新的基礎,對其進行有效的管理尤為重要。通過引入信息生命周期理論,探究在整個科研數(shù)據周期中,高校圖書館在數(shù)據監(jiān)護中的作用,提出高校圖書館開展數(shù)據監(jiān)控的啟示:充分認識到數(shù)據監(jiān)護工作開展的重要性,制定數(shù)據監(jiān)護的長期規(guī)劃;制定數(shù)字資源的長期保存計劃,保障數(shù)據監(jiān)護工作的有序開展;加強科學素養(yǎng)教育,培養(yǎng)專業(yè)數(shù)據監(jiān)護人員;注重保護科研數(shù)據的知識產權,促進科研數(shù)據的交流與共享。
[關鍵詞]信息生命周期高校圖書館數(shù)據監(jiān)護
1前言
隨著計算機技術的發(fā)展與互聯(lián)網的普及,電子科研(e-science)時代到來,大量科研數(shù)據產生。海量的科研數(shù)據為科研人員帶來前所未有的機遇與挑戰(zhàn),一方面科研數(shù)據作為信息時代最基本、最活躍的戰(zhàn)略資源為科研創(chuàng)新提供了強有力的保障,另一方面e-science環(huán)境下產生的大量科研數(shù)據不僅數(shù)量多、類型復雜、管理難度大,而且在促進科研數(shù)據共享方面也面臨著難題。目前,我國已經認識到科研數(shù)據的重要性,國家層面的有科技部的“科學數(shù)據共享工程”[1]和中科院的“中國科學院科學數(shù)據庫”[2],但是基層科研單位的大量科研數(shù)據并未得到有效的管理。高校圖書館作為數(shù)字資源長期保存的主要機構,對數(shù)字資源的管理一直秉承“重保存,輕管理”的做法,如何進一步提升信息服務能力,是高校圖書館面臨的重大挑戰(zhàn)。近年來數(shù)據監(jiān)護(data curation)成為圖書館科研服務的研究熱點,不僅為科研數(shù)據的管理提供了有效的手段,也能為高校圖書館的信息服務能力的提升提供可能。筆者基于信息生命周期理論,對高校圖書館的數(shù)據監(jiān)護工作進行探析,以明確高校圖書館在數(shù)據監(jiān)護工作中的作用。
2信息生命周期概念
生命周期原為生物學領域的概念性術語,是指一個生物從出生到消亡所經歷的各個階段。信息生命周期最早由Levitan在1981年提出,他認為信息或信息資源是一種“特殊商品”,具有生命周期特征,具體包括信息的生產、組織、維護、增長和分配[3]。1985年,Horton在《信息資源管理》中提出,信息是一種有生命周期的資源,其生命周期由一系列邏輯上相關的階段或步驟組成,體現(xiàn)了信息運動的自然規(guī)律,并由此定義了兩種不同形態(tài)的信息生命周期:一是基于信息利用和管理需求的信息生命周期,由需求、定義、收集、傳遞、處理、存儲、傳播、利用7個階段組成;二是基于信息載體與信息交流的信息生命周期,包括交流、利用、維護、恢復、再利用、再包裝、再交流、降低使用等級、處置10個階段[4]。信息生命周期在21世紀初正式進入主流研究視野,ISO/TC171文件成像應用技術委員會在2000年的倫敦年會上正式通過了405號決議,將ISO/TC46”信息技術委員會”的一個分委員會改為“信息生命周期管理”技術委員會,該決議稱“信息無論是以物理形式還是數(shù)字形式管理,其信息生命周期均為信息的生成、獲取、標引、存儲、檢索、分發(fā)、呈現(xiàn)、遷移、交換、保護與最后處置或廢棄”[5]。筆者認為數(shù)據監(jiān)護工作中的科研數(shù)據屬于信息的一種具體形式,其生命周期符合信息的生命周期理論,但是還要注意文章討論的科研數(shù)據的生命周期是一個動態(tài)的循環(huán)過程,不斷有數(shù)據被廢棄,同時又有新的數(shù)據產生。
3數(shù)據監(jiān)護的內涵及實踐
數(shù)據監(jiān)護(data curation)是一種對科研數(shù)據進行管理的方法,它通過對科學數(shù)據收集、組織、查證和保存,使科研人員在以后的研究中發(fā)現(xiàn)這些數(shù)據的新價值。Choudhury認為數(shù)據監(jiān)護是對數(shù)據進行收集、驗證、組織及儲存維護,以供科學家在面臨的各種科研挑戰(zhàn)時使用的活動[6]。筆者認為數(shù)據監(jiān)護要注重對科研數(shù)據進行篩選與鑒定,有選擇地進行監(jiān)護,同時也要注意將科研過程中產生的重要科研數(shù)據納入數(shù)據監(jiān)護的范疇,對科研數(shù)據進行動態(tài)管理,使科研數(shù)據能最大限度發(fā)揮其價值。
國外的數(shù)據監(jiān)護已經由理論走向實踐,不少高校圖書館紛紛推出基于數(shù)據監(jiān)護的學科服務及相關項目。其中較有影響力的是美國國家科學基金會NSF(the National Science Foundation)在2007 年啟動 DataNet 計劃,預算花1億美元,明確以圖書館為主體,用5年時間資助5項數(shù)據監(jiān)護重點研究課題,以推動數(shù)據監(jiān)護工作,目前已經有兩個課題獲得全額資助,分別為墨西哥大學主持的DataOne(Data Observation Network for Earth)項目[7]和由約翰霍普金斯大學圖書館主持的Data Conservancy項目[8]。針對數(shù)據監(jiān)護開展相應的教育與培訓,如IDEA(International Data Curation Education Action)工作小組就是一項為了促進教育領域和研究領域的人員在這一方面的合作而產生的職業(yè)教育交流項目。[9]同時一些大學也紛紛開展數(shù)據監(jiān)護的相關課程,如伊利諾伊大學圖書情報研究院、緬因州大學、雪城大學信息學院等都開展了專門的數(shù)據監(jiān)護課程,授課對象主要為研究生,旨在培養(yǎng)數(shù)據監(jiān)護的專業(yè)人員。
我國在數(shù)據監(jiān)護方面仍處于起步階段,尚未有成熟的數(shù)據監(jiān)護項目。雖然高校圖書館對于數(shù)字資源長期保存已經有20余年的研究,但是其工作重點僅停留在數(shù)據的保存,對于數(shù)據的管理能力仍有待提高。目前,除積極介紹國外關于數(shù)據監(jiān)護的相關項目外,國內的圖書館界也積極探索圖書館在數(shù)據監(jiān)護方面發(fā)揮的作用,借鑒國外的經驗,提出具體的圖書館的服務內容與形式,有利于指導圖書館開展數(shù)據監(jiān)護工作,搶占數(shù)據監(jiān)護高地。
4信息生命周期視域下圖書館在數(shù)據監(jiān)護中的作用
科研數(shù)據的生命周期主要包含的核心階段為:數(shù)據產生——數(shù)據收集——數(shù)據整理——數(shù)據發(fā)布——數(shù)據利用[10],科研數(shù)據的生命周期意味著通過對科研數(shù)據的管理與保存,實現(xiàn)資源的發(fā)掘與再利用。針對科研數(shù)據的生命周期,高校圖書館可嵌入基于信息生命周期的數(shù)據監(jiān)護,相應的科研數(shù)據監(jiān)護流程可劃分為:收集、評介、組織、處理、描述、訪問、再利用,同時也要考慮科研過程中產生的新數(shù)據的收集與舊數(shù)據的剔除。
在科研數(shù)據生命周期的上游階段——數(shù)據生產階段,高校圖書館在宏觀上需要與學校相關機構共同制定相關的政策,如數(shù)據提交政策、數(shù)據管理策略、數(shù)據長期保存策略,以明確數(shù)據監(jiān)護的各階段的主要任務,保證數(shù)據監(jiān)護的實施。微觀上,圖書館應在科研數(shù)據產生前,參與到科研項目中,與科研人員共同對將產生的數(shù)據類型、數(shù)據量等進行評估,確定相應的數(shù)據篩選方案、數(shù)據提交格式等。同時圖書館也可為科研項目提供數(shù)據檢索與分析服務,圖書館員可作為嵌入學科館員針對科研人員的信息需求進行數(shù)據檢索,并對相關數(shù)據進行整理、分析,以便科研人員判斷數(shù)據的可用性并根據反饋意見及時調整檢索策略。在這一階段,圖書館主要通過與科研人員的合作實現(xiàn)其作用,如麻省理工學院圖書館通過與科研人員(團隊)合作,將科學數(shù)據咨詢服務館員嵌入到科研工作過程之中,為科研人員提供及時、準確的科學數(shù)據需求。[11]
高校圖書館在數(shù)據監(jiān)護工作中的重點主要體現(xiàn)在數(shù)據生命周期的中游階段。在這一階段,圖書館的工作重點與難點主要為知識的抽取。首先,圖書館對于產生的未發(fā)表的科研數(shù)據提供存儲服務,制定學科館員幫助科研人員對產生的數(shù)據進行規(guī)范存儲,并定期更新,同時對所存儲的數(shù)據的名稱、類型等進行簡單描述。其次,對科研數(shù)據進行評估,根據相應的數(shù)據篩選方案,剔除沒有價值的數(shù)據,有選擇性的對數(shù)據進行保存與監(jiān)護。數(shù)據監(jiān)護管理的科研數(shù)據是不斷更新,因此為滿足科研人員與用戶的信息需求,需要構建數(shù)據中心或數(shù)據庫將評估和選擇完的數(shù)據轉移到里面,這就需要對所存儲的數(shù)據格式進行轉換,如設計相關的元數(shù)據、不同元數(shù)據標準或不同數(shù)據之間的交換形式等,對轉移的數(shù)據進行長期保存,同時存儲前注意數(shù)據的完整性,沒通過預處理的中間數(shù)據是暫時的、動態(tài)的,這部分數(shù)據在后續(xù)的科研結束后可能具有長期保存的價值,因此對于這部分數(shù)據進行暫時性的歸檔和維護。[12]另外,在這一階段需要確定不同科研人員與用戶的對于數(shù)據的使用權限,確保有權限的使用者能夠及時訪問。高校圖書館在數(shù)據生命周期的最后階段主要為提供科研數(shù)據的共享服務,在此階段通常產生大量的有價值的數(shù)據,通過與科研人員的交流,確定共享的數(shù)據,并幫助其完成數(shù)據提交,同時注意調整數(shù)據的訪問權限。圖書館在科研項目結束后也要保持同科研人員的聯(lián)系,以保證及時更新數(shù)據庫中的數(shù)據,與科研人員協(xié)商,確定公開的范圍。[13]同時高校圖書館也要注意在數(shù)據監(jiān)護過程中數(shù)據共享產生的知識產權問題。
此外,高校圖書館在數(shù)據監(jiān)護工作中不僅作為主要參與者,同時承擔著數(shù)據監(jiān)護專業(yè)人員培養(yǎng)的任務。專業(yè)人才的培養(yǎng)實踐已經在國外的高校圖書館積極開展,如美國北德克薩斯大學信息學院與圖書館通過合作的方式,開設了Graduate Academic Certificate in Digital Curtation and Data Management的課程,通過在線課堂的方式在三年內教授研究生(除圖書情報專業(yè)的碩士、博士研究生外)4門課程,目前已經開設兩門:數(shù)據監(jiān)護基礎和數(shù)據監(jiān)護工具、應用與基礎設施,未來還將開設數(shù)據管理與保存、數(shù)據管理研究兩門。[14]一直以來圖書館以信息素養(yǎng)培訓的主要機構存在,尤其是高校圖書館依托自身優(yōu)勢,積極與其他機構合作,培養(yǎng)用戶的“科研數(shù)據素養(yǎng)”以應對電子科研(e-science)時代的到來。
5我國高校圖書館開展數(shù)據監(jiān)護的啟示
數(shù)據監(jiān)護作為一項新興的知識服務,國外的高校圖書館已積極展開實踐,我國的圖書館界也開始意識到數(shù)據監(jiān)護的重要性,因此筆者旨在通過上述高校圖書館在數(shù)據監(jiān)護中的作用,為我國高校圖書館開展數(shù)據監(jiān)護服務提供參考與啟示。
5.1充分認識到數(shù)據監(jiān)護工作開展的重要性
在高校圖書館開展數(shù)據監(jiān)護工作首先要充分認識到數(shù)據監(jiān)護對于高校圖書館的重要性。高校作為科研活動開展的重要場所,各種類型的科研數(shù)據不斷產生,在e-science的背景下這些科研數(shù)據以電子的形式記錄下來,存在著科研數(shù)據丟失與利用價值低的風險,因此科研工作人員迫切需要圖書館搭建科研數(shù)據交流與共享平臺,以充分發(fā)揮科研數(shù)據的信息價值,而圖書館可依托自身的軟硬件優(yōu)勢,積極宣傳數(shù)據監(jiān)護,使高??蒲腥藛T充分認識到其重要性,進而開展數(shù)據監(jiān)護工作,制定明確的數(shù)據監(jiān)護策略與發(fā)展規(guī)劃,圖書館員以學科館員的身份參與到科研項目中去,積極搭建數(shù)據交流與共享平臺,加深學科服務的深度與廣度,提升自身的信息服務能力,使高校圖書館成為提供知識管理的重要陣地。其次,數(shù)據監(jiān)護工作的開展需要大量的資金投入,這就需要學校的相關部門與領導的大力支持,通過引入相關設備與專業(yè)人員,為圖書館開展數(shù)據監(jiān)護工作提供保障。
5.2制定數(shù)字資源的長期保存計劃
數(shù)字資源作為數(shù)據監(jiān)護的對象,有關數(shù)字資源的長期保存尤為重要。數(shù)字資源的長期保存作為數(shù)據監(jiān)護的基礎環(huán)節(jié),為數(shù)據監(jiān)護提供數(shù)據源和基礎性保障;數(shù)據監(jiān)護則有利于保障數(shù)字資源長期保存計劃的實施與優(yōu)化。[15]在電子科研的時代背景下,大量數(shù)字資源不斷產生,科研人員對數(shù)字資源的依賴程度與日俱增,這就促使高校圖書館制定有效的數(shù)字資源長期保存計劃。國際圖書館協(xié)會與機構聯(lián)合會(International Federation of Library Associations and Institutions,簡稱IFLA)與 國 際 出 版 商 協(xié) 會 (International Publishers Association,簡稱 IPA)在 2002 年聯(lián)合發(fā)表的《永久保存世界記憶:關于保存數(shù)字化信息的聯(lián)合聲明》中明確規(guī)定:“出版者應該擔負短期保存的責任,長期保存的責任應由圖書館承擔”。圖書館只有將科學數(shù)據納入長期保存的范疇,以主動的姿態(tài)承擔起科學數(shù)據長期保存的責任,以數(shù)據監(jiān)控為契機,才能尋求新的生長點。
5.3加強科學素養(yǎng)教育,培養(yǎng)專業(yè)數(shù)據監(jiān)護人員
數(shù)據監(jiān)護工作具有專業(yè)性與復雜性的特點,這就需要負責這項工作的人員具備相關的專業(yè)知識與較高的信息素養(yǎng)。培養(yǎng)用戶的信息素養(yǎng)一直以來就是高校圖書館的主要任務之一。由于數(shù)據監(jiān)護剛剛在我國興起,關于這方面的研究主要停留在理論研究方面,因此高校圖書館一方面需要增強自身在數(shù)據監(jiān)護方面的專業(yè)技能,不斷學習科研數(shù)據管理方面的專業(yè)知識,借鑒國外相關的管理經驗,為圖書館的工作人員開展專業(yè)的科學素養(yǎng)教育,通過為科研人員提供課程培訓,提高科研人員的數(shù)據意識,增強其收集數(shù)據、管理數(shù)據、分析數(shù)據的能力。有條件的圖書館應該積極參與國際大型數(shù)據監(jiān)管培育項目,邀請國內外數(shù)據專家為圖書館員進行技能培訓,并設置專門的數(shù)據監(jiān)護員職位。另一方面,專業(yè)人才至關重要。美國雪城大學秦健博士在《E-science環(huán)境下的信息服務、信息組織和信息系統(tǒng)》報告中總結當前圖書館參與科學數(shù)據管理所面臨的問題,其中之一即是缺少具備專業(yè)技能的人員來提供數(shù)據管理服務[16]圖書館可以與相關專業(yè)的院系或機構開展合作,開設相關課程與學位,培養(yǎng)專業(yè)的數(shù)據監(jiān)護人員。
5.4注重保護科研數(shù)據的知識產權
科學數(shù)據作為科研產出的重要內容,其知識產權保護問題一直是被關注的重點,歐美等發(fā)達國家已經制定了相關政策法規(guī)。美國在1996年頒布了國有科學數(shù)據完全與開放的國策,在不同的應用領域和部門,科學數(shù)據共享相關的政策管理和規(guī)章也相繼出現(xiàn),這些政策法規(guī)很好地促進了各自領域中的數(shù)據資源與信息的共享,協(xié)調了共享過程中出現(xiàn)的問題。英國在1998年制定了《數(shù)據保護法》(Data Protection Act 1998)、信息自由法案(Freedom of Information Act 2000)、環(huán)境信息條例(The Environmental Information Regulations)。[17]這些政策法規(guī)既保障了科研數(shù)據的知識產權,也促進了科研數(shù)據的交流與共享。在我國并沒有相關的政策法規(guī)對此進行保護,科學數(shù)據引用問題也是目前科學數(shù)據領域研究的熱點之一,大量科學數(shù)據被用在科研以及文獻中,但是并沒有對其引用狀況進行標識和應用,導致科學數(shù)據的價值沒有有效體現(xiàn)出來。因此高校圖書館可具體劃分科研數(shù)據的密級,并適時更改密級,科研項目組可向圖書館提供具體的有訪問權限的名單,圖書館根據名單予以開放。同時圖書館可與科研人員簽訂相關協(xié)議,以確定科研數(shù)據的具體公布情況,用于保證科研數(shù)據的知識產權。
6結束語
數(shù)據監(jiān)護實質上是對科研數(shù)據的整個生命周期進行管理的知識服務,對于發(fā)揮科研數(shù)據的價值,推動高校科研進步有著重要的意義。目前我國對于數(shù)據監(jiān)護的研究剛剛起步,由于其自身的專業(yè)性與復雜性,需要國家、社會尤其是圖書館界的全面支持。圖書館應評估數(shù)據監(jiān)護的可行性與必要性,制定數(shù)據監(jiān)護的宏觀計劃,積極開展與相關機構的合作,履行自身在數(shù)據監(jiān)護工作中的作用,提升館員的知識服務能力,推動圖書館的發(fā)展轉變。
參考文獻
〔1〕科學數(shù)據共享工程[EB/OL].[2015-08-14].http://www.science.data.cn/index.php
〔2〕中國科學院科學數(shù)據庫[EB/OL].[2015-08-14].http://www.csdb.cn/in?dex.jsp
〔3〕LevitanK B.Information resources as“goods”in the life cycle of information production[J].Journal of the American Society for Information Science,1981,33(1):44- 45
〔4〕Horton FW.Information resources management[M].London Prentice Hall.1985
〔5〕李銘.看國際動態(tài),找國內差距,促技術發(fā)展[J].縮微技術,2002(2):25-29
〔6〕Choudury S.Data Curation:An Ecological Perspective[J].College &Research Libraries News.2010,71(4):194-196
〔7〕DataONE[EB/OL].[2015-08-14].https://dataone.org/
〔8〕DataConservancy[EB/OL].[2015-08-14].http://dataconservancy.org/
〔9〕劉霞,劉小杏.數(shù)據監(jiān)護范例分析——以DataCite、 DCP和IDEA Working Group為例[J].大家,2012(9):101
〔10〕丁寧,馬浩琴.國外高校科研數(shù)據生命周期管理模型比較研究及借鑒[J].圖書情報工作,2013(6):18-22
〔11〕Lincoln Laboratory Grid(LLGrid)[EB/OL].[2015-8-16].http://www.11.mit.edu/news/11grid.html
〔12〕樊俊豪.圖書館在科學數(shù)據管理中的角色定位研究[J].圖書情報工作,2014(6):37-41
〔13〕沈婷婷,盧志國.科研項目不同階段的科學數(shù)據監(jiān)管方法[J].圖書館建設,2013(3):49-51
〔14〕UNT Receives More Than $800,000 in Funding to Investigate Needs in Archiving Research Data[EB/OL].[2015-08-17].http://untsystem.edy/news/2011/August/11-08-09-arch-res-data.html
〔15〕程連娟.美國高校圖書館數(shù)據監(jiān)護的實踐及其啟示[J].圖書館雜志,2012(1):76-78
〔16〕肖瀟,呂俊生.E-science環(huán)境下國外圖書館科學數(shù)據服務進展[J].圖書情報工作,2012(17):53-58,114
〔17〕劉細文,熊瑞.國外科學數(shù)據開放獲取政策特點分析[J].情報理論與實踐,2009(9):5-10
Research on Data Curation of University Library Based on Information Life Cycle Theory
Zhou ShuyunWu Dan
[Abstract]Scientific data is the basis of scientific research and innovation, so the management of scientific data becomes important. Through the introduction of information life cycle theory, the paper explores the role of university library in data monitoring, and points out the importance of data monitoring. Then the paper suggests that university library should make a long-term plan of data monitoring, develop the long-term preservation plan, ensure the orderly development of data monitoring, strengthen the scientific literacy education, train professional data monitoring personnel, and focus on the exchange and sharing of scientific data.
[Key words]Information life cycle;University library; Data curation
[中圖分類號]G250.7
[文獻標識碼]A
〔作者簡介〕周淑云,湘潭大學公共管理學院副教授,博士。研究方向:信息法學,圖書館管理等,已發(fā)表論文30余篇;伍丹,湘潭大學公共管理學院14級研究生。