余思琨,崔 征
(中國地質大學(武漢)圖書館,湖北 武漢 430074)
數據一直是科學研究中不可或缺的重要部分,隨著網絡發展和e-science環境的進程加快,數據被從實驗室和筆記本中帶出,進入了網絡空間。Alan Blatecky[1]提出“數據是研究的新貨幣”??茖W研究的更加緊密合作和跨專業,也使得數據生產數量達到了空前高度,Milner[2]提出科研數據每年以127%的速度增長。大數據的技術發展使得大量珍貴的科研數據能夠得到保存與管理,DATAONE等許多圖書館合作的科研數據管理項目致力于在全球范圍內共享和重復利用數據。圖書館作為知識服務提供者和科學文獻的集散地,更應利用自身優勢,提供更好的數據管理服務。據此圖書館館員應在科研數據管理中適應新的角色定位,對自己提出更高要求。
在2016年的ACRL趨勢報告中明確提出科研數據服務是圖書館的首要發展趨勢[3],圖書館員需為研究人員提供整個科研過程中的存儲、組織、分享、記錄和處理等工具與服務,確保科研數據的可訪問性、可靠性和及時性。許多高校特設了數據館員崗位,或是將數據服務視作是參考咨詢服務的新領域,甚至有高校將圖書館員嵌入科研團隊中進行數據管理。在現有文獻中,胡元元[4]對數據館員崗位設置和服務內容進行梳理,穆向陽[5]探討科研數據管理與學科館員之間的關系,蔡韶瑩[6]調研國內各大高校圖書館在科研數據管理中的實踐。而本文結合DATAONE項目成功案例,進一步梳理圖書館員在科研數據管理項目中所扮演的角色及定位。
DATAONE(Data Observation Network for Earth)是一個多機構跨學科合作項目,致力于構建出新的全球網絡基礎設施的組織結構,解決生物、生態和環境研究領域中整個數據生命周期問題的數據管理集成工具。學術圖書館(加利福尼亞大學數字圖書館、田納西大學和伊利諾伊大學芝加哥分校圖書館)、學術機構、環境觀測站、基金和政府組織等多種機構都是DATAONE的開發合作機構。DATAONE的管理團隊設在新墨西哥大學,超過25%的DATAONE成員來自圖書館學或是圖書館員[7]。
DATAONE項目吸引了廣泛的利益相關者參與,而小組的跨學科組成產生了富有成效的思想交流。隨著小組成員的不斷互動,對各領域的數據再利用有了充分的理解,并形成了綜合性的處理方法。融合研究已被確定為NSF的十大理念之一,并被NSF定義為深度整合多個領域知識、技術和專長,形成新的和擴展的框架[8]。融合研究通過讓利益相關者參與合作,利用不同的專業知識,以增強創新和解決問題的潛力。正因為DATAONE項目中的融合思想,使得在識別利益相關者時并不是通過學科分類,而是通過使用者的身份與環境來考慮。
如圖1所示,DATAONE認為科學家是最主要的利益相關者,將其放在利益相關者網絡的中心,并識別到5種科學研究環境:私營組織、學術界、社區、政府、非營利和私營組織,每一個環境中都有次要利益相關者,組織用方框表示,個人用橢圓形表示??梢钥吹綀D書館及圖書館員存在于多個環境中,且圖書館在5種科學研究環境中都提供支持服務。因如此,DATAONE一開始就將圖書館及圖書館員列為最重要的次要利益相關者。
圖1 DATAONE利益相關者網絡
DATAONE以數據為核心,立足于整個數據生命周期的問題,建立了一個簡單易懂的可視化模型,如圖2所示,用來確定科學家、圖書館員及其他用戶在使用數據時的各種階段和過程,滿足所有科研數據管理的要求。
圖2 DATAONE數據生命周期
圖書館員在整個數據生命周期過程中都可以提供支持和服務。在規劃階段,圖書館開發的DMPTool(Data Management Planning Tool)可以幫助研究人員在線制定和創建數據計劃;在數據收集階段,圖書館員可以提高收集效率和準確率;在質量保證階段,圖書館員可以協助科學家制定對已收集數據的篩選和質量保證策略;在數據描述階段,圖書館員針對數據的類別和特點幫助研究人員理解、選擇和生成適合的元數據;在數據保存階段,圖書館員也將根據研究的內容提供安全、穩定、分類清晰的數據庫,以便于數據的二次利用;在數據發現階段,圖書館員則利用自身專業優勢幫助用戶更快更好精準檢索和訪問數據;在數據整合與分析階段,圖書館員能增強科研人員生成集成數據集的能力,并針對科研人員的研究要求提供可視化分析工具。
圖書館員在DATAONE科研數據管理項目中不僅能作為研究者從DATAONE中受益,并且能夠參與項目的管理工作,更好為融合研究服務,更能從利益相關者的角度為科研數據管理提出建議,推動科研數據管理發展。
3.1.1 科學研究參與者
2006年10月在美國國家科學基金委員會和研討圖書館協會召開的會議上就曾提出圖書館員參與數據管理的角色應從科研數據生命周期下游向上游拓展與延伸[9]。因此,圖書館員應作為科學研究的參與者,從研究初始階段就與科研人員密切接觸,深入到科學各環節。一方面將發揮圖書館員的信息管理學和圖書情報學專業優勢與科研人員專業知識的優勢互補,在進行科研時查閱到最新研究動態,時刻掌握學科前沿動態,加快科學研究進程;另一方面也能加深對科研項目內容的理解,提升圖書館員的自身專業科研水平,增長業務能力,從某種程度來說,圖書館員作為科研團隊成員是一種雙贏。正因如此,康奈爾大學、麻省理工大學、哥倫比亞大學等高校已對數據館員提出了參與科研項目的崗位要求,且已有圖書館員團隊嵌入國家科學基金項目中[10]。
3.1.2 數據管理服務者
DATAONE項目中圖書館員能在數據生命周期的各個環節提供支撐與服務,并且為了能更好提供服務,創建用戶畫像以突出特點,形成用戶場景,并根據個性化的需求提供定制化服務。而這些被展示在DATAONE網站中提供外部潛在用戶瀏覽,進一步了解科研數據管理所能提供的服務,擴寬用戶群體。而服務對象層次的提升,服務要求的細化,都促使數據管理服務者的服務層次不斷深入。不僅需要隨時跟進項目進度,還需要通過項目開展前中后期多次的評估了解用戶的需求變化,調整服務模式。
3.1.3 科研數據管理者
已有研究指出了創新團隊中邊界跨越者的重要性[11]。邊界跨越者可以跨學科轉換不同的信息,減少學科邊界造成的不連續性鴻溝等負面影響??蒲腥藛T知道如何就自己學科以外的學科提出問題,溝通解決問題。Tenopir 也認為“圖書館員在數據服務方面具有天然的領導作用,因為他們是機構中能夠看到所有組成部分或學科廣泛情況的人”[12]。在DATAONE項目組中,新墨西哥大學圖書館成立了SC(社會文化問題)和U&A(可用性與評估)兩個工作組,前者負責從社會文化、國際和跨學科等不同的角度為DATAONE提供信息,創建可廣泛用于科學界的模型、框架、定義和理論;后者則為DATAONE建立計劃績效指標,利用可用性分析原則衡量使用情況。
3.2.1 數據管理培訓師
圖書館一直致力于提高全民信息素養,推動信息素養教育發展,而數據素養是信息素養教育的重要組成部分,更應受到重視,在數據生命周期各個階段中的數據管理素養和意識都應給予培訓與提高。教育對于DATAONE項目的成功尤其重要,因為大多數科學家不了解元數據標準、數據共享方式和存檔工具以及數據管理方法。圖書館員通過發布教程文檔、召開研討會、座談會等形式為用戶在科研數據管理的流程、標準、資源、管理計劃制定、技術、平臺選擇、工具使用等多種方面提供專業指導。與圖書館數據素養培訓不同的是,數據管理培訓應更加注重元數據的教育和應用。元數據是數據發現和理解至關重要的必要描述,但廣泛使用的元數據標準被采用率卻很低。高校圖書館員也應關注和指導學生進行數據管理實踐,提高大學生的數據素養,以便為他們的學習或職業生涯做好準備。
3.2.2 科研數據管理產品經理
新墨西哥大學圖書館成立的U&A(可用性與評估)工作組反復進行產品的可用性測試,每兩個月列出報告與SC組(社會文化問題)開會進行探討。前中后期的多次評估、創建人物角色、搭建用戶場景都有助于推動產品和服務的開發。根據反饋意見和問題,U&A工作組改善了DATAONE網站的外觀,調整搜索區的功能,增強了頁面上的用戶體驗,提高產品對科研數據管理和資源的利用價值,確保利益相關者的使用體驗良好。而圖書館員對于數據庫與數據管理工具的高度使用,對這些軟件和網站的優缺點有充分的認識與了解,在開發維護的過程中可擔任產品經理的角色,與開發人員合作,推動產品更好為提高科研效率服務。
科研數據管理給圖書館提出新挑戰,圖書館員更應盡快適應新角色。
(1)以用戶為核心,促進交流。圖書館員需要從用戶的實際角度出發,全面了解科研用戶在數據管理中存在的困難與需求。在初期用戶的態度、行為和對科研管理期望值都是圖書館員需要理解和學習的,中期的在線咨詢都可以加強圖書館員與用戶的交流。提升與科研人員合作和溝通的技巧。
(2)增強自身數據素養。充分調動圖書館員的數據意識和敏銳度,加強對科研數據生命周期的理解和把握,全面了解科研數據管理的政策和法規,深入學習數據分析工具、語義描述語言、元數據的標準與格式、數據庫等專業知識和計算機技術。在保持自己優秀科研數據管理水平的基礎上,應投入時間和精力了解科研用戶的學科內容,深入理解用戶的科研數據管理需求。