文 / 李楊 裴麗
大量數據的產生使得科學研究正處于信息海嘯的邊緣,如何對大量的研究數據進行有效的管理成為學界關注的焦點。2017年3月,OCLC發表的《研究數據管理的現實》系列報告強調:“研究數據管理已經成為高等教育中十分重要的一個領域,需要對服務、資源和基礎設施進行大量投資,以支持研究人員的數據管理需求。”[1]
圖書館作為學校信息知識中心,逐漸提高了對研究數據管理的關注度。2016年,在美國大學及研究型圖書館協會計劃與評估委員會發表的圖書館學領域十大研究趨勢中,“研究數據服務”位列第一。《新媒體聯盟地平線報告:圖書館版》連續在2014年、2015年和2017年三版中都將“提升研究數據管理的關注度”作為圖書館研究的關鍵趨勢。國內學者也將“研究數據服務”列為圖書館學研究以及高校圖書館業務發展持續關注的主題領域[2]。在數字科研環境下,高校圖書館有必要將學科服務嵌入科研過程,融入研究數據生命周期各環節,以用戶需求為核心,提供研究數據管理服務,從而提高科研用戶的工作效率,促進科研創新。
生命周期原本是生物學術語。1980年代美國學者將“生命周期”概念引入信息管理學領域。Levitan認為,信息生命周期包括信息的產生、組織、維護、增長以及分配[3]。研究數據是在科研過程中所產生或獲取的各類數據信息資源。它同一般信息資源一樣,具有生命周期的特征。目前得到學術界較多認可的研究數據生命周期模型有數據歸檔倡議(DDI)研究數據生命周期模型、數字數據管理中心(DCC)研究數據生命周期模型、DataONE研究數據生命周期模型、英國數據規定中心(UKDA)研究數據生命周期模型等。
UKDA研究數據生命周期采用環形結構描述研究數據生命周期。該模型將研究數據生命周期歸納為6個節點:數據創建、數據加工、數據分析、數據保存、數據訪問、數據再利用[4],見圖1。

圖1 英國數據規定中心(UKDA)研究數據生命周期模型
與其他模型相比,UKDA研究數據生命周期模型更加直觀,層次也更加簡潔。雖然UKDA研究數據生命周期模型的主要適用對象是社會經濟科學研究,但是鑒于其對研究數據生命周期較為全面且簡潔的描述,該模型可為即將或剛剛開始研究數據管理的機構提供借鑒。
將學科服務嵌入研究數據生命周期,就是要將圖書館服務融入研究數據生命周期的各環節,對研究數據進行有效的組織管理,以學科服務的形式提供給科研用戶,協助科研的開展,推進科研創新與成果轉化。
在數據創建階段,學科服務團隊應聚焦兩方面服務內容。第一,制定研究數據管理規劃。在科研項目開始之前,學科館員應協助科研人員制定研究數據管理規劃,規劃內容應包括研究數據的格式選取、存儲方式、數據分析及共享方式等。學科館員還應積極為科研人員提供各種研究數據管理計劃工具,并對制定的數據管理規劃進行審核,提高效率,合理分配資源。第二,挖掘以往相關研究數據,實現數據再利用。UKDA研究數據生命周期模型是一個閉合環路。研究開始前,學科館員應對以往相關研究數據進行挖掘,將能夠支撐本次科研項目的數據提供給科研人員,使新的科研活動在以往數據的基礎上開展,降低科研成本,體現研究數據管理的價值與意義。
研究數據格式復雜、載體多樣、內容繁雜。為了讓數據更好地服務科研,學科服務團隊應適時地協助科研人員收集研究數據,清理冗余數據,對研究數據格式、載體、命名等進行規范化監管。由于學科差異,科研過程存在不同。對于不同科研過程中產生的研究數據,學科館員應協助研究人員進行元數據處理,并向研究人員介紹相應的元數據標準或提供元數據處理工具,為用戶建立元數據記錄,以提高不同科研方式與過程中產生的數據之間的可操作性,提高數據被發現的幾率。
在數據分析階段,圖書館學科服務的主要任務是萃取和提煉研究數據中的信息知識[5]。學科館員需要對經過標準化處理的研究數據進行分析,挖掘數據之間的潛在規律,對數據特征及內涵進行說明,將研究數據進行關聯化處理,實現數據升值。學科館員可以將分析結果以報告形式提供給科研人員,也可以在科研人員授權的前提下,將分析報告出版,向社會公開發表。
數據保存服務是嵌入式學科服務的核心內容。數據保存的對象既有研究過程中產生的一次數據,也包括學科服務團隊對研究數據進行分析、組織得到的數據集合。數據保存應按照統一格式,遷移至適當的媒介當中,并進行定期備份與更新維護。學科服務團隊應充分發揮圖書館文獻信息中心的職能,依托資源與專業優勢,為科研項目或學科搭建知識庫,將科研數據及其衍生數據按照安全與共享相協調的原則進行保存與備份。
在數據訪問階段,學科服務的內容主要包括提供數據共享、發布、檢索等。學科服務團隊提供數據共享服務時,應注重保護科研人員利益。高校圖書館可根據科研人員意見設定共享級別,對于不同數據與不同用戶,設定相應共享權限。數據發布包括對內與對外發布。對內發布是指將研究數據及其衍生數據等向科研團隊內部發布;對外發布則是指經過科研人員授權允許后,將研究數據及其衍生數據向科研團隊以外的社會公開。學科館員還應發揮專業優勢,幫助科研人員用正確的檢索方式快速獲取研究數據,以支持科研活動的進行,提高數據利用率。
在開展新研究之前,學科館員應對以往相關研究數據集進行調研,在以往研究數據的基礎上,開展新一輪的研究活動。這不僅能夠避免重復工作,提高研究效率,降低科研成本,而且可以基于以往研究數據,制定新一輪的研究數據管理計劃與科研活動計劃,為嵌入研究數據生命周期的學科服務做好準備。
用戶需求是開展嵌入式學科服務的出發點與落腳點。高校圖書館在開展嵌入研究數據生命周期的學科服務之前,應充分調研科研人員需求,堅持以用戶需求為導向,指導服務的開展。目前,較為成熟的用戶需求識別方法主要有:基于數據管理計劃識別法,即通過研究數據管理計劃揭示科研人員服務需求;基于結構化訪談工具捕獲服務需求,即通過一些結構化訪談工具,了解用戶需求;基于大規模調查問卷收集用戶需求,即通過廣泛發放調查問卷獲取用戶需求[6]。
圖書館開展嵌入研究數據生命周期的學科服務,需要有相應政策對服務進行規范與管理。2018年3月17日,我國實施了《科學數據管理辦法》。該辦法對研究數據的采集與保存、共享與利用、保密與安全等作出了規定。高等學校作為《辦法》規定的研究數據管理主體之一,有必要在國家層面政策指導下,提升對研究數據的重視程度,制定適合本校情況的研究數據管理政策,明確研究數據管理內容,規范管理行為,并突出圖書館在本校研究數據管理服務中的主體地位,給予圖書館政策支持,提高科研人員對于圖書館服務的信任度。
由于專業限制,科研人員可能并不具備較高的數據素養。這制約了研究數據管理服務的水平。因此,面向科研人員開展數據素養培訓對于開展嵌入研究數據生命周期的學科服務具有積極意義。高校圖書館在開展服務之前,應該對研究人員進行數據素養教育,提升研究人員的數據意識,豐富研究人員數據技能,讓研究人員認識到研究數據管理的重要性,主動接受研究數據管理服務。數據素養培訓可以通過授課、集中培訓、單獨輔導、自主學習、研討會等形式開展,通過微信、網站、APP等途徑向研究人員提供數據素養知識,開展全方位、多渠道的數據素養培訓。
圖書館開展嵌入研究數據生命周期的學科服務,需要完善的硬件環境,包括服務器、存儲、通訊設備、計算機等。先進技術的介入能夠提高服務水平與效率,如利用“云計算”實現研究數據的存儲與共享;利用可視化技術對數據進行分析,發現數據關聯;重視人工智能在服務中的應用;重視數據挖掘技術在用戶需求捕獲中的應用等。開展嵌入研究數據生命周期的學科服務在技術層面最核心的內容是構建一站式服務平臺。平臺的設計目標是實現全部研究數據管理的服務內容,提供管理計劃制定、數據存儲、數據下載、數據分析等功能。平臺的構建不僅能夠提高學科館員的服務效率,而且能夠幫助研究人員更加便捷地儲存、共享、獲取研究數據,實現研究數據一站式管理。
圖書館開展嵌入研究數據生命周期的學科服務,是一項復雜的服務項目,對于小型圖書館來說,開展的難度很大。針對學校規模較小或圖書館能力較弱的情況,應協調多部門合作,有效整合校內資源,為開展研究數據服務提供捷徑。學校應建立以圖書館為核心的研究數據服務機構集合,整合學校科研管理、信息技術等部門,各自發揮優勢,推動研究數據服務的順利開展。
當前科學研究已進入數字科研環境,研究數據的價值日益顯現,研究數據已成為最重要的資源。高校圖書館作為學校的文獻信息中心,有義務為科研人員提供高水平數據服務,助推科研。當前,我國高校圖書館開展嵌入研究數據生命周期的學科服務實踐案例較少,仍處于起步階段。我國高校圖書館在開展嵌入式研究數據服務時,應借鑒國外成功案例,構建適合本校科研工作特點的研究數據生命周期模型,將學科服務嵌入到研究數據生命周期各環節,提供優質高效的研究數據管理服務。這對于提高科研效率、促進科技創新、轉變圖書館服務模式都有積極的作用。