●祁 寧袁羽墨
1.沈陽建筑大學圖書館,沈陽,110168
2.沈陽建筑大學計算機科學與工程學院,沈陽,110168
科學數據是國家科技創新和經濟社會發展的重要基礎性戰略資源[1],科學數據的收集整理、分析挖掘和共享利用已成為世界范圍內學界和業界的研究熱點。 隨著大數據時代的到來和數據密集型科學環境的發展,世界范圍內的科學數據總量不斷激增,我國科學數據也呈現出“井噴式”增長。 高校圖書館作為支持科研創新和服務高層次人才培養的學術性機構,有必要結合科學數據環境,根據科研人員的需求提供精準化的科學數據服務。 2011 年,楊鶴林將美國高校圖書館的數據監護服務引入國內,率先開啟了高校圖書館界對科學數據服務領域的關注和研究[2]。 2014 年復旦大學、北京大學和清華大學等9 所高校圖書館共同成立了“中國高校研究數據管理推進工作組”,合力推進國內高校研究數據管理事業發展[3]。 2014—2022 年各成員館以自身的發展重點和優勢為突破點,開展不同方向的研究和實踐工作,目的是共同推動研究數據的政策制定與實施,提升館員與科研人員的數據素養,推進研究數據的收集與存儲、重用與共享,并為高校圖書館研究數據的管理和建設提供參考方案。
目前,國內針對高校圖書館科學數據服務領域的綜述類論文僅10 余篇,分為國內和國外兩個方向。 第一,國外高校圖書館科學數據服務的綜述研究。 肖瀟等[4]從未來規劃、角色定位、技術與合作、科學數據素養教育4 個方面,對國外圖書館的科學數據服務進行歸納總結;楊文建等[5]對國外高校圖書館開展的科學數據管理服務進行梳理,對比國內在該領域存在的不足,在服務環境、合作交流、服務需求、人才培養和素養教育方面為我國提出參考建議;夏琬鈞等[6]從國外區域性實踐調查入手,對高校圖書館科學數據服務的進展進行總結,為我國高校圖書館科學數據服務實踐提供借鑒;蔡韶瑩[7]從理論、政策和實踐3 個方面對國外高校圖書館科學數據服務進行梳理,并從政策監管、創新模式、館員角色、服務平臺4 方面提出啟示;嚴珊[8]對國外高校圖書館科學數據素養教育進行綜述研究,從培養科學數據人才、豐富教育模式、完善法律體系3 方面為我國提供啟示。 總體來看,國內學者對國外該領域綜述性的研究多集中于基礎理論、發展政策、建設策略、實踐啟示等方面的梳理和總結,缺乏研究趨勢預測。 第二,國內高校圖書館科學數據服務的綜述研究。 陳媛媛等[9]從理論、實踐、政策和教育等角度對國內外高校圖書館科學數據服務研究的總體情況進行了梳理;李金建[10]對高校圖書館科學數據服務研究現狀進行了分析,但文獻計量分析不夠深入;陳晉[11]從統計分析視角,對我國科學數據管理服務進行現狀分析和主題歸納,但缺少知識圖譜的展現;劉敏[12]對我國圖書館科學數據素養研究態勢和特點進行分析,包括發表期刊、基金和詞頻等,但沒有對核心研究作者、團隊和機構進行分析;陳薇[13]對我國圖書館科學數據管理研究現狀進行了梳理和述評,但沒有知識圖譜分析。 總體來看,針對國內該領域的綜述性研究或是系統性文獻梳理,或是對態勢與特點進行的簡單計量分析,缺少文獻計量方法與知識圖譜相結合的可視化研究與分析。
為了全面、系統掌握我國高校圖書館科學數據服務的發展脈絡、研究熱點及趨勢預測,本文結合文獻計量學方法,綜合應用CiteSpace、SPSS、Excel 等軟件進行文獻可視化分析,為相關領域的研究與實踐提供參考借鑒。
以中國知網(CNKI)為檢索數據庫,構建“SU%=(‘科研數據’+‘科學數據’+‘科技數據’)?服務AND SU %=(‘高校圖書館’+‘大學圖書館’)”檢索式進行專業檢索,檢索日期截至2022 年12 月31日,共獲得816 篇文獻。 經過人工篩選,剔除無關文獻后,最終獲得相關文獻522 篇。 本文結合文獻計量方法,采用Excel 和SPSS 軟件對相關文獻的發文量、核心研究作者、核心研究團隊、核心研究機構等進行文獻計量分析;并將CiteSpace6.1.R6 軟件作為可視化分析工具,對相關領域的研究進展、熱點演化、主題分布及未來趨勢進行可視化知識圖譜分析。
年度發文趨勢可以用來判斷研究領域在某一時間段的發展現狀與研究歷程,對明晰高校圖書館科學數據服務領域的概況具有輔助作用。 根據相關文獻的年發文量與年累計發文量,本文運用Excel 制作了我國高校圖書館科學數據服務領域發文趨勢及擬合曲線圖,如圖1 所示。 年發文量曲線顯示,相關領域的研究文獻最早發表于2011 年,前3 年年均發文量不超過10 篇,2011—2013 年的總體發文量偏少、增長緩慢。 從2014 年開始,發文量快速增長。此外,國務院在2015 年和2018 年分別發布了《促進大數據發展行動綱要》與《科學數據管理辦法》,進一步促進了科學數據的規范管理與開發利用,并且使科學數據逐步上升為支撐國家科技創新和社會經濟發展的戰略資源,相關研究開始趨于穩定發展。

圖1 我國高校圖書館科學數據服務領域發文趨勢及擬合曲線
從圖1 可以看出,年累計發文量曲線的走勢較為穩定,其數值呈現規律性變化,形成的曲線可以用函數或參數方程進行表示,因此可參照規律曲線的變化進行發展預測。 本文以發文年份和年累計發文量建立數據關系,采用SPSS 回歸分析中的二次函數進行曲線擬合[14],來預測我國高校圖書館科學數據服務領域的未來發文走勢。 圖1 中的虛線即擬合曲線,R2=0.990 8,擬合效果較為理想,同時得到我國高校圖書館科學數據服務研究領域文獻增長的預測模型,擬合方程為:F(t)= 3.072 7t2+12.073t-34.659,其中F(t)為年累計發文量,t為發文年份,如表1 所示。 根據虛線的走勢,本文預測我國高校圖書館科學數據服務領域的研究總量還將在虛線附近穩定出現,虛線也表明未來幾年的相關研究仍然呈現增長趨勢。

表1 我國高校圖書館科學數據服務領域二次函數擬合曲線匯總
篩選出的522 篇文獻,共計有720 位作者,其中張群以11 篇的發文量排名第一。 根據普賴斯定律,首先,確定核心研究作者最低發文量的公式,即M=0.749,其中M為論文數量,Nmax為所統計作者的最大發文量。 將該領域作者的最大發文量11代入公式可得,M≈3.317,因此發文量在4 篇及以上的作者可以被列為該領域的核心研究作者候選人。 其次,被引頻次是確定核心研究作者的另一重要因素,由普賴斯定律得出最低被引頻次的公式,即Mc=0.749,其中Mc為核心作者累積最低被引頻次,Ncmax代表該領域內單篇論文被引頻次最高值。 經檢索,孟祥保和李愛國發表的《國外高校圖書館科學數據素養教育研究》一文,被引頻次達到219次,代入公式可得Mc≈11.08,說明發文累積最低被引頻次達到11 次及以上也可被列為核心作者候選人。 經統計,滿足上述兩項指標的作者共有16 人。
最后,運用綜合指數評價法對核心研究作者進行準確判斷,先確定與評價對象有關的重要指標,再計算指標數值,并將其轉換為指數、確定指標權重,然后再設定閾值并計算綜合指數。 本文結合專家訪談法對評價該領域核心研究作者的重要指標及指標權重進行調查,最后得到4 個評價指標,分別為相關領域發文總量(A)、相關領域論文總被引頻次(B)、第一作者身份相關領域發文量(C)、作者相關領域的H 指數(D)[15],其權重分別為30%、30%、20%、20%。 根據普賴斯定律對發文量和被引頻次進行限定,即需同時滿足“A≥4,B≥11,C>0,D>0”4 個條件的作者才能成為核心研究作者候選人。 根據上述統計得到符合條件的16 位核心研究作者候選人,核心研究作者綜合指數Wi的計算公式為:
i=1,2,3,4,…,16
經計算,核心研究作者候選人各項指標的平均指數為:A均=5. 63,B均=173. 13,C均=3. 69,D均=3.81。 將各項指標的平均指數代入公式后得到Wi=100,將此數值認定為核心研究作者的閾值,閾值大于100 的候選人可被認定為該領域的核心研究作者,按照綜合指數進行降序排序,得到表2。

表2 作者綜合指數統計
經綜合指數計算,國內該領域共產生10 位核心研究作者。 首先,孟祥保在發文量和被引頻次方面均排名靠前,尤其是被引頻次遠超于其他研究者,其綜合指數排名最高;張群在該領域的發文量排在首位,超半數文章為第一作者,說明其對該領域研究的貢獻度較高。 兩位作者的綜合指數均超過平均值兩倍,說明其是我國高校圖書館科學數據服務研究的領軍作者,其發表的論文具有極高的參考價值。 其次,胡卉、吳鳴、楊鶴林、劉桂鋒和沈婷婷5 位作者的發文量和被引頻次較高,說明其研究成果能夠充分反映該領域內的前沿水平,具有一定的代表性,能夠幫助研究者快速明晰該領域的研究內容和總體發展方向。 最后,鄧李君、陳媛媛和葉蘭發文量較少,但葉蘭的論文被引頻次較高,3 位作者在該領域的不同方向上進行深層次的研究,為該研究領域向縱深方向發展起到推動作用。
通過CiteSpace 進行作者合著情況的可視化分析,生成作者合著共現圖譜。 圖譜中的節點代表作者,節點面積與作者的發文量呈正相關,節點之間的連線表示二者之間存在合作關系,如圖2 所示。

圖2 作者合著共現關系
圖2 顯示共有4 個合著團體,首先是孟祥保、葉蘭、常娥團隊,其研究成果主要聚焦于高校圖書館科學數據聯盟建設與數據素養培養方面,屬于跨校合作團體;其次是劉桂鋒、盧章平和劉瓊團隊,其主要研究方向為國內外研究數據管理與治理、數據管護等,屬于校內合作團體;再次是吳鳴、胡卉和陳秀娟團隊,其屬于導師與學生合作的關系,主要研究方向為數據素養教育、圖書館科學數據服務等;最后是崔海媛、羅鵬程、李國俊和朱玲團隊,其主要研究開放數據平臺和圖書館研究數據管理,研究領域較為專一,屬于部門內部合作團體。 以上4 個團隊合著發文量相對較多,合著較為緊密,說明其已初步形成較為穩定的作者合著團體。 此外,圖2 的網絡密度為0.003 7,表明作者之間的合作關系較為松散,單一作者仍占據主要地位。 這也說明作者之間的合作意識不夠強烈,還應不斷加強學術交流與合作,以此拓寬我國高校圖書館科學數據服務領域的研究深度和廣度。
核心研究機構因在某些研究領域中具有人才支撐、資源保障和技術護航等多重優勢,其相關的科研成果更具競爭力和影響力。 本文利用綜合指數評價法進行核心研究機構判定,設計兩個評選指標,分別是機構發文總量(X)、論文總被引頻次(Y),因X和Y之間存在較強的正相關關系,因此將二者權重均設置為50%[14]。 根據普賴斯定律對核心研究機構進行限定,公式為Mi=0.749,其中Mi為核心機構數量,Nimax是機構最高發文量。 經統計,中國科學院文獻情報中心與中國科學院大學是我國高校圖書館科學數據服務領域發文量最高的機構,發文量為16 篇,代入公式可得Mi≈2.996,即發文量在3 篇以上的機構可以作為核心候選機構,共有35個機構入選。 因此,核心研究機構綜合指數Zi的計算公式為:
i=1,2,3,…,35
經計算,核心研究機構各項指標的平均指數為:X均=5.14,Y均=121,將各項指標的平均指數代入公式后得到Zi值為100,該數值即可被認定為判定核心研究機構的閾值,根據綜合指數進行排序,得到表3。

表3 研究機構綜合指數統計
根據表3 的結果,可以得到該領域共有12 個核心研究機構。 高校圖書館有7 所,占核心研究機構的大部分。 其中東南大學圖書館位列首位,其發文被引頻次在平均值的5 倍以上,說明該機構的研究成果受到學者最多的關注,在該領域具有較高的影響力和權威性。 另外,黑龍江大學信息管理學院的綜合指數在非核心研究機構中排列最高,與平均值的差距較小,表明該機構若在此領域繼續深入研究,提高科研效率與產出質量,將會在不久后躍升至核心研究機構行列。
再利用CiteSpace 對我國高校圖書館科學數據服務領域研究機構進行可視化分析,生成該領域研究機構共現網絡知識圖譜,見圖3。

圖3 研究機構共現網絡
結合研究機構共現知識圖譜,可以看出共有4個研究機構合作網絡,均是由核心研究機構帶領形成的合作網絡:一是由中國科學院文獻情報中心、中國科學院大學、中國科學院成都文獻情報中心、中國科學院計算機網絡信息中心等形成的研究機構合作網絡,其中中國科學院文獻情報中心和中國科學院大學在核心研究機構中發文量最多;二是由上海大學圖書館、上海大學圖書情報檔案系、武漢大學信息管理學院形成的研究機構合作網絡,在核心研究機構中發文量緊隨其后;三是由東南大學圖書館、中山大學圖書館和中山大學信息管理學院形成的研究機構合作網絡;四是由北京大學圖書館、北京大學信息管理系與中國科學技術信息研究所形成的研究機構合作網絡。 核心研究機構帶領下合作網絡的形成,說明高校圖書館之間、高校圖書情報專業相關學院之間,以及高校圖書館與圖書情報專業相關學院之間的合作研究,有利于推動該領域理論與實踐相結合,促進研究方向的多元化發展,其產生的成果也對高校圖書館的科學數據服務具有參考價值。
基于上述分析,本文對我國高校圖書館科學數據服務領域的研究熱點、演化過程和主題分布進行探討。 關鍵詞是對論文主題與核心內容的高度概括與總結,通過對關鍵詞進行可視化分析,能夠快速了解某研究領域在不同時期的研究熱點、研究視角和研究變化。 因此,本文利用CiteSpace6.1.R6 軟件生成關鍵詞共現圖譜和關鍵詞突現圖譜,分析該領域的研究熱點和變化;同時生成關鍵詞時間線圖譜和關鍵詞聚類圖譜,分析該領域研究主題的演化和趨勢。
通過關鍵詞共現分析,我們能夠掌握某領域的研究熱點。 如圖4 所示,每個節點均代表一個關鍵詞,節點大小與關鍵詞的頻次有關,頻次越高節點越大,節點之間的連線代表兩個關鍵詞曾在同一篇文章中出現。 關鍵詞的中介中心性代表其在共現圖譜中的關鍵程度及與其他節點之間的相關性,一般認為中介中心性≥0.1 的節點在圖譜中的位置相對重要,說明該關鍵詞在本研究領域中的代表性較強。科學數據(91 次,0. 3)、科研數據(72 次,0. 21)和圖書館(56 次,0.3)是圖4 中或頻次最高,或中介中心性最大的3 個節點,表明其是該領域研究的核心關鍵詞。 數據管理(52 次,0.13)、數據素養(42 次,0.2)、數據服務(38 次,0.11)和大數據(29 次,0.11)是圖4 中頻次較高、中介中心性>0.1 的4 個節點,表明其是該領域的主要研究熱點,體現了該領域的主要研究方向。 而數據館員(24 次,0.09)、數據監護(21次,0.06)和學科服務(17 次,0.06)雖然頻次相對較低、中介中心性<0.1,但其也是該領域內的重要研究熱點,與該領域研究的發展方向密切相關。

圖4 關鍵詞共現網絡
突現詞分析能夠將研究領域某一時段的高頻關鍵詞突顯出來,我們以此辨識研究趨勢和前沿動態。如圖5 所示,2011 年“數據監護”概念被引入國內高校圖書館領域,熱度持續了近4 年;2012 年E-science 環境下的數據長久保存與整合加工受到廣泛關注,推動了高校圖書館對數據監護服務的發展,“數據監管”成為最強的突現詞,熱度持續時間超過4 年。 此后,“開放獲取”“學科館員”“服務”等關鍵詞在2014—2016 年相繼突現,說明E-research 理念推動數據資源的高效整合與開放共享,高校科學數據的開放獲取助推了圖書館學科服務與數據服務的融合發展。 “開放數據”“科研支持”“服務體系”“數字學術”等關鍵詞在2017 年突現,突出了科學數據服務內容的廣泛發展與交叉融合。 “啟示”一詞在2018 年突現,熱度持續4 年,說明國內外高校圖書館科學數據服務發展的啟示受到學者的廣泛關注。 “數據服務”和“數據館員”出現較早,但到了2019 年和2020 年才開始被學術界重點關注并持續至今,說明高校圖書館數據服務與數據館員是近年來發展和研究的重點。

圖5 關鍵詞突現
筆者利用CiteSpace 軟件中的Timeview 模塊繪制關鍵詞時間線圖譜,將時間跨度設為2011—2022年,得到關鍵詞演進時間線圖,該圖譜可以直觀地展示該領域研究主題的變化情況和發展趨勢。 根據圖6,可以將我國高校圖書館科學數據服務的研究歷程劃分為3 個階段。

圖6 關鍵詞演進時間線
第一階段為我國高校圖書館科學數據服務的起步期(2011—2014 年)。 這一階段我國高校圖書館科學數據服務研究的發文數量由少至多,呈現上升趨勢,同時時間線圖譜中涉及的關鍵詞逐步增多,關鍵詞和聚類開始發生初步演化,研究方向由圖書館、科學數據、數據監管研究發展到數據館員、數據管理和數據服務等的研究。 相關文獻主要是圍繞數據監管、數據館員、數據管理的基本概念,國內高校圖書館科學數據服務的存在問題及其帶來的啟示等主題內容進行研究和論述,為后續研究奠定了堅實基礎。
第二階段為我國高校圖書館科學數據服務的上升期(2015—2020 年)。 這一階段我國高校圖書館科學數據服務相關的發文量較前一階段有大幅上漲,涉及的關鍵詞和聚類數量增多,同時該階段呈多元化特點,涉及的主要關鍵詞包括數據素養、學科館員、開放數據、人才培養、開放科學和科研支持等。這表明我國科學數據服務的發展與高校圖書館的基礎保障、資源建設、人才隊伍、服務模式等密切相關,該階段的研究對后續發展起到引領作用。
第三階段為我國高校圖書館科學數據服務的深化期(2021—2022 年)。 這一階段我國高校圖書館科學數據服務研究的發文量較上一階段有所下降,但在前期研究的基礎上,該階段的研究成果在研究內容和范式上發生新變化,如區塊鏈、智慧環境等新技術手段的應用和實證研究、框架體系等新研究范式的涌現。 同時,數字技術的快速發展與應用推動了我國高校圖書館科學數據服務的發展,拓展了其研究范圍,未來可能引發更多學者進行相關主題的研究。
在對關鍵詞共現的基礎上,筆者運用LLR 計算方法進行關鍵詞聚類,共得到11 個聚類模塊,其中聚類模塊值Modularity Q =0.872,聚類平均輪廓值Silhouette S =0.973 7,結果顯示聚類結構顯著、聚類結果可靠。 研究共得到:數據素養、數據館員、信息服務、高校、數據分析、數據管理、科研數據、科研支持、數據共享、服務、數據服務11 個聚類結果,如圖7 所示。

圖7 關鍵詞聚類圖譜
為了進一步梳理我國高校圖書館科學數據服務領域的熱點研究主題,將聚類結果按照高校圖書館的管理、服務、教育、保障等職能歸納為4 個大類,即科學數據周期管理、科學數據服務模式、科學數據素養教育和科學數據基礎保障。
3.3.1 科學數據周期管理
高校圖書館的管理功能可分為科學研究數據的收集與整理、保存與共享、數據監護3 方面。 相關研究深入探討科學數據管理的各個階段,對科學數據收集的發展特征[16]、科學數據共享的功能作用[17]、科學數據開放共享服務模式[18]與科學數據監護的監管模式[19]、實施要素[20]、模型設計[21]等方面展開深入研究,豐富了我國高校圖書館科學數據周期管理的實施流程與具體運作的實踐經驗,對加快科學數據平臺建設具有重要的推動作用。 高校圖書館對科學數據進行系統化、規范化的周期性管理,能夠為高校科學數據的存儲與管理提供便利,同時也為推動國家實施數字強國戰略與科技創新發展提供數據保障。
3.3.2 科學數據服務模式
國內多位學者通過借鑒國外高校圖書館科學數據服務的先進經驗,構建本土化的科學數據服務模式,或從用戶需求、政策支撐和人員配置等方面構建嵌入科研過程的科學數據管理服務模式[22],或結合本館科學數據服務進行理論驗證,搭建基于流程端、服務端和支持端的本土化服務模式[23],為國內高校圖書館提供服務模式參考。 此外,還有學者借鑒國外的實踐經驗,從科學數據的咨詢型服務和技術型服務兩方面提出服務策略。 咨詢型服務以科學數據的管理計劃、發現和引用、存儲和共享、保護與培訓等多方面的咨詢為主,或基于信息生態學理論為高校圖書館構建數據管理計劃服務框架體系[24],或從合作方式、管理技能、服務內容、管理培訓等角度提出咨詢服務策略[25]。 技術型服務包括科學數據的應用與推廣,從數據的標識、更新、創建及元數據更改等技術支持[26]到區塊鏈技術保障科學數據的安全性、可靠性和穩定性,并輔助構建貫穿科研周期的科學數據管理系統[27]。
3.3.3 科學數據素養教育
科學數據素養教育是高校圖書館教育職能的重要體現,其相關理論的研究主要從數據意識、知識和技能、數據分析和處理3 個層次來歸納總結科學數據素養的概念[28]。 經過進一步細化,有學者提出數據素養是數據行為主體在滿足社會倫理和道德倫理的基礎上,能夠辯證、科學、正確地認識、操作和管理數據,進而有效利用數據并發揮其最大價值[29],該定義擴展了科學數據素養的內涵與外延。 對于科學數據素養教育相關教學模式的探索,有學者從教學主體、教育階段、教學動因、教學內容和實施方式等方面構建了高校圖書館科學數據素養教育體系“5W”模型[30]。 而對于科學數據素養教育相關教學實踐的發展,有學者從教育內容與模式、教育主體的關注點和參與維度等方面提出科研人員的數據素養教育中的關鍵問題[31];有學者從基本能力、應用能力和意識形態3 個層面搭建圖書館員科學數據素養能力的框架[32];也有學者以雙生命周期為理論視角,構建了研究生數據素養評價體系[33]。 科學數據素養教育以科研人員、圖書館員和研究生群體為對象,豐富了教學內容與實踐形式。
目前,我國正處于實施創新驅動發展和建設科技強國的關鍵時期,為保障戰略的穩步推進,高校圖書館的科學數據素養教育應進一步提質提量,努力協調各利益主體,實現從理論研究到模式探索再到教學實踐的高質量飛躍。
3.3.4 科學數據基礎保障
高校圖書館以各級政策為導向,以數據館員的專業能力為支撐,構成科學數據服務的基礎保障。相關研究從國家政策層面和高校政策層面出發,探討中美兩國科學數據政策的側重點[34],建議參照荷蘭高校圖書館的科學數據管理政策,實施“校+院”兩級分級管理的政策模式[35],彌補我國在科學數據政策指導方面的時間落差。 國內外高校圖書館科學數據的比較分析和國外高校圖書館科學數據管理的參照研究也逐漸成為我國高校圖書館科學數據服務領域的研究熱點。
此外,圍繞數據館員專業支撐的研究主要是從館員素養提升的多重要素出發,對數據館員的角色定位和發展特點[36-37]、崗位職責劃分與服務內容[38-39]、技能體系與素質能力[40-41]等展開深入探討。 基于數據館員多維度的支撐研究,更有利于我國高校圖書館形成明確角色定位、規范崗位職責、協同能力建設三方聯動的基礎能力保障體系。
隨著數字化社會的發展,政府機構、高等院校、圖書館、數據出版商、數據用戶和行業協會等科學數據生產、保存和使用的不同利益主體之間相互關聯、相互影響,高校圖書館需要在科學數據服務中明確角色定位、參與環節、參與方式和建設重點。 為進一步加快高校圖書館科學數據服務的創新發展,本文從以下5 個層面提出建設重點與研究展望。
2018 年國務院印發《科學數據管理辦法》,從國家層面加強和規范科學數據管理制度,對科研院所、高等院校和企業等責任主體提出新要求,明確提出要健全管理制度、科學收集整理和保存數據、保障數據安全、推進數據共享服務[42]。 高校圖書館應積極開展規范合理的科學數據監護服務,有效輔助科研人員進行科學數據的周期性管理,提高科學數據的利用效能。 未來可重點對數據監護各個環節進行細化研究,專注于數據的采集、存儲、處理、共享和銷毀等各環節的實施標準與政策研究,也可從個人隱私數據的流程化管理與安全監管角度進行相關研究。同時,隨著國家《“十四五”數字經濟發展規劃》的推進,數據要素成為數字經濟的發展核心,高校圖書館也可積極發揮數據賦能作用,助力國家經濟社會的數字化發展。
2019 年中國科學院發布《中國科學院科學數據管理與開放共享辦法(試行)》,在科學院層面強化科學數據管理與開放共享服務,推進了科學數據的可持續發展[43]。 我國在科學數據開放共享方面仍處于起步階段,未來可與高校優勢學科發展相結合,充分發揮高校科學數據的規模和場景優勢,開放機構知識平臺,不斷推動跨學科的融合發展。 我國應從不同利益相關者視角出發,開展數據開放政策、數據交流安全審查機制、評價機制、激勵機制等的深入研究。 同時,還需融入先進的數字技術和智能技術,包括元宇宙、區塊鏈、大數據、人工智能等,拓寬科學數據開放共享在創新與實踐方面的廣度和深度。
美國大學與研究型圖書館協會發布的《2020 年學術圖書館發展趨勢》提出大學與研究型圖書館科研數據服務應積極應對倫理問題[44]。 2021 年中國高校研究數據管理推進工作組會議召開,強調高校圖書館應注重科學數據素養培訓與科學數據管理,這說明科學數據管理與服務實踐將成為未來高校圖書館發展的重要內容和新增長點[45]。 面向未來,我國要加快創新科學數據服務實踐的體系建設,聯合利益相關主體,由圖書館、數據中心、科研機構、學術出版機構等機構聯合探索構建差異化服務模式。 此外,還應借鑒國外高校圖書館科學數據服務的內容框架,依據服務對象特征設計層級化服務體系。 例如,面向本科生開展數據意識與實踐能力培養;面向研究生開展科學數據需求調研、能力評價體系構建和影響因素分析;面向科研人員提供科技政策、科學數據知識產權與科研誠信等深層學術支持。 以支撐科研為目的,通過上述兩種方式構筑全方位、多層級、個性化的科學數據服務新路徑。
美國發布的《新媒體聯盟地平線報告:2017 年高等教育版》曾預測科研數據管理服務將成為圖書館未來服務發展的新方向[46];美國大學與研究型圖書館協會《2021 環境掃描》報告又提到,在開放科學生態系統中,高校圖書館應將開發數據管理作為研究支持服務的重點[47]。 這說明在圖書館服務層面,創新科學數據服務模式已成為領域重點實踐方向之一。 我國未來利用數據要素賦能圖書館科學數據服務的多模式發展,可從虛擬服務和實體服務兩方面入手。 一是基于資源整合視角,研究科學數據資源一站式平臺模式,倡導多部門聯合協作,鼓勵用戶進行在線學習。 二是基于空間再造視角,再造數據科學空間,運用AI、AR、VR 等技術打造智能化數據服務,實現跨學科協作服務模式。 同時,豐富科學數據培訓模式,以數據可視化課程、學科實踐活動、專項基金項目為突破口,建立融入科研全程的精細化服務模式,進一步優化科學數據服務培訓體系。
高校圖書館的數據服務已經引起了業界的關注,館員的多元數據素養能力培養將成為圖書館提升服務效能的新增長點。 教育部高等學校圖書情報工作指導委員會《大學圖書館現代化指南針報告》指出,圖書館應結合自身優勢加快建設有助于科研管理和科技創新的數據管理服務等項目,并組織高素質的數據館員隊伍,不斷強化業務能力,推動科學數據服務高質量發展[48]。 美國大學與研究型圖書館協會《2023 環境掃描》報告指出,學術館員需要掌握數據分析、數據服務研究等技能,隨著其技術水平和技能的提升,可以引領研究數據領域的未來發展[49]。 我國未來應重點關注本土數據館員的需求情況、崗位能力、晉升機制以及職業發展前景,還需兼顧其數據倫理與道德意識的塑造。 同時,面向全體館員開放專業數據科學與技能培訓課程,重點培養與提升其數據技能。
目前我國高校圖書館在科學數據的周期管理、服務模式、素養教育和基礎保障4 個方面的研究已陸續展開并取得初步成效,但在政策建設、數據共享、模式創新、服務發展和館員能力提升等方面仍發展緩慢。 清華大學圖書館黨委書記蔣耘中在“2021中國高校研究數據管理推進工作組會議”上提出,高等學校是國家科技創新的重要基地,其生產的大量研究數據對國家科技創新和經濟社會發展都具有非常重要的意義。 采集、保存、管理和使用這些數據,最大限度地發揮數據效能,是高校圖書館的使命,也是未來高校圖書館的發展方向[45]。 高校圖書館開展科學數據服務,能夠加強各方利益主體間的協同交流,形成數據管理與服務合力,為高校科學數據的存儲、管理、共享和重用提供有力支持與保障。