張艷梅
(內蒙古農業大學圖書館 內蒙古呼和浩特 010018)
大數據時代的到來,使得我們的工作、生活、學習等均與“數據”密不分離,一方面,社會因數據而產生新的工作、學習和生活范式,使我們不得不去適應并力爭在新的范式環境下有所創新和發展,如2007年,JimGrey在美國國家研究理事會計算機科學和遠程通訊委員會 (NRC-CSTB)的演講報告中首次提出了以數據密集型計算為基礎的科學研究 “第四范式”概念,并將其作為與實驗科學、理論推演、計算機仿真三種科研范式平行的科學研究。這就要求科研工作者不但需注重所從事實驗、分析的最終結果產生,還需注重在最終結果產生過程中數據的積累、應用和二次、乃至多次開發,這也隱性的要求科研工作者不但需具備在所從事科研領域的儀器、工具應用能力,還需具備基于數據處理平臺的數據存儲、辯識、分析和挖掘能力,具備傳統的基本信息素養已經不適應數據社會的發展和需要,數據素養應運而生并受到社會的重視;另一方面,圖書館不但通過其專業的信息與數據處理,如分類、分析、借閱、組織與呈現等行為,使其館藏資源得到最大化利用,并使其地位總是被人們和社會所接受與認可,同時,圖書館也總是能在社會的發展中起到文化傳承、文明傳播與社會教育的功能,使其用戶通過享受圖書館的資源推送等服務而提高了資源獲取與利用、信息搜索與分析等技能。圖書館在大數據時代也扮演著同樣的角色,并通過為讀者用戶提供科學數據保存、分析與挖掘等數據監管服務而實現了從信息到數據的業務對象轉換,使圖書館繼續成為社會的信息中心機構。那么,在現實中,這些數據管理服務是否被大多數用戶所接受,是否在實踐過程中考慮到了用戶的數據素養,如何在未來將普遍開展的數據服務上升到一個新的高度,等等問題,都是已有的學術研究所不涉及的,這也就是本文的立論與創新之處。
科學數據是產生于實驗等科研過程中、蘊含有用價值的數據總稱。最早的科學數據定義是1958年,世界經濟合作與發展組織(OECD)在“OECD關于公共資助科學數據獲取的原則和方針”中認為“科學數據作為科學研究基本來源的事實記錄(數值、文本記錄、圖像和聲音),被科學團體所共同接受的對研究結果有用的數據。但不包括實驗室筆記、初步分析、科學論文的草稿、未來的研究計劃、同行評論以及個人和同行的交流,以及實物(例如實驗樣本、細菌和測試的動物)等”。之后,不同國家、不同機構對其進行了不同的定義,但均都提到了科學數據的價值與本質:反映客觀世界、含有科學價值。筆者認為:科學數據就是指收集了科研結果產生或科學發展過程的多形態數據集或材料,而這種數據集或材料的存在形態可能是多樣化的。
目前,因信息素養難以滿足數據社會環境下的數據處理需求素養,業界提出的旨在補充信息素養內涵在數據社會所缺失的數據素養如元素養、媒介素養、數字素養、信息通信技術素養、視覺素養一樣都還沒有一個權威的定義概念,但業界特別是信息管理科學界及教育界還是針對數據社會的數據行為主體所需的數據技能與知識要求,在數據工程專業課程體系、最新版的信息素養教育規劃等文件中有所體現。根據美國學校圖書館員協會(AASL)制定的《共同核心州立標準》、美國大學與研究圖書館協會(ACRL)制定的《美國高等教育信息素養能力標準》(Information Literacy Competency Standards for Higher Education,ILSHE)及美國高校開設的數據監護課程體系,筆者認為:數據素養就是數據行為主體符合社會倫理和道德倫理的基礎上,能對所面對的數據進行辯證、科學、正確的認識、操作和管理,進而使數據為我所用,以挖掘其蘊含巨大價值的能力。
盡管自2011年美國自然科學基金委員會(NSF)對所資助的科研項目所產生的數據提出管理計劃以后,圖書館特別是高校圖書館便積極的參與到了對科學數據的管理實踐活動之中。據基礎研究出版公司(Primary Research Group)在 2013年 7月發布的一項科學數據管理調查報告中發現,美國約有72.22%的高校圖書館提供科學數據管理服務。從實踐的發展規模和圖書館類型來看,高校圖書館是主流,據筆者通過網站瀏覽和文獻查閱發現,截止到2015年6月20日,美國US News&World Report排名前20名的大學圖書館都提供基本的科學數據管理計劃制定、科學數據管理工具下載、科學數據評估等服務,這說明經過兩年時間的發展,美國的著名高校圖書館基本都認識到了科學數據管理服務的重要性和不可或缺,并提供越來越多的相關服務。此外,通過相關文獻可以發現澳大利亞和英國的一些高校圖書館也加入到了科學數據的管理實踐之中。國內圖書館中則主要有北京大學圖書館、東南大學圖書館和中科院文獻情報中心(國家科學圖書館)等為數不多的圖書館,服務主要是通過向用戶提供相關講座、科學數據檢索、科學數據咨詢等內容,國外圖書館主要提供的服務定制、數據保存等還沒有在國內圖書館中開展。
國內圖情界對科學數據管理的研究主要包括對國外關于數字化科研和科學數據共享等相關研究的引介以及近年來逐漸展開的科學數據服務研究。如李娟、陳傳夫、王巧玲、楊鶴林、張曉林等人對美國、英國及相關組織,如CODATA、OECD的科學數據共享政策、保障體系、實踐進展、發現與關聯、利用與再利用等情況進行了介紹;彭潔、黃筱瑾、魏東原、劉細文、李曉輝、楊文等從科技信息機構科學數據研究與服務的可行性、科學數據共享服務、圖書館科學數據服務的實現保障、科學數據的生命周期及服務、圖書館科學數據的管理與服務模式、科學數據與科學文獻的關聯、整合及聚合等方面研究了科學數據的服務。
國外圖情界的科學數據管理研究則主要從科學數據管理概念、科學數據作為信息管理對象的分析以及科學數據管理活動中的一些非技術因素等角度進行。如:Elizabeth Yakel對NSF等機構關于科學數據管理報告的解讀與分析;Andrew Trdoar對科學數據不同研究階段領域的劃分、JaneGreenberg對科學元數據如何滿足即時共享數據以及長期保存數據的雙重需求分析、GailSteinhart和Love對科學數據管理障礙等非技術因素梳理。
大數據時代的用戶數據素養,不但與用戶的個人因素息息相關,如文化教育程度、從事職業因素等,也與用戶在享受圖書館的服務過程中所受到的教育相關,如圖書館所提供的服務是否具有對用戶的數據操作技能培養元素、是否為用戶提供諸如數據保存和數據獲取的講座與培訓等。國外高校圖書館界的科學數據管理實踐和國內部分圖書館的有益探索,不但可以清晰的顯示出我國圖書館界的科學數據管理差距,也為我國未來圖書館的數據管理之路提供了借鑒模板。
從國內J據管理進展來看,數據素養教育視角下的科學數據管理存在的問題一方面體現在對科學數據管理與用戶數據素養教育之間的關系缺乏認識與理解。雖然歐美的圖書館等均在用戶服務中有所體現,但更多的圖書館并沒有真正立足于用戶的需求與教育視角,而是根據科學數據的生命周期等內在規律與圖書館服務需求等去設計所提供的服務。這一點在國內體現的也更為充分,如在2013年東南大學圖書館孟祥保、李愛國進行了相關的數據管理與數據素養研究后的快兩年時間里再未有相關新成果出現,也從另一個角度說明對該問題的認識在這段時間里沒有出現積極的變化;差距的另一方面則主要體現在科學數據管理缺乏相應的數據素養教育元素設計。由于缺乏統一的規劃與設計,一些歐美高校所招收的數據工程等專業學生也沒有固定統一的課程體系,以致影響到高校圖書館所提供的數據管理也沒有統一的用戶培訓課程體系,進而影響到了用戶的數據素養教育。
基于上述分析,筆者認為數據素養教育視角下的圖書館科學數據管理需從以下兩方面進行思考與探索:
第一,了解用戶需求,通過服務使其認識數據素養、數據管理及其關系。對圖書館數據管理服務用戶的實際需求進行調研,有助于圖書館對其內容的設計與實現,也有助于提高用戶的服務粘結度,進而通過滿足用戶需求的服務來實現用戶觀念的轉換,讓用戶真正認識到大數據時代用戶數據素養的重要性和圖書館數據管理服務所提供的教育培養途徑。
第二,注重協作與合作,設計既統一又多樣的教育內容。數據管理與用戶教育的共同實現,還需要圖書館與業界、教育界、企業、政府的協作合作才能有效完成?;谟脩襞嘤柦逃恼n程、服務,也需要在政府、教育部門、業界聯合會或聯盟的統一規劃下進行設計,各個圖書館則在統一范圍內根據自身服務特色與用戶的個性化特征去完善和補充,使其既具統一性也具多樣性。
[1] 周曉英.數據密集型科學研究范式的興起與情報學的應對[J].情報資料工作,2012(2):5-11.
[2] 梁娜,曾燕.推進數據密集科學發現提升科技創新能力:新模式、新方法、新挑戰——《第四范式:數據密集型科學發現》譯著出版[J].中國科學院院刊,2013(1):115-121.
[3] Distributed Active Archive Centers[EB/OL].[2012-12-15].http://nasadaacs.eos.nasa.gov/about.html.
[4] 李慧佳,馬建玲,王楠,等.國內外科學數據的組織與管理研究進展[J].圖書情報工作,2013(23):132-138.
[5] Gary Price.HighlightsFrom:International Survey of Academic Library Data Curation Practices[EB/OL].[2014-10-05].http://www.infodocket.com/2013/07/11/highlights-from-in-lernational-survey-of-academic-library-data-curation-practices/.
[6] 張紅亮.澳大利亞科學數據管理實踐[J].圖書館學研究,2014(1):46-49.
[7] 李娟.國際科學數據共享原則和政策研究[J].圖書情報工作,2008(12):77-80.
[8] 陳傳夫.科學數據完全與公開獲取政策及其借鑒意義[J].圖書館論壇,2006(2):1-5.
[9] 王巧玲.英國科學數據共享政策法規研究[J].圖書館雜志,2010(3):63-66.
[10] 楊鶴林.數據監護:美國高校圖書館的新探索[J].大學圖書館學報,2011(2):18-21,41.
[11] 張曉林.顛覆數字圖書館的大趨勢[J].中國圖書館學報,2011(9):4-12.
[12] 彭潔.科技信息機構從事科學數據研究的趨勢和可行性分析[J].圖書情報工作,2009(20):47-50.
[13] 黃筱瑾.研究型圖書館參與科學數據共享服務研究[J].圖書館論壇,2009(6):177-193.
[14] 魏東原.專業圖書館如何實現科學數據共享[J].圖書館論壇,2007(6):253-255.
[15] 師榮華,劉細文.基于數據生命周期的圖書館科學數據服務研究[J].圖書情報工作,2011(1):39-42.
[16] 李曉輝.圖書館科研數據管理與服務模式探討[J].中國圖書館學報,2011(9):46-52.
[17] 楊文等.生物信息學序列庫與文獻庫的整合模式淺析[J].情報理論與實踐,2008(1):112-115.
[18] Elizabeth Yakel.Archives and manuscripts[J].Digital curation,2007(4):335-340.
[19] Andrew Treloar et al.The Data Curation Continuum Managing Data Objects in Institutional Repositories[J/OL].[2014-10-05].http://www.dlib.org/dlib/septeniber07/treloar/09treloar.html.
[20] Jane Greenberg.Introduction Metadata for Scientific Data:Historical Considerations,Current Practice'andProspects[J].Journal of Library Metadata,2010(10):75-78.
[21] Gail Steinhart.Academic Libraries and Data Curation:Mega-opp? [EB/OL].[2014-10-12].http://ecommons.comell.edu/handle/1813/15034.
[22] Making Sense of All Your Data[EB/OL].[2015-06-05].http://www.nassp.Org/portals/0/content/54342.pdf.
[23] 孟祥保,李愛國.國外高校圖書館科學數據素養教育研究[J].大學圖書館學報,2014(3):11-16.
[24] 何海地.美國大數據專業碩士研究生教育的背景、現狀、特色與啟示——全美23所知名大學數據分析碩士課程網站及相關信息分析研究[J].圖書與情報,2014(2):48-56.