孟祥保 李愛國



摘要 從科研生命周期、學科專業和大數據角度闡釋了科學數據素養的內容與特征,將國外高校圖書館數據素養教育實踐歸納為利用Libguides建立科學數據管理資源導航、數據素養通識教育、學科數據素養教育三種模式。然后,針對我國高校數據素養教育現狀,指出我國高校圖書館應借鑒國外的基本經驗:掌握科研人員數據管理需求;基于科研生命周期設計教育內容;注重合作,配備訓練有素的教育館員;依托數據管理平臺推進科學數據素養教育。
關鍵詞 科學數據素養 用戶教育 數據管理服務 高校圖書館 大數據
1 引言
“數據驅動科學發展,科學就是數據,數據就是科學”,隨著數據密集型科研和第四科研范式的興起,研究者面臨一系列數據管理問題,如數據管理計劃制定、數據引用、數據出版、數據使用倫理等,科學數據素養成為科研人員學術研究與交流的必備能力之一。美國自然科學基金、國立衛生研究院等科研資助機構,以及英國高等教育撥款委員會、英國研究理事會、惠康基金和研究信息網絡等科研資助機構的數據管理與共享政策,也對研究人員的數據管理能力提出了要求。2010年,第76屆IFLA大會在瑞典哥德堡召開,社會科學數據素養成為會議主題之一。2012年,美國博物館與圖書館服務協會(Institute ofMuseum and Library Services,IMLS)資助了“數據信息素養項目”,探索如何培養下一代科學家查找、組織、利用與共享數據的能力。可見,科學數據素養問題引起了圖書館業界的高度關注,歐美部分學術圖書館已經開展相應的素養教育活動,以提高科研人員的數據意識、數據收集與分析技能,促進科學數據管理與共享。因此,厘清科學數據素養的內涵及其特征,及時總結國外高校圖書館科學數據素養教育的實踐經驗,具有重要的理論價值和實踐借鑒意義。
2 科學數據素養的內涵及特征
2.1 從科學研究生命周期的角度
“科學數據素養是指科學研究中收集、加工、管理、評價和利用數據的知識與能力。科學數據素養雖然與信息素養、數字素養類似,但是它主要關注數據收集、加工、管理、評價與使用的多種能力,而非基于文獻,強調在科學研究中對數據產生、操作和使用數據集的能力”。卡爾森等認為信息數據素養教育的基本內容包括:數據庫及數據格式介紹、數據發現與獲取、數據管理與組織、數據轉換與互操作、數據質量保證、元數據、數據管理與再利用、數據保存、數據分析、數據可視化、數據倫理(包括數據引用)等。科學數據素養的核心能力包括理解數據、解讀與評價數據、管理數據、利用數據。從上述分析來看,科學數據素養與信息素養類似,包括數據意識、數據管理知識與數據管理技能三個層次;同時,科學數據素養具有周期性,強調對科學數據展開的收集、加工、評價、管理和利用的活動,注重在科學研究基本流程中所需要的各種管理數據的技能;此外,科學數據素養更為強調分析數據、展現數據的能力以及數據管理工具的使用。
2.2 從學科專業的角度
具體到學科領域,對科學數據素養能力的要求更為具體和更具有專指性,如社會學強調數據的收集和統計分析能力,經濟學專門開設計量經濟學課程,強調數據分析和建模能力,生物信息學則強調以計算機為工具對生物信息進行儲存、檢索和分析的能力。在新聞學領域,哥倫比亞大學新聞學院數字新聞塔爾中心針對“數據新聞記者”這一新型職位,提出后工業時代新聞記者所應具備的六項硬技能中即包括數據與統計能力、掌握用戶分析工具的能力和數據分析技能。學科領域的數據素養具有嵌入特性,這種嵌入性體現為教學方式的合作,例如加州大學洛杉磯分校社會學系教師與圖書館員合作開展數據素養教育口,專業教師教授科學研究方法論和專業知識,館員傳授數據的收集、存儲與管理等技能,相互協作,發揮各自的優勢。
2.3 從大數據的角度
與科學數據素養緊密聯系的一個重要概念是“大數據”,按照維基百科的定義,“大數據由巨型數據集組成,這些數據集大小常超出人類在可接受時間下的收集、管理和處理能力,大數據必須借由計算機對數據進行統計、比對、解析方能得出客觀結果”,具有數量大、速度快、多樣性和真實性的“4V特征”。2008年,《自然》出版“大數據”專刊,從網絡經濟、超級計算、生物醫藥等多方面論述大數據對科學研究造成的影響。2011年,《科學》刊載“數據處理”專題文章,圍繞大數據的收集、組織、存取展開專題研究。2013年,與大數據相關的11項課題獲得國家社科基金項目立項資助,涉及統計學、新聞學、圖書情報學。從大數據角度來理解科學數據素養,其內容包括:一是大數據意識,能夠清晰認識到大數據對科學研究的顛覆性意義,例如,數據是全樣本的,數據處理流程從“由薄到厚”轉向“由厚到薄”;二是數據分析與挖掘能力,如機器學習、深度學習、語義分析、預測模型等,具備從數據中萃取有價值情報的能力;三是解釋與展示數據的能力,能夠熟練運用軟件工具,對分析和挖掘的數據進行解釋與可視化展示。
綜上所述,本文認為“科學數據素養”包括三個層次:具有“數據”意識,能夠認識到數據是一種資源;具備數據基本知識與技能,熟悉數據生命周期與科學研究生命周期,在特定專業領域內具有查找、管理、利用與共享數據的能力,了解相關數據管理政策法規、數據倫理等知識;在大數據時代,能夠利用數據資源發現問題、分析問題與解決問題。
3 國外高校圖書館科學數據素養教育的基本模式
大數據時代的來臨使得科研人員對數據素養教育的需求更為迫切。圖書館是科學數據素養教育的主要承擔者之一,國外部分高校圖書館已經開始對科研人員、研究生和數據服務人員進行科研數據管理意識、知識和技能方面的教育與培訓。通過調查,筆者發現國外高校圖書館存在三種模式的科學數據素養教育。
3.1 利用Libguides建立科學數據管理資源導航,提供數據服務
該方式是科學數據素養教育較為初級的形式,主要提供科學數據管理資源的網絡資源目錄與導航,幫助研究者建立起對科學數據管理的初步概念,了解科學數據管理的方法、工具與可利用資源。表1列出了美國、澳大利亞及英國部分高校圖書館利用Libguides建立的科學數據管理資源導航的情況。
利用Libguides建立科學數據管理資源導航,主要是對“科學數據管理”這一概念及圍繞此概念的數據管理計劃、數據政策、數據共享、數據資源、數據倫理等內容,以及圖書館所能提供的服務、數據資源分布或是數據管理與共享平臺等進行介紹,是對科學數據管理的總體介紹和分類梳理。
3.2 科學數據素養通識教育
科學數據素養通識教育主要面向研究生或者某一學科的研究人員,概覽性地介紹數據管理的基本理論與方法,使學習者整體把握數據管理的基本知識。表2列舉了部分歐美高校圖書館的科學數據素養通識課程。
科學數據素養通識教育內容比利用Libguides建立科學數據管理資源導航更為深入,以數據生命周期和科研生命周期為主線進行“通論”教育,介紹數據管理基本概念、數據管理與分析工具的具體操作與使用、數據管理政策與倫理等,部分課程還介紹該圖書館的數據管理平臺,如賓州州立大學圖書館、哈佛大學圖書館分別介紹其數據管理平臺School-arSphere、Dataverse,起到了宣傳圖書館數據服務的效果。科學數據素養通識教育的教學形式多樣化,包括開設選修課程、專題討論、在線課程等。部分課程得到美國自然科學基金、美國博物館與圖書館服務協會、英國聯合信息系統委員會、英國數字管理中心等機構的資助。
3.3 學科專題數據素養教育
該模式針對具體學科領域開展數據素養教育,與前兩種模式相比,針對性更強、內容更為系統與深入。調查發現,開展學科專題數據素養教育的高校圖書館較少(具體見表3)。
學科數據素養教育主要針對特定學科的需要而設置,其中弗吉尼亞大學圖書館的數據素養教育課程形成了較為完備的體系,按照數據生命周期縱向設計,在不同的學科領域橫向展開,為特定學科研究人員提供專業的培訓。不同的學科領域對數據素養教育的需求也不盡相同,譬如理工科的數據素養強調數據分析工具的使用,注重大數據環境下的數據挖掘與分析方法的利用。不同層次用戶的教育需求也是有差異的,研究人員更為關注如何撰寫研究數據管理計劃,以適應科研資助機構的數據管理與共享要求,而研究生可能更為關注數據收集、分析與處理過程以完成具體研究的數據利用與管理。
4 國外高校圖書館科學數據素養教育的經驗借鑒
我國部分高校圖書館在科學數據素養教育方面開展了有益嘗試,如一些圖書館開展的科研管理軟件、商業統計數據庫的使用培訓等。北京大學圖書館在其網站首頁列出“數據服務”,以一小時講座的形式提供IBM SPSS Statistics 20.0網絡版的培訓。但是,這些圖書館的行動基本處于起步階段,與國外高校圖書館相比尚存在一定的差距,具體表現是:①對科學數據管理、科學數據素養概念缺乏系統的研究與理解;②對科學數據素養教育缺乏足夠的認識和重視,缺乏相應的政策支持和服務設計;③尚未形成明確的數據素養教育模式,部分圖書館的培訓僅涉及了科學數據素養某個方面的內容,如要么僅介紹數據資源的分布與獲取方式,要么僅針對數據分析軟件的使用方法進行培訓。總體來看,國內高校圖書館科學數據素養教育的課程內容設計缺乏整體性和系統性。而國外不少高校圖書館的科學數據素養教育已經起步,自上而下的數據管理政策、良好的團隊協助、扎實的科研數據管理實踐項目等推動了教育內容和模式的不斷創新與發展,形成了既有通識教育又有學科專業教育的多種模式和分別針對研究人員和研究生的課程內容。國外高校圖書館開展科學數據素養所積累的實踐經驗值得國內高校借鑒。
4.1 掌握科研人員數據管理需求,宣傳科學數據素養理念
國際科學研究政策慣例與國家數據管理法律框架、科研資助機構的數據管理計劃要求、學術論文發表的原始數據共享規定、所在機構的數據呈現保存政策等數據管理方面的各種政策與規范,對科研人員的數據管理知識和技能提出了挑戰,成為數據素養教育的內在動力。國外不少高校圖書館在開展科學數據素養教育前都進行了不同形式的用戶數據管理需求調查,如康奈爾大學圖書館從數據類型、數據與元數據的格式和內容、數據獲取與共享政策、數據再利用等方面對85名科研人員進行了調查。弗吉尼亞大學圖書館對研究人員的訪談,旨在探尋科研人員管理數據時面臨的問題與所需要的數據管理培訓等。這些調查以不同方式了解用戶數據管理的需求,為各個圖書館開展具有針對性的科學數據素養教育奠定重要基礎。不同的國家與地區、不同的學校數據管理需求具有差異性,國內高校圖書館在開展科學數據素養教育實踐前應與研究人員積極交流,準確掌握用戶的具體需求,同時向他們宣傳數據管理與共享理念。
4.2 基于科研生命周期設計教育內容,注重教學的層次遞進性
國外高校圖書館科學數據素養教育的內容設計,從橫向上看一般是圍繞科學研究的生命周期展開,涉及數據收集、組織、管理、保存、利用與再利用活動,以及相關的數據政策、數據管理計劃、數據共享等內容,注重數據分析工具、數據管理計劃書的撰寫、數據引用、數據倫理等知識與技能的培訓;從縱向看,科學數據管理的資源導航、數據素養通識教育、學科數據素養教育構成了一個由淺入深的連續整體,具有層次遞進性。我國科學數據素養教育在內容設計上也應注重與信息素養教育的區別,體現出科學數據管理的周期性與完整性,注意教育模式上層次的遞進性,針對不同的學科領域不同的用戶群體,展開系列的數據意識、知識與技能的訓練。
4.3 注重合作,配備訓練有素的教育館員
科學數據素養教育并不是某個館員能獨立完成的,合作是開展科學數據素養教育的必經之路。國外高校圖書館開展科學數據素養教育也是采取合作的方式,由圖書館的學科館員、技術專家、科研管理部門、院系等以團隊形式協作開展,他們根據各自專長,調查數據管理需求、共同設計教學內容。其次,配備訓練有素的教育館員是國外高校圖書館成功開展科學數據素養教育的保障。為此,不少國外高校圖書館十分注重館員本身的科學數據素養能力建設,如哈佛大學圖書館舉辦數據科學家培訓班,著力提升館員的數據管理能力。部分圖書館還設置專門的數據館員崗位,推進數據管理與服務工作。由是觀之,國內圖書館開展科學數據素養教育時應注意學科館員、圖書館技術人員、科研管理部門、數據管理機構之間的相互合作,立足于已有的信息素養教育經驗,提升館員隊伍的數據管理技能,適時拓展服務功能,探索適合本館的數據素養教育模式。
4.4 依托數據管理平臺推進科學數據素養教育
圖書館在資源采集、組織與服務方面具有傳統的優勢,應發揮科學數據管理的職能,為高校科研與教學服務。國外部分高校圖書館建立科學數據資源,為研究人員提供數據存儲、管理與共享系統,建立用戶與館員之間交流互動的平臺。如前文所述,賓州州立大學圖書館、哈佛大學圖書館、普渡大學圖書館等依托各自的數據管理資源與數據管理平臺開展數據素養教育,同時在培訓中介紹圖書館的數據管理系統、宣傳數據服務項目。同時,圖書館也逐步形成自身的特色資源與服務,如康奈爾大學圖書館的研究數據管理服務小組提供數據存儲、數據分析、數據出版等系列服務。
5 結語
綜上所述,國外高校圖書館科學數據素養教育基本是從數據生命周期角度出發,圍繞科研流程所需技能而展開,多數采取通識教育模式,僅少數圖書館針對具體學科領域開展專題教育。目前,學界與業界對科學數據素養概念尚未形成統一認識,現行的科學數據素養教育基本以信息素養教育為參考藍本,缺乏大數據時代數據素養的特征。此外,對于如何評價科學數據素養教育、大數據環境下如何構建數據素養教育內容等問題也有待深入研究。毋庸置疑,適時開展科學數據素養教育活動能夠在一定程度上滿足科研人員的數據管理需求,是拓展與深化高校圖書館服務功能的有效途徑之一,也是高校圖書館積極融入學術交流與大數據環境的戰略選擇。積極探索科學數據素養教育的內容和模式,提高科研人員的數據管理意識和能力,將是圖書館在未來的科學數據管理服務工作中所需努力的方向之一。