鄭新 李俊霞
【摘要】大數據時代,科研環境發生了變化,數據的重要性日益凸顯。數據伴隨科研活動的全周期產生,真實記錄了科學研究的全過程,是支撐和佐證科研活動的重要條件和基礎。置身于海量的數據中,如何獲取、處理和利用這些數據,成為科研人員的必備素養。英國開展數據素養教育的時間較早,在理論和實踐方面形成了完備的體系。本文從開發背景、教學對象與目標、課程內容三個方面剖析了英國倫敦大學城市學院數據素養教育課程的建設過程,以期為我國開展數據素養教育提供借鑒。
【關鍵詞】高校數據;素養教育;課程內容
一、開發背景
在E-Science科學研究環境下,科研范式發生了轉變,繼實驗科學、理論科學和計算科學之后,第四個“數據密集型科學”研究范式出現了。其理念為“數據驅動科研發展,科學是數據,數據是科學”,數據包含了重要的科研價值和使用價值。密集數據環境的形成使得大學產生的科學數據在數量、種類和速度方面都在增長,研究人員面臨一系列數據管理問題。在這種數據環境中,對數據的獲取、分析、管理與共享能力成為科研人員的必備素養。2012年,英國皇家學會發布題為《作為開放事業的科學》的報告,強調了數據在科研行為和交流中的重要性,建議大學和科研機構在促進數據管理和服務方面發揮重要作用。這種專業化和規范化的數據政策無疑對于科研工作者管理科研數據的工作能力提出了更高的要求。為了契合大數據時代科研環境變化帶來的挑戰,滿足科研人員的數據素養教育需求,倫敦大學城市學院開設了數據素養教育課程。
二、教學對象與目標
英國倫敦大學城市學院圖書館教學對象針對性較強,包括全校的師生用戶,即本科生、研究生和科研人員。不同的教學對象不同,教學目標也有所差異。本科生處于知識學習的初級階段,應注重講解科學數據基本知識;研究生具備了一定的研究與學習能力,應培養科學數據管理技能;科研人員,具有深厚的知識基礎和精湛的科研能力,長期工作在科研一線,需要掌握科學數據的分析、處理、存儲、共享、政策等系統的數據管理知識,以使其依托科研數據,獲取科研成果。
根據不同層次教學對象與目標的差異性,教學課程設置有所區別。本科生主要是通識性教育,主要介紹科學數據的基本理論和方法,使學習者能夠理解科學數據,逐步培養數據意識。研究生與科研人員的數據素養教育模式,以數據生命周期為指導,以啟發式教育為手段,培養其對數據的全面理解,從數據采集到轉換應用的一系列過程以及對數據的批判性思考,還包括針對某一具體學科領域的數據知識和技能進行教學,以培養他們良好的數據素養。
三、課程內容
作為處理與圖書館信息專業相關的所有方面的數據課程,倫敦大學城市學院的數據素養教育課程以社會技術和道德的視角,重新定義信息技術在數據管理中的應用,教學內容包括數據科學和數據管理基礎、科學數據管理的通識性問題、科學數據管理實踐等。每個課程包括兩個部分:講解展示和實際操作。共15個學分,150個學時,這足以確保所有學生有機會從概念和實踐上獲得對每個主題的理解。在一些章節中,來自英國數字管理中心Altmetric等機構的客座講師和CILIP提供了集體智慧。具體分為以下五個模塊。
(一)數據概述
第一模塊介紹了數據泛濫的現代現象及其對個人的影響,信息和文件之間的關系,計算機系統的歷史發展以及計算機描述和處理數據的方式——圖靈和馮諾依曼架構,比特和字節以及編碼系統,圖書館學和信息專業的社會技術問題。確定了課程的概念框架,并提供了對任何讀者處理數據所需基本問題的解答。
(二)有關數據的數據
第二模塊介紹了數據表單文檔中的方式以及如何定義,描述組織不同類型的文檔,從而引入元數據標準和應用程序。按照Pomerantz(波梅蘭茨)的方法,這會廣泛地處理元數據,對書目和Web資源元數據給予一些關注,但同樣關注數據集的元數據。這提供了圖書館員熟悉的元數據概念與不太熟悉的數據集上下文中的應用程序之間的鏈接。
(三)組織數據
第三模塊將數據結構化為各種有組織的數據文件、平面文件、CSV文件,包括有關的數據庫結構和標準,包括XML、RDF和鏈接數據,包括討論數據管理過程,研究數據監護的過程。對這些類型的數據文件的概念性理解和使用能力是科研人員在處理數據集合方面取得成功的基礎。
(四)搜索數據
第四模塊討論如何在早期數據結構的基礎上查找各種形式的數據。它涵蓋了各種形式數據收集的搜索工具,搜索引擎,關系數據庫系統和sQL,全文書目搜索系統和其他專業檢索工具。它包含了大多數讀者熟悉的文本檢索和書目檢索系統,這些系統在更廣泛的系統框架內,具有各種檢索數據的功能。
(五)使用數據
第五模塊重點介紹數字數據和數據集,從Web服務和API(如Twitter)收集數據的方式,然后進行處理、操作和分析,“數據抓取”和“數據爭論”的含義;GoogleSheets,OpenRefine,Tags和Tags Explorer等軟件用于說明收集、處理、摘要和可視化。所使用的軟件將隨著時間的推移而變化。熟悉這些過程對于尋求成為幫助用戶處理數據問題專家的圖書館員來說尤其有價值,因為它正在成為一種廣泛的數據使用形式。
結語
在數據密集型科學研究范式下,倫敦大學城市學院開設的數據管理課程呈現如下特征:注重數據能力培養的系統化,重視信息技術和軟件工具在教育課程中的應用、強調應用數據進行批判性思維的培養。目前,我國高校還沒有明確的數據素養教育課程,我們可以參考和借鑒倫敦大學城市學院開設的數據素養教學模式,結合本校實際,推動我國高校數據素養教育課程的發展。