(廣西民族大學管理學院,廣西 南寧 530006)
大數據及數據密集型科學的興起,使得數據素養成為大數據背景下的研究熱點。但學界對數據素養的定義仍未有統一表述,有學者將其與信息素養的定義聯系起來[1],認為數據素養是信息素養在大數據時代的拓展和延伸。雖然兩者在能力表述上具有相似性,但數據素養更強調數據的生產、保存與管理等方面。基于已有研究[2-4],本文認為數據素養是具備數據意識,掌握數據基本知識和技能,擁有有效獲取、處理、分析和使用數據的能力,能夠遵守數據法律法規和道德準則。其內涵包括數據意識、數據知識、數據能力、數據倫理4個方面。
目前,數據素養的相關研究大多圍繞著國外數據素養教育經驗介紹[5-6]、圖書館開展數據素養教育實踐[7-8]等主題,針對圖書情報學數據素養教育的研究較少,而面對大數據及數據密集型科學的興起,圖書情報學專業開展數據素養教育刻不容緩。因此,本文在分析圖書情報學開展數據素養教育必要性的基礎上,從數據素養教育內容、教育框架兩方面構建圖書情報學數據素養教育體系,以期為圖書情報學數據素養教育實踐提供借鑒參考。
關注并解決“信息爆炸”的現象和問題,是圖書情報學科產生的初衷之一[9]。信息技術的發展,使圖書情報學的研究內容不斷調整和擴展,從學科誕生之初的文獻資料加工,到20世紀60年代后期開始關注信息的處理利用[10],再到20世紀90年代開始全面關注網絡信息的處理分析。在大數據時代,為了應對數據爆發式增長的挑戰,圖書情報學科的研究重心由信息轉向為數據。相比于信息,數據的外延更加廣泛,因此圖書情報學的研究對象和內容也變得更加廣泛,這種變化可以從兩方面來理解,雖然數據一直是圖書情報學的研究對象之一,如圖書館元數據研究、信息計量學中的文獻數據、社會網絡分析的數據等,但與大數據相比,這些數據的規模極小,并且數據范圍局限于文獻領域。而大數據使得圖書情報學由小數據研究轉變為全源粗糙海量的大數據研究[11]8,并且數據范圍也突破了學科的界限,不再局限于文獻領域。在這樣的背景下,圖書情報學研究者必須具備一定的數據素養,深刻認識和理解數據的內涵以及大數據帶來的影響和變化,其次需要掌握基本數據知識以及學科交叉融合的知識,實現跨領域、跨學科研究。
大數據及數據密集型科學的興起,不僅拓展了圖書情報學的研究對象和內容,同時也為圖書情報學研究方法提供了借鑒和參考。數據密集型科學帶來的科學研究第四范式是一種新興的方法論,其本質是以數據為驅動探索數據密集型科學中有價值的數據[12],而圖書情報學是一門關于信息的科學,信息與數據的密切關系,使得圖書情報學與科學研究第四范式有著與生俱來的本質聯系。在大數據及數據密集型科學背景下,數據涵蓋了文獻、信息和知識,使得圖書情報學研究方法由原有的信息驅動轉變為數據驅動。一方面,數據挖掘、大數據分析、機器學習等技術方法給圖書情報學帶來了研究方法上的借鑒,豐富和拓展了圖書情報學研究方法體系;另一方面,大數據思維也給傳統圖書情報學帶來了新的啟示,圖書情報學的研究思維由因果推導轉變為關聯分析[11]9。因此,圖書情報學研究者不僅需要掌握圖書情報學研究方法,還需要了解大數據挖掘分析、機器學習等大數據技術方法。同時要轉變研究思維,培養數據意識和思維,積極適應科學研究第四范式帶來的變化。
在大數據時代,圖書情報服務實踐也圍繞著“數據”而開展。2013年11月,德國數字圖書館(Deutsche Digital Bibliothek)就正式利用應用程序接口(API),向公眾提供開放數據服務[13]。美國高校圖書館的科學數據服務囊括了科學數據管理的各方面內容,涉及科研工作的全部流程[14]。從實踐形式看,圖書館科學數據服務分為咨詢類和技術類兩類服務,咨詢類服務如數據服務培訓、數據管理計劃、數據查找與引用等;技術類服務包括提供數據標識、數據更新、技術支持等。但由于技術服務涉及數據的內容、形式、創建與修改等方面,對館員的數據素養提出了更高的要求[15]。與此類似,面對海量數據的供應,用戶迫切需要從海量數據中挖掘情報,對情報機構的情報服務也提出了更高的要求,并催生出精準情報服務[16]。而服務的過程中,要求情報機構必須將支撐情報服務的數據和信息進行整合[17],這必然對情報服務人員的數據素養提出了要求。“打鐵還需自身硬”,圖書情報機構在提供服務的過程中,必須提高機構人員的數據素養,才能更好地適應時代的發展,實現優質的圖書情報數據服務。
無論從圖書情報學研究內容、研究方法還是服務實踐看,大數據及數據密集型科學帶來的影響都不可忽視。圖書情報學專業學生作為未來的從業人員必須具備數據素養,才能適應大數據時代圖書情報理論研究和服務實踐的發展。因此,數據素養教育就成了大數據時代圖書情報學教育中不可回避的問題。
數據素養教育,顧名思義就是為提高數據素養而開展的一系列教育活動。國內外學者定義數據素養教育的主要有三種類型:一是通過列舉數據素養的課程來進行闡述,Milo Schield認為數據素養的要求相比于計算機科學的技術含量低,主要要求學生掌握各種工具來獲取、轉換和操作數據,包括結構化語言SQL、關系數據庫如MS Access、數據處理技術、統計軟件(SPSS、STATA、Minitab和Excel等)和數據演示軟件PowerPoint等[18];二是基于數據生命周期視角進行闡述,Carlson等認為數據素養教育的基本內容包括數據庫及數據格式介紹、數據發展與獲取、數據管理與組織、數據轉換與互操作、數據質量保證、元數據、數據管理與再利用、數據保存、數據分析、數據可視化和數據倫理等[19];張靜波則將數據素養教育的主要內容歸納為:數據的收集技能、數據組織與管理的規則和技術、數據分析的工具和技能、數據保存與安全問題、數據共享規則、數據管理和應用中的法規和倫理道德等部分[20];三是將數據素養教育劃分為若干模塊,黃如花指出數據素養教育是信息素養教育在大數據時代的拓展,并將數據素養教育劃分為三個模塊:培養數據意識、培育數據能力、樹立數據倫理[21]。
本文認為數據素養教育包括樹立數據意識、掌握數據知識、培育數據能力、培養數據倫理4個方面的內容。樹立數據意識是先導、掌握數據知識是基礎、培育數據能力是核心、培養數據倫理是必備素質,這4部分內容相輔相成,構成一個不可分割的整體。
基于數據素養教育的內容,本文將圖書情報學數據素養教育劃分為數據意識教育、數據知識教育、數據能力教育、數據倫理教育4個模塊,在具體課程內容設計方面應考慮到圖書情報學專業特點,并結合數據生命周期理論。

表1 數據素養教育內容及模塊
續表

教育模塊教學單元內容設計數據能力數據分析與利用單元介紹若干數據統計、數據挖掘工具和軟件,并對數據分析利用工具在圖書情報學領域的應用進行重點講授,同時結合圖書情報學進行專題實際操作。并要求熟練掌握1至2種數據挖掘分析工具的使用數據展示交流單元介紹數據可視化工具和軟件,講授對可視化圖表進行解讀過程,以及利用數據可視化工具進行科學研究的過程,并結合圖書情報學進行專題實踐操作。并要求熟練掌握1至2種數據可視化工具的使用數據倫理數據法律單元介紹數據采集、使用、分享中所涉及的數據信息法律問題,重點講解圖書情報學領域內的數據利用所涉及的知識產權及隱私權問題數據道德單元介紹數據采集、使用、分享中所涉及的道德和倫理問題,以及數據利用過程中需要遵守的學術道德和學術規范。重點講解圖書情報學領域內的科研數據開放共享的規范與原則
如表1所示,本文參考已有研究[22-23]將圖書情報學數據素養教育模塊進一步細化為9個單元:數據意識及思維單元、數據基礎知識單元、數據應用知識單元、數據獲取與評估單元、數據組織與管理單元、數據分析與利用單元、數據展示交流單元、數據法律單元、數據道德單元。
2.2.1 數據意識教育模塊
數據意識教育模塊包含數據意識及思維教學單元,從數據意識內涵而言,數據意識是數據素養的先決條件,涵蓋整個數據生命周期,涉及數據獲取、數據評價、數據分析、數據交流等環節,因此數據意識教育模塊不可能獨立開展,應結合數據知識和數據倫理的理論知識學習,以及數據能力的實踐鍛煉,將理論學習和實踐結合起來,真正樹立數據意識、強化數據需求、提高數據價值觀念[24]。從教育內容而言,應緊密圍繞數據對于圖書情報學專業的理論研究和實踐應用的價值,重點培養學生利用數據解決圖書情報學專業問題的意識。
2.2.2 數據知識教育模塊
數據知識教育模塊包含數據基礎知識和數據應用知識教學單元,該模塊為理論知識的學習,主要介紹數據素養的基本知識以及數據挖掘、數據組織、數據分析等數據應用的技術知識,并在教學實踐中將數據知識與圖書情報學專業知識進行對比教學,為后續的數據能力教育打下知識基礎。教學內容側重于大數據及數據科學對圖書情報學帶來的影響,以及圖書情報學數據利用方面的知識,讓學生掌握和了解圖書情報學在利用大數據方面的優勢。
2.2.3 數據能力教育模塊
數據能力教育模塊結合數據生命周期理論,共劃分為數據獲取與評估、數據組織與管理、數據分析與利用、數據展示交流4個教學單元。該模塊每一單元的教學內容都與圖書情報學專業內容結合起來,實現數據素養與專業素養的融合,具體而言應在教學過程中將數據獲取評估、組織管理、分析利用、展示交流與信息獲取評估、組織管理、分析利用、展示交流進行對比教學,同時配有專題實踐教學,開設相關實驗課程,給學生提供實踐操作的機會,如開設數據挖掘實驗課程、數據分析實驗課程等,通過理論學習結合實踐操作達到學以致用的目的。
2.2.4 數據倫理教育模塊
數據倫理教育模塊包含數據法律和數據道德兩個教學單元,該模塊主要是理論知識的學習。主要介紹數據生命周期中從數據采集到數據利用整個過程涉及的法律和規范,在教學內容設計中,可以通過相關案例分析,向圖書情報學專業學生介紹圖書情報學領域涉及的法律法規與學術規范,如結合圖書情報學專業組織學生學習我國的《科學數據管理辦法》,讓學生了解圖書情報學領域涉及的數據法律和學術規范等。
圖書情報學數據素養教育結構包括教育對象、培養目標、培養模式、教育主體、培養形式5大部分,其中教育對象與培養目標密切相關。
3.1.1 圖書情報學數據素養教育對象及培養目標
我國圖書情報學分為圖書館學和情報學兩個專業,其中情報學專業僅存在于研究生教育中,此外在研究生教育中還有圖書情報專業碩士研究生(以下簡稱“圖情專碩”)。因此,圖書情報學數據素養教育對象包括圖書館學本科生和研究生,情報學研究生以及圖書情報專業碩士研究生4個部分。從圖書情報學教育對象面對的工作領域看,圖書情報學數據素養教育的目的包括兩方面:一是數據研究型人才,讓學生成為具備數據素養的科研工作者;二是數據應用型人才,培養在圖書情報服務實踐領域的數據管理人才。
從教育層次看,圖書館學本科教育為基礎性教育,其主要培養目標為圖書館專業人員[25],但圖書館學本科生可以選擇更高的教育層次,因此圖書館學本科生數據素養培養目標應該包括兩方面:一是培養具備數據素養的圖書館專業人員,該目標偏向實踐應用領域;二是為有志讀研的本科生培養一定的數據素養和科研素養。從我國研究生教育現狀看,學碩及博士生培養一般面向學術科研領域,專碩培養一般面向實踐應用領域。因此,圖書館學、情報學研究生的培養目標應定位為培養具備數據素養能夠從事科研工作的研究人員,而圖情專碩則應定位為培養具備數據管理能力能夠從事圖情服務實踐的應用型人才。
3.1.2 圖書情報學數據素養教育主體

圖1 圖書情報學數據素養教育主體結構圖
數據素養是一個全方位、綜合性素質能力,這決定了數據素養教育必須走合作化培養路徑[26]。有研究認為數據素養教育主體包括圖書館、院系專業教師和科研人員等[27],從圖書情報學數據素養教育培養目標來看,并非所有圖書情報學生都會從事科研工作,因此有必要在教育主體中增加具有實踐性和應用性的教育主體,以培養圖書情報學學生的實踐應用能力。如圖1所示,圖書情報學數據素養教育主體包括圖書情報學院系、圖書館、數學統計院系、圖書情報服務機構、導師以及網絡MOOC。其中圖書情報學院系為主導主體,負責制訂學生的培養方案,明確學生的培養目標,設置教學課程以及開展多方位的實踐鍛煉。圖書館、數學統計院系、導師以及網絡MOOC則是支持主體,圍繞著圖書情報學院系制訂的培養方案,對學生各方面的數據素養能力進行培養和教育。
3.1.3 圖書情報學數據素養教育模式
傳統圖書情報學教育模式是老師講授、學生選修的單一模式,而圖書情報學本科生文理兼收,而研究生的本科專業更是差異懸殊。因此,圖書情報學數據素養教育應考慮到學生的專業功底、學科背景差異以及興趣愛好[28],綜合各種教育模式優勢,形成互補教育體系。根據不同的教育主體類型,可以將圖書情報學數據素養教育模式劃分為4個部分:通識教育、專業教育、嵌入教育和網絡教育[29-30]。其中:通識教育是基礎,專業教育是核心,嵌入教育是通過實踐鍛煉和培養數據能力和數據意識,網絡教育是對上述教育的補充。通過通識教育培養學生的基本數據素養,專業教育則是結合圖書情報學專業特征及需求而開展,將數據素養教育融入圖書情報學教育之中。在此基礎上,根據學生群體的不同,通過不同目標的嵌入式教育,培養學生的科學研究素養和實踐應用能力。此外,還應鼓勵學生進行網絡學習,以滿足不同層次學生的數據素養學習需求。
3.1.4 圖書情報學數據素養教育培養形式
由圖書館和數學統計院系承擔通識教育課程,通過開設培訓講座、公共基礎課等,培養形式為課程講授。由圖書情報學院系承擔專業教育課程,開設專業必修課和專業選修課,采取課堂講授與課下實踐操作相結合的方式進行培養。由學生導師或圖書情報服務機構承擔嵌入教育,通過制訂學習目標、培養計劃和考核方案,在課題研究、專業實踐實習過程中,不斷強化和鍛煉數據能力的培養,樹立學生的數據意識。網絡教育則由學生根據個人興趣愛好及知識體系欠缺部分,自主進行互聯網在線課程選修和學習,并且各圖書情報學院系應承認其MOOC學習考核通過獲得的學分,以此鼓勵學生通過多元化途徑自主學習。
通過對圖書情報學數據素養教育結構的分析,本文構建出圖書情報學數據素養教育框架體系(如圖2所示)。框架體系包括教育主體、培養模式、培養形式、教學內容4個部分,通過教育主體之間的相互協調配合、培養模式之間的互補,突出培養形式的多元化特征、教學內容的層次性特征,并且將數據素養教育內容分配到各個教育主體,形成合作化教學和培養。

圖2 圖書情報學數據素養教育框架體系
不同教育對象在通識教育、專業教育的基礎上,可以通過不同嵌入式教育模式,實現多層次的培養目標。如針對圖書館學本科生和圖情專碩,應加強圖書情報服務機構的實踐實習的作用,在實踐鍛煉中強化圖書館學本科生的數據能力和數據意識,以此鍛煉其成為圖書館專業人員。針對圖書館學、情報學研究生,則應加強導師課題項目研究的作用,通過實際科研工作鍛煉、深化其數據能力和數據意識,使其具備開展科研工作的數據素養。除此之外,針對有志讀研的本科生,他們還可以通過MOOC學習的方式,深入學習數據知識,掌握數據能力,為后續研究生學習階段打下良好的基礎。
圖書情報學數據素養教育培養路徑應從教育主體、教育模式、教育對象等多方面進行分析。
3.3.1 編寫數據素養課程教材,制定數據素養教學大綱
目前,我國尚無具體的數據素養課程教材,已有的數據素養教育都是通過諸如數據挖掘、數據分析等課程教學來實現的。隨著大數據持續深入的影響,有必要編寫特色鮮明、有針對性的數據素養教材。因此,各大圖書情報學院系應聯合起來,通過研討、協調、調研等方式,借鑒國外相關經驗,合作編寫數據素養課程教材,并且根據院系特色和實際教學方向制定數據素養教學大綱,完善數據素養課程和教學體系,以此滿足圖書情報學專業學生日益增長的數據素養需求。
3.3.2 加強多元教育主體合作,提升數據素養教育能力
僅僅依靠圖書情報學院系來培養學生的數據素養肯定是不現實的,各教育主體之間應加強合作,形成優勢互補,提升教育主體的數據素養教育能力。如北京大學信息管理系與北京大學圖書館、南海大數據應用研究院合作舉辦了首屆全國高校數據驅動創新研究大賽[31],不僅加強了各主體之間的交流合作,也為圖書情報學學生提供了實踐和交流的機會。圖書情報學院系作為教育主體中的主導力量,應積極開展與其他主體間的合作交流,大力推動各主體間的合作教學,并且將學生的學習狀態和數據素養水平反饋給其他教育主體,這不僅會提高教育教學的針對性,也能使教育主體了解到自身的教育問題,從而達到教學相長的目的。
3.3.3 明確學生的興趣及需求,開展多元化數據素養教育
不同學生有不同的學科背景、興趣愛好、數據素養需求,這一點在情報學研究生群體中尤為突出。國外教育機構在開展數據素養教育前,十分重視用戶需求的調查,通過調查了解教育對象對數據的基本態度和觀點,從而掌握其獲取和利用數據的基本情況[32]。因此,圖書情報學數據素養教育應在兼顧普遍性的同時突出差異性,調查和了解學生的學科背景、興趣愛好、數據素養需求,制訂個性化、多層次的數據素養教育方案,利用嵌入式教育和網絡教育模式,滿足不同層次學生的數據素養需求。同時在課程設置方面應結合專業方向以及培養目標,靈活設置數據素養相關課程,以此保證圖書情報學專業學生掌握相應的基礎知識和能力,又保證相關專業方向及培養目標的學生在知識和能力獲得長足發展和提高。
數據素養是信息素養在大數據時代的拓展和延伸,圖書情報學數據素養教育更是圖書情報學專業素養的拓展和提升。本文在分析圖書情報學開展數據素養教育的必要性和圖書情報學數據素養教育結構的基礎上,從教育內容、教育框架兩方面構建了圖書情報學數據素養教育體系,并針對當前的現狀提出了培養途徑建議,以期為圖書情報學數據素養教育提供借鑒和參考。