高詠先
(浙江師范大學圖書館,浙江 金華 321000)
當前,我們處于數據爆炸性增長的“大數據”時代,大數據愈發對社會經濟、政治、文化以及生活等各方面產生著深遠的影響。隨著科學研究“第四范式”(the fourth paradigm)的提出,數據密集型的科研環境正深刻影響著科學研究的各個方面。在高校中,研究生作為科學研究的得力助手和重要力量,在科研數據的生產和使用中扮演著重要角色和發揮著特殊的作用,但由于個人素質的差別以及學科自身的特點,不同學科專業的研究生數據素養能力以及需求都會不太一樣,這就決定了數據素養的教學內容和教育模式必須根據不同學科專業的特點而調整,滿足個性化的需要?;趯W科的研究生數據素養教育模式研究,主要根據不同學科專業的數據需求特點和研究生的數據素養差異特征,來構建針對性的研究生數據素養教育模式,以滿足不同數據素養要求,為完善高校研究生數據素養教育機制提供必要的素材與理論支持。
數據素養(Data Literacy,DL)是信息素養與媒介素養的延伸和擴展,主要包括數據的收集和獲取、數據的分析和處理、數據的評估和利用、數據的存儲和共享等意識和能力,涉及數據意識、數據知識、數據能力、數據道德等諸多層面的內容[1]。在大數據時代,隨著各類數據的激增,大量對用戶的研究和有價值的決策信息被海量數據所掩蓋,要獲取這些信息不能僅依賴傳統方式,需通對復雜的數據進行辨析、加工和處理,以此來挖掘隱藏于這些數據之中的有用信息[2]。海量雜亂無序的數據對科研工作的影響主要表現在科研數據的指數增長和管理利用難度的増大,再加上數據密集型科研范式的誕生,導致數據素養成為提高科研能為、驅動科技創新的基本素養之一,也是科研人員的核心競爭力所在。
在研究生數據素養教育方面,美國、英國、澳大利亞等國眾多知名高校均已開展形式多樣的科學數據素養教育實踐。在教學課程設置方面主要包括學位項目或證書課程、專題研討、短期培訓、大型開放式網絡課程(Massive Open Online Courses,MOOC)等,教學的主要內容包括科學數據的管理方法和工具、基于數據生命周期的科學數據管理。國外高校的數據素養教育普遍受到了各類基金會和協會的資助,如美國國家科學基金會(National Science Foundation,NSF)就資助了大學技術類專業本科生和研究生開展“科學數據素養項目”的研究[3],美國博物館和圖書館服務協 會(Institute of Museum and Library Services,IMLS)資助設置了研究生、本科生在科學數據管理方面的課程計劃框架。在教學形式方面,數據素養教育主要通過科學數據管理導航、講座、研討會和在線課堂等形式開展。目前,國外高校的數據素養教育正朝著專、精、深的方向全方位和多層次發展。
國內數據素養教育研究及實踐起步較晚,前期主要是對國外相關研究和實踐進行介紹和總結。近年來,國內有關數據素養教育的研究有所活躍,在研究生數據素養教育方面,郝媛玲等[4]采用問卷調查法對上海地區高校文理科研究生的數據素養現狀進行分析與對比,認為高校應該對數據素養教育資源和平臺進行優化,制定數據管理政策,分學科、分層次地開展研究生數據素養教育。李紅[5]通過編制數據素養測量量表,構建了數據素養影響因素模型研究生數據素養評價指標。張曉陽等[6]通過編制研究生數據素養能力測試量表來構建研究生數據素養評價指標和模型。曲德強等[7]分析了上海某理工大學本碩、男女生數據素養的特點和區別,并提出通過通識教育、數據技能培養與建立數據素養評價體系加強大學生數據素養的教育。
良好的數據素養能夠幫助研究生更好地開展課題研究,更深入地分析和展示研究內容,從而提高研究成果的水準和質量。美國高校一直很重視對研究生開展數據素養教育,并且高校圖書館在其中發揮著推動作用。如美國高校圖書館在合作開展的“研究生數據素養”計劃中,由數據館員、學科館員和專業教師組成教學團隊,為特定專業的研究生提供專門數據素養教育[8]。
與國外高校相比,國內研究生的科學數據素養教育研究及實踐起步較晚。高校對研究生數據素養的培養力度不夠,目前大部分研究生沒有參加過正規的數據素養課程。據調查,國內部分高校不同學科專業,以及不同年級研究生對于數據意識、數據挖掘、數據管理、數據利用等方面的認知比較模糊,相關知識淺薄,大部分研究生對本學科主要的科學數據平臺了解較少,數據搜索知識欠缺,特別是數據獲取的方法和途徑有限,整體的數據利用能力較低。
對于研究生來說,學科和專業是影響其數據素養水平和能力的重要因素。黃如花等[9]通過對學習自己開設的“信息檢索”MOOC課程學生的問卷調查,揭示了數據素養能力與具體學科之間的密切聯系:以數據和信息為平時主要學習和研究對象的圖情檔案等管理類專業學生,與其他學科專業學生相比,數據意識和獲取等方面的能力素養比較出色。其他學科專業對比方面,理學的學生更注重定量分析,在數據分析、建模等方面的數據素養較高。法學的學生更關注數據素養中與法律規范相關的內容,在數據倫理方面的整體得分最高。不同學科和專業研究生在數據的需求和利用方面都有各自的特點,因此,高校的數據素養教育應基于學科專業特點來進行課程設置,以滿足不同學科專業對數據素養的不同需求,特別是研究生的專業特點更明顯,所以必須開展不同學科和領域的研究生數據素養教育,以滿足其特定的需求。
利用學科數據服務平臺提供科學數據管理資源導引服務,可以開展涵蓋數據管理的內涵、方法、工具、可利用資源等基礎數據服務,利用學科服務平臺開展數據素養教育的優勢在于使用方便快捷、學科分類直觀清晰等。
學科數據服務平臺主要包括數據資源模塊和數據管理模塊。數據資源模塊主要包括各類數據來源數據庫、相關的數據處理工具和軟件等。數據管理模塊是一種數據管理導航模式,是基于數據生命周期而產生的一種教育模式,主要是圍繞數據采集、數據加工、數據保存、數據發布、數據分析和利用等環節來制定計劃和進行數據管理。不同學科數據的加工和管理有著各自的特點:在數據來源方便,理工科專業研究生要處理大量試驗數據,人文社科專業研究生更多的是搜集調研數據;在數據加工方面,經濟管理類專業對數據的綜合統計和分析尤為重視。在平臺的數據管理模塊中,要引導和幫助研究生利用好元數據來描述數據集和管理數據,平臺應該提供相關的數據遴選、評價以及數據安全技術等知識,還有與數據引用和公開相關的數據倫理、引用規范知識等。
嵌入式數據素養教育模式即學科館員在研究生的專業課教學和項目研究中嵌入與學科專業相關的數據素養教育內容,該教育模式的特點是將數據素養教育作為各學科專業課程學習和課題研究內容的一部分,將學習科研和專業數據素養培養有機結合,使學生在學習和研究中掌握數據管理的知識和技能,并用之解決相關專業問題[10]。
深入專業課堂和課題研究的嵌入式數據素養教育可以分為嵌入課程教學和嵌入課題研究以及論文寫作兩塊。在嵌入課程教學時,應該把數據意識、數據技能和數據倫理等內容融入專業課程或網絡教學平臺的設計與教學實踐中。在設計相關數據素養教學方案時,應該和相關學院和專業課程任課老師充分合作,根據學科專業的特點,有針對性地設計數據素養的授課內容。嵌入課題研究的論文、寫作模塊是指圖書館數據館員參與到研究生的課題研究和論文寫作中,館員可以培訓和幫助研究生獲取權威的學科數據資源、制定科學合理的數據管理計劃、保存和分享在科研和寫作中產生的各類科學數據等。
根據數據素養的內容,可以將其分為意識培養、知識學習和應用技能等不同種類的模塊,將模塊進行組合教學,以適應不同的學科專業特點,獲取更好的數據素養教育效果。
數據意識是數據素養教育體系中較為抽象的部分,但卻是數據素養其他方面能力建設的重要基礎。作為所有學科和專業研究生都應該具備的基礎性素養,不同的專業還是有差別,可以舉一些實際案例來說明數據對學科或專業發展的重要性,加強學生的數據意識。知識學習模塊涉及數據的方方面面,比如數據采集、數據的管理和利用、數據的保存和分享等。在數據管理方面,目前很少有學生采用元數據,對如何利用元數據來組織數據不甚了解。因此,可以加強元數據相關講解和培訓,讓研究生學會利用元數據對數據進行管理,從而讓數據更有價值。應用技能模塊主要是培訓研究生利用諸如SPSS,SAS等工具和軟件進行數據處理和分析。不同學科專業的研究生培養計劃和學習內容都不同,所以此類數據素養技能培訓可以分層次進行,一種是普適性工具軟件的基本功能介紹和基本功能模塊使用等,另一種是根據研究生的個性化需求,有針對性地開展個別或者一個科研團隊的培訓。
目前,MOOC、微課等在線課堂形式多樣,非常適合不同學科和專業背景的研究生自主學習。同時,在線課程的交互性,可以讓研究生在學習的過程中進行交流和討論,使學習內容內化,從而更符合高層次研究生教育中創新性和個性化的需求。
目前國內外有多家知名高校開設了數據素養教育相關的MOOC課程,如約翰霍普金斯大學開設的“數據科學家的工具箱”“獲取和整理數據”“數據科學”“統計推理”“回歸模型”等系列MOOC數據素養課程,影響較大、學習者眾多。南京大學在“中國大學MOOC”平臺開設了“探索數據的奧秘”課程[11],著重為學生確立數據科學中的各種基本概念與原理,建立數據科學的、完整的規范化流程。浙江大學開設了“數據結構”[12],介紹最基礎的數據結構和與之關聯的最基本算法。
基于MOOC、微課等在線課堂開展數據素養教育,研究生可以根據自己的學科專業特點,有針對性地選擇合適的課程和內容來學習,更好地滿足學習者個性化的需求。同時,在線課程的交互性,使得數據素養的培養過程不是一種被動的灌輸性學習,同一學科或專業研究生可以在學習社區中對學習內容進行更加深入的探討和交流,這有助于促進高層次研究生創新性教育和個性化教育的實現。
大數據時代,數據與科研的結合愈發緊密,研究生作為科學研究的后備力量,加強其數據素養教育、提升其數據處理和利用能力意義重大。同時,不同學科專業在數據利用中各有特點,根據這些特點開展研究生數據素養教育,更有針對性,效果也會更明顯。