●范繼榮 (廣西民族大學 南寧 530006)
?
美國高校圖書館數據素養研究與教育實踐*
●范繼榮(廣西民族大學南寧530006)
[摘要]數據密集型科學的出現使數據素養成為科學工作者的關鍵技能,美國多所大學由此開展數據素養研究與教育。文章從數據素養的概念、構成、教學模式等方面,分別對美國普渡大學聯合其他三所大學開展的數據信息素養項目、加州大學的社會學和人口統計學數據素養項目和雪城大學科學信息素養(SDL)項目等典型案例進行了介紹,并對研究不足和進一步努力的方向進行了述評,對我國開展數據素養教育提出了建議。參考文獻10。
[關鍵詞]數據素養模式高校圖書館
進入到大數據時代,數據挖掘作為決策基礎已經廣泛滲透到社會生活中,成為獲取競爭優勢的手段;數據密集型科學的出現使得科學與知識的發現更加依賴于對海量數據的利用,美國國家科學基金會制定科研數據共享政策,美國政府于2012年公布了《大數據的研究和發展計劃》,因此提高包括大學生在內的全體公民的數據素養成為一個重要課題。筆者通過選取多個典型案例,對數據素養和教育模式進行了介紹,以期冀能為國內高校的數據素養教育提供借鑒。
1美國高校開展數據素養研究和教育實踐
1.1美國四所大學的數據信息素養DIL項目[1]
美國普渡大學、康奈爾大學、明尼蘇達大學和俄勒岡大學的數據服務館員、學科或信息素養服務專家以及教師研究員組成的團隊,在博物館與圖書館服務協會(IMLS)的資助下,與5個不同學科的教師或研究員合作,對研究生和教師開展了兩年的數據素養教育實施與研究。借助扎根理論(grounded theory),通過對研究生和教師訪談及結果的分析,項目團隊抽象出數據信息素養模型(Data Information Literacy Model)。主要內容有:
(1)從數據消費和生產者角度界定數據信息素養及其核心技能結構。調查表明,師生都認為,在電子化科研中,下列12項是研究生有效管理和監護研究數據所需的“重要”的數據技能;不過教師和學生的評價分值存在差異,教師更加重視學生處理數據和維護數據長期價值的能力(見表1)。

表1 研究生有效管理和監護研究數據所需技能
在美國高校與研究圖書館協會(ACRL)的高等教育信息素養標準中,信息素養被定義為“個體識別信息需求并發現、評價、有效利用信息的能力集合”[2],數據信息素養更加注重從數據和信息的生產與消費即數據活動的多元利益相關者的視角界定成功完成數據活動所需技能、知識和習慣,如在數據倫理中,涉及到數據共享的產權、隱私、保密等意識,因而數據信息素養可以說是信息素養的深化與拓展。
(2)教師和研究生在數據活動中存在的問題[3]。訪談揭示了師生在過去的電子化科研數據活動中存在的如下問題,為開展數據素養教育提供了內容的基礎和依據。
第一,研究生普遍缺乏數據管理與監管的正式培訓,他們以前的數據素養也大不相同,如數據庫技能,教師還沒有為指導學生做好時間和技能上的準備。
第二,學科合作方缺乏正式的實驗室數據活動政策,多數研究人員認為,專業領域還沒有可供遵循的數據管理最佳實踐,學生的數據活動質量參差不齊并存在各種問題,如缺乏良好的元數據、混亂不同的文件歸檔操作導致他人難以對數據再利用,缺乏數據版本控制。
第三,研究生通過試錯法自學數據技能,主要關注數據分析技術。
第四,對數據機構和地方性的直接需要比深層概念和數據在實驗室之外的利用更加受到師生關注。
(3)不同學科的研究生數據素養教學需求與教學方法比較[4-5]。 對研究人員和學生的訪談后確定的研究生的數據素養教育需求和設計的教育項目如下:

表2 數據素養教學模式比較
從表2可知,不同學科的數據素養的教學需要各有特點,不盡相同,應該采取多元化的教學方法,而館員與其他相關方的合作尤為重要。
課程結束評價和作業分析表明,學生對多數數據素養主題表現出很高的興趣,不過他們在數據保存/歸檔、元數據、數據分享等方面依然有很大提升空間。
(4)明尼蘇達大學在線數據信息素養教育[6]。 為了應對研究人員遵守美國國家科學基金會提交數據管理計劃規定的需求,項目組以美國國家科學基金會撥款申請的數據管理計劃(DMP)模板為基礎制定7大課程模塊(見表3)。
根據課程模塊,項目小組使用微軟PPT、視頻錄制軟件ScreenFlow、Google Drive等工具和設施制作、組織和推廣課程并對學生的學習進行過程和結果的管理與評價。
此外,明尼蘇達大學圖書館開發了面向研究人員和教師的研討會課程,名為“為你的撥款申請制定數據管理計劃”(Creating a Data Management Plan for Your Grant Application)。課程由具有數據科學專長的研究館員和具有學科專長的學科館員協同教學,內容基于國家科學基金會申請書指南,包括數據格式、元數據標準、數據發布、數據共享和數據保存等,在教師演講和參與者互動討論之后,提供該大學的數據管理計劃樣本和向研究服務館員咨詢數據管理計劃的服務。
1.2加州大學數據素養教育
(1)洛杉磯分校UCLA社會學信息素養項目[7]。由于該校社會學學院致力于提高學生的信息素養能力,圖書館與之合作,對學生開展數據素養教育。項目小組認為,數據素養是信息素養的一部分,他們根據美國大學與研究型圖書館協會關于人類學社會學學生信息素養標準和對教師焦點訪談結果,提出了社會科學數據素養模塊,即4個方面的學習結果:發展解讀和批判性評價簡單的2*2列聯表或3維表的能力;為數據表格制作精確的引文資料出處;使用“American Factfinder”創建表格,并能夠被正確描述和引用;閱讀包含用圖形描述數據的論文,討論與文章內容相關的表格。
項目組在2004年和2005年均開設“社會學105(社會學信息素養實驗室)”課程,2005年冬季教學大綱規定,課程目標是:展示出學生能夠“為了社會學研究識別、查找、評價和有效并合符倫理地利用信息”。課程主題有:闡明研究課題,識別和評價研究所需的各種信息;館藏目錄,引用解釋;文獻數據庫;網絡資源及其評價;信息倫理,剽竊;統計分析表,在線圖表制作資源等;同時附有相應的閱讀要求和家庭作業;課程網站具有各種學習參考材料的鏈接。
對項目的評價主要依據學生學習活動反應、家庭作業質量和期末課程評定表;多數學生的反饋是積極的,認為從課程中獲得的技能有助于學術論文的寫作。而作者建議加強與教師的合作,利用在線數據及其分析工具,探索如何將數據素養模型與社會學課程更好地結合起來,形成一體化的課程體系。
(2)伯克利分校圖書館使用網絡軟件SDA提升本科生數據素養[8]。 SDA(Survey Documentation and Analysis)作為Berkeley大學計算機輔助調查方法項目的成果,是對調查數據進行存檔和基于網絡分析的免費程序,具有界面簡易、啟動運行快速、統計功能多樣等特點,可以鏈接到大量免費和聯盟網站的數據庫,方便學生在線獲取和分析數據,開展課題研究。該校圖書館數據實驗室(UC Berkeley's Library Data Lab)利用網絡軟件SDA,從2008年開始給學生開設經濟人口統計學課程,已經超過300人。課程強調學生對原始數據進行創新性的定量分析,而非參考他人的研究以完成人口統計學方面的課題,教師會在固定的研討會上給予學生數據分析技能和SDA操作指導。

表3 數據素養課程模塊
1.3雪城大學的通用型科學數據管理本科生課程(SDL)
雪城大學信息科學學院教授秦健和John D’Ignazio從2007年5月到2009年5月開展了科學數據素養項目(SDL),在對科學、技術、工程、數學學院(STEM)的學生和教工調研的基礎上,設計并給科學和技術專業的學生開設了“科學數據管理”課程。項目主要內容如下。
(1)科學數據素養定義與科學數據管理課程大綱[9]。研究認為,科學數據素養與信息素養和數字素養有相似之處,不過前者更多地關注收集、處理、管理、評價、使用數據的操作性能力,強調在科學研究中的以實際為基礎的數字化數據集合的生產、操作和使用。三者比較見表4。

表4 信息素養、數字素養、科學數據素養的比較
根據調查分析制定的在線科學數據管理課程包括三大模塊,模塊一,科學數據和數據管理概述:關于數據的形式、度量、類型、水平、結構和模型等;模塊二,通過數據的收集、處理、轉換和管理的案例研究來理解數據在三個級別上的聚合;模塊三,為評價數據質量和數據的實際使用介紹各種方法和工具。具體內容見表5[10]。

表5 科研數據管理課程
(2)課程推廣策略。為了提升師生參與課程的意識,項目組采取拉與推的策略加強推廣。拉的策略是吸引師生的注意力,推的策略是將課程信息推送到師生那里。研究認為,推的策略可能比拉的策略更加具有影響力。
1.4美國其他高校的數據素養教育內容
麻省大學開設的研究數據管理課程,主要模塊有:數據格式與管理計劃、數據安全、數據共享、數據描述和訪問、數據生命周期、數據命名規范、數據轉換與存儲、隱私與限制等。俄勒岡州立大學圖書館的研究數據管理課程內容也類似,包括:數據類型、格式和周期,數據組織,研究工作的數據管理計劃,數據監護配置文件(Data Curation Profiles),數據存儲、備份和安全,版本控制理論與方法,通過元數據制作數據文件,研究數據的法律和倫理問題,數據共享與再利用政策,數據歸檔與保存等。為了回應國家科學基金會2010年的數據管理計劃的強制要求,美國許多大學圖書館都提供了在線網頁指南并配以不同學科的數據館員咨詢服務,如麻省理工學院圖書館提供數據管理在線指南(http://libraries.mit.edu/data-management/),介紹了數據管理技巧,塔夫斯大學(Tufts university)圖書館也有類似網頁(http://tischlibrary.tufts.edu/services/data-management)。
2美國高校圖書館數據素養研究與教育實踐述評
2.1數據素養教育實踐
美國國家科學基金會等機構的項目申請書數據管理計劃的規定成為開展數據管理教育的直接動因,盡管數據素養本身內容廣泛,但美國高校圖書館數據素養教育主題主要集中為電子科研過程中的數據活動及其成果管理,即科研數據管理,教學對象多為需求強的數據密集型學院,如科學、技術、工程和數學學院(STEM)的研究生、本科生,也涉及教師科研人員。在流程上,以項目管理運作,包括組建人員、需求調研、設計開發課程、開展教育、進行評估、后續數據服務等;注重應用現代教育與信息技術,教學和輔導方式注重嵌入對象專業學習與研究活動,如在線課程、課堂互動教學、同行研討班、個別咨詢、網頁自學教程等;注重通過與相關機構和人員(如學科館員、學院、研究中心)合作開展活動,資源互補,課程推廣方式靈活多樣。
2.2未來研究內容
(1)數據素養理論。雖然具體的活動環節劃分各有差異,不過學者大多從有效完成數據活動的生命周期來界定數據素養的結構;由于數據含義的拓展性、數據活動的泛在性等原因,數據素養構成、測量仍然需要探索,比如從心理學視角分析,數據素養究竟如何測量,可選擇名義尺度、順序尺度、等距尺度和比率尺度中的何種進行操作;數據素養與其他構念,如信息素養、評價素養、統計素養、媒體素養、科學素養等的關系研究有待加強。
(2)數據素養教育與發展。數據素養發展與外部多種因素的互動影響,包括個體、組織、環境等,如領導的數據素養如何影響組織文化和績效;不同情景之下,數據素養教育活動的最佳模式與評價;不同情景下多階段的數據活動過程中,不同利益相關者的數據素養、數據素養發展工具等等課題都需要采取更有效的定性和定量方法加以進一步研究。
參考文獻
[1]Jake Carlson, Lisa Johnston, Brian Westra, Mason Nichols. Developing an Approach for Data Management Education: A Report from the Data Information Literacy Project [J]. The International Journal of Digital Curation. 2013,8(1) : 204-217.
[2]Information Literacy Competency Standards for Higher Education [EB/OL].http://www.ala.org/acrl/standards/informationliteracycompetency.[2014-04-15].
[3]Jacob Carlson, Michael Fosmire, C.C. Miller, Megan Sapp Nelson. Determining Data Information Literacy Needs: A Study of Students and Research Faculty [EB/OL]. http://docs.lib.purdue.edu/cgi/viewcontent.cgi?article=1031&context=lib_fsdocs.[2014-04- 15].
[4]Sarah Wright, Camille Andrews, Cliff Kraft. Developing a data management curriculum for graduate students in the natural resources[EB/OL].http://docs.lib.purdue.edu/cgi/viewcontent.cgi?article=1001&context=dilsymposium.[2014-09-14].
[5]Sarah J. Wright, Camille Andrews. Developing a Data Management Curriculum for Graduate Students in the Natural Resources[EB/OL].http://escholarship.umassmed.edu/escience_symposium/2014/posters/8/.[2014-09-02].
[6]Jon N.Jeffryes,Lisa Johnston. An E-Learning Approach to Data Information Literacy Education[EB/OL].http://conservancy.umn.edu/bitstream/11299/156951/1/ElearningApproachtoDIL_final.pdf.[2014-09-14].
[7]Elizabeth Stephenson , Patti Schifter Caravello. Incorporating data literacy into undergraduate information literacy programs in the social sciences: A pilot project[EB/OL].http://www.emeraldinsight.com/doi/pdfplus/10.1108/00907320710838354.[2014-09-14].
[8]Harrison Dekker. Using Web-based Software to Promote Data Literacy in a Large Enrollment Undergraduate Course[EB/OL]. http://conference.ifla.org/past-wlic/2010/86-dekker-en.pdf.[2014-06-02].
[9]Jian Qin, John D'Ignazio. Lessons learned from a two-year experience in science data literacy education[EB/OL].http://docs.lib.purdue.edu/iatul2010/conf/day2/5/.[2014-09-14].
[10]Jian Qin,John D’ignazio.The Central Role of Metadata in a Science Data Literacy Course[J].Journal of Library Metadata, 2010,10:2-3,188-204.
(劉平編發)
Data Literacy Research and Education in American University Libraries
Fan Jirong
(Guangxi University for Nationalities, Nanning, Guangxi 530006, China)
AbstractThe emergence of data-intensive science makes data literacy become a key skill of scientific workers and which also makes American universities develop data literacy education. The study introduces and reviews the current status of data literacy research and education throughout American university libraries in term of data literacy conception, formation, teaching mode and so on, and puts forth suggestions for data literacy research and education in our country. 10 refs.
KeywordsData literacy. Model. University libraries.
[收稿日期]2014-12-06
[作者簡介]范繼榮,講師,現在廣西民族大學圖書館工作。
[中圖法分類號]G252
[文獻標識碼]A
[文章編號]1003-7845(2016)01-0080-05
*本文系廣西民族大學中國-東盟信息重點研究基地重點課題“高校數據素養教育體系構建與實踐研究”(201401)研究成果之一。
【用戶·服務】