陳明星(東南大學情報科學技術研究所 江蘇 南京 211189)
錢 鵬(東南大學圖書館 江蘇 南京 210096)
跨學科、多主體、多視角——數據素養研究特點綜述
陳明星(東南大學情報科學技術研究所 江蘇 南京 211189)
錢 鵬(東南大學圖書館 江蘇 南京 210096)
從研究領域、研究主體和研究視角3個方面對國內外數據素養研究進行分析可以發現,數據素養研究呈現出跨學科、多主體、多視角的特點。拓展數據素養研究范圍、促進數據素養教育,爭取數據素養研究利益相關者的支持,構建數據素養教育案例庫,注重數據素養研究的系統性,等等,是數據素養未來發展需要認真思考的方向。
數據素養 信息素養 素養教育
近年來,數據素養(Data Literacy)已然成為當前一項熱點研究議題,受到來自國內外眾多研究者的重點關注。從數據素養的發展歷程到未來趨勢,從理論研究到實踐教育,從自然科學領域到人文社會科學領域,有關數據素養研究的學術成果正不斷問世,并使得學術界、教育界以及圖書館界獲益匪淺,這也意味著數據素養研究正由一個新興領域逐漸走向成熟。隨著科研環境的變化和用戶需求的內在驅動,數據素養研究正在快速發展,與之相關的各種概念和實踐也在發生變化。因此,對數據素養領域的研究成果進行系統的梳理顯得非常必要。那么,如何多方位揭示數據素養領域研究特點?這是一個具有現實意義和應用價值的問題。
1.1數據與數據素養
談及數據素養,不得不提及“數據(Data)”這一概念。在拉丁語中,數據意指得到的東西;在實際中,商家將數據定義為商品的銷售成績;研究者將數據分為定量與定性數據;地區和國家的發展業績則是政策制定者關注的數據。正如繆其浩所說,在信息化語境下,數據是指收集、測度到并保存起來可管理可利用的信息[1]。因此,筆者認為,在數據素養研究過程中,數據不再只是定量的數字,而是以任何方式編碼的信息,如上傳至You T u be的錄像、Facebook的圖片、Twitter的微博和電子郵件等社交媒體包含的數據,以及科學研究、交通物流、遙感遙測、工業生產和自動控制等產生的數據。
數據素養這一概念最先流行于美國教育界。關于數據素養概念的界定,學術界分別從知識(Knowledge)和技能(Skill)兩個方向給出了定義。Mandinach等人認為,數據素養是一種收集、分析和解讀多種類型數據,并將其轉化為指導性知識和實踐的一種能力,以此幫助教育者做好決策[2]。北京師范大學項華副教授從物理學的角度出發認為,數據素養是指滿足個體自身需求的獲取數據或者信息,或者通過數據挖掘而產生知識的一種素養,也是對科學方法、信息技術和人文精神的整合,其核心是數字環境下的科學思想、方法、習慣和精神[3]。雪城大學博士秦健等人認為,科學數據素養是指科學研究中收集、加工、管理、評價和利用數據的知識與能力,與信息素養相比,更強調科學研究中數據產生、操作和使用的能力[4]。陳娜萍認為,數據素養是指在實際情境中具有數據意識,能基于數據提出問題,結合信息技術,使用恰當方法對數據進行收集、整理、呈現和分析,并掌握用數據進行說理和交流的能力[5]。
結合上述定義,筆者認為,數據素養至少包括3個層面的含義:一是在主體層面,專業人員與普通公民的數據素養應當具有共性和個性,即專業數據素養與公民數據素養;二是在技能層面,主體應該具備良好的數據意識,掌握正確的數據收集和獲取、處理、推斷與辨別、使用和共享能力,了解數據倫理與規范;三是在知識層面,主體應當掌握相關的教育學知識、法律知識等。這3個方面相互補充、相輔相成,共同構成數據素養基本內涵。
1.2數據素養與信息素養
信息素養是由信息產業協會主席保羅·澤考斯基于1974年在美國提出的,并將其定義為“利用大量的信息工具以及主要信息使問題得到解答的技術和技能”[6],是最熟為人知的實踐能力[7]。2000年,美國大學和研究型圖書館協會(Association of College and Research Libraries,簡稱ACRL) 將信息素養定義為個人能認識到何時需要信息,以及有效地搜索、評估和使用所需信息的能力[8]。依據ACRL關于高等教育中學生信息素養的能力標準的界定,信息素養至少包含了信息意識、信息獲取、信息辨別與吸收、信息利用以及信息倫理5個方面,目的在于解決實際問題。
作為一種特定形式的“信息”,“數據”的內涵更窄且具體。張靜波將“數據素養”視為“信息素養”的一個子集,并認為,“信息素養”是生活在信息時代普通民眾應具備的一種能力,屬于科普教育的范疇;而“數據素養”主要是指科研人員在開展科學研究時應具備的一種能力,屬于專業技能教育的范疇,因此,“數據素養”應該是“信息素養”教育的進一步提高和深化[9]。Thompson等人也認為,數據素養與信息素養之間的差異主要在于處理數據比處理任何其他類型的信息更復雜[10]。然而,隨著計算機和互聯網的發展,數據獲取與操作、數據總結及表達等內容也成為信息素養的內涵元素。因此,數據素養與信息素養表現在獲取、理解、評估、管理、處理等方面的能力上又具有相似性。
從學科角度來說,數據素養研究以培養與學科內容相關的能力為主,無論是課程的教育實踐,還是理論意義上的探討。如下頁表1所示[11-15],數據素養研究大多在界定數據素養內涵的基礎上,探討如何提高數據素養水平。目前看來,大多數研究者相信,數據素養可以通過數據意識以及數據獲取、處理和交流等能力方面表現出來,這也是實施數據素養教育的基礎和前提。然而,具體到特定學科領域,數據素養水平的衡量方面又是截然不同的。
2.1數學:注重學生統計素養的提升
統計知識的教學歷來是中學數學教育的重要內容,對于統計素養的重視為數據素養的建構和發展提供了契機。數學教育主要是將統計學的知識與方法納入到課程內容之中并不斷地反映在課程教育改革之中,以培養中學生的統計素養,即閱讀和解釋數據的能力。例如,2005年,美國統計協會(American Statistical Association,簡稱ASA)頒發的《美國統計教育評價與教學指導綱要(中小幼)》提出了“統計素養”一詞,并將其作為統計教學的終極目標[16]。
2.2物理學:主張探究式學習的運用
國內物理學的發展已經進入到信息技術與物理課程整合階段,在這種數字化物理教學環境中,物理教學應該以提高學生科學素養水平為目的、以提高學生數據素養水平為抓手、以實現主流學習范式從被動接受走向自主合作創新為目標[3]。因此,物理教學中的數據素養研究會更多地依賴理論、實驗和數據探究式教學來完成。
2.3社會學:社會學科也需要數據素養
2013年,ACRL指出,人文與社會科學學者一致認可數據素養的重要性[17]。社會學關注定量與定性的社會研究,數據(或信息)統計和分析具有很重要的地位。實施一項社會調查,或者搜集某一社會學主題的文章,理解各種圖表以及基本的統計概念和術語,均與學生或者研究者的數據素養相關。
2.4圖書情報學:開展數據素養教育活動

表1 不同學科領域內的數據素養研究一覽表
圖書館歷來承擔著社會教育和資源保存的職能。然而,大數據時代則要求圖書館在服務方式和內容上做出調整。張晨將大數據時代圖書館的職能改變歸結為兩個方面:一方面,圖書館將成為社會數據中心;另一方面,圖書館將成為社會繼續教育、素養(信息素養與數據素養)培養中心機構[18]。因此,數據素養教育可以依托圖書館員的專業知識和能力,將用戶的數據素養教育以嵌入式課程的方式進行;同時,圖書館員也可針對不同用戶群體的需求,制訂個性化的培訓,開展數據素養教育活動。
2.5新聞傳播學:重點培養實踐操作能力
大數據時代的到來,使得數據成為新聞報道的重要內容,不僅包括數據的發現和獲取,而且要對挖掘到的數據進行解釋說明。正如劉穎婕等人所說,新聞業需要注入新的思維方式和技術等,在新聞的產生、編輯及報道等方面做出改變[19]。因此,對于新聞從業人員來說,在新聞傳播的實際操作過程中,具備良好的數據素養必不可少,如敏銳的數據意識,優秀的數據解讀、分析能力。
過去任何一個時代都沒有做到像今天(大數據時代)這樣,將學生、教育者、圖書館員、記者等群體緊密聯系在一起。人們被復雜而多樣的數據所包圍,也就與數據素養教育發生關系(如表2所示[20-25])。楊瑞龍等從企業理論角度進行分析后認為,公司治理應該鼓勵利益相關者的參與[26]。同樣地,在數據素養研究過程中,教育者依據學生在校表現數據對其進行評價;財經記者基于經濟數據做出客觀的新聞報道;圖書館員依據讀者借閱數據開展圖書館特色服務等,這些主題內容構成了數據素養研究系統。
3.1教育者實現教學相長的過程
教育工作者不僅需要學習深奧的知識并將教育學靈活運用,而且還要學習與同事合作,依據學生學習的數據做出指導性決定,即“以學生為中心的數據使用”[27]。這些數據可以來自國家學業水平測試,國家臨時或基準評價,地方成熟的階段性評價、測試、小測驗、學科信息、父母信息以及教師觀察等[28]。
在這一過程中,教育工作者通過運用信息媒介技術以及個人社會網絡來獲取、管理、分析和表達數據,這既是一個學習如何使用數據的過程,也是一個社會交往深入的過程。對于受教育者來說,教育工作者則是一個培訓者,可以利用自身的知識和能力教授他們如何提升數據素養。
3.2學生群體提升能力的過程
學生群體涵蓋了中學生、本科生以及研究生。他們在數據素養培訓課程和計劃的過程中,培養了對數據的敏感性或者數據意識,增強了使用恰當方法進行數據收集、整理、呈現和分析并用數據進行說理和交流的能力。具體來說,中學生以解決具體的課程問題為目標,如物理問題、數學問題;研究生則重點關注如何做好一項社會研究,并在科研周期內不斷提升自身的數據素養;而本科生的能力發展兼而有之,既要熟練解決問題,也要涉及對學術素養的培養。

表2 不同主體的數據素養研究一覽表
3.3圖書館員履行職能的過程
為了讓用戶具備基本的數據素養,圖書館員通過講座培訓(如新生入館培訓)、參考咨詢等途徑,向用戶普及數據檢索知識。同時,圖書館還獨立開設或者與院系合作開辦數據素養的課程(必修或通識),包括數據獲取、數據篩選、數據共享、數據保護、數據評價等內容。例如,伊利諾伊大學圖書館和信息科學研究生院合作實施了數據監護教育計劃(Data Cure Education Program,簡稱DCEP),即在成熟課程基礎上添加數據監護新內容的建設方法,研究和學習數據保存、數據監護和數據標準等方面的內容,以幫助提升眾多學生以及教師的數據素養[29]。此外,在數據密集型科研環境下,研究者面臨著數據引用、數據出版等一系列數據管理問題,而圖書館員則可以通過定題服務、數據整理和文獻傳遞等工作,為其提供專業幫助。
3.4記者揭示社會事實的過程
記者在向公眾傳達國家政策和向國家反映社會事實情況的輿論傳播過程中起著橋梁的作用。在互聯網高速發展的信息化時代,技術革命使得數據呈現爆炸增長的態勢,新聞報道更加關注數據內容。為了準確與合法地報道社會事實,記者應當具備以下的基本數據素養:一要具備敏感的數據意識,即對身邊的各種數據傾注更多精力;二要通過合法途徑獲取可靠、關鍵的數據,既熟練運用數據庫、機構知識庫等,也善于從人際網絡中獲取資源;三要能夠對數據進行合理解讀與分析,如關聯分析、趨勢分析[30];四要利用數據客觀準確地報道社會事實,切忌歪曲真相。以數據新聞記者與財經記者為例,前者強調從數據資料的挖掘中發現具有新聞價值的事實,而后者則以解讀經濟發展、幫助民眾了解和判斷相關行業和企業狀況為主要目的。

表3 不同視角下的數據素養研究一覽表
4.1生命周期視角下的數據素養研究
在表3中,從數據生命周期角度來說,數據素養是指完成原始數據、數據收集與組織、數據處理和分析、數據共享與存檔的過程;就科研生命周期而言,數據素養是指研究人員在科研項目的計劃、啟動到結題整個過程中具備的處理和應用數據的技能。同時,數據生命周期內的行為規范問題也將與科研人員相關。前者將數據作為研究對象,而后者關注的是科研數據。雖然二者的研究側重有所不同,但是在數據素養的核心內容上卻有一致要求,即主體應該具備數據獲取、收集、組織、分析、表達、共享等能力。除此之外,在科研中,“數據共享”和“數據引用”等都需要具備數據素養[35]。
4.2基于多數據來源下的數據素養研究
從來源上說,數據既可以由調查所得,也可以通過觀測的方式獲取,如表3所示。與大多數研究不同,這類數據素養研究主要以觀測數據的方式展開,同時更多地關注數據來源的多樣性。由于獲取方式存在差異,這類研究可以視為數據素養研究的另一視角。此外,隨著網絡的蓬勃發展,元數據得以出現。元數據是“關于數據的數據”[36],是對信息資源的內容、特征、屬性及與其他資源的關系的描述。而在如何利用元數據這一問題的討論中,元數據素養應運而生,它是指信息化環境中概念化、創建和利用元數據的一種能力。所以,有關元數據素養研究必然涉及到對于數據素養的討論和分析。
4.3數據驅動決策視角下的數據素養研究
所謂數據驅動決策,是指依據數據做出決策, 又稱數據決策。例如,教師通過收集學生在校測驗成績、家庭信息等數據,做出關于學生管理和教育的策略或計劃[28];政策制定者通過獲取關于國民經濟社會發展的數據,擬出未來發展藍圖。不難看出,諸如此類的活動既是一個決策過程,也是一個使用數據的過程,需要有一定的數據素養作為支持。Marsh將這一過程概括為:數據收集—數據辨別和分析—信息解讀—反應和行動—結果評估,這一過程并非是線性的,而是循環往復的[37]。
綜上所述,數據素養研究呈現出“跨學科”“多主體”和“多視角”的特點:(1)從研究領域來看,數據素養研究不專屬于任何一門學科,其重要性在不同學科中也充分得到了體現。在數學教育中,數據素養研究注重統計知識的教學和能力的訓練;而在物理學的教育中,探究式的學習更有助于提高學習效果。(2)在研究主體方面,從縱向來看,中學生、本科生以及研究生均成為數據素養研究的重點對象,數據素養培養具有層次性;從橫向來看,主體包含了學生、教師、館員、記者等群體。這反映了數據素養研究具有普適性,因此,對于數據素養的定義也有所不同,即有了專業數據素養與公民數據素養之分。(3)基于研究視角,其研究路徑分為基于生命周期的數據管理、基于數據決策的用戶行為以及基于數據來源多樣性3種,分別從培養用戶數據管理能力、數據使用能力以及用戶的數據意識3個方面為提升用戶的數據素養水平提供參考。
一言以蔽之,數據素養研究雖然出現了上述研究的差異,但是這些研究均是在分析數據素養內涵的基礎上,為數據素養的教育提供某種思路和借鑒。因此,本文基于已有的研究成果,針對未來數據素養研究提出以下幾點思考:
第一,拓展數據素養研究范圍,促進數據素養教育。數據素養研究的跨學科屬性,使得數據素養教育也具備了多學科交叉特點。數據的收集、處理等過程會不可避免地出現在學習、科研和工作當中,尤以定量研究最突出。因此,在人文社會科學的學習過程中,了解計算機科學或者管理信息系統,熟悉結構查詢語言(SQL)、相關數據庫、數據操作技術、統計軟件(SPSS)以及數據可視化軟件(CiteSpace)的使用,對研究結果的可行度和科學性的提高有很大幫助。
第二,爭取數據素養研究利益相關者的支持。學校系統中形成的一致想法有助于學校師生數據素養的培養。例如,學生、教師以及學校領導者在關于學生全面發展的評價指標方面達成統一意見,將使學生的表現得到提升。上行下效,政策是否被有效遵循和實施,取決于上下同心同力的程度,包括輿論宣傳、社會參與等。袁智強通過研究,發現各個國家逐漸意識到本國存在的數據素養缺失問題,并從政府為教育開放數據庫、教師重視統計核心概念教學、課堂經歷PPDAC循環3個維度提出了解決問題的方法[38]。
第三,構建數據素養教育案例庫。圖書館以及圖書館員可以利用其資源和專業優勢,為學生和科研人員的學習或者科研工作提供幫助,如查證查引、跟蹤科研、文獻傳遞等,并通過信息檢索課程,針對不同學科領域的學生和老師進行專業培訓和指導。從目前來看,國內外圖書館相繼開設了針對不同用戶需求的通識教育和學科專題課程,實施了旨在提高用戶基本數據素養的專題講座等。如果對這些成功的實踐經驗進行匯總和處理,形成數據素養教育的案例庫,那么將會對數據素養的教育有所幫助。
第四,注重數據素養研究的系統性。由于缺乏統一的理論體系,致使數據素養的研究未能成熟化。從目前研究來看,與有關數據意識、使用、管理和分析的研究相比,數據倫理以及數據使用的合法性問題受關注的程度更小。楊曉瓊認為,數據素養的內涵還應包括數據道德,即要培養受教者的知識產權理念,在合法基礎上合理地獲得數據,并正確地表達數據來源,防止出現非法存取現象[39]。此外,面對當前數據巨大商業價值的誘惑,以及更加數字化、開放化的環境,維護(個人或者國家)數據安全至關重要。
[1]繆其浩. 大數據時代的數據意識和數據素養[EB/OL].[2015-12-12]. http://d.wanfangdata.com.cn/Conference/821214a.
[2]Mandinach E, Friedman J M, Gummer E. How can Schools of Education Help to Build Educators' Capacity to Use Data? A Systemic View of the Issue. [J]. Teachers College Record, 2015, 117(4):1-50.
[3]項 華. 論物理教育中數據素養的培養[J]. 中國現代教育裝備, 2011(4):84-85.
[4]Qin Jian,D'Ignazio J. Lessons Learned from a Two-Year Experience in Science Data Literacy Education[EB/OL].[2016-04-25]. http://docs.lib.purdue.edu/cgi/viewcontent.cgi? article=1009&context=iatul2010.
[5]陳娜萍. 初中生數據素養現狀調查研究[D]. 福建:福建師范大學數學與計算機科學學院, 2014:14.
[6]Zurkowski P G. The Information Service Environment Relationships and Priorities[EB/OL]. [2016-03-04]. http://files. eric.ed.gov/fulltext/ED100391.pdf.
[7]Conceptual Relationship of Information Literacy and Media Literacy in Knowledge Societies [EB/OL].[2016-04-25].http:// www.unesco.org/new/fileadmin/MULTIMEDIA/HQ/CI/CI/pdf/ wsis/WSIS_10_Event/WSIS_-_Series_of_research_papers_-_Conceptual_Relationship_between_Information_ Literacy_and_Media_Literacy.pdf.
[8]Iannuzzi P. Information Literacy Competency Standards for Higher Education [J]. Community and Junior College Libraries, 2000 (9):63-67.
[9]張靜波. 大數據時代的數據素養教育[J]. 科學, 2013, 65(4): 29-32.
[10]Thompson K A, Edelstein D M. A Reference Model for Providing Statistical Consulting Services in an Academic Library Setting [J]. Iassist Quarterly, 2004(2-3):35.
[11]陳娜萍. 初中生數據素養評價指標與試題[J]. 初中數學教與學, 2013(14):5-7.
[12]王 顯. 圖書館數字資源對讀者數據素養的提升分析[J]. 湖北經濟學院學報:人文社會科學版, 2014(12):163-164.
[13]Atkinson M P, Brewster Z B. Integrating Sociological Research into Large Introductory Courses: Learning Content and Increasing Quantitative Literacy [J]. Teaching Sociology, 2006, 34(1):54-64.
[14]金兼斌. 財經記者與數據素養[J]. 新聞與寫作, 2013(10):5-8.
[15]Public Affairs Data Journalism at Stanford [EB/OL].[2016-06-13].http://www.padjo.org/ lectures/comm_273d/2014_fall/ syllabus/.
[16]Aliaga M, Cobb G, Cuff C, etc. Guidelines for Assessment and Instruction in Statistics Education [EB/OL]. [2016-06-13]. http:// www.amstat.org/education/gaise/GAISECollege.htm.
[17]Association of College and Research Libraries. Intersections of Scholarly Communication and Information Literacy: Creating Strategic Collaborations for a Changing Academic Environment [EB/OL]. [2016-06-13]. http://www.ala.org/ acrl/sites/ala.org. acrl/files/content/publications/whitepapers/Intersections.pdf.
[18]張 晨.大數據時代的圖書館與數據素養教育[J]. 圖書與情報, 2014(4):117-119.
[19]劉穎婕, 衛張寧. 數據新聞生產所帶來的新聞業務創新思考[J].新聞研究導刊, 2014, 5(6):233.
[20]陳娜萍, 袁智強, 章浩偉.數據素養視角下的PISA與中考統計試題比較研究[J]. 福建教育, 2013(4):40-43.
[21]Johnston L, Jeffryes J. Data Management Skills Needed by Structural Engineering Students: Case Study at the University of Minnesota [J]. Journal of Professional Issues in Engineering Education & Practice, 2014,140(2):331-361.
[22]黃 俊. 論大數據時代輔導員的新素養[J]. 大學教育, 2015(5): 34-35.
[23]Bocala C, Boudett K P. Teaching Educators Habits of Mind for Using Data Wisely[J]. Teachers College Record, 2015(117): 1-20.
[24]Macmillan D. Data Sharing and Discovery: What Librarians Need to Know [J].Journal of Academic Librarianship, 2014, 40(5):541-549.
[25]沈 浩, 談 和, 文 蕾. 數據新聞記者的數據素養[J]. 青年記者, 2014(21):17-18.
[26]楊瑞龍, 楊其靜.專用性、專有性與企業制度[J].經濟研究, 2001 (3):3-11.
[27]Mandinach E B, Parton B M, Gummer E S, et al. Ethical and Appropriate Data Use Requires Data Literacy[J]. Phi Delta Kappan, 2015,96(5):25-28.
[28]Jimerson J B, Wayman J C. Professional Learning for Using Data: Examining Teacher Needs and Supports[J]. Teachers College Record, 2015,117(4):1-36.
[29]DCEP [EB/OL]. [2016-06-13].http://cirss.lis.illinois.edu/ Project/project-details.php?id=19.
[30]崔立勇. 財經記者如何做到“心中有數”[J]. 新聞窗, 2013(3): 21-22.
[31]孟祥保, 李愛國. 國外高校圖書館科學數據素養教育研究[J]. 大學圖書館學報, 2014(3):11-16.
[32]Mokros J, Wright T. Zoos, Aquariums, and Expanding Students' Data Literacy[J]. Teaching Children Mathematics, 2009, 15(9): 524-530.
[33]Schildkamp K, Poortman C L, Handelzalts A. Data Teams for School Improvement [J]. School Effectiveness & School Improvement, 2015(27):1-27.
[34]Schildkamp K, Kuiper W. Data-Informed Curriculum Reform: Which Data, What Purposes, and Promoting and Hindering Factors [J]. Teaching & Teacher Education, 2010, 26(3):482-496.
[35]Weideman A. Assessing and Developing Academic Literacy [J]. Per Linguam A Journal of Language Learning, 2003,19(1): 55-65.
[36]陳乙南. 布魯姆分類學對提高大學生元數據素養的指導意義[J].吉林省教育學院學報:學科版, 2014,30(1):17-19.
[37]Marsh J A. Interventions Promoting Educators' Use of Data: Research Insights and Gaps[J]. Teachers College Record, 2012 (114):48.
[38]袁智強. 社會需要而課堂缺乏的數據素養[J].福建教育:中學版, 2012(11):37-39.
[39]楊曉瓊. 大數據時代高校數據素養教育的合作路徑[J].情報資料工作, 2015(3):98-102.
陳明星 男,東南大學情報科學技術研究所圖書館學專業2014級碩士研究生。
錢 鵬 男,現工作于東南大學圖書館,教授。
Cross-Discipline, Multiple Subjects and Perspectives:An Overview on Research Characteristics of Data Literacy
It is found by the research on domestic and overseas data literacy from three aspects of research field, subject and perspective that the research features in cross-discipline, multiple subjects and perspectives. Future development directions of data literacy should be considered seriously in following aspects: expanding data literacy research scope, and promoting data literacy education; getting support from data literacy research stakeholders; establishing data literacy education case database; and stressing on the integrity of data literacy research.
Data literacy; Information literacy; Literacy education
G250.76
A
2016-07-13]