隆 茜(華東師范大學圖書館 上海 200241)
數據素養能力指標體系構建及高校師生數據素養能力現狀調查與分析
隆 茜
(華東師范大學圖書館 上海 200241)
〔摘 要〕文章在調研國內外文獻的基礎上,構建了數據素養能力評價維度與具體指標體系,并以此調研了高校不同群體(大學教師、博士生、碩士生、本科生)的數據素養能力現狀。研究發現不同群體在數據素養能力上具有顯著性差異,高校圖書館可通過設置數據館員崗位、建設數據服務網頁及開展差異化的數據素養教育等方式提升高校師生的數據素養能力。
〔關鍵詞〕數據素養 能力 維度 評價 指標體系
隨著大數據時代的來臨,科學研究范式進入到一個新的階段,產生了繼實驗科學、理論科學、計算科學之后的科學研究第四范式—數據密集型科學。2007年,圖靈獎獲得者、微軟研究院科學家Jim Gray提出了“以數據為基礎的科學研究第四范式”(The fourth paradigm: data-intensive scientific discovery)的概念。微軟公司還于2009年10月發布了《e-Science:科學研究的第四種范式》論文集,首次全面的描述了快速興起的數據密集型科學研究。數據不再僅僅是科學研究的結果,而且變成科學研究的基礎,科研工作000799者需要基于數據來思考、設計和實施科學研究,并從中推論出事實真相。因而,在大數據時代,科研工作者的數據素養對其順利開展科學研究具有重要推動作用。
1.1 數據素養概念綜述
對數據素養目前有不同的定義,有研究認為數據素養(data literacy)的概念是對媒介素養(media literacy)、信息素養(information literacy)等概念的一種延續和擴展;也有研究將數據素養等同于統計素養(statistical literacy)、數字素養(quantitative literacy 或numeracy);還有研究認為數據素養是信息素養的同義詞;也有研究認為數據素養是信息素養的提高與深化。但總的來說,大多數的研究支持數據素養是人們有效且正當地發現、評估和使用信息及數據的一種意識和能力。而對數據素養的內涵與能力,文獻中則有不同的闡述。文章在調研國內外文獻的基礎上,總結了國內外文獻對數據素養定義、內涵或組成能力的具體闡述(見表1)。
從文獻中對數據素養內涵及其組成能力的具體表述可以發現,國內研究者著重于數據素養的數據意識、數據獲取、數據處理、數據評估等能力,而國外研究者則更著重于利用數據來演繹、推導結論及利用數據進行決策的能力。

表1 數據素養定義、內涵或組成能力
1.2 數據素養能力評價指標體系的構建
目前除陳娜萍提出了初中生數據素養評價指標外,國內外對高校師生數據素養能力評價的研究較少。文章在綜合國內外文獻對數據素養內涵、組成能力的闡述的基礎上,從數據意識、數據獲取能力、數據處理與分析能力、數據交流能力、數據評價能力及數據道德等幾個維度構建了高校師生數據素養能力評價指標體系(見表2)。

表2 高校師生數據素養能力評價指標體系
2.1 調查問卷的編制
問卷調查對象為有科研需求的大學教師、博碩士研究生及本科生。問卷內容分為兩部分,第一部分為被調查者的個人信息,如:職業、年齡、學歷等,第二部分為文章構建的數據素養能力評價指標體系的調查。為對比不同群體在數據素養能力上的差異,研究采用評分制調查法,對每個問題按1-5分設置分值,由被調查者根據自己的實際情況自評打分,1分最低,5分最高。

表3 調查對象情況表
研究利用“問卷星”專業問卷調查平臺在線發布問卷,通過各種方式廣泛宣傳,使被調查者可以通過電腦和移動終端如ipad、手機等方式便捷的回答問卷。問卷調查時長30天,共回收問卷151份,調查對象的具體情況如表3所示。
2.2 數據素養能力的調查結果與分析
表4列出了各群體數據素養能力指標得分均值及標準偏差等統計數據。將指標1-21的均分相加可以看出,得分由高到低的群體依次為:大學教師〉博士生〉碩士生〉本科生,說明以科研為主的大學教師和博士生是數據素養能力最高的群體,而本科生群體的數據素養能力整體較低。

表4 各群體數據素養能力指標得分統計數據(單位:分)
從各指標具體分值來看,各群體得分最高的指標是1,即數據意識中“能認識數據是科研過程中非常重要的因素”,說明大數據時代,各群體已經充分意識到數據在科學研究中的重要性。得分最低的指標是10,即數據處理與分析能力中“能夠利用統計分析軟件如SPSS對獲取的數據做恰當的統計分析”,說明對所有群體而言,對統計分析軟件利用能力或者數據分析能力較弱,相關培訓的開展勢在必行。
得分較低的指標還有6,7,8,19,即數據獲取能力的“能夠熟練獲取各類數據,了解數據源,如獲取途徑或數據庫等、具有檢索與收集各種數據的能力、能夠對獲取的各種形式的數據(格式、類型、特點)做準確解讀”以及數據評價能力的“能夠批判性的評價數據,結合實際質疑數據”。隨著網絡的快速發展,各高校電子資源的迅速增長以及海量的數字資源每日迭加,一方面使資源的獲取變得簡單,另一方面也使得對資源的定位變得復雜。由于缺少數據素養獲取能力的相關培訓,如何高效的搜索數據仍然是各群體普遍缺乏的能力。
2.2.1 數據意識

表6 各群體數據獲取能力指標分值占比
在數據意識的各指標中,各群體均能意識到數據是科研過程中非常重要的因素,而且能以嚴謹認真的態度對待與使用科研過程中產生的數據。但是,指標“能夠認識到科學數據具有生命周期”和“能夠保證數據的公正性與開放性”在不同群體中得分差異較大(見表5)。數據生命周期是指從數據產生,經數據加工和發布,最終實現數據再利用的一個循環過程。博士生與大學教師對數據具有生命周期的認知高分值比例較高(4分和5分總和分別占82%和93%),但也有部分教師自評為1分,而本科生相對高分值比例略低(4分和5分總和占73%)。反之,在數據的公正性與開放性上,則出現了相反的結果,博士生與大學教師分值中5分分別占47%和53%,并有部分2分的選項,而碩士生分值中5分占57%,表明了以科研為主的博士生與大學教師在數據的開放性上表現出相對謹慎的態度。
2.2.2 數據獲取能力
各群體在數據獲取能力指標上均出現了相對較低的分值。表6給出了各群體數據獲取能力指標分值占比,從中可以看出,在該維度中,各群體分值均較低而且分值差異較大,1-5分均有分布,而且3-5分占比在10-33%之間,表明各群體中個體差異較大。以指標“能夠熟練獲取各類數據,熟練掌握各類數據源”為例,大學教師的得分在2-5分均有分布,其余的3分占比達占1/3,與碩士生3分占比幾乎相同。而本科生的3分占比則近60%,如果以3分作為及格線,則表明有大量的教師與碩士生在數據獲取能力上僅為合格。而在“具有檢索與收集各種數據能力”的指標中,各群體3分占比也較高。由各群體在數據獲取能力指標中得分的巨大差異表明,各群體中不同個體在數據獲取、檢索、收集等方面具有非常大的差異,這一方面可能由于不同個體學科專業存在差異,如部分文科教師的研究方向對數據依賴性不強,圖1對不同學科師生檢索與收集數據能力做了對比,可以看出,理科類師生總體高分值占比較高;另一方面可能與研究生是否參加過科研項目有關,研究表明,參加過科研項目的研究生科學數據收集與利用能力高于沒有參加過的研究生[16]。

圖1 不同學科師生檢索與收集數據能力分值比例分布
2.2.3 數據處理能力
各群體在數據處理能力指標中均分最低,即使是利用EXCEL處理與分析原始數據,在不同個體間也出現了較大的差異,有部分博士生、碩士生的EXCEL數據處理能力還存在較大差距。而指標“能夠利用統計分析軟件如SPSS對獲取的數據做恰當的統計分析”在各群體之間顯示出巨大的差異,大學教師、博士生、碩士生、本科生的5分占比分別為35%、47%、54%、5%,并且各群體中1分占比超過10%(見表7)。目前各高校中,關于如何使用統計分析軟件的課程較少,大多數的師生主要是通過自學來掌握這些軟件,雖然各高校圖書館也陸續開設有此類的講座,但由于各種因素限制如宣傳力度不夠、講授時間過短、與師生課程沖突等導致師生無法通過課程教育有效的掌握該軟件。

表7 各群體數據處理能力指標分值占比

表8 各群體數據交流能力指標分值占比
2.2.4 數據交流能力
高校師生不僅要有數據意識、數據獲取能力及數據處理能力,還需要有合理有效的數據交流才能將研究成果傳播出去,為科學發展作出貢獻。應該說,數據交流能力是從事科研工作最重要的能力之一,如果數據交流能力弱,即使有良好的實驗結果,較好的統計分析能力,但是不能有效的描述原始數據、不能恰當的應用圖表展示數據、不能利用數據支撐論點以及不能利用數據結果作出正確的決策并撰寫出報告、論文等等,所有的數據都沒有意義。因此,國外的研究者對數據素養的交流能力非常重視,通過將數據素養與專業課程相結合,利用實踐教育提升學生的數據交流能力[17]。
表8給出了各群體數據交流能力指標分值占比,從中可以看到,數據交流能力各指標中5分分值占比相對其它指標較少,尤其是“能夠依靠數據及其統計分析結果做出正確決策”,表明各群體在該指標上持謹慎態度。在國外的文獻研究中可以發現,較多的研究者認為數據素養能力是能夠從數據中發現規律、推導論點并作出正確決策,而調查問卷也顯示出在這項指標上國內科研人員相對能力較弱。
2.2.5 數據評價能力
表9給出了各群體數據評價能力指標分值占比,可以看出,各群體高分值占比不高,大學教師群體在指標“能夠審核數據的準確性,剔除錯誤或無效數據”及“能夠批判性評價數據,結合實際質疑數據”中還出現了2分的選項,說明在數據的具體評估能力上,各群體中的部分個體還需要加強。

表9 各群體數據評價能力指標分值占比
2.2.6 數據道德
在數據道德維度指標“了解數據采集、使用、分享中所涉及的道德和倫理問題,能夠尊重他人的數據,使用時能夠注明出處”上,各群體分值均較高。隨著國內各高校、科研院所對師生及科研人員在學術道德、學術規范等方面的教育加強,師生及科研人員對數據道德也具有較高的自我評價。

表10 各群體數據道德指標分值占比

表11 985高校圖書館數據素養類相關講座
在大數據時代的推動下,數據素養研究的開展,在圖書館學情報學領域也掀起了研究熱潮。2010年,第76屆IFLA大會將“社會科學數據素養”列為會議主題之一;2007-2009年,秦健獲NSF資助,開展“科學數據素養項目”的研究;2012年,美國博物館與圖書館服務協會IMLS資助了“數據信息素養項目”。朱玉奴等[18-19]、孟祥保[20]分別調研了國外高校圖書館數據素養教育的現狀、內容與特征發現,國外高校圖書館的數據素養教育基本是從數據生命周期角度出發,圍繞科研流程所需技能而展開,通過建立科學數據管理資源導航、數據素養教育通識課程以及學科專題數據素養教育等方式開展。
為了解國內高校圖書館在數據素養教育的實踐,文章調研了39家985高校圖書館數據素養教育現狀。表11列出了部分985高校圖書館數據素養類相關講座,除北京大學圖書館與上海交通大學圖書館外,其它高校圖書館雖然也有涉及到數據素養內涵的講座,如:數據獲取能力(數據檢索)、數據處理與分析能力(SPSS、EXCEL使用方法),但均未明確提及數據素養。雖然北京大學圖書館和上海交通大學圖書館提及了“數據素養”的概念并開設了部分相關講座,但還未涉及到數據素養的所有維度,更未形成系統的課程??傮w看,目前國內高校圖書館尚未形成明確的數據素養教育模式。
在數據密集型科學環境下,科學研究越來越依賴于海量數據的聚焦與分析[22]。文章對有科研需求的不同群體高校師生的調研結果表明,雖然大學教師與博士生整體的數據素養能力高于碩士生和本科生,但是在數據獲取能力及數據處理能力等方面較差,且出現了極大的個體差異。目前,國內高校圖書館不論在數據服務、數據監護還是數據素養教育等領域均大大落后于國外高校圖書館,國內高校圖書館應該利用第四研究范式興起的契機,針對有科研需求的高校師生,開展有針對性的數據管理、數據素養教育等服務,提升高校師生的數據素養能力。
4.1 設立數據館員崗位
Creamer A.通過調查美國141 個健康科學館員與科學技術館員的工作內容和所需技能,總結出數據館員所需技能包括 Web2.0 技術、數據保存、數據評估、數據監管工具使用、數據服務宣傳與營銷、數據監管標準的制定等[23]。孟祥保等[24]通過分析國外高校圖書館數據館員的招聘信息發現,數據館員主要從事參與數據管理政策制定、數據資源管理、數據服務以及數據版權、數據倫理以及數據隱私等工作。葉蘭等[25]分析了國外高校圖書館數據監護崗位的設置與需求后指出,數據監護崗位已成為國內外高校圖書館越來越需求的崗位。面對大數據時代的來臨與大數據的沖擊,國內高校圖書館應該積極應對,重新審視自己在科學數據管理中的角色定位,開展專業的科學數據服務[26]。并通過設置數據館員崗位,為師生提供專業的學科服務。數據館員崗位的產生可通過兩種途徑完成:一是設立全新的崗位,二是對原有崗位進行改造和重構[27]。
4.2 建設數據服務(data service)網頁
國外高校圖書館的網站往往開設有數據服務(data service)的專門網頁,如紐約大學圖書館[28]、加州大學戴維斯分校圖書館[29],內容包括查找數據、組織數據、管理數據、保存數據等。而國內高校圖書館網站目前尚無此類服務,在大數據背景下,國內高校圖書館也應該與時俱進,在網站中開設相應的服務欄目。可先從如何檢索數據、數據版權、數據引用等內容開始,隨著數據管理服務的逐步開展,再引入數據管理、數據保存等內容。
4.3 開展差異化數據素養教育
信息素養能力在不同群體[30]、不同性別[31]、不同年齡[32]往往具有一定的差異性,而在不同年齡與學歷教師群體中也發現了信息素養水平有顯著性差異[33],因此,針對不同群體開展信息素養教育具有重要意義。而在大數據時代,各領域的從業人員都需要數據素養,如記者要具備新聞數據素養;科研工作者需要科研數據素養;圖書館館員也需要數據素養以對科研數據開展有效的管理。因此,針對不同群體開展數據素養教育迫在眉睫。同樣,不同群體由于工作、生活等的側重點不同,數據素養能力往往也有很大的差異。各高校圖書館可以在提供現有數據素養相關培訓的基礎上,繼續深化培訓內容,開展系統的、有針對性、多層次的數據素養教育。
4.3.1 針對教師、研究生群體開展深入的數據素養教育
教師與研究生群體以科研為主,往往面臨申報項目、撰寫論文、報告等科研任務。這部分群體人員平時常常關注科研動態,經常閱讀文獻,具有一定的數據素養,但往往能力還不夠。主要的弱項體現在數據獲取能力與數據處理與分析能力上,這一方面源于科研人員對圖書館購買的電子資源了解得不全面,另一方面也源于科研人員的檢索能力不強。此外,由于缺少學習途徑,對一些統計分析軟件的使用方法不夠熟練,也導致其在數據分析能力上的不足。各高校圖書館可為該群體制定特定的學科服務策略,深入院系,開展有針對性的數據檢索、數據處理與數據分析能力的專場講座,并結合文獻、學科專業等進一步開展數據素養在論文寫作中的應用,以拓展學科服務的廣度與深度。
4.3.2 針對本科生群體開展全面的數據素養教育
本科生群體雖然不一定以科研為主,但在大數據時代,他們畢業后不論從事什么行業,都需要數據素養。因此,對本科生群體的數據素養教育應該采用通識教育課程,從數據意識、數據獲取能力、數據交流能力、數據評價能力以及數據道德等角度全面培養數據素養能力。
隨著科學研究第四范式的興起,數據必將是科學研究中最重要的因素,數據素養也將是科研工作者最重要的能力素養之一。國內高校圖書館需要抓住機遇與挑戰,積極應對數據管理、數據監護的研究熱潮,一方面陸續開展數據管理研究,另一方面開展數據素養相關的教育與培訓,將數據素養教育納入學校通識教育課程或嵌入學科教育培訓中,為提升高校師生數據素養能力,提升圖書館整體水平作出貢獻。
(來稿時間:2015年6月)
參考文獻:
1.沈婷婷. 數據素養及其對科學數據管理的影響. 圖書館論壇, 2015(1): 68-73
2.張晨. 大數據時代的圖書館與數據素養教育. 圖書與情報, 2014(4)117-119
3, 20, 21.孟祥保, 李愛國. 國外高校圖書館科學數據素養教育研究. 大學圖書館學報, 2014(3):11-16
4.Schneider R. Worldwide Commonalities and Challenges in Information Literacy Research and Practice. Switzerland: Springer, 2013:130-140
5.Mandinach E, Gummer E. A Systemic View of Implementing Data Literacy in Educator Preparation. Educational Researcher, 2013, 42(1):30-37
6.陳娜萍. 初中生數據素養評價指標與試題. 初中數學教與學, 2013(14):5-7
7.張靜波. 大數據時代的數據素養教育. 科學, 2013(4):29-32
8.金兼斌. 財經記者與數據素養. 新聞與寫作, 2013 (10): 5-9
9.繆其浩. 大數據時代:趨勢和對策. 科學(上海),2013, 65(4):25-28
10.百度百科.數據素養. [2015-06-08]. http://baike.baidu. com/link?url=AciQr1vRmlbJvFfRx7nAjHitE2BjEzhwPCVNpYT7q xlvOPqiDwDUDxoMmIWiQp2RzCXB90Tujv6PpGU29KYi9q
11.Vahey P, Rafanan K, Patton C et al. A Cross-Disciplinary Approach to Teaching Data Literacy and Proportionality. Educational Studies in Mathematics, 2012, 81(2):179-205
12.Carlson J, Fosmire M, Miller C et al. Determining Data Information Literacy Needs: A Study of Students and Research Faculty. Portal-Libraries and the Academy, 2011, 11(2):629-657
13.項華,毛澄潔. 以物理教育為例 談信息時代的數據素養. 中小學信息技術教育, 2011(4):47-49
14.Jian Q, D’Lgnazio J. Lessons Learned From a Two-Year Experience in Science Data Literacy Education. IATUL Proceedings, New Series, 2010:10
15.Stephenson E, Caravello P. Incorporating Data Literacy into Undergraduate Information Literacy Programs in the Social Sciences: A Pilot Project. Reference Services Review, 2007, 35(4): 525-540
16.洪程,錢鵬. 高校研究生科學數據需求與利用行為調查分析——以東南大學為例. 國家圖書館學刊, 2014(1):16-21
17.Harris C, Berkowitz A, Alvarado A. Data Explorations in Ecology: Salt Pollution as a Case Study for Teaching Data Literacy. American Biology Teacher, 2012, 74(7):479-484
18.朱玉奴,陳益君. 圖書館數據素質教育的理論與實踐.情報資料工作, 2014(6):106-109
19.朱玉奴. 國外數據素質教育及圖書館服務模式研究.圖書情報工作, 2014(5):29-34
22.張凱勇. 數據密集型科學環境下的高校圖書館科學數據服務. 圖書館學研究, 2014(3):69-72
23.Creamer A,Morales M,Crespo J et a1. An Assessment of Needed Competencies to Promote the Data Curation and Management Librarianship of Health Sciences and Science and Technology Librarians in New England. Journal of eScience Librarianship, 2012, 1(1):18-26
24.孟祥保,錢鵬. 國外高校圖書館數據館員崗位設置與管理機制. 圖書與情報, 2013(4):12-17
25-27.葉蘭. 國外圖書館數據監護崗位的設置與需求分析. 大學圖書館學報, 2013(5):5-12
28.紐約大學圖書館. [2015-06-08]. http://guides.nyu.edu/ dataservices
29.加州大學戴維斯分校圖書館. [2015-06-08].http:// guides.lib.ucdavis.edu/content.php?pid=274775&sid=2265260
30.李德娟. 信息能力群體間差異與高校圖書館信息素質教育改進研究——北京交通大學在校研究生問卷調查分析.河北科技圖苑, 2013(3):39-42
31.何彤宇, 李志國. 高校師范生信息素養性別差異的相關性分析. 軟件導刊(教育技術), 2013(8):54-56
32.林川, 于挽平. 大學生信息素質的年級差異研究. 圖書館, 2009(1):108-110
33.張霞, 楊勁松. 江蘇省高職院校教師信息素養水平的差異性比較分析. 教育學術月刊, 2012(11):49-51
〔分類號〕G250
〔作者簡介〕隆茜(1974-),女,博士,華東師范大學圖書館副研究館員,已發表論文10余篇,參著中英文專著3部,研究方向:信息素養、數據素養、信息檢索。
Construction of Index System of Data Quality Ability and Investigation of Present Situation of Data Literacy Ability of Teachers and Students
Long Xi
( East China Normal University Library )
〔Abstract 〕On the basis of the research literature at home and abroad this article introduces construction of evaluation dimension and the specific index system of data quality ability to research the data quality status of different groups of colleges and universities ( teachers, PhD, master’s and undergraduate).The study found that different groups have significant differences in data quality ability, academic libraries can set up the data librarian post, construct data service web page and carry out data literacy education in order to promote the data quality ability of teachers and students.
〔Keyw ords 〕Data quality Ability Dimension Evaluate Index system