信息素養是當代人的基本素養,也是科學研究的基礎能力。隨著大數據時代的到來,社會因數據而產生了新的工作、學習范式等,人們需要具備數據獲取、分析、使用、管理等方面的能力。傳統的信息素養已經難以適應數據社會的發展和要求,以數據為核心對象的數據素養成為信息素養不可或缺的一部分。根據DIKW概念模型,數據是一種基礎信息,“信息”是經過加工后的“數據”,因此,“數據”的外延大于“信息”,數據素養可以說是信息素養在大數據時代的延伸與拓展,其概念雖然源于信息素養,但對信息素養提出了新的要求和發展方向。
目前,學界對數據素養的定義并未達成統一認識。如Calzada等認為數據素養“包含獲取、理解數據、批判性評估和管理數據的能力,并在使用數據的過程中遵守道德規范。”伊利諾伊香檳分校的Hogenboom等將其定義為“閱讀、解釋、分析、批判性思考以及將統計數據作為證據的能力。”國內胡卉等提出“數據素養是正當地發現和獲取數據、批判地選擇和評估數據、規范地管理和處理數據、合理地利用和共享數據的意識和能力?!庇鴶祿n案館根據數據生命周期提出了各階段的數據素養內容,包括創建數據、處理數據、分析數據、保存數據、共享數據和復用數據等6個方面。綜合各方觀點,筆者認為數據素養強調的是數據生命全周期內的數據發現、獲取、選擇、評估、管理、保存、共享等一系列所需的意識和能力。LIS學科中對數據素養的要求主要包括數據知識、數據獲取、數據解釋與評估、數據管理、數據應用五個方面。
LIS教育機構作為信息素養教育的重要陣地,在大數據時代開展數據素養教育既是它的重要功能,也是LIS教育與時俱進、實現自身發展的需要。因此,近年來美國的LIS教育越來越多地融入了數據素養教育的內容,使數據素養教育成為LIS教育的有機組成部分。在我國,數據素養教育也引起了LIS教育領域的重視,通過調整人才培養目標,設置研究方向及相關課程,變革教學內容等舉措,加強了數據素養教育。本文擬通過調研了解當前數據素養教育在中美LIS教育機構的開展現狀,在此基礎上對各自的培養特色進行對比分析,了解兩者的差距所在,以期為國內LIS教育機構開展數據素養教育提供借鑒。
本次研究選取的國內調研對象為具有 “圖書情報與檔案管理”一級學科或下設二級學科博士學位授予點的LIS教育機構,另外由于華東師范大學信息管理系自主設立的圖情二級學科“商業分析”與數據素養關聯密切,故納入調研范圍,共計13所院系。調研的專業在本科階段包括圖書館學、檔案學與信息資源管理三個專業,碩士研究生階段則包括圖書館學、檔案學、情報學以及圖書情報專業碩士,以及部分機構在圖情一級學科下自主設置的二級學科,如出版發行學、保密管理等,共計70個專業。
美國的調研對象則主要依據 《美國新聞和世界報道》(US News&World Report)2017 年發布的美國圖書情報學院排名,選取其中排名靠前的13所圖情院系,以其開設的圖書情報學相關本科、碩士學位項目以及與數據科學高度相關的碩士后專業認證項目為對象,主要包括Library and Information Science(圖書情報學)、Library Science(圖書館學)、Information Science(信息科學)等共計36個項目。
本次調研以網絡調查方法為主,通過逐一訪問各LIS院系的網站,圍繞各個專業的培養目標、就業路徑、研究方向、課程設置等方面進行全面調查,調查時間為2017年9月與12月 (所調研的中美LIS院校名單見表1)。
本文對中美LIS教育機構數據素養開展現狀的分析擬從專業設置、培養意識以及培養力度三方面入手。數據素養培養意識是指LIS院系在對教學計劃的設計中關注到數據素養的重要性從而開展針對性教育,主要從其培養目標以及研究方向/培養路徑中得以體現。數據素養培養力度則是指LIS院系在實際教學活動中對數據素養培育的開展情況,可以從數據素養相關課程的覆蓋面、相關教學內容的深淺等方面體現。
設置數據素養相關的學位項目是LIS院系開展數據素養教育的重要形式。在本次調研的美國LIS院系中已有5所大學開設了9個獨立的數據科學或數據管理專業項目,并有17個項目設置了與數據高度相關的研究方向或培養路徑,其中既有本科、碩士等學位項目,也有碩士后項目以及靈活的認證教育項目,其中不少碩士項目及認證項目都支持在線遠程教學,培養形式多樣。總體來看,與數據相關的教育項目約占所有項目的72%。

表1 調研的中美26所LIS教育機構名單
國內LIS院系數據素養教育起步較晚,調查發現在國內13所LIS院系中獨立的“數據管理”或“數據科學”學位項目僅有武漢大學擬設的“數據科學”專業,招收碩士與博士研究生,相近的獨立學位項目還有中國人民大學的“信息分析”專業,課程設置與數據分析聯系緊密,以及華東師范大學自設的“商業分析”專業,以商業數據采集、數據存儲、數據分析、數據展現、數據利用為核心內容。國內另有5個學位項目設置了與數據高度相關的方向,如南京大學情報學碩士的研究方向設有 “數據科學技術”方向??傮w來看,國內LIS教育機構設立的與數據相關的教育項目數量較小,占比僅為11.4%,與美國相比差距較大,且培養層次集中在碩士教育階段,培養方式較為單一。從中得出中美LIS教育機構與數據相關的教育項目列表(見表2)。
筆者從各項目的培養目標以及研究方向/培養路徑的設定兩方面入手,分析當前中美LIS教育對數據素養培養的意識強弱情況。
3.2.1 培養目標分析
培養目標是人才培養整體思路的體現,對其進行解讀可以了解院系對學科動態以及社會環境變化的敏感度。筆者通過對上述LIS教育機構培養目標的分析,發現美國大部分LIS院系均針對大數據環境對培養目標進行了調整,面向各行業的數據崗位培養學生的數據知識與能力,而國內則鮮有LIS院系做出改變,數據素養培養調整意識較低。
(1)從LIS院系定位的就業方向來看,國內大部分院系將就業目標定為各類信息服務機構與企事業單位的信息部門,從事信息管理與信息服務相關工作,并沒有明確提到不斷涌現的各類大數據機構。僅有中國人民大學的信息資源管理專業在其畢業生的求職方向中提到“各類單位的信息中心、數據中心以及數據管理企業”,率先意識到就業市場對數據型人才的巨大需求。而在所調研的36個美國LIS教育項目中,有34個項目將適應廣泛的行業領域的數據崗位作為培養目標,其定位既包括圖書館、檔案館等信息機構,政府與非盈利組織,也包括醫療、科學及商業組織,涉及數據服務館員、數據科學家、數據架構師、數據分析師、數據安全管理等豐富的數據相關崗位。
(2)從知識能力要求來看,雖然針對數據素養作出調整的國內機構數量遠小于美國,但是兩者都以培養數據應用型人才為主,注重學生數據知識、數據能力與職業技能的全面培養,如華東師范大學要求培養“具有堅實的數據和組織管理基礎理論知識,并能將數據管理理論、方法和技術應用于實踐的高級專門人才”;中國人民大學則要求學生“掌握數據資源管理原理與方法技術,能勝任數據組織、定位、加工、存儲、檢索、處置和挖掘應用等工作”;伊利諾伊大學要求學生 “對數據有強烈的理論和技術理解”;雪城大學要求學生能夠 “將數據科學應用于組織運營和流程,并根據數據來進行決策”,并“在數據管理和分析中遵守隱私和道德原則”。

表2 中美LIS教育機構與數據相關的教育項目列表
3.2.2 研究方向分析
本次調研共搜集了國內11所院校共計159個研究方向,由于國內大部分研究方向是復合的,筆者對其進行了拆分,如“知識組織與信息檢索”拆分為“知識組織”與“信息檢索”兩項,拆分后共獲得252項,另獲取了美國13所院校共計210項研究方向/培養路徑。隨后,筆者通過分析各個研究方向的主要研究對象來理解研究方向與數據主題的整體相關程度,得出統計結果(見表3)。其中“其他”類的研究方向主要為相關學科、組織管理與環境、包含多種基本概念的理論研究等。

表3 中美LIS教育機構研究方向的研究對象統計
由統計可以看到,國內以信息作為研究對象專門開設的研究方向占比最大的為38.5%,如果將文獻、情報、信息資源、知識包含在信息范圍內,那么信息的占比將達到65%,以數據作為研究對象的研究方向則僅占比6%。因此從整體來看,在LIS教育中涉及數據的內容較少。而美國以數據為核心研究對象的研究方向占比達到21%,遠高于國內的比例,說明美國LIS院系更為重視針對數據的專門研究以及對數據人才的培養。
從具體的研究方向來看,武漢大學和中國人民大學設置的“數據科學”方向比較全面地涵蓋了數據素養教育的內容,其他涉及數據的研究方向主要是數據分析與挖掘、數據管理、數據安全、數據開放,僅僅是包含數據素養教育的某一方面。而美國LIS院系有三分之一的項目均設置了“數據科學”研究方向,更加注重數據素養的全面培養。
本研究通過調研中美LIS院系在數據素養教育課程的開設情況,來分析當前中美LIS教育機構的數據素養培養力度。本次調研通過網絡調查收集了中美26所LIS院系開設的數據素養培育相關課程,篩選標準為教學內容部分與數據科學、數據監護、數據管理等相關課程,最終收集國內課程共243門,美國課程499門。為了便于分析,從兩個維度對這些課程進行歸類,一是教學內容的主題,依據前述數據素養教育的內容分為數據知識、數據收集、數據解釋與評估、數據管理、數據應用等五個方面;二是教學內容的數據化程度,參考Varvel等2012年對美國LIS院校數據相關課程開設情況的調研,將課程內容的數據化程度劃分為四類(見表4),分別是:
(1)以數據為中心的課程:專注于數據監護、數據管理或數據科學主題;
(2)包含數據的課程:教學內容部分與數據主題相關,對數據部分具有明確的定義;
(3)數字化課程:沒有明確的數據專業知識,但包含與數據專業教育高度相關的數字化主題,通常側重于數字圖書館的發展,如數字保存、數字資源與服務;
(4)傳統課程:長期在LIS課程中教授的內容,內容通常是介紹在前兩種課程中進一步發展的重要課題。
3.3.1 教學內容的主題分布情況
從教學內容的主題來看,中美LIS教育機構將數據素養的教育重點均集中在“數據解釋與評估“以及“數據管理“兩部分,相關的課程主要有數據挖掘、數據可視化、科學數據管理、數據庫原理與技術等,國內這兩項主題的課程占比高達74.5%,美國則達到61.6%,這是由于這兩項是數據素養中的核心部分,最直接地與數據技術掛鉤,在實踐中運用最為廣泛,兩者的高占比也在一定程度上體現了中美LIS教育機構數據人才培養的實踐導向。國內LIS機構對于“數據解釋與評估”的教學最為重視,以上13所國內院系全部開設了數據分析類相關課程,并且以數據為中心或包含數據部分的課程達到66%,可見國內LIS機構能在一定程度上意識到數據素養教育的重要性,并落實到教學實踐中。但同時我們需要關注到課程主題分布的不均衡問題,中美LIS教育機構開設的數據收集與數據應用類課程數量少,覆蓋面小,并且相關課程均以傳統類課程為主,涉及的數據教學內容量少而淺顯。細化到單個機構的教學主題來看,美國13所院系中有12所院系開設的課程覆蓋以上五個主題(見圖1),而國內只有4所院系達到要求,從圖中亦可發現國內的不均衡性更甚于美國,這種教學主題的不均衡性易導致學生出現數據知識與技能的短板。
3.3.2 教學內容的數據化程度分析
美國LIS院校開設的數據素養相關課程中,以數據為中心開展教學的課程比例最高,占比達到32.1%,以數據為中心或包含數據單元的課程占比則達到53.1%。國內LIS院系開設的課程中占比最高的為數字化類課程,主要為數字資源管理方向,以數據為中心或包含數據單元的課程占比則為39.5%(見圖2),上述13所國內院系均開設有專門的數據相關課程,說明從整體來看國內LIS院系在數據素養教育實踐方面有了初步的進展,但從課程的數量以及教學內容的數據化程度來看,與美國相比仍存在一定差距。

表4 中美LIS院系數據素養課程設置情況統計表
另外,值得關注的是武漢大學、中國人民大學、華東師范大學開設的數據相關課程中,以數據為中心的課程占比達到35%以上,課程的數據化程度較高,表明這些院系開始注重學生數據素養的培養,這也與其數據相關獨立學位的設立關聯密切。以上三所院系分別設置了 “數據科學”“信息分析”“商業分析”等三項獨立的數據學位項目,在培養目標中明確地對學生的數據素養提出要求,并圍繞數據設置了較為系統、深入的課程體系以全面地提升學生的數據素養,由此也可看出獨立學位項目的設置對數據素養教育強大的推動力。

圖1 數據素養相關課程教學內容主題分布統計圖

圖2 不同數據化程度數據素養課程數量統計圖
通過分析發現,國內LIS教育開展數據素養教育與美國相比還存在一定的差距。針對存在問題并結合中美LIS教育機構目前的數據素養教育建設情況,筆者對國內LIS教育機構開展數據素養教育提出三點建議。
通過調查可知,目前國內的數據素養教育尚未獲得足夠的重視,整體上培養意識弱,開展力度小,而美國發展更為成熟,已出現一定數量的數據科學的獨立學位項目,并且已經形成了本科、碩士學位教育和認證培訓三個層次的數據專業教育。這與國內數據素養教育在LIS教育中的定位尚未明確有關,國內LIS教育中獨立的數據素養培養項目較少,大部分院系將數據素養相關課程放在圖書館學、情報學專業下,課程設置較分散。這種依附于其他專業的培養模式固然拓展了LIS專業學生的知識結構與專業能力,但是這也意味著LIS教育缺乏明確而獨立的數據人才培養目標,對LIS學生的數據素養要求也不明確,也就難以有針對性地確定培養方式,無法形成獨立、系統的課程體系。
針對該問題,首先應從專業——行業——就業三個環節入手,開展國內LIS專業學生數據素養需求調查,了解LIS學科中不同層次、不同專業師生與科研人員的數據素養培養要求,了解圖書館、檔案館等信息機構對LIS專業人才的數據素養要求,明確更為廣泛的就業市場中對高等教育人才數據素養的需求情況,從而明確我國LIS專業數據人才培養目標、知識結構以及培養重點;其次,借鑒美國等在LIS學科中數據素養培養體系較為完善的國家,參考其對數據科學、數據管理等學科的建設,找到適合國內LIS院系的專業設置方案,既可設立獨立的數據科學項目,如雪城大學信息研究學院等院系設立了應用數據科學、企業數據系統等多種數據碩士項目;也可結合校內外相關學科的發展情況,與其他機構合作開展跨學科培養,如卡內基梅隆大學的數據科學教育結合了統計學、信息科學、工商管理等專業。
在同一學科領域內不同層次人員的數據素養要求不盡相同,學科的科研人員與相關行業的從業人員對數據素養的要求也不一樣,因此在LIS教育內部需要注重不同層次數據人才的培養,也要注意面向學術研究以及面向就業的區別教育。目前國內LIS教育機構的數據素養培養模式較為單一,在碩士研究方向中真正以數據作為研究對象的僅占比6%,可見即使對研究生的數據素養要求更高,對其數據素養培養的力度也不強,而類似于美國的主要面向在職人士的認證類數據素養教育也尚未設立,難以滿足LIS學生數據素養教育的要求。另外,目前國內LIS教育機構將數據素養教育的重點放在對數據的分析與處理技能的培養上,相關課程比重達到41%,而數據知識、數據收集、數據應用的課程總占比僅為25%,對教學內容的過度傾斜不利于學生養成全面的數據素養。
針對以上問題,國內LIS教育機構需要從教育對象、教育形式、教學內容等方面構建多維LIS數據素養體系。首先,數據素養教育需要根據教育對象的層次開展教育,如與本科生相比,研究生需要深入參與科研活動,其數據素養教育更需要專、精、深,更要結合科研數據生命周期來進行教育。另外還可借鑒雪城大學開設數據素養認證教育,來靈活滿足工作人士數據職業能力培養的要求;其次,完善國內LIS數據素養教育體系需要經歷循序漸進的過程,即數據素養教育的覆蓋面需要逐步擴大、教育內容的深度需要逐漸遞增,這意味著在相當長的發展階段里,各種形式的數據素養教育需要并存,也應當鼓勵數據素養教育形式的多樣化發展,如設立獨立學科、設立獨立的研究方向、開設獨立的數據素養教育課程、融入信息素養教育、嵌入科研過程的教育、開設MOOC等形式;最后,從教學內容來看,目前國內LIS機構的數據素養教育偏重于數據技術的教學,而在大數據時代LIS教育應當從數據驅動的技術自覺向數據驅動的文化自覺和教育自覺轉變,教學內容需要以數據意識的教育為重點并全方位覆蓋數據素養的要求。
數據產生于各行各業,分布范圍廣泛,涉及的學科專業復雜多樣,數據素養具有的應用性決定了其培養方式的實踐性和跨學科性,并且數據素養在不同學科也有不同的表現形式。因此數據素養的培育不能局限在LIS學科內,要求對其他相關學科以及相關行業持開放合作的態度。目前國內教學內容多局限在信息科學領域內,除了武漢大學信息管理學院擬與該校計算機科學合作開設的數據科學專業外,其他尚未出現跨學科學院合作培養數據人才的案例,因此在數據素養教育方面LIS教育機構亟需加強與其他機構的合作。
圖書館是開展數據管理服務和數據素養教育的最佳主體,對與圖書館聯系緊密的LIS學科來說,高校圖書館無疑是數據素養教育的最佳合作對象,兩者的合作路徑主要由以下兩條:首先,高校圖書館的數據管理服務越來越普遍,部分高校圖書館已經開設了數據實驗室,這為LIS專業學生提供了合適的數據素養教育實踐基地;其次,LIS院校注重培養具備LIS專業知識的高層次數據人才,而高校圖書館也在逐步開展面向師生的數據素養教育以及面向學科的數據素養教育,這使得兩者在教學任務上產生契合點,可合作開展嵌入式教育,LIS院??商峁熧Y力量,圖書館則可為課程提供各類教學資料,如密歇根大學信息學院與該校圖書館聯合申報,獲得了IMLS的資助項目“支持圖書館員將數據素養技巧增加到數據素養教育中”。除了圖書館,LIS教育院系還可以與數據相關的企業進行合作,重視數據素養的實踐教學,提高學生實踐能力與就業競爭力,亦可與相關學科進行跨學科培養,如計算機科學、統計學等,培養具有多學科背景的數據人才。如華盛頓大學信息學院與校內的應用數學、生物統計學、計算機科學與工程、以人為本的設計與工程以及統計學五個專業聯合提供數據科學碩士項目,全面的跨學科課程由以上六個院系以及有意向招聘數據科學專業人員的頂級公司共同合作開發,兼顧數據人才培養的跨學科性以及實踐性的特點。
參考文獻:
[1]葉鷹,馬費成.數據科學興起及其與信息科學的關聯[J].情報學報,2015,34(6):575-580.
[2]鄭彥寧,化柏林.數據、信息、知識與情報轉化關系的探討[J].情報理論與實踐,2011,34(7):1-4.
[3]Calzada Prado J,Marzal Má.Incorporating data literacy into information literacy programs:Core competencies and contents[J].Libri,2013,63(2):123-134.
[4]Hogenboom K,Phillips C M H,Hensley M K.Show me thedata!Partnering with instructors to teach data literacy[EB/OL].[2017-11-30].https://www.ideals.illinois.edu/bitstream/handle/2142/73409/ShowMeTheData_2011.pdf?sequence=2&isAllowed=y.
[5]胡卉,吳鳴.面向不同參與主體的國內外數據素養教育現狀研究[J].數字圖書館論壇,2016(9):61-67.
[6]UK Data Archive.RESEARCH DATA LIFECYCLE[EB/OL].[2017-09-23].http://www.data-archive.ac.uk/create-manage/life-cycle.
[7]武漢大學.數據科學自主設置交叉學科論證方案[EB/OL].[2017-09-22].http://www.chinadegrees.cn/xwyyjsjyxx/gs/zsejxkgs/gsnr/?curpager=1&zsxkId=56450.
[8]華東師范大學信息管理系.商業分析[EB/OL].[2017-09-22].http://coe.ecnu.edu.cn/html/1/53/56/index.html.
[9]中國人民大學信息資源管理學院.人才培養-學士教育[EB/OL].[2017-09-17].http://irm.ruc.edu.cn/more.php?cid=234.
[10]School of Information Sciences of University of Illinois at Urbana-Champaign.MS in Information Management[EB/OL].[2017-12-04].http://ischool.illinoi s.edu/academics/degrees/msim.
[11]School of Information Studies of Syracuse University.Enterprise Data Systemsat The i School[EB/OL].[2017-12-04].https://ischool.syr.edu/academics/gr aduate/masters-degrees/ms-in-enterprise-data-systems/.
[12]Varvel Jr V E,Bammerlin E J,Palmer C L.Education for data professionals:A study of current courses and programs[C].Proceedings of the 2012 iConference.ACM,2012:527-529.
[13]王世偉.數據驅動的時代特征與圖情教育的創新轉型[J].圖書情報知識,2016(1):15-20.
[14]黃如花,李白楊.數據素養教育:大數據時代信息素養教育的拓展[J].圖書情報知識,2016(1):21-29.
[15]UW Continuum College.Master of Science in Data Science[EB/OL].[2017-12-15].https://www.datasciencemasters.uw.edu/.