余維杰,陳思琪,陳 序(中山大學資訊管理學院)
“數(shù)據(jù)素養(yǎng)”(Data Literacy),也稱“數(shù)據(jù)信息素養(yǎng)”(Data Information Literacy),其概念最早起源于國外,由信息素養(yǎng)引申、細化而來。數(shù)據(jù)素養(yǎng)是指在科學數(shù)據(jù)的采集、組織和管理、處理和分析、共享與協(xié)同創(chuàng)新利用等方面的能力,以及在數(shù)據(jù)的生產(chǎn)、管理和發(fā)布過程中的道德與行為規(guī)范。[1]與信息素養(yǎng)相比,它更側(cè)重于數(shù)據(jù)的生產(chǎn)、保存與管理等技術性強的方面,測度體系也更關注對結果的評價。[2]
數(shù)據(jù)素養(yǎng)的重要性日益顯著,業(yè)界對其重視程度也越來越高,數(shù)據(jù)素養(yǎng)在學術領域的研究成果不斷涌現(xiàn),研究熱度也不斷上升。早在2001年,英國學者大衛(wèi)·鮑登(Bawden David)發(fā)表了關于信息和圖書館領域中用詞研究的文獻。[3]隨后,以數(shù)據(jù)素養(yǎng)為研究主題的學術文獻不斷涌現(xiàn),這些研究成果主要圍繞用戶數(shù)據(jù)行為、數(shù)據(jù)素養(yǎng)與圖書館領域的關系、數(shù)據(jù)素養(yǎng)與醫(yī)療健康領域的關系、數(shù)據(jù)素養(yǎng)的培養(yǎng)等主題展開討論。但是,這些研究成果基本上都側(cè)重于對某一主題的深入探討,只有少數(shù)成果涉及對數(shù)據(jù)素養(yǎng)研究進行整體的評述和分析。
在我國,最早的數(shù)據(jù)素養(yǎng)研究論文是2011年發(fā)表的《論物理教育中數(shù)據(jù)素養(yǎng)的培養(yǎng)》,文章深入探討了信息時代中數(shù)據(jù)素養(yǎng)和物理教學的關系。[4]隨后,數(shù)據(jù)素養(yǎng)受到學者越來越多的關注。從目前的研究成果來看,我國對數(shù)據(jù)素養(yǎng)領域的研究分析更側(cè)重對數(shù)據(jù)素養(yǎng)的內(nèi)涵、構成要素的分析,對用戶數(shù)據(jù)素養(yǎng)的培養(yǎng)探討,以及對數(shù)據(jù)素養(yǎng)與圖書館的關系探討,[5]它們都側(cè)重于對某一主題的數(shù)據(jù)素養(yǎng)研究進行定性的解讀剖析。在國內(nèi)眾多數(shù)據(jù)素養(yǎng)領域的研究成果中,只有少數(shù)研究成果是從定量的角度進行剖析與解讀,數(shù)據(jù)素養(yǎng)研究的定量分析存在較大空缺。
因此,本文采用文獻計量法,對國內(nèi)外數(shù)據(jù)素養(yǎng)領域內(nèi)文獻進行統(tǒng)計分析和比較研究,從定量和定性雙重角度總結其成果和研究態(tài)勢,為數(shù)據(jù)素養(yǎng)領域更深層次的應用研究提供參考。
在國內(nèi)文獻數(shù)據(jù)方面,文章以CNKI(中國知網(wǎng))數(shù)據(jù)庫為數(shù)據(jù)來源。檢索式為:(關鍵詞=“數(shù)據(jù)素養(yǎng)”or“數(shù)據(jù)信息素養(yǎng)”)or(題名=“數(shù)據(jù)素養(yǎng)”or“數(shù)據(jù)信息素養(yǎng)”)or(主題=“數(shù)據(jù)素養(yǎng)”or“數(shù)據(jù)信息素養(yǎng)”),進行精確匹配檢索,時間跨度為2018年及以前,一共檢索到文獻503篇。經(jīng)刪除重復、通知、簡訊、報導等非學術文獻以及與主題弱相關的文章,最終得到有效樣本文獻462篇。將這462篇文獻的題錄數(shù)據(jù)以EndNote格式和Excel格式導出,為后續(xù)的數(shù)據(jù)分析研究做準備。
在國外文獻數(shù)據(jù)方面,以WebofScience的SCI-E和SSCI作為數(shù)據(jù)來源。檢索式為Topic=(“Data Liter acy” or(Data and“ Information Literacy”) or Title=(“Data Literacy”or(Data and“Information Literacy”)),檢索語種為英語,最終得到有效樣文文獻473篇。
文獻計量法是從定量的角度出發(fā),對文獻體系和文獻計量特征進行分析的研究方法。其分析對象主要有文獻數(shù)量、作者分布、期刊分布等外部特征和關鍵詞分布等內(nèi)容特征。本文主要采用文獻增長規(guī)律分析、來源期刊載文情況分析、作者發(fā)文情況分析和關鍵詞分析,借助 Excel、文獻題錄分析工具SATI、SPSS和UCINET等統(tǒng)計工具,對數(shù)據(jù)素養(yǎng)領域的研究現(xiàn)狀和發(fā)展趨勢進行定量研究。
文獻增長規(guī)律能在一定程度上反映出某個研究領域的發(fā)展狀況。文獻邏輯增長模型提出文獻增長包括三個階段:早期階段呈指數(shù)增長;中期階段增長率開始變小,出現(xiàn)轉(zhuǎn)折點;后期文獻累積量增加緩慢并且趨于一個極限值。[6]
從圖1可以看出,我國數(shù)據(jù)素養(yǎng)領域的相關研究始于2011年,隨后發(fā)文量呈現(xiàn)逐年快速增長趨勢,截至2018年底,已有462篇公開發(fā)表的文獻。根據(jù)文獻計量學理論中的文獻指數(shù)增長規(guī)律,對2011-2018年CNKI收錄的數(shù)據(jù)素養(yǎng)領域研究的累積發(fā)文量進行曲線擬合,發(fā)現(xiàn)可用指數(shù)函數(shù)y=1.8812e0.7309x擬合,決定系數(shù)R2的值為0.9857,表明此函數(shù)曲線可描述累積發(fā)文量隨時間增長的情況。從擬合曲線走勢來看,我國的數(shù)據(jù)素養(yǎng)研究文獻現(xiàn)處于早期的增長階段,尚未到達文獻邏輯增長模型中的增長率減小階段。由此可知,未來國內(nèi)學者對數(shù)據(jù)素養(yǎng)領域的研究熱度依然會呈上升趨勢。

圖1 CNKI收錄的數(shù)據(jù)素養(yǎng)研究文獻的年代分布
圖2 是國外數(shù)據(jù)素養(yǎng)研究文獻的年代分布,早在2001年就有國外學者發(fā)表了關于信息和圖書館領域用詞研究的文章,[3]隨后4年的發(fā)文量都為個位數(shù),增長較為緩慢??傮w來看,國外數(shù)據(jù)素養(yǎng)領域的研究呈現(xiàn)出一直平穩(wěn)增長的趨勢,并沒有出現(xiàn)類似我國發(fā)文量快速增長的情況。此外,國外數(shù)據(jù)素養(yǎng)研究文獻與文獻指數(shù)增長模型或文獻邏輯增長模型的符合度較低,無法用指數(shù)函數(shù)曲線擬合分析。但發(fā)現(xiàn)其更符合冪函數(shù)的曲線特點,可用冪函數(shù)y=0.8816x2.1343擬合,決定系數(shù)R2的值為0.9943。從圖2呈現(xiàn)的數(shù)據(jù)節(jié)點分析,國外學者對數(shù)據(jù)素養(yǎng)領域研究的熱度呈現(xiàn)階段性變化,2008年、2009年、2013年、2017年的發(fā)文量均分別比其前一年的發(fā)文量低,但隨后會出現(xiàn)小幅度的增長。由此可以推測,國外數(shù)據(jù)素養(yǎng)領域研究的文獻數(shù)量每4年或5年為一個增長階段,每一個階段內(nèi)呈現(xiàn)先逐步增長再有所下降的態(tài)勢,而階段之間呈現(xiàn)總體增長態(tài)勢。
通過對某領域?qū)W術文獻的來源期刊進行分析,可以掌握該領域的核心期刊,了解該領域的空間分布特點。

圖2 SCI-E、SSCI收錄的數(shù)據(jù)素養(yǎng)研究文獻的年代分布
經(jīng)統(tǒng)計發(fā)現(xiàn),國內(nèi)關于數(shù)據(jù)素養(yǎng)研究的462篇文獻分布在245種期刊中,平均每種期刊刊載文獻1.89篇。在這245種期刊中,發(fā)表1篇文獻的有174種,發(fā)表2篇的有36種,發(fā)表3篇的有9種,發(fā)表4篇的有7種,發(fā)表5篇及以上的共有19種。而國外關于數(shù)據(jù)素養(yǎng)研究的473篇文獻分布在145種期刊中,平均每種期刊刊載文獻3.26篇。在這145種期刊中,發(fā)表1篇文獻的有92種,發(fā)表2篇的有19種,發(fā)表3篇的有9種,發(fā)表4篇的有1種,發(fā)表5篇及以上的共有24種。表1為國內(nèi)外數(shù)據(jù)素養(yǎng)領域載文量最多的前12種期刊,綜合對比來看,國外數(shù)據(jù)素養(yǎng)領域期刊的刊均發(fā)文量更高,原因是數(shù)據(jù)素養(yǎng)研究起源于國外,且國外研究的時間更長。

表1 國內(nèi)外發(fā)文量排名前12的期刊及載文量
文獻計量學中的布拉德福分散定律描述了科技論文在期刊中的分布規(guī)律,運用此定律,結合本研究的樣本數(shù)量,將來源期刊按照其刊載的文獻數(shù)量進行降序排列,并且劃分出4個區(qū)域(核心區(qū)、相關區(qū)、弱相關區(qū)、非相關區(qū)),使每個區(qū)內(nèi)期刊載文量約為全部期刊載文量的1/4,并且盡量使核心區(qū)、相關區(qū)、弱相關區(qū)、非相關區(qū)含有的期刊數(shù)量滿足1:n:n2:n3的比例關系。[7]表2為中英文期刊進行區(qū)域劃分后的結果??梢姡瑹o論是中文文獻還是英文文獻,布拉德福常數(shù)n僅對于前三個區(qū)域的描述程度較高,說明依據(jù)布拉德福定律能較為準確的得出刊載數(shù)據(jù)素養(yǎng)領域研究文獻的核心區(qū)期刊。從表2還可以看出,與國內(nèi)相比,國外數(shù)據(jù)素養(yǎng)領域的文獻更明顯地集中在少數(shù)期刊中,形成的核心區(qū)期刊群更穩(wěn)定,進一步體現(xiàn)出國外的數(shù)據(jù)素養(yǎng)領域研究更成熟。

表2 中英文期刊區(qū)域分析法劃分
洛特卡定律描述了科學工作者和科學論文產(chǎn)量之間的數(shù)學規(guī)律,核心思想可表述為:發(fā)表x篇文章的作者數(shù)量是發(fā)表1篇文章作者數(shù)量的1/x2,且發(fā)表1篇文章的作者數(shù)是全體作者的60%左右。[8]利用此規(guī)律可以對某領域的作者發(fā)文情況進行分析。
表3展示了國內(nèi)外數(shù)據(jù)素養(yǎng)領域作者發(fā)文量的情況。經(jīng)統(tǒng)計,國內(nèi)的462篇文獻共涉及572位作者,其中發(fā)文量1篇的作者有484人,占作者總數(shù)的84.62%;發(fā)文量2篇的作者有57人,約為發(fā)文1篇作者數(shù)的11.78%;發(fā)文量3篇的作者有16人,約為發(fā)文1篇作者數(shù)的3.31%。而國外的473篇數(shù)據(jù)素養(yǎng)文獻共涉及1,052位作者,其中發(fā)文量1篇的作者有950人,占作者總數(shù)的90.30%;發(fā)文量2篇的作者有59人,約為發(fā)文1篇作者數(shù)的6.21%;發(fā)文量3篇的作者有25人,約為發(fā)文1篇作者數(shù)的2.63%。

表3 作者發(fā)文量統(tǒng)計
綜合對比來看,國內(nèi)外數(shù)據(jù)素養(yǎng)領域發(fā)表1篇文章的作者為絕大多數(shù),都超過作者總數(shù)的80%,遠高于洛特卡定律中提出的60%。由此表明,國內(nèi)外數(shù)據(jù)素養(yǎng)領域研究的發(fā)展處于上升階段,核心作者群還未形成。此外,國內(nèi)數(shù)據(jù)素養(yǎng)領域每篇文獻平均約由1.24位作者完成,國外數(shù)據(jù)素養(yǎng)領域每篇文獻平均約由2.22位作者完成,說明在數(shù)據(jù)素養(yǎng)領域,國外論文合著情況較國內(nèi)更顯著。
表4列舉了國內(nèi)外數(shù)據(jù)素養(yǎng)領域主要發(fā)文作者的發(fā)文量及其所屬單位,可以看出,無論是國內(nèi)還是國外,大學學者都是數(shù)據(jù)素養(yǎng)領域研究的主力軍。

表4 國內(nèi)外主要發(fā)文作者所屬單位及發(fā)文量
研究將收集到的文獻題錄信息導入SATI,提取文章的關鍵詞并且進行關鍵詞詞頻統(tǒng)計。詞頻按從高到低排序,從中文文獻中截取詞頻大于7的關鍵詞,得到23個高頻關鍵詞(見表5);從英文文獻中截取詞頻大于6的關鍵詞,得到25個高頻關鍵詞(見表6)。

表5 國內(nèi)數(shù)據(jù)素養(yǎng)研究高頻關鍵詞(詞頻>7)

表6 國外數(shù)據(jù)素養(yǎng)研究高頻關鍵詞(詞頻>6)
為了后續(xù)進行因子分析、系統(tǒng)聚類分析以及社會網(wǎng)絡分析,把獲取到的中文和英文文獻題錄信息分別導入SATI,利用其直接生成矩陣,分別得到國內(nèi)外數(shù)據(jù)素養(yǎng)研究的高頻關鍵詞共詞矩陣、高頻關鍵詞相關矩陣、高頻關鍵詞相異矩陣。
3.4.1 因子分析
因子分析是一種在變量中找出隱藏的具有代表性因子的統(tǒng)計分析方法,目的是用盡可能少的因子描述眾多指標間的聯(lián)系,基本思想是把研究對象變量分組,使同組內(nèi)的變量相關性較高,不同組的變量相關性較低。[9]
將生成的高頻詞相關矩陣導入SPSS,選擇主成分法、協(xié)方差矩陣、最大平衡值法對其進行因子分析,得到因子數(shù)和涵蓋的信息量表,以及各因子成分。結合本次分析的樣本數(shù)量,參考統(tǒng)計學慣例,規(guī)定在本次分析中旋轉(zhuǎn)后因子的絕對值大于0.5才被接受。
根據(jù)分析結果,從23個中文高頻關鍵詞中提取出10個因子,它們能解釋全部信息的50.287%。由表7可知,第一個因子主要解釋了數(shù)據(jù)素養(yǎng)和大數(shù)據(jù),第二個因子主要解釋了高校圖書館和信息素養(yǎng),第三個因子主要解釋了數(shù)據(jù)素養(yǎng)教育和科學數(shù)據(jù),第四個因子主要解釋了MOOC和信息素養(yǎng)教育,第五個因子主要解釋了科研數(shù)據(jù)管理,第六個因子主要解釋了圖書館和互聯(lián)網(wǎng)+,第七個因子主要解釋了數(shù)據(jù)分析和科學數(shù)據(jù)素養(yǎng),第八個因子主要解釋了教育大數(shù)據(jù)和數(shù)據(jù)管理,第九、第十個因子分別解釋了大數(shù)據(jù)時代和教師專業(yè)發(fā)展。
從25個英文高頻關鍵詞中提取出10個因子,它們能解釋全部信息的50.050%。由表8可知,第一個因子主要解釋了信息和素養(yǎng),第二個因子主要解釋了行為和信息搜尋,第三個因子主要解釋了學生和學習,第四個因子主要解釋了信息檢索和情報研究,第五個因子主要解釋了循證實踐和護士,第六個因子主要解釋了學術圖書館和圖書館員,第七個因子主要解釋了教育,第八個因子主要解釋了圖書館和尼日利亞,第九個因子主要解釋了數(shù)據(jù)素養(yǎng)和健康素養(yǎng),第十個因子主要解釋了研究。
中文高頻關鍵詞的因子分析結果顯示,提取到的10個因子中,存在過半的因子主要解釋了數(shù)據(jù)素養(yǎng)領域教育方面的問題,每個因子之間相關性較高,可見我國當前數(shù)據(jù)素養(yǎng)的研究熱點集中于此。此外,通過第二個因子的解釋,可以看出圖書館,尤其是高校圖書館與用戶的數(shù)據(jù)素養(yǎng)培養(yǎng)密切相關。而通過對英文高頻關鍵詞的因子分析可發(fā)現(xiàn),提取到的10個因子里,同組因子內(nèi)關鍵詞相關性較高,不同組因子之間相關性較低??傮w來看,國外數(shù)據(jù)素養(yǎng)領域的研究范圍較我國更分散,主要分布在圖書館職能與角色、與數(shù)據(jù)相關的行為、校內(nèi)教學、在線學習等方面。

表7 國內(nèi)數(shù)據(jù)素養(yǎng)研究高頻關鍵詞旋轉(zhuǎn)成分矩陣

表8 國外數(shù)據(jù)素養(yǎng)研究高頻關鍵詞旋轉(zhuǎn)成分矩陣
3.4.2 系統(tǒng)聚類分析
系統(tǒng)聚類分析能夠利用高頻關鍵詞反映某學科或主題的研究熱點,定量反映出詞與詞之間的親疏關系,進而反映這些詞所代表的主題內(nèi)容的結構。[10]
本研究將生成的中英文高頻詞相異矩陣分別導入SPSS,選擇組內(nèi)連接法,采用Minkowski距離對其進行系統(tǒng)距離分析,分別得到中文高頻詞聚類樹狀圖(圖3)和英文高頻詞樹狀圖(圖4)。

圖3 國內(nèi)數(shù)據(jù)素養(yǎng)研究的高頻關鍵詞系統(tǒng)聚類樹狀圖

圖4 國外數(shù)據(jù)素養(yǎng)研究的高頻關鍵詞系統(tǒng)聚類樹狀圖
從圖3可以看出,在數(shù)據(jù)素養(yǎng)領域,國內(nèi)數(shù)據(jù)素養(yǎng)研究文獻的23個高頻關鍵詞可聚為4類。第1類:數(shù)據(jù)素養(yǎng)、大數(shù)據(jù)、信息素養(yǎng)、圖書館、教育、MOOC、大數(shù)據(jù)時代、圖書館員、信息素養(yǎng)教育、高校教師、數(shù)據(jù)新聞;第2類:教育大數(shù)據(jù)、教師專業(yè)發(fā)展;第3類:科學數(shù)據(jù)、素養(yǎng)教育、數(shù)據(jù)管理、高校;第4類:高校圖書館、數(shù)據(jù)素養(yǎng)教育、科研數(shù)據(jù)管理、科學數(shù)據(jù)素養(yǎng)、互聯(lián)網(wǎng)+、數(shù)據(jù)分析。根據(jù)系統(tǒng)聚類結果可以發(fā)現(xiàn),隨著大數(shù)據(jù)時代的到來,對數(shù)據(jù)素養(yǎng)提出了更高的要求,并且主要集中在教育方面,尤其是針對高校師生以及科研人員的數(shù)據(jù)素養(yǎng)培養(yǎng)。此外,圖書館與數(shù)據(jù)素養(yǎng)也呈現(xiàn)出緊密關系,圖書館在培養(yǎng)用戶數(shù)據(jù)素養(yǎng)中起著非常重要的作用,也承擔著相應的職責。在大數(shù)據(jù)時代,提升數(shù)據(jù)素養(yǎng)不僅是對高校師生及科研人員提出的要求,也是對圖書館員、新聞工作者提出的要求,大數(shù)據(jù)已經(jīng)全面滲透到各個行業(yè)、各個領域,數(shù)據(jù)素養(yǎng)是每個企業(yè)甚至每個員工應該具備的一種專業(yè)素養(yǎng)。
從圖4可以看出,國外數(shù)據(jù)素養(yǎng)領域研究文獻的25個高頻關鍵詞可聚為4類。第1類:信息、素養(yǎng)、評定、因特網(wǎng)、研究;第2類:圖書館、尼日利亞、學術圖書館、圖書館員、高校圖書館、高等教育、數(shù)據(jù)素養(yǎng);第3類:學生、學習、信息檢索、情報研究、高中、健康素養(yǎng);第4類:循證實踐、護士、在線學習、信息搜尋、行為、信息素養(yǎng)、教育。根據(jù)系統(tǒng)聚類結果不難發(fā)現(xiàn),國外數(shù)據(jù)素養(yǎng)領域研究,主要集中于用戶數(shù)據(jù)行為、數(shù)據(jù)素養(yǎng)與圖書館領域的關系、數(shù)據(jù)素養(yǎng)的培養(yǎng)等方面??梢妶D書館以及學校都在培養(yǎng)用戶數(shù)據(jù)素養(yǎng)的過程中擔任非常重要的角色。此外,醫(yī)療健康領域也強調(diào)了數(shù)據(jù)素養(yǎng)的重要性。
對比國內(nèi)外數(shù)據(jù)素養(yǎng)領域的高頻關鍵詞聚類結果,發(fā)現(xiàn)以下特點。① 國外數(shù)據(jù)素養(yǎng)領域研究的涉及面更廣泛,具體包括了各級學校教育、各類圖書館、用戶數(shù)據(jù)行為、醫(yī)療健康領域等;而國內(nèi)更多集中在高校教育和科研層面。② 國外對學生數(shù)據(jù)素養(yǎng)的培養(yǎng)從更早的階段開始(第3類聚類結果中出現(xiàn)關鍵詞“高中”);而國內(nèi)更多強調(diào)的是高校學生的數(shù)據(jù)素養(yǎng)培養(yǎng)。原因是國外已經(jīng)形成較為系統(tǒng)的數(shù)據(jù)素養(yǎng)培養(yǎng)體系,而國內(nèi)尚未形成完備的教育體系。[11]③ 國外在數(shù)據(jù)素養(yǎng)領域研究中更重視具體行為,對數(shù)據(jù)行為的研究更細化,如高頻關鍵詞中出現(xiàn)的循證實踐、在線學習、信息檢索等;國內(nèi)對具體數(shù)據(jù)素養(yǎng)相關行為的探討較少,在高頻關鍵詞中未有具體體現(xiàn)。但是,國內(nèi)外數(shù)據(jù)素養(yǎng)領域研究仍存在一些共同點。① 國內(nèi)外都認為圖書館對用戶數(shù)據(jù)素養(yǎng)的培養(yǎng)和發(fā)展起著非常重要的作用。② 數(shù)據(jù)素養(yǎng)都體現(xiàn)在除教育科研外的其他領域,國內(nèi)對新聞工作者提出了數(shù)據(jù)素養(yǎng)要求,國外在醫(yī)療健康領域強調(diào)了數(shù)據(jù)素養(yǎng)的重要性。
3.4.3 社會網(wǎng)絡分析
社會網(wǎng)絡分析是由社會學家根據(jù)數(shù)學方法以及圖論發(fā)展而成的定量分析方法。[12]度中心度(Degree Centrality)是在社會網(wǎng)絡分析中描述節(jié)點中心性的最直接度量指標,它表示一個關鍵詞與其他關鍵詞相聯(lián)系的程度,關鍵詞的中心度越高說明該關鍵詞在整個研究網(wǎng)絡中就越重要。[13]結合關鍵詞的中心度,可將社會網(wǎng)絡分析應用于分析某學科或某主題中關鍵詞之間的關系,發(fā)現(xiàn)當前研究熱點,推測未來研究趨勢。
將高頻詞共現(xiàn)矩陣導入社會網(wǎng)絡分析軟件UCINET中,再通過可視化軟件NetDraw選擇節(jié)點大小,依據(jù)中心度大小進行顯示,生成用于分析高頻關鍵詞中心度的網(wǎng)絡。圖5為國內(nèi)數(shù)據(jù)素養(yǎng)研究的高頻關鍵詞中心度分析網(wǎng)絡,圖6為國外數(shù)據(jù)素養(yǎng)研究的高頻關鍵詞中心度分析網(wǎng)絡。在圖5和圖6中,一個節(jié)點代表一個關鍵詞,節(jié)點越大說明該關鍵詞的中心度越高,與其他關鍵詞聯(lián)系緊密,在該分析網(wǎng)絡中越重要。表9和表10分別為利用UCINET分析而得的國內(nèi)外數(shù)據(jù)素養(yǎng)研究的高頻關鍵詞中心度排序。
由圖5可知,在國內(nèi)數(shù)據(jù)素養(yǎng)研究中,圖書館和數(shù)據(jù)素養(yǎng)教育在整個關鍵詞網(wǎng)絡中占據(jù)著主導地位,并且數(shù)據(jù)素養(yǎng)教育和圖書館之間聯(lián)系也非常緊密。由此可以發(fā)現(xiàn),我國數(shù)據(jù)素養(yǎng)領域當下的研究熱點集中于領域相關的教育以及圖書館在其中擔任的角色。通過分析邊緣節(jié)點發(fā)現(xiàn),在大數(shù)據(jù)時代,無論是圖書館員還是高校師生(尤其高校教師),都要提升自身數(shù)據(jù)素養(yǎng),圖書館員和教師還要擔當培養(yǎng)學生數(shù)據(jù)素養(yǎng)的重任。此外,大規(guī)模開放在線課程MOOC的出現(xiàn)和興起正好順應了互聯(lián)網(wǎng)+時代的用戶需求,可推測其研究熱度會不斷上升。[14]
由圖6可知,在國外數(shù)據(jù)素養(yǎng)研究中,與教育和各級圖書館相關的關鍵詞也占據(jù)整個網(wǎng)絡的主要位置。此外,體現(xiàn)數(shù)據(jù)素養(yǎng)相關行為的關鍵詞也在網(wǎng)絡中占據(jù)一定位置,如信息檢索、循證實踐、信息搜尋、在線學習等??梢?,與國內(nèi)相比,國外數(shù)據(jù)素養(yǎng)領域的研究熱點更廣,不僅包括學校教育及圖書館職能,更強調(diào)了在學習或科研過程中數(shù)據(jù)素養(yǎng)行為的具體表現(xiàn),在線學習的普及率更高。通過研究關鍵詞網(wǎng)絡邊緣節(jié)點還發(fā)現(xiàn),關鍵詞“評估”(Assessment)的中心度在所有關鍵詞中位于中等偏上的位置,可推測國外數(shù)據(jù)素養(yǎng)的教育中更注重反饋。[15]

圖5 國內(nèi)數(shù)據(jù)素養(yǎng)研究的高頻關鍵詞中心度分析網(wǎng)絡

圖6 國外數(shù)據(jù)素養(yǎng)研究的高頻關鍵詞中心度分析網(wǎng)絡

表9 國內(nèi)數(shù)據(jù)素養(yǎng)研究的高頻關鍵詞中心度

表10 國外數(shù)據(jù)素養(yǎng)研究的高頻關鍵詞中心度
(1)從文獻數(shù)量及年代分布來看,我國的數(shù)據(jù)素養(yǎng)研究領域現(xiàn)處于早期的增長階段,發(fā)展速度較快,可以推測未來國內(nèi)學者對此的研究熱度會呈上升趨勢;而國外學者對數(shù)據(jù)素養(yǎng)領域的研究已進入相對穩(wěn)定的階段,呈現(xiàn)出約每五年為一個周期的階段性增長。
(2)從文獻來源期刊分布來看,國內(nèi)外數(shù)據(jù)素養(yǎng)領域都已形成較為穩(wěn)定的核心期刊群。與國內(nèi)相比,國外數(shù)據(jù)素養(yǎng)領域期刊的刊均發(fā)文量更高,文獻更明顯地集中在少數(shù)核心期刊群中,體現(xiàn)出國外數(shù)據(jù)素養(yǎng)領域的發(fā)展較為成熟。
(3)從作者發(fā)文情況來看,無論是國內(nèi)還是國外,數(shù)據(jù)素養(yǎng)研究領域中發(fā)文量1篇的作者占絕大多數(shù)。目前主要發(fā)文作者所屬機構主要是高校,但國內(nèi)外都暫未形成穩(wěn)定的核心作者群。此外,國外論文合著情況較國內(nèi)更顯著。
(4)從關鍵詞來看,通過因子分析、系統(tǒng)聚類分析和社會網(wǎng)絡分析,發(fā)現(xiàn)國內(nèi)外數(shù)據(jù)素養(yǎng)研究領域的以下特點。① 共同點。無論是國內(nèi)還是國外,圖書館對培養(yǎng)用戶數(shù)據(jù)素養(yǎng)的重要性都得到了肯定,同時學校教育也在培養(yǎng)學生數(shù)據(jù)素養(yǎng)的過程中擔任重要角色。此外,數(shù)據(jù)素養(yǎng)的重要性不僅僅體現(xiàn)在教育科研中,其他領域也對相應工作者提出了數(shù)據(jù)素養(yǎng)要求,如國內(nèi)的新聞工作領域、國外的醫(yī)療健康領域。② 不同點。第一,國內(nèi)數(shù)據(jù)素養(yǎng)領域的研究更多集中在高校教育和科研層面;而國外相關研究的涉及面更廣泛,具體包括了各級學校的數(shù)據(jù)素養(yǎng)教育、各類圖書館的職能和角色、用戶具體的數(shù)據(jù)行為、醫(yī)療健康領域與數(shù)據(jù)的關系等。第二,國內(nèi)更多強調(diào)的是高校學生的數(shù)據(jù)素養(yǎng)培養(yǎng);而國外對學生數(shù)據(jù)素養(yǎng)的培養(yǎng)從更早的階段開始(高頻詞中多次出現(xiàn)高中)。此外,國內(nèi)對具體數(shù)據(jù)素養(yǎng)相關行為的探討較少;而國外在數(shù)據(jù)素養(yǎng)領域研究中更重視具體行為,對數(shù)據(jù)行為的研究更細化,如高頻詞中出現(xiàn)的循證實踐、在線學習、信息檢索等。
(5)從總體上看,國內(nèi)外數(shù)據(jù)素養(yǎng)領域的研究仍在不斷發(fā)展中。相對而言,國外的數(shù)據(jù)素養(yǎng)研究更成熟、數(shù)據(jù)素養(yǎng)實踐更多樣。因此,構建和完善數(shù)據(jù)素養(yǎng)教育體系、豐富數(shù)據(jù)素養(yǎng)具體行為是我國數(shù)據(jù)素養(yǎng)研究未來的重要發(fā)展方向,也是不斷提高用戶信息素養(yǎng)、適應大數(shù)據(jù)時代發(fā)展的重要舉措。