董 蕓
(宜春幼兒師范高等專科學校 學前教育學院,江西 宜春 336000)
在人工智能時代,數據素養作為一項重要的素養引起了學界的關注,涌現了許多相關研究成果。本文借助文獻計量法,檢視國內相關研究成果,把握國內數據素養研究現狀,可以為后續研究提供依據。
借助“中國知網”的高級檢索功能,檢索條件設置如下:范圍為“期刊”,來源類別為“核心和CSSCI”,篇名為“數據素養”。共檢索到175 條文獻,檢索到的所有文獻均符合研究需要。借助COOC、VOSviewer 軟件及“中國知網”自帶的計量可視化分析功能,對所有檢索結果進行文獻計量分析,以揭示國內數據素養研究現狀。
在“中國知網”上,將檢索到的全部結果按照“發表年度”瀏覽,并對其進行計量可視化分析,借助辦公軟件Excel 繪制、美化折線圖,如圖1 所示。可以看出,2013 年國內才開始出現數據素養研究的高質量研究成果,且數量較少。2014 年開始增長,2016 年達到頂峰,發文量高達36 篇。2016—2020年,發文量經歷了“回落—上升—回落—上升”的過程,但這五年里發文量總數最低都保持在23 篇,呈“W”型增長,雖不穩定,但總體呈增長趨勢。這說明近些年來數據素養一直是學界關注的熱點,且涌現了不少高質量研究成果。數據素養的研究受到國內學者的關注,與國家頒發的有關教育信息化和人工智能教育的相關政策有關。

圖1 文獻年度分布圖(2013—2020)
在“中國知網”上將檢索到的全部結果按照“期刊”進行瀏覽,并對其進行計量可視化分析,如圖2所示。可以發現,國內關于數據素養研究的成果多發表在圖書館和情報學期刊上,排在前20 位的教育學類的期刊只有《電化教育研究》(發文量6 篇)、《現代教育技術》(發文量4 篇)和《開放教育研究》(發文量3 篇)三種。結合學科分類的計量可視化結果,如圖3 所示。可以發現,66.85%屬于圖書情報檔案學科,25.41%屬于教育學學科。這說明教育學學科領域還需加強對數據素養的研究。

圖2 期刊分布

圖3 學科分類分布
利用COOC 軟件繪制發文量前20 位作者的柱形圖,如圖4 所示。發文量最高的作者發表論文篇數為9 篇。根據普萊斯公式來確定核心作者,求得N=0.749×√9 ≈2,核心作者即發文量2 篇及以上?者,根據后臺結果,符合此條件的作者為48 人,意味著核心作者有48 人。為進一步挖掘研究方向高度一致的作者,利用COOC 軟件構建基于關鍵詞的作者耦合矩陣,再將作者耦合矩陣轉化為鄰接表,鄰接表轉化為VOSviewer 能識別的.net 格式的文件,導入VOSviewer 中,繪制出基于關鍵詞的作者耦合網絡,如圖5 所示。在該網絡圖中,屬于同一顏色的作者意味著他們的研究方向比較接近,可以發現,形成了四大耦合團體,分別是以胡卉、吳鳴、陳秀娟、李建霞、郭倩、黃如花、陳琦、余維杰、徐萍、沈玖玖、艾文華、劉愛琴、尚珊、王維佳、曹樹金、盧祖丹為代表的團體;以劉智、孫建文、張斌、劉三女牙、楊現民、林秀清、李新、李青、陳明星、錢鵬、張娟、任一姝、付超、左平熙、胡洋、謝友寧為代表的團體;以孟祥保、楊文建、鄧李君、隆茜、程結晶、劉敏、張路路、張群、劉玉敏、彭奇志、宋甲麗、秦小燕、初景利為代表的團體;以郝媛玲和沈婷婷為代表的團體。

圖5 基于關鍵詞的作者耦合網絡圖
利用COOC 軟件繪制發文量前20 位研究機構的柱狀圖,如圖6 所示,位居第一位的是中國科學院文獻情報中心,發文量前20 位的研究機構多屬于雙一流高校或高水平研究機構,且多是圖書館情報領域的,僅有江蘇師范大學智慧教育學院屬于師范類院校。從這個層面上說,教育學學科領域在數據素養方面研究相對較為系統的師范類院校當屬江蘇師范大學。

圖6 發文量前20 位的機構
利用COOC 軟件構建詞頻大于等于3 的關鍵詞的共現矩陣,將其轉化為鄰接表,再轉化為.net 格式,將.net 格式的文件導入VOSviewer 中,繪制高頻關鍵詞的主題聚類圖,顏色相同的關鍵詞為一個主題,如圖7所示。可以發現,一共有九個聚類:聚類一包含大數據、大數據素養、師范生、教師專業發展等關鍵詞;聚類二包含數據素養、圖書館、大數據時代、教育等關鍵詞;聚類三包含數據意識、用戶教育、科學數據管理等關鍵詞;聚類四包含人才培養、信息素養教育、數字人文等關鍵詞;聚類五包含指標體系、能力、能力模型等關鍵詞;聚類六包含信息素養、大學生、數據素養教育等關鍵詞;聚類七包含數據管理、科研人員、科研數據等關鍵詞;聚類八包含科學數據、素養教育、高校圖書館等關鍵詞;聚類九包含館員一個關鍵詞。
(六)高頻關鍵詞的系統聚類分析
利用COOC 軟件構建詞頻大于等于3 的高頻關鍵詞相異矩陣,并繪制譜系圖譜,此實質上為系統聚類分析,結果如圖8 所示。據此,將國內數據素養研究分為檔案學專業學生數據素養教育研究(領域1)、教師和師范生數據素養研究(領域2)、圖書館科學數據素養研究(領域3)、高校圖書館數據素養教育研究(領域4)、中小學教師和大學生數據素養研究(領域5)五大領域。

圖7 高頻關鍵詞主題聚類圖
領域1 為檔案學專業學生數據素養教育研究,包括人才培養、數字人文和檔案學三個關鍵詞,主要圍繞檔案學專業教育的數據素養教育內容體系[1]、基于數字人文理念的檔案學專業學生數據素養培育策略[2]展開。
領域2 為教師和師范生數據素養研究,包括教師專業發展、師范生、模型構建、教師數據素養、教育大數據、大學圖書館、美國、能力、指標體系等九個關鍵詞。關于教師數據素養研究,主要圍繞基于數據素養的中小學教師專業發展的內涵與路徑[3]、教師數據素養的內涵、價值和發展策略[4][5]、教師數據素養模型及教師數據素養教育實施建議[6]、美國發展教師數據素養的基礎和路徑[7]等研究展開。關于師范生數據素養研究,主要圍繞師范生數據素養概念、構成要素、教育模式[8]、培養目標及課程體系[9]、模型及培育實踐研究[10]展開。
領域3 為圖書館科學數據素養研究,包括科學數據素養、科學數據管理、用戶教育、科研人員、數據生命周期、數據管理、科研數據等七個關鍵詞。主要圍繞科學數據素養的內涵結構[11]、能力指標體系構建[12]、科研人員科學數據素養能力評價體系[13]、高校圖書館用戶科學數據素養能力與需求[14][15]、用戶科學數據素養研究架構及干預策略[16]、圖書館員科學數據素養能力框架及發展策略[17]、高校圖書館科學數據素養教育的現狀及建議[18]、高校圖書館科學數據素養教育體系模型[19]、研究生科學數據素養教育模式[20]、國內外高校圖書館科學數據素養教育的比較分析[21]展開研究。
領域4 為高校圖書館數據素養教育研究,包括信息素養、數據素養、大數據、慕課(MOOC)、數據素養教育等十三個關鍵詞。主要圍繞某一具體課程中數據素養教育的方法[22]、圖書館開展數據素養教育的內容與方式[23]、發展策略[24][25][26][27][28]、針對不同培訓對象的數據素養教育策略[29]、存在的問題及對策[30]、高校圖書館數據素養教育體系框架[31]、數據素養教育體系以及服務模式[32]、面向學科的高校圖書館數據素養教育特征與模式[33]、開展嵌入式數據素養教育的路徑[34]、基于數據素養教育高校圖書館的服務轉型策略[35]等方面展開研究。
領域5 為中小學教師和大學生數據素養研究,包括數據意識、中小學教師、大數據時代、教師、教育、大學生、館員、大數據素養、因子分析等九個關鍵詞。關于中小學教師數據素養研究,主要圍繞中小學教師數據素養評價指標體系構建[36]、發展路徑與培養策略[37]展開。關于大學生數據素養研究,主要圍繞大學生數據素養現狀及培養方法[38]、評價[39]、提高的途徑與對策[40]、數據素養能力評價的實證研究[41]、高校數據素養教育對其影響[42]、大學生數據素養教育的目標定位及體系構建[43]展開。

圖8 高頻關鍵詞系統聚類
本研究以國內刊載在核心及CSSCI 期刊上的175篇關于數據素養研究的文獻為研究對象,基于文獻計量分析,得出結論并展望如下。
第一,從學科視角來看,國內關于數據素養的成果集中分布在圖書情報檔案學科,基于教育學學科視角的高質量成果偏少,因而教育學學科領域應加強數據素養研究。比如關于師范生的數據素養現狀、提升對策、師范生數據素養教育等研究應該加強。
第二,從研究方法來看,已有的研究多為理論研究,實證研究相對偏少,特別是關于大學生、教師、師范生的數據素養研究,也多集中在數據素養的基本理論的探討上,忽視了有關這些不同群體數據素養現狀和培育實踐的實證研究。因而需進一步加強實證研究。
第三,從研究內容來看,數據素養的基本概念、內涵、價值、教育模式、發展策略等方面的研究比較豐富,但關于數據素養現狀、提升策略、培育實踐的實驗研究等相對偏少。未來研究在關于數據素養的實踐層面的內容應該加強。