黃麗霞 韓曉雨 劉琤斐
(1.黑龍江大學信息資源管理研究中心 黑龍江哈爾濱 150080)
(2.黑龍江大學信息管理學院 黑龍江哈爾濱 150080)
(3.黑龍江省生態地質調查研究院 黑龍江哈爾濱 150080)
隨著科學技術的不斷發展,新媒體時代已經到來,海量的信息資源不但促進了社會信息環境的演進與成熟,而且也使人們更加注重對自身數據素養的提升。尤其自疫情爆發以來,以疫情分布圖、人口流動圖、病源排查、疫情管理等為代表的大數據項目各顯神通,數據信息充分發揮了重要作用,因此數據素養能力的高低對于疫情防控工作而言顯得格外重要。大學生作為社會未來發展的重要群體,更應當具備良好的數據素養,以提高自身的多方面能力,來順應時代的變化。
數據素養不等同于信息素養,而是對信息素養和媒介素養概念的擴展和延伸,也就是說,數據素養的內涵來源于信息素養,但卻具有一定的獨立性。數據素養強調對數據的敏感性、數據的分析和處理能力、對數據的批判性思維、數據的收集能力以及決策能力等方面。近年來,雖然與數據素養有關的研究和實踐成果數量呈現逐漸上升的趨勢,但由于發展時間較短,因此數據素養的具體含義尚無定論。
目前,數據素養逐漸成為科學研究的熱點,國內外很多學者對數據素養的核心內容與評價體系進行了不同程度的研究與探討。A.Grillenberger和ROMEIKE以計算機科學專業為主題,運用理論知識推導出了數據素養的核心內容和應用領域,并且構建了由4個數據主題及相應的數據處理模塊構成的數據素養能力模型[1];Databilities研究組織將15項數據素養能力劃分為6個等級,并從數據獲取、操作過程與應用交流3個方面構建出了數據素養能力框架[2];周兵以高校教師為研究主體,運用模糊綜合評價法設計了數據素養評價指標集合和數學模型,并給出了具體應用案例[3];潘雪等人利用層次分析法從教育主體、教育對象、教育形式、教育內容和教育效果5個角度構建了高校數據素養教育評價指標體系[4]。綜上,關于數據素養的研究目前多注重數據素養教育,以數據素養能力現狀和提升策略作為研究的重點,而有關大學生數據素養能力評價指標的實證性研究比較少。為此,本文基于現有研究成果并結合美國大學與研究圖書館協會(Association of College and Research Libraries,ACRL)標準,探討基于新媒體時代大學生數據素養的新要求,構建具有專指性的大學生數據素養評價指標體系,從定性和定量兩個方面對指標進行實證評價。
互聯網的發展加速拓寬了人們利用網絡進行數據轉化的可操作時間與空間。傳統的網絡環境要求使用者要具備一定的計算機操作能力,而如今的大數據環境降低了人們上網的準入門檻。對于大學生群體來講,他們能夠通過手機、電腦等移動終端隨時隨地地通過網絡獲取所需要的信息,將以往的單向獲取數據轉變為雙向共享數據。智能終端的利用極大地方便了大學生的日常學習和生活。
在新媒體時代下,大學生的數據素養呈現進步性和適應性。第一,在復雜的網絡信息環境中,大學生在數據演化的過程中呈現出協調性、復雜性的特征,個體在進行數據交換和使用行為的同時,能夠根據自身的需求來調節數據應用方式[5],如越來越多的大學生能夠利用手機和平板電腦等移動終端進行在線購物、網絡社交等行為,不再利用傳統的PC端訪問。第二,大學生能夠利用更多樣的渠道來獲取數據,除了常用的網站、微信、微博等新媒體渠道,大學生還能通過抖音、快手、花椒等視頻和直播平臺來獲取有效的數據。第三,大學生的數據辨別能力有著顯著的提高。如今,大學生數據搜尋呈現出碎片化的趨勢,海量的信息不斷地向大學生輸出,使得大學生的甄別和處理數據能力穩步提高。
在總結大學生數據素養能力的特點和調研相關文獻的基礎上,以新媒體環境下社會和國家發展戰略的核心目標為依托,并結合現有的理論研究成果和數據素養的內涵,筆者構建了大學生數據素養評價指標體系。該體系包含數據意識、數據獲取、數據利用、數據分析、數據評價、數據管理、數據知識、數據創新、數據倫理、數據安全在內的10個一級指標,及對應的21個二級指標,具體如表1所示。

表1 新媒體時代大學生數據素養評價指標體系
數據意識是數據素養能力的基本組成部分,它主要強調主體對數據及相關信息的感受程度,常常表現為在復雜的網絡環境下激發的探索需求,對數據搜尋、處理、辨別等過程中的敏感性和多領域的數據拓展意識。
作為數據素養評價體系中重要的一環,數據獲取表現為對于所需要的數據的多方面功效進行考量,通過適當的方法和手段進行有策略的、精確的搜尋工作。
數據利用的過程能夠反映出數據的真實價值,數據在應用、表達與交流、共享等資源整合和展現時,才能充分完成其效能的價值轉化。
數據分析是指用適當的分析統計方法對收集到的數據進行分析,提取有用的信息和形成的結論并對數據進行詳細研究和總結概括的過程。數據分析往往與數據判斷并存,分析即存在判斷的過程。
數據評價是指對數據質量進行評估,是從數據綜合運用的視角考慮,對信息和數據的收集、儲存和應用進行全方面的考察和評估,進而提高數據的有效度和可信度。
數據管理是對數據進行分類組織、存儲管理的過程,通過對收集到的數據信息進行正確處理,能夠實現數據應用和共享的真實價值。
數據知識是數據素養能力的基礎,包括數據的基本概念、類型、特點等基礎知識和數據的交流方法、轉換方式等應用知識。
數據創新可以是在本學科領域內對基礎數據的聚集、優化、再造,也可以是跨學科的對數據進行融合,構建出新的數據,進而實現數據的共享和交流。
數據倫理是從數據視角對人的信息行為進行的倫理關注,是指在數據獲取、加工、利用、創新等數據活動過程中與數據相關的所有道德規范問題。
數據安全是圖書情報等相關學科的重要研究領域之一,它的核心內容是隱私。安全思維和安全技能是數據安全的基礎。數據安全不僅關系到個人隱私、企業隱私,甚至能夠直接影響國家安全。
根據構建的新媒體時代大學生數據素養評價指標體系開展問卷調查,調查問卷主要分為兩個部分:第一部分為調查者的基本信息,包括性別、年齡、年級、所屬學院和專業;第二部分是根據10個一級指標、21個二級指標設計的問題,運用李克特五級量表的形式,設置了“完全不同意”“比較不同意”“基本同意”“比較同意”“完全同意”五個選項,分別按照1—5分進行賦值。
問卷調查利用“問卷星”平臺,并通過社交軟件在線上完成,選擇的調查對象為黑龍江大學在校本科生,本次調研的時間為2021年7月13日至2021年7月18日,共發放問卷1 703份,經過篩選和整理得到有效問卷1 592份,有效問卷回收率為93.5%。本次調查兼顧了不同學科專業的差異性,因此調查樣本來自理工類、經管類、文史類等多種類別。回收到的數據中,男生669人,約占總人數的42.02%;女生923人,約占總人數的57.98%。
利用SPSS軟件對收集到的數據進行描述性分析,統計數據素養評價指標體系10個一級維度和總量的平均值、標準偏差、方差、Cronbach’s α系數,具體計算結果如表2所示。

表2 量表各維度平均值、標準偏差以及信度
標準偏差能夠評估數據之間的離散性,標準偏差越小,表明選擇的樣本數據與平均值的偏差越小。從表2能夠看出,10個維度的數據標準偏差均在0.88—0.96之間,這說明題項的離散性不大,調研結果比較穩定。信度能夠反映調查數據的可靠性。本文在進行信度分析時,選用Cronbach’s α系數進行信度檢驗。一般認為當α系數大于0.7時,調查問卷的信度比較好。通過SPSS軟件的信度分析,能夠得到10個維度的α系數均大于0.7,并且除數據意識之外,其他9個維度的α系數都大于0.8,問卷的整體信度為0.981,這能夠表明此問卷的可靠性和穩定性都比較好。
利用SPSS軟件進行相關性分析,得到的具體結果如表3所示。從表3可以看出,10個一級指標之間的相關性在0.333—0.691之間,而除了數據意識與總量表的相關性為1.000外,其余一級指標與總量表的相關性均在0.333—0.515之間,這說明每個一級指標都具有一定的獨立性,而且只有數據意識與其他一級指標以及整個評價指標體系存在很大的關聯性,其余一級指標與整個評價指標體系關聯性不大,這說明數據意識從某種程度上來說決定了數據素養能力。

表3 量表相關性分析
在結構有效性方面,利用SPSS軟件對問卷進行KMO和巴特利球形檢驗,結果如表4所示。

表4 KMO和巴特利特球形檢驗
從表4能夠發現,KMO的值為0.975,大于0.9,并且顯著性值P=0.000<0.05,說明這些數據有共同因素存在,非常適合進行主成分分析。
在因子分析中,以特征值大于1為原則提取主成分,運用最大方差法對原始載荷進行旋轉,得到的結果如表5所示,旋轉后的主成分矩陣如表6。
從表5能夠看出,共有2個成分特征值大于1,因此該數據能夠提取2個主成分。這2個主成分方差的累積貢獻率為65.194%(一般認為累積貢獻率達到55%就可以接受),這表明提取主成分后數據的損失率比較小,主成分分析效果比較好。運用綜合得分來評價大學生數據素養能力現狀,可以按各主成分對應的方差貢獻率的比例為權重來計算綜合得分,第一主成分的權重43.163%/65.194%=0.662,第二個主成分的權重為22.032%/65.194%=0.338,因此,數據素養綜合評價得分為:Factor=0.662Factor1+0.338Factor2。

表5 總方差解釋
從表6可以看出,第一個因子包含X1、X2、X3、X4、X5、X6、X7、X8、X9、X10、X11、X12、X14、X15、X16、X17,第二個因子包含X13、X18、X19、X20、X21。那么,第一個因子可以概括為數據的獲取與應用,第二個因子可以概括為數據存儲與安全。

表6 旋轉后的成分矩陣
3.4.1 基于性別分組比較分析
為了了解性別對于數據素養能力的影響,運用SPSS軟件對不同性別的樣本進行比較分析,計算結果如表7和表8所示。
對于方差齊性進行檢驗,從表7中能夠看出F=12.940,P=0.000<0.05,因此兩個樣本方差有差異,即方差不齊性,方差不齊性看第二行,t=3.735,P=0.000<0.05,因此認為不同性別的大學生數據素養能力存在顯著差異。從表8能夠看出,男生的個人平均分略大于女生,分數越高,數據素養能力也越好,這說明男生整體的數據素養能力要高于女生的數據素養能力。

表7 獨立樣本T檢驗

表8 不同性別統計分析
3.4.2 基于專業分組比較分析
運用SPSS軟件對不同專業的大學生樣本數據進行比較分析,把數據中的專業分成三個大類,即理工類、文史類、經管類,得到的計算結果如表9、表10、表11和表12所示。
從表9能夠看出,P=0.000<0.05,因此可認為樣本來自的總體不滿足方差齊性的假設。從表10能夠發現,P=0.003<0.05,表明達到顯著水平,即不同專業類別的大學生的數據素養存在顯著差異。由于不滿足方差齊性,因此利用塔姆黑尼方法對數據進行多重比較。兩兩比較時,P<0.05,說明兩類數據存在顯著差異;P>0.05,說明兩類數據不存在顯著差異。通過表11能夠看出,理工類和文史類、理工類和經管類的學生數據素養存在顯著差異,而文史類和經管類的學生數據素養沒有顯著差異。從表12能夠看出,經管類和文史類的樣本數據平均值非常接近,而理工類高于經管類和文史類的平均值,這說明從宏觀來看,理工類的學生數據素養能力要高于文史類和經管類的學生數據素養能力,文史類和經管類的學生數據素養能力相差不大。

表9 方差齊性檢驗

表10 方差分析

表11 基于不同專業的多重比較

表12 不同專業分析描述
3.4.3 基于年級分組比較分析
運用同樣的方法對不同年級的學生數據素養進行比較分析,計算結果如表13、表14、表15所示。從表13能夠看出,P值均大于0.05,因此可認為樣本滿足方差齊性的假設。從表14能夠發現,P=0.249>0.05,表明沒有達到顯著水平,即不同年級大學生的數據素養能力相差不大。從表15能夠看出,四個年級的樣本平均值相近,這也充分證明了大學生的數據素養能力與年級無關。

表13 方差齊性檢驗

表14 方差分析

表15 不同年級分析描述
在對當前高校大學生數據素養能力的特點總結和上述實證分析的基礎上,面對現實社會復雜多樣的環境變化,以新時代新媒體背景為前提,探討大學生數據素養能力提升的合理化建議。
數據的生命周期一般可以分為認知階段、能力階段和應用階段三個階段。新媒體時代的大學生數據素養教育體系應以素質教育為依托,以數據的生命周期為基礎,著眼于生命周期的各個階段,通過個人、家庭、學校、社會組織等力量,從根本上逐步提升大學生的數據素養能力[6]。
在數據認知階段,重點培養大學生的數據意識和共享意識,并在原有的數據安全意識的基礎上,拓展與數據相關的法律法規知識,逐漸提升其數據倫理和數據道德意識,為后面兩個階段數據素養能力的提高奠定認知基礎。在數據能力階段,幫助大學生尋找更多的數據收集與評估途徑,提升他們數據獲取和分析的能力,使其掌握數據管理和存儲的多種方法和技巧,培訓使用數據分析軟件,灌輸與數據有關的基礎知識,從而更好地為數據應用鋪墊。獲取和管理數據都是為了更好地應用和表達。在數據應用階段,應該重點培養大學生的數據利用與交流共享的能力,為他們制造更多交流和創造的機會,拓展數據創新能力。
對于大學生而言,高校是他們學習和生活的主要場所之一,高校不僅承擔著傳授科學文化知識的職能,而且還擔負著提升學生多方面素養和能力的使命。
從上述的實證分析可知,數據意識對于大學生數據素養能力起著至關重要的決定作用,它是數據素養能力的基石,是數據素養長久發展的基礎,因此高校可以針對不同專業的需求,聯系專業理論性知識,開設數據通識教育類的課程,構建數據結構體系,建立高校智慧培養機制,注重培養大學生的數據意識,增強他們對數據的敏感度和重視度,從而使學生逐漸形成數據分析思維意識,從根本上提升個人的數據素養。
在培養數據意識的基礎上,高校可開設數據分析與應用等相關課程,教師要利用理論與實踐相結合的方式來提升大學生的數據處理能力。同時,授課項目可以是豐富多樣的,例如:跨校交流、網上直播、新媒體課件等。這些多樣化的數據分析應用課程體系為學生搭建了新媒體資源平臺,提供了新型的數據技術和產品,在學習與交流時,自然而然地組建了數據素養小組和團隊,營造了和諧、共享的交流氣氛,從而能夠滿足因個體差異而對數據產生的不同需求[7]。
高校只是社會環境體系中的一個組成部分,因此,想要提升大學生的數據素養能力,需要以社會環境為依托。云環境要為大學生用戶群體樹立正確的數據意識導向,通過多樣化的數據應用與交流方式,構建良好、健康的網絡共享環境,完善數據管理云環境,將數據知識與技能、數據應用與管理等多重能力融入互聯網數據文化的建設中,打造具有專業學科知識特點的特色數據庫,充分利用大數據、云計算等先進技術和網絡平臺,挖掘并開發將數據獲取與利用、數據分析與評價、數據管理與創新等多功能集于一體的云服務體系,從而全面促進大學生數據素養能力的提升[8]。
除此以外,國家應構建新媒體時代云服務的管理標準與規范,優化數據素養培養體系的評價指標,制定相關法律制度體系,從根本上保障大學生數據素養能力的全面提升。
新媒體時代的來臨,使數據的價值達到了一個新的高度,這對大學生的數據素養能力提出了更大的挑戰。本研究基于現有的理論成果,結合新媒體時代大學生數據素養能力的新特點,構建了具有針對性的數據素養評價指標體系,形成了10個一級指標和21個二級指標,并對體系進行了描述性分析、信度分析、主成分分析等一系列實證評價,以完善大學生的數據素養綜合測評,并在實證分析的基礎上,構建起在協同與重構下的數據素養能力提升策略,以滿足學生個體成長要求和實現社會對復合型人才培養模式的創新,從而最終更好地服務于社會和國家。