劉愛琴,劉蕾蕾,尚 珊(.山西大學經濟與管理學院;.中國科學院文獻情報中心)
大數據時代的到來把數據的價值推向了新的高度,數據資源的作用和影響力逐漸深入,并對個人進行有效數據分析處理及決策能力提出了更高的要求。大學生作為未來研究人員的潛在力量以及大數據時代社會工作的主要創新力量,提高大學生的數據素養能力是當務之急。目前,國內外對數據素養能力的研究主要是基于研究生和科研人員的視角,從群體角度出發,分析適用于大眾的數據素養能力構成要素,并沒有考慮個人因素對其數據素養能力的影響;針對特殊的學科領域開展了相應的數據素養教育,但對教學成果的評估只是定性的反饋,并未形成定量的評估模型。曲德強對當代大學生數據素養現狀的研究顯示,碩士研究生在數據意識和數據技能兩方面均強于本科生。[1]隨著MOOC類教育平臺的開放,傳統的教育模式和學習方式在不斷被更新。MOOC類教育平臺與一般環境相比,其最主要的特征在于聚集、重組和個性化,因此極大地豐富了數據素養教育的課程體系,學習者可根據自己的興趣、專業和能力持久而穩定的學習。盡管大學生接受數據素養教育的方式更自由,內容更豐富,但學習能力和效果卻無法考量。因此,一套標準規范的數據素養能力評價機制亟待建立。本研究以高校大學生為研究對象,借鑒國內外數據素養教育理念、能力框架及評價標準設計數據素養要素指標,同時,考慮個人因素對MOOC平臺學習效果的影響,將學生的個人因子納入其中,構建了數據素養能力評價指標體系。并采用因子分析法實現了數據素養能力量化評定,達到了精確評價數據素養能力的目的,實現了MOOC環境下數據素養教育類課程效果的有效評估。學生可以隨時對其接受的數據素養課程進行效果評估,并據此來調整自己的學習目標,在MOOC平臺選擇與自己目標與學科相關的課程,最終實現數據素養能力的全面提高。
從目前有關數據素養的研究來看,不同學者對于數據素養定義的關注點有所差別。如,Hogenboom認為數據素養是通過對收集數據讀取、理解和轉換后,將結果數據作為驗證材料的能力;[2]Mandinach等提出數據素養包含了數據的解讀和運用技巧,能夠有效地利用信息指導決策制定;[3]張靜波主張數據素養是信息素養內容的豐富,其更強調數據的解讀、產生和使用技巧。[4]數據素養指在具備數據意識的條件下,在道德倫理范圍內收集、檢測、分析、處理、解讀和應用數據信息。而一個完整的數據素養教育則應針對數據素養包含的具體內容,從通識教育層面開始,提高個體的數據主體、獲取、安全等意識及數據道德觀念,同時,利用數學及計算機科學知識開辦數據分析及處理軟件工具教學提高其數據處理技能。
目前,國內外都在開展各種模式的數據素養教育。國外許多高校圖書館針對不同學科和教學對象及目標,采用了多種形式的數據素養教育。如,哥倫比亞大學針對其新聞專業碩士生開展了有關“數據新聞”的數據素養教育;約翰·霍普金斯大學開辦了數據科學系列課程,主要內容涉及數據獲取、清理及分析等;普渡大學針對理工本科生開展了有關評估數據對象及網絡數據庫的數據素養教育來提高學生的數據來源和質量意識,同時,還面向圖書館在農業與生物工程學科領域進行了數據素養教育,但教育對象卻主要選擇了博士和研究生。同樣,劍橋大學也創建了以考古學專業和社會人類學專業的研究生為教學對象的數據素養教育模型——DataTrain。此外,英美其他高校圖書館開展數據素養教育也主要針對研究生和科研人員。[5]
國內只有極少圖書館實施數據素養教育。中科院文獻情報中心選擇地球科學專業的研究生作為主要的教育對象,通過設計“地學科學數據管理”課程以提高其研究生的數據素養能力。我國高校圖書館開展數據素養教育課程的主題大多是利用數學和計算機相關知識分析處理數據,比較片面和單一,如,南京大學開展了“用Python玩轉數據”的有關數據統計和可視化的數據素養教育;哈爾濱工業大學開辦了“大數據算法”課程,山東大學圖書館開展了“Origin軟件的使用方法”等系列講座,只有極少圖書館開展了涉及數據素養內涵的相關講座。
國內外數據素養教育現狀表明,研究生和科研人員是數據素養教育的主要對象且本科生接受的線下數據素養教育課程數量少,項目單一。吳晶娥對美國開展課堂數據素養教育經驗的研究顯示,應從中小學時期開展數據素養教育,大學時期是基礎數據素養的重要發展階段,必須加強高校大學生數據素養教育,為研究生數據素養教育課程培養高層次人才和下一代的數據科學家和工程師奠定基礎。[6]受場地和時間等因素的限制,高校圖書館不可能對全校學生普及教學知識,各個學科有涉及特定的數據素養教育課程,但對全面提高學生數據素養來說仍是微不足道的。同時,受個人因素的影響,學生的接受能力也有所不同,MOOC類線上教育平臺作為個人學習平臺,學生可根據自身情況選擇或者重復利用課程。因此,MOOC平臺的開放,在全面、自由的豐富學生課程體系的同時,也為大學生接受數據素養教育提供了很好的路徑。
在開展數據素養教育前,必須明確其實施的必要性和目標。數據素養教育實施后,需要對數據素養教育進行教學評估,以確定數據素養教育對象能力的提高。國外關于學生數據素養學習成果評價大多采用定性分析,如,康奈爾大學和倫敦大學圖書館通過考試、提交學習報告等途徑考核學生是否達到了預期的效果。普渡大學圖書館會在課程結束后舉辦小型討論會議,通過會議反饋得知學生課程的接受程度,并根據接受程度和預期目標調整課程內容和進度;在期末課程結束時給學生發放問卷,了解其對所學知識的掌握情況并要求學生為后期的教學提出建議;在課程結束六個月后會針對教學對象開展討論會議,以評價數據素養教學的長期影響力。
國內關于數據素養能力評價的研究較少。隆茜根據數據素養不同定義中包含的數據素養能力因素建立了詳細的評價體系,在此基礎上,通過對不同群體發放問卷,調研各目標群體的數據素養能力水平,提出了根據不同群體在數據素養能力上的差異性來開展差異化的數據素養教育。[7]王維佳等人圍繞數據生命周期的各個環節歸納設計了數據素養能力評價指標,采用LIKET五分法得到了科研人員數據素養綜合評分函數。[8]
國內外的數據能力評價研究角度大多為定性分析,很少有學者對數據素養能力做量化研究,而量化分析是每個數據素養教育對象最直接的成果評價。尤其是學生在MOOC平臺接受素養教育時,受平臺條件和機制的限制,大多數課程只是在課程中或者課程后穿插部分習題檢測學生對所學知識是否掌握,學生無法得知自己的數據素養能力是否有所提高。因此,建立數據素養能力量化評價模型,能夠促使學生在實時檢測學習成果的同時評估數據素養能力等級,及時調整學習方案,提升自身能力。
此外,我國學者對數據素養教育及評價的研究主要從群體的角度出發,如,曲德強等對上海某理工大學學生數據素養的研究,主要以研究生與本科生、男生和女生為分類標準,調查結果顯示碩士研究生的數據意識比本科生強,女生通過數據來挖掘信息的能力及數據儲存意識比男生強;[1]吳晶娥對數據素養的研究主要以大學生整體為研究對象,提出高校圖書館針對大學生實施數據素養教育的對策;[6]喻婷對數據素養的研究是以全體圖書館員為研究對象,提出面向圖書館員的數據素養培育路徑;[9]隆茜對數據素養評價的研究,以大學教師、博士生、研究生及本科生整體為調查對象,分析各群體的各項數據技能分值。[7]并沒有學者從個體出發研究其數據素養能力,或者在研究數據素養能力構成時融入個人因素,僅僅是分析廣泛且通用的數據素養能力的構成要素。MOOC教育平臺是針對個人的自由學習平臺,個人可通過該平臺為自己個性化定制課程,但由于個人基本因素的不同,學生通過該平臺接受數據素養教育時,其學習效果必然受到影響,因此在對MOOC平臺學習成果進行評價時必須考慮其個人因素的影響。本文在之前對數據素養能力要素研究的基礎上,加入學生個人因素,以期能對學生的數據素養能力作出更全面,準確的評價。
對于不同的數據素養內涵,其中包含的數據素養要素也不盡相同。在考慮大學生的數據素養能力時,個人因子對其數據素養能力的影響也是一個重要層面。一套綜合性的數據素養能力評價指標系統應包含數據素養要素和學生個人因素兩個方面。綜合來看,該體系共包含了數據素養能力和個人因子兩個模塊和26個具體指標,它們之間是相互獨立,并行不悖,協同促進的關系。
不同的數據素養能力框架包含了不同的能力維度和能力指標。上海大學的郝媛玲和沈婷婷[10]以及華東師范大學的隆茜[7]建立了10種數據素養能力框架,本文借鑒國內外數據素養教育理念、能力框架及評價標準,提取了21種數據素養能力要素及指標含義(見表 1)。

表1數據素養能力評價體系——能力要素
不同學生因教育背景不同直接影響學生的數據素養能力高低不同,本文把學生的個人因素,如,學校、城市、專業等融入設計度量(見表2)。

表2數據素養能力評價體系——學生個人因素
數據素養能力評價系統的要素組成采用LIKET五分法對在校學生的數據素養評價指標進行評分,學生的個人因子指標按照評價尺度表打分(見表3)。

表3 學生個人因素評價尺度表
問卷調查采用線上和線下相結合的方式,調查對象為全國各高校的大學生,問卷內容分為兩個部分,第一部分,為學生的個人因子評分;第二部分,為學生的數據素養要素評分,問卷調查歷時60天,共收回有效問卷2,280份。調查問卷的信度分析結果顯示,Cronbach’s Alpha 值為 0.808,標準化項 Cronbach’s Alpha值為0.91,26個項目內部具有很好的一致性。數據素養能力評價指標的KMO測度和Bartlett球體檢驗結果顯示KMO值為0.787,相關矩陣中均存在大量顯著相關關系(a=.000),保證了問卷結構的有效性。
樣本符合因子分析的條件,本文在主成分分析的基礎上,提取數據素養能力的主要評價維度。采用最大方差法旋轉因子,得到各公共因子在各指標上的載荷值,并將其作為各指標的權重系數。通過矩陣旋轉,因子載荷值截取點為0.8,特征值大于1,分析得到5個公因子,累計方差貢獻率為90.287%。
因子得分系數矩陣顯示,F1在 X5、X6、X7、X8、X9、X10、X11、X12、X13上的載荷值大于 0.8,包含了收集、檢測、整理、分析、解讀等數據技能認知;F2在X14、X15、X16、X17、X18、X19上的載荷值很高,代表數據倫理認知;F3在X1、X2、X3和X4上的載荷值很高,體現了數據意識認知;F4在X22、X23、X24、X25和 X26上的載荷值很高,體現了學生個人因子的影響。F5在X20和X21的載荷值較大,體現了數據管理認知。
為了更好地體現數據素養各能力要素認知及其指標和個人認知之間的反饋關系,依據系統動力學設計了能力評價關系圖(見下圖)。數據素養能力系統分為數據意識認知、技能認知、管理認知、倫理認知和個人因素5個子系統。學生個人因素在很大程度上反饋了技能、意識等其他數據認知。而數據技能、管理、意識、倫理認知子系統間則是相互獨立,并行不悖,協同作用的。
依據確定的公共因子個數和不同指標在公共因子上的載荷來計算其絕對權重。

圖 數據素養能力評價系統因果關系圖
按照公式(1)計算得到各個指標的絕對權重Aj(j=1,…,26)。

其中,aij=(i=1,…5,j=1,…,26) 表示第 j個指標在第i個公共因子上的因子載荷,表示第i個公共因子對第j個指標的權重系數。Fi=(i=1,…5)表示公共因子的貢獻率。
確定了26個指標的絕對權重,利用公式(2)作歸一化處理,即可獲得數據素養能力評價指標體系中各指標的標準權重Wj=(j=1,…,26)(見表4)。

為了更準確地測定每個學生的數據素養能力,必須由學生個體來評價。在表4確定的數據素養能力評價指標相應權重的基礎上,依據表3確定的學生個人評價標度,以及表1的數據素養能力要素指標進行LIKET五分法打分,即可得到數據素養能力評價指標體系下不同指標上的得分Sj(j=1,……,26)。依據公式(3)就可以確定學生具體的數據素養能力值。根據打分標準可知,數據素養能力數值T的取值區間為[1,5],數值越大,學生的數據素養能力水平越高。

根據數據素養能力評價指標體系以及學生個人數據素養能力數值確定方法,本文選取問卷中某學生的數據結果如表5所示。

表5 某同學數據素養能力評價指標得分
將Sj與其在評價指標體系中對應的權重Wj(j=1,……,26)相乘,并將乘積相加,即可得到該學生的數據素養能力數值T=2.496,得分顯示該學生數據素養能力水平較低。根據該得分,對比數據素養能力評價指標權重,該學生應主動學習的模塊是數據技能。可通過MOOC平臺學習常用的期刊論文數據庫CNKI、SSCI、Elsevier、SDOL和World Cat等,加強數據收集能力,學習InspierData,加強數據分析能力。其次,由于數據倫理認知在學生的數據素養技能中也占了較大比重,該學生可通過學習知識產權與數據共享加強數據倫理認知。學生個人因子作為主要的影響因子之一,其中包含了許多不可控因素如學校、城市等,但學生可通過參與科研項目來提高自身的數據素養技能。
數據素養動力學能力評價系統動力學關系圖很好地表征了數據素養能力因子子系統間的反饋關系,利用Spss,定量確定數據素養評價標度,構建了完整的數據素養指標體系。基于該體系可以實現:① 數據素養能力影響因素的比較和分析,確定了它們的先后順序;② 明確不同指標之間的密切聯系;③ 明確數據意識認知、技能認知、管理及倫理認知對能力權重的影響;④ 對學生的數據素養能力進行了量化。
通過量化數據素養能力,學生在了解自己的能力水平的基礎上可根據自己的評分偏向,在MOOC平臺選擇加強課程。如,得分在4-5之間,顯示該學生的數據素養能力已經很高,得分在2-4之間,顯示該學生的數據素養能力較低,得分在0-2之間,顯示該學生的數據素養能力差。對于數據素養能力弱的學生,應結合自己的各項得分來有針對的選擇適合自己的數據素養課程。如,數據意識各指標的得分較低,其可以在MOOC網站選擇《數據管理概念介紹》等課程;數據管理各指標較低,其可以選擇《數據管理培訓》等課程,通過學習DataCitec工具、EZID元數據創建工具和DMPTOOLS等數據管理計劃制定工具,提高數據管理技能;[11]數據技能各指標得分較低,其可以在MOOC平臺選擇計算機和數學等相關課程及軟件來提高其數據分析處理技能。MOOC教育的細分模式能夠幫助學生精準、快速、反復地進行素養提高。
大數據時代,高校大學生提高數據素養能力不僅僅是為了培養未來研究人員具備的品質,更是為了適應時代的發展,學生應結合個人教育背景,合理利用MOOC平臺和數據素養評價標度,學習必須的數據素養技能,以此在大數據的浪潮中站穩腳步。
[參考文獻]
[1]曲德強,李陳財.當代大學生數據素養的現狀分析及培養方法研究[J].思想政治教育研究,2015(4):97-101.
[2] Hogeoom K,etal.Showme thedata!Partneringwith instructorstoteachdataliteracy[EB/OL].[2016-05-07].http://www.ala.org/acrl/sites/ala.org.Acrl/files/con tent/conferences/11/papers/showme thedata.pdf.
[3] Mandinach E B,Gummer E S.A systematic view of implementing data literacy in educator preparation [J].EducationalResearcher,2013,42 (1):30-37.
[4]張靜波.大數據時代的數據素養教育[J].科學,2013,65(4):29-32.
[5]胡卉,等.英美高校圖書館數據素養教育研究[J].圖書與情報,2016(1):62-69.
[6]吳晶娥.高校圖書館大學生數據素養教育探析[J].圖書館理論與實踐,2014(12):73-78.
[7]隆茜.數據素養能力指標體系構建及高校師生數據素養能力現狀調查與分析[J].圖書館,2015(12):51-56.
[8]王維佳,等.數據素養能力評價與大學圖書館數據素養教育的思考[J].圖書館雜志,2016(8):96-102.
[9]喻婷.大數據時代圖書館員的數據素養研究[J].圖書館界,2016(3):1-4.
[10]胡卉,吳鳴.嵌入科研工作流與數據生命周期的數據素養能力研究[J].圖書與情報,2016(4):125-137.
[11]黃如花,林焱.大數據背景下數據素養教育研究[J].數字圖書館論壇,2016(5):19-26.