萬星火 徐述 檀亦麗 王紅蓮
【摘 要】數據素養(data literacy)通常指的是研究者在工作中對科學數據的采集、組織和管理、處理和分析、共享等過程中所具有的能力,大數據環境下,數據素養已逐漸成為提升科研創新能力的必備因素和核心競爭力。為使我校碩士研究生教育更好地適應我國科技進步、經濟建設和創新型社會的發展需要,提高碩士研究生培養質量。本文參考國內外有關數據素養研究相關文獻,構建自己的數據素養量表體系并對于本校的工科研究生數據素養進行了問卷調查獲得本校研究生的相關數據,通過數據分析來了解研究生數據素養的現狀;對目前研究生數據素養進行了綜合評價并提出了相關建議。
【關鍵詞】數據素養;數據意識;數據共享
【中圖分類號】TP391 【文獻標識碼】A
【文章編號】2095-3089(2019)10-0004-01
大數據背景下,數據作為一種重要的學術資源對研究工作產生了極大的價值,數據素養成為研究生學術發展的必備能力之一,已經引起國內外學者的高度重視。對研究生數據素養評價是開展針對性、有效性數據素養教育的前提基礎,對于提升大數據時代高校研究生信息素養水平、優化科研方式具有重要意義。
本論文以華北理工大學在校研究生為調查對象,針對我校研究生的培養要求以及“大數據”時代背景下如何培養出具有較高的數據素養去適應社會創新需求的高級人才。基于大數據的背景設計調查問卷,通過調查數據對本校研究生的數據素養現狀進行分析,掌握我校研究生數據素養培養存在的主要問題和制約因素,揭示我校研究生數據素養的現實狀況和實際需求,引起和研究生對數據素養的重視。實現我校研究生數據素養的培養體系系統化、規范化的研究目標。
由于各學科數據素養的差異性存在,本次調查采用分層抽樣的方法,將在校研究生按照所屬學科來分層來抽取。因為各層抽樣的費用相近,則按照內曼分配的原則來分配樣本量,以研究生數量比例及各分層的方差差異作為調整權重進行分層依據來抽樣;在每個分層中采取簡單隨機取樣的方法,以研究生的宿舍為抽取單位進行隨機取樣。
對在校研究生總體采用分層抽樣的調查方法,首先通過預調查發現各層中樣本方差存在差異,基于校研究生各學科的具體數量,記研究生總數為N,各學科的研究生為Nh,取權重Wh=Nh/N,以預調查各學科樣本方差估計真實方差,通過算得各學科的應收集的樣本量情況,如下表:
為了提高調查結果的精度,保證回收樣本量的充足,本次問卷調查共發放問卷360份,回收345份,其中有效問卷330份,回收率和有效率均約為96%。
數據分析:調查結果顯示,有效樣本中,46.84%的學生不了解數據素養 ,31.55%的學生通過網絡新聞了解數據素養,11.17%的學生通過查閱文獻了解數據素養,僅有10.44%的學生通過課堂教學了解數據素養。并且有80%以上的學生認為數據素養應該具備數據分析、數據收集和數據意識,大約70%的學生認為數據素養應該具備數據運用和數據描述。由此可以看出,我校外國語學科的學生的數據素養明顯偏低,大約二分之一的學生不了解數據素養。
數據素養的自我評價
〖XC4.JPG;%30%30〗
在本次調查活動中發現,在校研究生對于數據素養的自我評價情況較為集中,絕大數處于一般水平,占總樣本將近七成;另外處于差與較差水平的共占不到8%,對于自己數據素養評價為較好與好的占約22%。可以推測總體研究生數據素養的自我評價處于中等偏上的水平。
被調查者從何種途徑獲得數據素養教育(數據相關活動的參與情況)
〖XC5.JPG;%30%30〗
數據統計分析方法的使用:如果在學習或科研過程中需要做統計分析時,大部分學生會選擇自己先試試的做法,占總人數的79.55%;有12.12%的學生選擇請人幫忙的做法,一少部分同學學的比較好的會選擇自己直接操作的做法。在調查的研究生中,均值、中位數、眾數等為最常用的統計方法,也是最基本的統計方法,86.42%的人進行了選擇,標準差、正態分布、抽樣、概率等方法也都有超過一半的人選擇,而是用t檢驗、方差分析、卡方分析等其他方法的人比之較少,說明研究生對數據分析具有多樣性,但是對推斷統計方法的掌握和使用程度還不夠,仍需要多加學習和使用。
基于層次分析評價模型的我校研究生數據素養差異分析
目標層為比較各學科研究生數據素養A;準則層為數據意識B1、數據采集能力B2、數據管理能力B3、數據處理和分析能力B4、數據共享B5。方案層為3個工科、醫科、理學科研究生C1、C2、C3。
方案C1在目標中的組合權重為:0.156+0.039+0.024+0.063+0.018=0.300
方案C2在目標中的組合權重為:0.073+0.112+0.024+0.019 +0.018=0.246
方案C2在目標中的組合權重為:0.034+0.324+0.008 +0.017+0.073=0.456
由以上數據,我們可以得出,研究生專業數據素養評價相關因素的重要性排序結果依次為: 理學類研究生、工學類專業研究生、醫學類專業研究生,即我校研究生中理學類研究生數據素養水平最高,其次是工學類專業專業的學生,之后是醫學類研究生的數據素養水平在三個專業比較中水平較差。
結論
我校研究生教育總體上是比較關注對學生的數據素養的教育的,不僅開設一些相關課程,還經常舉辦講座、競賽活動為研究生提供學習的機會與便利,但學校仍需注意對不同專業不同水平的學生進行針對性教育,在某些方面仍需改善。
我校研究生具備基本的數據素養能力,部分數據素養水平較高,但大部分學生的數據素養仍處于中間或偏低水平。在此對數據素養的各方面進行總結。首先從數據意識方面來說,我校研究生絕大多數都對數據素養有一定的了解,但仍有很多不足之處,沒有形成主觀意識。其次,我校研究生具備一定的數據收集能力,但大部分情況下不具有客觀性,大多還是參照二手數據,在這方面應多加改善。對于數據分析整理方面,大部分研究生的能力比較欠缺,很少能夠找到合理準確的方法對問題進行分析。
建議
1.重視數據意識的提升,對于數據意識教育來說,“育”大于“教”。研究生學院應該積極鼓勵教師、學生對數據素養的研究,大力宣傳有關數據素養的知識,包括大數據時代背景,數據素養等相關內容、概念以及在科研中的重要地位。引導研究生主動提升自身數據意識的興趣。
2.加強數據技能的培養:數據技能是數據素養中的最為核心部分。應建設一支好用的數據并且數據素養較強的教師以及學生隊伍,開設學分課程、學位課程、講座、短期培訓等多樣的教學模式,基于數據素養的相關知識,創造學生感興趣的學習環境,再結合當前大數據時代的物聯網、云計算等技術,大膽創新,積極嘗試,讓學生能夠將理論與實踐結合在一起。對學生來說,認真學習,努力創新,提升自己的數據技能。
3.開展嵌入式和差異化的數據素養教育:由于學生個體之間存在著差異性,在數據素養方面也是如此,為了響應以學生為主體的教育教學模式,可以針對不同專業、不同性別或不同年級的學生來分別展開有關數據素養教育的相關課程,開展有針對性、多層次的數據素養教育,要重視數據素養教育,為建設科教強國提供人才上的支持。
參考文獻
[1]Carlson J,Fosmire M,Miller C,ct al.Determining data information literacy needs:a study of students and research faculty[J].Portal-Libraries and the Academy,2011,11(2):629-657.
[2]黃如花,王春迎.面向學科的數據素養現狀及需求調查——以《信息檢索》MOOC學生為例[J].圖書館.
[3]卜冰華.大數據環境下我國大學生數據素養教育研究綜述[J].數字圖書館論壇,2017(12):63-67.
[4]張明海,周艷紅.大數據時代大學生數據素養教育的目標定位及體系構建[J].圖書館,2016(10):84-88.
[5]吳晶娥.高校圖書館大學生數據素養教育探析[J].圖書館理論與實踐,2015(12):73-77.
[6]沈婷婷.數據素養及其對科學數據管理的影響[J].圖書館論壇,2015,01:68-73.
[7]隆茜.數據素養能力指標體系構建及高校師生數據素養能力現狀調查與分析[J].圖書館,2015,12:51-56+62.
[8] Shields M.Information literacy,statistical literacy, data literacy[J]. IASSIST Quarterly,2004,28(2/3):56-61.