黃如花,王春迎
?
面向學科的數據素養(yǎng)現狀及需求調查
——以《信息檢索》MOOC學生為例*
黃如花,王春迎
摘要以《信息檢索》MOOC課程學生為調查對象,從數據基本意識、數據獲取、數據管理(狹義)、數據分析、數據存儲與安全、數據倫理六個維度調查其數據素養(yǎng),并分析其數據素養(yǎng)課程學習情況、數據素養(yǎng)需求情況以及學科背景與數據素養(yǎng)需求之間的差異。
關鍵詞學科數據素養(yǎng)信息素養(yǎng)MOOC需求
引用本文格式黃如花,王春迎.面向學科的數據素養(yǎng)現狀及需求調查——以《信息檢索》MOOC學生為例[J]. 圖書館論壇,2016(6):99-105.
*本文系教育部人文社科規(guī)劃基金項目“MOOC背景下圖書館嵌入教學服務的對策與實證研究”(項目編號:15YJA870006)和湖北省教改項目“‘慕課’背景下信息素質教育課程的變革研究”(項目編號:2015009)研究成果之一
近年來數據素養(yǎng)逐漸受到重視,越來越多行業(yè)開始要求從業(yè)人員擁有相應的數據素養(yǎng)。英國國家美術館(The National Gallery)開始招聘數據業(yè)務分析師[1];新聞行業(yè)要求從業(yè)者有數據素養(yǎng)做好數據新聞[2],哥倫比亞大學數字新聞學塔爾中心對“數據新聞記者”這一職位提出了包括收集與統(tǒng)計、用戶分析、數據分析等在內的六項數據素養(yǎng)要求[3]。然而英國的一項調查顯示,雖然不同學科的研究者在數據管理上存在差異,但普遍缺乏數據能力[4]。由此可見,現在及未來相關行業(yè)的從業(yè)者擁有與學科背景或行業(yè)需求相適應的數據素養(yǎng)的必要性。
目前國內外已有許多與數據素養(yǎng)相關的研究,但針對不同學科數據素養(yǎng)現狀及需求的研究卻相對缺乏。不同學科領域的知識結構、科研環(huán)境、研究內容不同,對數據需求也不同[5]。數據素養(yǎng)具體到學科領域有其專指性和差異性,如社會學強調數據的收集和統(tǒng)計,經濟學強調數據分析和建模[6]。本文以《信息檢索》MOOC課程學生為研究對象,通過問卷調查的形式獲取了不同學科背景學員的數據素養(yǎng)情況,在此基礎上進行分析,并對數據素養(yǎng)教育提出了一些建議。
本文采用基于問卷調查的研究方法,調查對象為筆者開設的《信息檢索》MOOC課程學生,利用問卷星平臺設計問卷,通過郵件和社交媒體發(fā)放問卷。MOOC作為一種新的學習方式,在我國各個高校發(fā)展迅速,筆者開設的《信息檢索》MOOC在國家教育部主辦的愛課程網旗下的中國大學MOOC平臺上開課,第三期課程學生人數有20040名,學生人數眾多,來自全國多個省份,地域分布廣泛,覆蓋各種學科?!缎畔z索》課程是國家教育部要求各高校開設的素質教育類課程之一,參加本次《信息檢索》MOOC課程的學生多數對數據、信息檢索等數據素養(yǎng)技能有一定的需求。因此,以該課程學生為調查對象,具有一定的代表性和針對性。
在設計問卷前,筆者進行了廣泛的文獻調研,參考了孟祥保和李愛國[7]、張靜波[8]、隆茜[9]、吳碧薇[10]等學者對數據素養(yǎng)的研究及問卷調查項目,初步設計出本研究的問卷調查項目。隨后,征集相關專家的意見和建議,并據此修改問卷,刪除重復內容,增添欠缺的項目,以保證問卷的全面性和簡潔性。然后,隨機將問卷發(fā)放給20名《信息檢索》MOOC學生進行測試,根據其反饋意見,在專家的指導下進一步修改及完善問卷,最終確定本次調查問卷的內容。
問卷分為三大部分。第一部分是被調查對象的基本信息,包括性別、年齡、學歷、學科等信息。為了更好地調查學生的學科信息,筆者按照2011年國務院學位委員會、教育部頒布的《學位授予和人才培養(yǎng)學科目錄(2011年)》中設置的13大學科門類[11],對被調查者的學科大類進行調查,并設置了文本題目,請被調查者寫下自己的具體專業(yè),以便進一步分析各專業(yè)的具體情況。第二部分是學生數據素養(yǎng)能力自評,從數據基本意識、數據獲取、數據管理、數據分析、數據存儲與安全和數據倫理6個維度展開調查:(1)數據基本意識主要調查學生對自己的數據需求以及滿足數據需求基本途徑的掌握和了解情況;(2)數據獲取調查學生利用數據庫獲取數據、制定檢索策略、檢驗數據準確性和評價數據質量的能力;(3)對于數據管理,筆者在問卷中設計了能否有效管理和組織數據,制定數據分類標準,能否根據元數據規(guī)范描述、組織和存儲數據,能否判斷有用與無用信息并及時刪除無用信息,能否及時更新數據存儲,跟進學科進展等內容,以期了解學生數據管理素養(yǎng)的情況;(4)數據分析調查學生對數據分析工具,對如何獲取和創(chuàng)建需分析的數據等的熟悉程度,了解學生可否掌握數據統(tǒng)計和分析的方法,用可視化工具分析、重新表現和解釋數據,具備將學科領域的分析轉換成數據建模的能力[12];(5)數據存儲與安全調查學生對數據存儲知識、解決相關問題及數據交互意識的了解情況;(6)數據倫理維度主要調查學生對相關法律、規(guī)定的了解程度,以及是否具備規(guī)范說明數據來源的能力。第三部分調查學生對數據素養(yǎng)課程的態(tài)度,以及對數據素養(yǎng)的需求,其中的13項數據素養(yǎng)能力參考數據信息素養(yǎng)項目組(The Data Information Literacy Project)對研究生定義的12項關鍵能力[13]。第一、第三部分為選擇題,第二部分是量表題,對變量的測量采用李克特五級量表形式(1=完全不同意,2=不同意,3=一般,4=同意,5=完全同意)。
本次調查的時間為2015年11月6日到12 月1日,共回收網絡發(fā)布的有效答卷796份。其中,男性332人,女性464人;年齡上,以19-29歲的居多,占77.39%,18歲及以下占3.64%,30-44歲占13.57%,45-59歲占5.15%,60歲及以上占0.25%,總體來看以中青年為主;在讀??粕?6人,在讀本科生411人,在讀碩士、博士研究生126人,研究人員123人,其他從業(yè)者100人,多數學生為在校學生或研究人員,以此樣本分析數據素養(yǎng)課程的設計是有意義的;學科大類上,哲學類占1.63%,經濟學類占4.9%,法學類占4.65%,教育學類占7.66%,文學類占8.42%,歷史學類占1.01%,理學類占10.55%,工學類占23.12%,農學類占2.39%,醫(yī)學類占4.15%,軍事學類占0.25%,管理學類占24.62%,藝術學類占6.28%,另有0.38%的人沒有選擇學科,被調查的學生涉及各個學科,便于后文據此進行分析。
數據素養(yǎng)貫穿于科學研究的各個階段,數據的生命周期融入科學研究生命周期之中[14]。筆者綜合了國內外學者專家對數據素養(yǎng)的界定,認為數據素養(yǎng)主要應涉及數據基本意識、數據獲取、數據管理(狹義)、數據分析、數據存儲與安全以及數據倫理等內容,并對上述每個維度設計具體問題讓學生進行自我評估,詳見表1。

表1 數據素養(yǎng)自評情況
3.1數據基本意識
調查結果顯示,數據基本意識維度得分普遍偏高,在6個維度中排名第一,說明學生具有基本的數據意識,基本了解自己在工作與學習中的數據需求,能夠通過搜索引擎和學校(機構)的數據庫獲取所需數據。但“了解學科數據來源”小項的得分相對較低,只有2.96分,說明學生雖有利用學校所購綜合性數據庫查找數據的意識,但從專業(yè)的學科數據來源查找數據的意識較弱。從學科來看,管理學的學生表現最好,均值最高,其中有三個小項得分在各學科中排名第一。
3.2數據獲取
在數據獲取維度的6個小題中,獲取符合自己需求的數據、對獲取的數據進行合理利用這兩項的得分相對較高,而在獲取數據時制定多種檢索策略、對獲取的數據進行準確性檢驗、正確評價數據的質量、權衡獲取數據的成本和效益上的得分相對較低,說明學生在這4個方面的能力較為薄弱。與其他維度相比,數據獲取維度排名第二,說明學生的數據獲取能力相對較好。其中,管理學和理學的學生比其他學科學生有更強的數據獲取能力;教育學的學生在正確評價數據質量的選項上得分最高,表現突出。
3.3數據管理
數據管理維度的得分在6個維度中排列第三,均值3.05分,表現尚可。在該維度的4個小項中,及時判斷有用與無用信息,對無用信息進行刪除的均值最高,為3.46分,說明學生有根據實際情況判斷和刪除數據的意識和能力。但是本維度得分差異明顯,除上述選項外,其余選項得分略低。根據元數據規(guī)范描述、組織和存儲數據這一項得分最低,平均只有2.74分;有效管理組織數據,制定數據分類管理標準的平均分也只有2.94分,這說明學生的數據管理能力欠缺,不能有效管理和組織數據。在學科上,本維度表現最好的是理學學科;在及時更新數據儲備,跟進學科進展這個單項上,管理學的學生的素養(yǎng)最高。
3.4數據分析
本維度在6個維度中平均得分最低,4個選項的平均分都在3分以下,說明學生數據分析能力普遍欠缺,不能熟練使用數據分析工具和軟件,沒有掌握基本的數據分析方法。數據可視化分析和數據建模的表現最差,平均分只有2.74 和2.32。理學的學生在本維度的表現最好,各個單項的均值都是各學科中最高的,這與理學的學科特點具有一致性。
3.5數據存儲與安全
調查結果顯示,學生在數據存儲與安全維度的能力有所欠缺,除了數據共享意識這一選項得分為3.15外,其余選項得分均在3分以下。說明學生不了解數據操作過程中可能出現的問題,不了解數據保存和安全的相關規(guī)定,也不能及時有效處理和解決數據存儲的問題。理學的學生的數據存儲與安全素養(yǎng)最高,各項得分在學科對比中均是最高的。
3.6數據倫理
本次調查顯示,學生的數據倫理素養(yǎng)有待加強。數據所涉及的知識產權及隱私權、了解數據倫理在學習和工作中的原則、對所引數據的出處進行規(guī)范說明,三項的平均分依次為2.93、2.79 和2.96,總體偏低。近年來數據倫理問題已逐漸引起人們的關注,但該維度各項平均分偏低,說明學生對數據倫理的認知不足,有必要加強教育,提高學生的數據倫理素養(yǎng)。法學的學生在數據相關權利方面的素養(yǎng)較高,法律意識強;教育學的學生比其他學科的學生更了解數據倫理在學習和工作中的原則;管理學的學生能更好地對所引數據的出處進行規(guī)范說明。不同學科學生的表現體現了各學科的特點。
3.7整體情況分析
通過上文不同層面和角度對學生數據素養(yǎng)情況的分析,可得出以下結論:
(1)學生數據素養(yǎng)較差。比較分析整個問卷的量表題,可發(fā)現學生的數據素養(yǎng)普遍偏低,平均分沒有高于4分的選項,數據管理和數據分析的平均分基本在3分以下;數據建模的平均分最低,只有2.32分;數據保存與安全的平均分僅有2.75。由此可見,學生明顯欠缺這些數據素養(yǎng)。
(2)多數學生只注重數據的獲取,對數據組織、存儲等后續(xù)管理以及數據相關權利的重視不夠。在得分上,利用元數據描述、組織、存儲數據的能力得分比較低,平均分僅有2.75;數據存儲與安全維度、數據倫理維度的平均分都僅為2.89??傮w來看,數據基本意識和數據獲取得分較高,而數據管理、分析、存儲和數據倫理得分相對較低,兩者之間差距較為明顯。
(3)管理學和理學的學生數據素養(yǎng)最好,多項指標的均值在13個學科中均是最高。其中管理學學生在數據基本意識和數據獲取維度上表現最好;理學的學生則在數據管理、分析和存儲的維度表現出色。
(4)數據素養(yǎng)能力與學科之間有著密切的聯系,參與調查的管理學的學生多數是圖書情報檔案等專業(yè)的學生,數據和信息是其平時學習和研究的主要對象,因此具有較高的數據素養(yǎng),與其他學科學生相比,其數據意識和獲取能力的素養(yǎng)尤為出色;理學學科注重定量分析,對數學能力的要求普遍比文史哲等學科高,因此其學生在數據分析、建模等方面的數據素養(yǎng)較高;法學的學生在“了解所研究學科領域的數據所涉及的知識產權、隱私權等問題”的選項上均值最高,在數據倫理上的整體得分也偏高,體現了法學關注法律與規(guī)范的學科特點。
本次調查顯示,僅有35.3%的學生曾經學習過數據素養(yǎng)相關課程。在“是否希望學?;蛩跈C構根據不同學科開設相關的數據素養(yǎng)課程”這一問題上,有87.19%的學生選擇了“希望”,12.19%的學生選擇了“無所謂”,僅有0.62%的學生明確表示“不希望開設相關課程”。筆者根據調查結果分析數據素養(yǎng)與課程學習之間的關系、各學科學生對數據素養(yǎng)需求的總體情況以及不同學科在數據素養(yǎng)需求上的差異。
4.1數據能力與數據素養(yǎng)課程的因果關系分析
為了解數據素養(yǎng)課程是否能提高學生的數據素養(yǎng),筆者以是否學習過“數據素養(yǎng)相關課程”對學生進行分類,將問卷中調查的各項素養(yǎng)分別統(tǒng)計均值,結果如圖1所示。
學習過數據素養(yǎng)課程的學生與沒有學習過的學生在數據素養(yǎng)各項得分的走向上保持了一致性,但可以明顯看出,前者的各項得分都比后者高。尤其在了解自己工作生活中的數據需求,在本校(本機構)購買的數據庫中查找自己學科數據,獲取符合自己需求的數據,正確評價數據的質量,以及數據倫理等方面,兩者得分差距顯著。可見,數據素養(yǎng)課程在提高學生數據素養(yǎng)方面發(fā)揮了重要作用,開設數據素養(yǎng)課程十分有必要。

圖1 數據素養(yǎng)比較注:按照問卷中數據基本意識等6個維度的題目順序,分別將各小題編號為1~26
4.2數據素養(yǎng)需求的基本情況
不同學科背景的學生對數據素養(yǎng)的需求不同,為了更好地展現差異,筆者首先將統(tǒng)計結果按照選項人數多少依次排序,并以圖表展現(見圖2)。在數據素養(yǎng)的需求上,數據發(fā)現和獲取、數據收集和統(tǒng)計的占比最高,分別有676人和645人選擇,占84.92%和81.03%。其次是數據檢索,有554人選擇,占69.60%;有529人選擇數據分析和建模這一素養(yǎng),占66.46%;選擇判斷數據質量的有523人,數據管理和組織有446人,數據可視化有437人,數據轉換和互操作有404人,數據格式有368人,數據的存儲和備份有351人,對元數據和數據相關權利兩項的需求人數最少,分別有344人和322人。學生各項數據素養(yǎng)需求的差異明顯,從需求最高的收集統(tǒng)計選項到需求最低的相關權利選項,人數依次平穩(wěn)遞減,最高值與最低值的差值較大,選擇數據收集統(tǒng)計的人數是選擇數據相關權利的兩倍多。

圖2 13項數據素養(yǎng)需求情況
4.3學科背景與數據素養(yǎng)需求的差異性分析
為了更好地了解學科背景與不同數據素養(yǎng)需求間的差異性,筆者將這兩個變量進行了交叉分析。由于調查對象是《信息檢索》課程的學生,某些學科學習該課程的人員較少,沒有采集到充足的樣本,為了減少分析上的誤差,對哲學、歷史學、軍事學、農學、醫(yī)學5個調查樣本不太充足的學科不作分析,只分析經濟學等8個樣本數相對較充足的學科。將8大學科和數據素養(yǎng)13個能力進行交叉分析,詳細結果見表2。

表2 不同學科對13項數據素養(yǎng)需求的交叉分析
4.3.1不同學科對數據素養(yǎng)的需求具有差異性
通過交叉分析表可以看出,不同學科對數據素養(yǎng)的需求具有差異性:(1)經濟學的學生對數據收集統(tǒng)計、數據分析和建模的需求最高;其次是數據發(fā)現和獲取、判別數據質量,對元數據和數據存儲備份的需求最低,僅有38.46%的學生選擇該項。(2)法學的學生對數據發(fā)現和獲取需求最高,94.59%的學生選擇了該項;其次是的數據收集統(tǒng)計,占89.19%,法學的學生選擇最少的是數據庫和數據格式;雖然數據相關權利這一選項的整體選擇意向不高,但法學的學生選擇該素養(yǎng)的人較多,占62.16%,在學科排名中位列第一;另外法學的學生對判別數據質量的需求較高,占比達78.38%,在所有學科中排名第一。(3)教育學的學生選擇最多的是數據發(fā)現和獲取;其次是數據收集和統(tǒng)計分析,選擇最少的是準確認識數據相關權利。與其他學科的學生相比,教育學的學生對根據元數據規(guī)范組織和存儲數據的選擇比較高,有54.10%的學生選擇了該項。(4)文學的學生對數據收集和統(tǒng)計分析的需求最高,對準確認識數據相關權利的需求最低,與其他學科的學生對比,文學的學生對數據檢索的需求比其他學科高,占比為76.12%,排名第一。(5)理學的學生選擇最多的是數據收集和統(tǒng)計分析這一選項,最少的是準確認識數據相關權利,與其他學科學生相比,理學的學生對數據轉換以及數據可視化的需求更高。(6)工學的學生對數據素養(yǎng)的需求比較均衡,最高值與最低值之間的差距較小,各項需求的比例集中分布在50%到70%左右。
4.3.2數據素養(yǎng)教育與學生需求的對接有偏差
目前數據素養(yǎng)教育和學生的數據素養(yǎng)需求在對接上仍有偏差,需進一步完善加強,以滿足學生的需求。數據分析和建模、檢索工具利用、數據質量判斷、數據管理和組織在學生需求排名中十分靠前,但調查顯示,這些學生的數據能力得分普遍偏低。例如,數據分析和建模的需求排名第四,有66.46%的人希望擁有這項素養(yǎng),但學生在數據分析維度的能力均值較低,其中數據建模能力的得分僅為2.34,是所有量表題中平均分最低的一項。學生數據素養(yǎng)欠缺和高度需求之間的關系,值得教育者警醒和注意。
4.3.3學科背景差異導致數據素養(yǎng)需求不同
不同學科的學生對數據素養(yǎng)需求不盡相同,這些差異與其學科特點呈現一致性。例如,經濟學的學生對數據收集統(tǒng)計、數據分析以及數據建模的需求偏高,而法學的學生在數據相關權利方面的需求明顯高于其他專業(yè)的學生。
總體看來,法學的學生對各項數據素養(yǎng)的需求都較高,可能是受訪的法學的學生數據素養(yǎng)較差,因此迫切希望提高自己的數據素養(yǎng)。與之相應,在《信息檢索》MOOC課程的教師答疑區(qū),經常有法學的學生提問,表現積極。由于大部分藝術類課程對數據的使用不多,藝術類的學生對數據的認識以及數據意識相對薄弱,藝術類的學生對各項數據素養(yǎng)的選擇率就比其他學科學生低。本調查中的管理學的學生多數為圖書情報檔案、會計以及統(tǒng)計等專業(yè),數據是其學習的主要對象,數據素養(yǎng)相對較高,因此對各項數據素養(yǎng)的期望值并不突出。
本研究表明,目前學生的數據素養(yǎng)較欠缺,數據素養(yǎng)課程較少,但學生對數據素養(yǎng)有明顯的需求,因此開設相關課程十分必要。有關機構應當重視學生的學習需求和能力的培養(yǎng),在現有數據素養(yǎng)課程的基礎上繼續(xù)深化培訓內容,增設系統(tǒng)的、有針對性的、多層次的數據素養(yǎng)教育課程[15]。此外,數據素養(yǎng)課程的開設要與各學科特點和需求相適應,可以根據學科分模塊教學。不同學科的學生對數據素養(yǎng)的需求有共性也有差異,對數據獲取、分析等共性需求,可以設置通用模塊進行統(tǒng)一教學;對數據建模、可視化、數據質量判斷等差異性較明顯的需求,可以設立彈性模塊,提供給有需要的學科,深入開展講解,對無需求或需求不高的學科僅提供通識教育即可。
參考文獻
[1] Data literacy in arts and cultural organisations arts & metrics[EB/OL].[2015-11-07].http://artsmetrics.com/ en/data-literacy-in-arts-and-cultural-organisations/.
[2] 大數據時代如何做好數據新聞:需有數據素[EB/OL]. [2015-11-07].http://tech.sina.com.cn/i/2015-03-27/ doc-ichmifpy2295828.shtml.
[3] Anderson W,Bell E,Shirky C. Post-industrial Journalism:Adapting to the Present[EB/OL].[2015-11-10].http://towcenter . org/wp-center/uploads/2012/11/TOW Center-Post_industrial_journalism.pdf.
[4] 沈婷婷. 數據素養(yǎng)及其對科學數據管理的影響[J]. 圖書館論壇,2015(1):68-73.
[5] 郝媛玲,沈婷婷. 數據素養(yǎng)及其培養(yǎng)機制的構建與策略思考[J]. 情報理論與實踐,2016(1):58-63.
[6][7] 孟祥保,李愛國. 國外高校圖書館科學數據素養(yǎng)教育研究[J]. 大學圖書館學報,2014(3):11-12.
[8][12][14] 張靜波. 大數據時代的數據素養(yǎng)教育[J]. 科學,2013(7):30-31.
[9][15] 隆茜. 數據素養(yǎng)能力指標體系構建及高校師生數據素養(yǎng)能力現狀調查與分析[J]. 圖書館,2015(12):55-56.
[10] 吳碧薇. 基于信息素養(yǎng)的數據素養(yǎng)核心能力基本框架構建[J]. 圖書與情報,2015(4):128-131.
[11] 學位授予和人才培養(yǎng)學科目錄(2011年)[EB/OL]. [2015-11-07]. http://baike.haosou.com/doc/1470554-1554873.html.
[13] Jake Carlson,Megan Sapp Nelson,Lisa R.Johnston,et al.Developing Data Literacy Programs:Working with Faculty,Graduate Students and Undergraduates[J]. Bulletin of the American Society for Information Science and Technology,2015(6):14-17.
Investigation and Analysis on the Current Situation of Subject-Oriented Data Literacy and Its Demands——A Case Study of Students from MOOC“Information Retrieval”
HUANG Ru-hua,WANG Chun-ying
AbstractThis paper investigates the data literacy of students who attend the MOOC Information Retrieval in the way of basic data awareness,data acquisition,data management(in a narrow sense),data analysis,data storage and security,and data ethics. It analyzes their studies and demands of data literary,as well as the variances in their demands for data literacy in different disciplines.
Keywordsdisciplines;data literacy;information literacy;MOOC;demands
作者簡介黃如花,女,教授,博士生導師,武漢大學信息管理學院副院長;王春迎,女,武漢大學信息管理學院碩士研究生。
收稿日期2015-12-28