凌婉陽
(廣東省生物工程研究所(廣州甘蔗糖業研究所) 廣州 510316)
在大數據時代環境中,各種數字、數據、圖表充斥著我們生活,與數據相關的類型、數量、范圍、形態、價值以及挖掘方式噴薄出現,數據的有效處理及高效開發成了各行各業發展中無法規避的問題。大數據時代的到來,科學研究也發生了深刻的變化,海量的數據促進了科研領域量化的進程,推動了以數據為核心的新型科研方式的形成。2009年《第四范式:數據密集型科學發現》(The Fourth Paradigm: Data-intensive Scientific Discovery)[1]一書的出版,標志著數據密集型科研范式的確立和數據密集型科研環境的形成,開啟了繼實驗科學、理論科學、計算科學之后的“數據密集型科學”的第四種科研范式[2]。在新的科研范式下,科研數據的創建、獲取、存儲和分析利用都發生了革命性的變化,數據作為科研過程的重要產出,是科研人員研究和利用的主要對象,而大數據中蘊含著豐富的價值和知識,對促進科研創新發展具有重要的作用,必將成為科研中競相爭奪的前沿。在大數據科研環境的壓力下,科研人員面臨著數據開發與管理能力的嚴峻考驗。數據素養作為數據管理與利用范疇的關鍵概念,日益受到重視,已成為科研人員科學研究與交流的必備能力之一。
在此背景下,數據素養的相關研究受到越來越多的關注,涌現了一批相關的文獻資料和研究成果。研究者們針對數據素養的內涵與外延進行了大量的研究,并在理論框架內提出了提高數據素養的建議。這些相關的研究對象大多集中于高校學生及高校圖書館范圍,對科研院所及其他機構的科研人員的科研數據素養研究較少。
作為創新型人才中堅力量的科研人員,必須有較高的綜合素質和較強的創新能力。然而科研機構數字資源建設情況并不樂觀,科研人員的科研意識、科研信息獲取等科研數據素養狀況不容樂觀[3],相關的研究表明,數據素養與科研創新能力具有較高的相關性[4],培養提高科研人員的科研素質對促進科研創新具有重大作用。
近年來數據素養(Data Literacy)成為大數據領域的研究熱點之一,與之相近的概念還包括信息素養、計量素養、量化素養、統計素養等,這些概念早在20世紀末已被提出,共同組成了數據素養的雛形。其中,信息素養被認為是與數據素養關系最密切,學者們對其關系進行了大量的研究探討,有學者認為數據素養是統計素養和信息素養不可或缺的內容[5],是信息素養內涵的最佳延伸、發展與表達[6]。信息素養,最早由美國信息產業協會主席Paul Zurkowski于1974提出,主要是指利用各種信息工具吸收主要的信息源,使問題得到解決的技術和技能[7]。直到2015年美國大學研究圖書館協會(The Association of College and Research Libraries,ACRL)發布了目前相對權威的定義,即信息素養是發現信息、理解信息和價值、使用信息創造新知識和參與社群學習的綜合能力集合[8]。在信息素養定義的研究基礎上,學者們對數據素養的內涵進行了探討。
用于表述數據素養的術語很多,包括數據素養、數據信息素養、科學數據素養、數據管理素養等,而在目前的研究成果中,“數據素養”已經成為目前研究使用的主流術語。David Herzog在其《Data Literacy: A Users’Guide》 一書中指出數據素養是對數據的確認、獲取、評估、凈化、分析及可視化過程[9]。郝媛玲等綜合國內外文獻論述和研究發展,提出數據素養是具備數據意識和數據敏感性,能夠有效且恰當地獲取、分析、處理、利用和展現數據,并對數據具有批判性思維的能力,它是對統計素養和信息素養的延伸和擴展[10]。從國內外學者現有的研究成果來看,關于數據素養定義的描述各異,但歸納起來,基本要素包括:數據意識、數據能力、數據倫理三大要素,一些學者將這三要素進行細化與擴展,提出數據素養的一些補充要素,包括數據知識、數據態度等。總體而言,數據素養強調批判性地認知和掌握數據的能力,同時也強調在科研實踐中能規范地處理和分析數據、利用數據,遵守數據倫理與道德,實現數據最大化[11]。
在科學研究領域中,數據素養稱為“科研數據素養”。科學研究過程中,通過觀察、計算或實驗等手段產生的數據稱為科研數據、研究數據或者科學數據[12]。科研數據可以以任何數字形式存儲,包括文字、數字、圖像、視頻或電影、音頻、軟件、算法、方程、動畫、模型、模擬等[13]。科研數據素養就是針對科研人員或科研數據的一種數據素養,是數據素養在科研范疇中的細化。相比一般數據素養,科研數據素養更強調科研人員這一主體,科研活動的范疇,并突出科研數據的特點。因此,參照數據素養的涵義與要素,科研數據素養就是指,在科技活動中能辯證、科學、正確地對數據價值進行感知并在數據搜集、組織、管理、分析、處理、共享、創新、協同、復用等方面具有相應的能力以及在數據生成、管理和發布過程中的道德與行為規范。科研人員作為科研數據的主要創建者和使用者,其數據素養對科學數據重要價值的產生起著關鍵作用[14]。
科研數據素養是數據素養的細化,數據素養的研究現狀在一定程度上引領了科研數據素養研究的方向,在開展科研數據素養研究方面具有重要的指導意義。目前數據素養研究成果大多集中于以下幾方面:一、數據素養的定義與要素,包括探討數據素養的概念與相關術語的含義以及數據素養內涵的能力要素[15]。二、數據素養的需求,通過問卷調查等方式獲取不同群體用戶的數據素養現狀以及數據素養需求[16-17]。三、數據利用行為,主要包括數據共享等行為。Fecher等建立了一個包括數據提供者、科研機構、制度與規范、研究社區、數據基礎設施、數據接收者六個要素在內的概念框架,以解釋數據共享行為的過程[18]。四、數據素養教育。早在20世紀70年代信息素養教育就被提出,信息素養在高校、圖書館界日漸得到重視,現在已具備了一定的教學模式。數據素養作為信息素養在大數據時代中內涵的延伸與發展,借鑒了信息素養的培養方式,國內外的數據素養教育研究與實踐也呈現豐富多樣的特點,有學者針對中外高校信息素養培養中的典型模式進行了案例和比較分析[19]。
具體到科研數據素養研究,目前將科研數據素養作為一個整體概念的相關研究較少,國內關于科研數據管理與共享方面的探索已逾10年,但主要集中在科學數據管理規范或標準、科學數據共享平臺建設兩方面。劉桂鋒等學者從文獻的學科分布、 國家分布、機構分布、作者分布等外在特征、知識基礎和研究前沿等方面分析了國內外關于科研數據管理的文獻,總結出科研數據管理理論、科研數據管理服務和科研數據管理案例為目前科研數據管理研究的三大研究熱點[20]。總體而言,國內相關研究大多集中在科研數據的管理與使用等科研數據素養的具體內容方面,對科研人員科研數據素養整體概念的針對性研究較少。因此,本文以科研人員為主體,研究科研人員的數據素養現狀,并探討針對其群體特征的數據素養提高策略,建立適用于科研人員的科研數據素養培養與提高框架,以期為科研人員適應科研環境變化及提高其科研數據素養提供研究基礎。
由科研數據素養的定義看出,科研數據素養的要素包括主體、客體和內涵體系三個層面,主體主要是指參與科研工作的科技人員;客體主要是科研過程中涉及的科研數據;而內涵體系作為最核心的要素,是科研數據素養主體作用于客體的表現的總和,是科研人員所具有的與數據有關的特質與技能。根據目前學者們對數據素養內涵體系的研究成果,筆者認為科研數據素養的內涵體系可以歸納為科研數據認知、科研數據能力和科研數據倫理等三個部分。科研數據認知,主要是指科研人員的主觀意識方面,強調的是精神層面的數據素養;科研數據能力,主要是指科研人員具備的技術和能力,是最直觀也最容易被理解和接受的科研數據素養要素;而科研數據倫理,主要是指在數據操作過程中遵守的原則和規范,主要體現科研人員的道德素質與行為規范。科研素養的內涵之間相互影響、相互滲透,具有密不可分的關系,它們共同決定了科研數據開發利用與管理的方式和效果。科研數據素養的要素及內涵體系之間的關系如圖1所示。

圖1 科研數據素養的要素與內涵體系關系圖
科研數據認知,整體包括數據意識和數據知識。數據意識,主要是指科研人員能夠意識到數據在科研實踐中發揮重大的作用,能意識到科研數據蘊含著重要的價值,具備敏銳的數據觸覺,能判斷數據是否有價值,還能辨別不同數據的價值差異,對高價值數據進行甄選。在科研合作全球化的環境下,具有廣闊的國際視野,選擇符合具體情況適用的數據尤為重要。另外,在大數據環境下,海量數據甄別工作繁瑣而昂貴,一些具有高價值的數據往往不易得到,數據共享具有減少重復勞動、實現優質資源共享等優勢,數據共享工作在科研協同合作、科研產品的轉化以及項目的延伸發展方面都具有積極的推進作用,已被作為科研項目的重要評核要素,因此,數據共享意識也逐漸成為重要的科研數據素養。
數據知識,則是指具備了數據相關的基本知識,包括熟悉科研生命周期和科研數據生命周期,了解數據分類與格式、數據的獲取與存儲、數據的處理與分析等。不同的科研階段對科研數據的需求和要求都不一樣,不同階段的數據對科研工作的作用不同,只有了解并熟知科研生命周期和科研數據生命周期,才能在每個科研階段采用恰當的科研數據,更好地推動科研項目的發展。同時,數據知識素養還包括具備相應的數據使用規范知識和相關的法律知識,合法合理地正確使用相關數據。
科研數據能力,是貫穿于數據生命全周期中數據采集、表示、描述、發現與檢索、選擇與評價、分析、利用、引用、整合、復用、保存、管理等一系列活動所需的技能[21],包括數據的定位與采集能力、數據分析與解讀能力、數據反思與決策能力等[5]。科研數據能力是科研數據素養的核心組成部分,決定開展科研數據工作的可能性,還決定科研數據挖掘分析的深度和廣度。科研數據能力的培養與提升是整個科研生命周期,甚至科研人員整個職業生涯需要反復進行,永無止境的必修課。
科研數據倫理素養,主要是指能夠合理合法地獲取并使用數據,在數據的發布和使用過程中能遵守相關社會法規與規范,采用正確的方法和堅持倫理性原則[5]。科研數據倫理不僅包括在數據的獲取和使用過程中能遵守相應的道德和規范,還包括對隱私數據的自我保護意識和行為。因此,科研數據倫理的核心是:在數據過程中,保護他人數據權益的同時,保護好自身的數據權益。
信息和互聯網發達的現代社會,人們對知識產權、個人隱私信息的重視達到了新的高點。科研項目數據,特別是在研項目,涉及大量不能公開的技術參數或參與者的身份信息,這些信息一旦泄露,項目的執行效果、項目的經濟效益甚至參與者的權益都可能受到影響和侵害,因此,在科研數據獲取和使用等過程中,遵守科研數據倫理,不僅是尊重他人勞動成果和產權的舉措,同時也保護了自身的權益。
3.1.1 有助于適應大數據環境,建設數字化科研。大數據的整體科研環境、數據密集型的第四科研范式、E-Science項目的啟動等一系列變化,為科學研究提供了全新的思維和科研模式,推動著數字化科研的深化發展。海量的數據是大數據時代的基礎,對龐大數據量進行有效管理是數字化科研建設的重要內容,是進行數據開發利用的重要前提。科研人員必須具備一定的大數據組織、管理和分析能力,才能順利開展科研工作。科研數據素養就是涵蓋從數據感知到數據獲取到數據開發利用的能力體系,是科研人員在大數據環境下必備的素養,因此,全面培養與提高科研人員的科研數據素養有助于其更好地適應科研在大數據環境下的變革,將大數據環境帶來的挑戰轉化成機遇。
在數字化科研中,科研領域中的科學研究生命周期與數據的生命周期息息相關,二者相輔相成。在科研立項階段,科研人員必須有足夠的數據感知能力以及數據收集能力,才能更好地論證項目的可行性以及規劃項目的進程;在科研項目開展階段,數據經歷了收集、甄別篩選、分析挖掘等處理,良好的科研數據挖掘能力是科研項目開展的必備條件,科研數據的收集與利用為科研項目進行論證,推進了科研項目的開展;在科研項目結項階段,科研數據面臨著長期存儲、后期管理等問題,科研人員必須從理論和技術上對其進行規劃實施,這也是項目結項中必須解答的問題。數據生命周期與數據素養能力貫穿科研生命周期的整個過程,了解和把握科研數據生命周期也屬于科研數據素養能力的范疇,因此掌握科研數據素養在深化數字化科研建設中具有重要意義。
3.1.2 有助于發掘數據價值,增強科研創新能力。大數據蘊藏著豐富的知識和價值,已經成為一種重要的戰略資源,對其進行深入挖掘是獲取數據價值的必經途徑。大數據環境下的數據處理與挖掘方法與模式發生了翻天覆地的變革與創新,這對數據挖掘提出了更高的能力要求。具有數據素養的科研人員,憑借對新的數據技術較強的敏銳度和理解力,能更好地理解科研數據在科研項目中的重要價值,從而將科研數據作為一種新的科研投入模式,用新的數據思維開發新的數據密集型科研方法體系,促進科研方式的創新,提升科研效率;而具備數據素養的科研人員,在數據處理和挖掘上具備了必要的技術與能力,能有效地管理數據洪流,從龐大的數據倉庫中挖掘科研價值,促進科研分析能力的提高,從而獲得新的科研創新點的啟發,增強科研創新能力;不同的科研數據素養能力之間的互補,不僅有利于科研人員間的科研協同,而且在科研的協同合作中能以互補的視角全面審視科研項目,促進科研項目的進一步完善與創新發展。
3.1.3 適應更高的項目開展與成果發布要求。在數據密集型的第四科研范式下,數據的獲取與開發成為科研項目的必由之路,在科研論證中數據已經成為重要的有力證據,在新的科研項目申請要求的趨勢里,項目數據被置于更高的地位。近年來美國國家自然科學基金(NSF)在項目申請者必須提交科研項目數據的要求上,增加了必須附有規范的數據管理計劃的要求[22]。這對科研工作者提出了必要的數據政策理解、數據操作技能等要求。在過去,一般情況下科研人員都傾向訴諸圖書館數據服務中心、數據館員等工作機構與崗位,協助開展相關的數據論證工作,這些機構與崗位人員缺乏對科研項目深層次的了解與感知,往往容易出現錯誤判斷。因此科研人員自我基本的科研數據素養無疑成為了一種趨勢[23]。隨著一系列以發表科研數據為核心的期刊的創辦,在數據期刊上進行科研成果發布對科研人員的數據素養提出了很高的要求,如何實現科研數據的準確描述、引用規范、易于發現并被共享和應用,都需要科研人員具有較高的科研數據出版能力[24]。
3.1.4 符合科研人才素質培養趨勢。隨著數字化和信息化對科研工作的滲透,獲取和培養高素質信息化科研人員已經成為科研院所重要的課題之一。目前高校教育中普遍涉及了數據素養通識教育,許多大學生已經具備了一定的科研能力素養,然而,在實際工作中,這些技能往往不能直接套用,進入具體的行業領域后,工作專業性和獨立性增強,在專業知識和科研數據素養方面對新進人才提出了更高的要求。因此,培養新進科研人員的科研數據素養,是科研人才培養的必由之路,有助于科研人才的快速成長。另外,時代在進步,新的科研儀器的使用會帶來新的科研數據獲取方式,新的研究方法會提高科研數據分析的精度,新的科研平臺出現會導致新的科研數據管理方式,因此,科研人員在科研工作開展過程中必須與時俱進,不斷學習新的數據獲取與開發的技能、了解新的數據政策,提高自身的科研數據素養,才能適應新的科研環境,成為高素質的科研人員。
3.2.1 科研數據意識薄弱。隨著眾多科研項目的開展,科研機構內部積累了豐富的實驗數據、科研數據和科學信息,由于部分科研人員缺乏長遠的數據管理和共享意識,大部分科研數據,特別是過去的項目數據,并沒有得到有效的數字化和共享,造成了大量科研項目的重復勞動和資源浪費。
大部分的科研項目團隊并沒有意識到數據管理與開發的重要性,缺乏數據管理方面的開發人員配置,很多科研人員在以傳統的原始的方式進行信息資源的開發和利用,數據管理和利用效率低,效果不理想。或者科研團隊配置的開發人員科研數據素養意識不足,難以將較高的數據系統開發與管理能力和項目數據挖掘與分析目標進行匹配,缺乏科研數據管理服務的主動意識和充分溝通能力。3.2.2 科研數據獲取與開發能力不足。科研數據的獲取是科學研究的基礎,其效果直接決定了科研結果的高度和深度。根據現有對科研人員數據素養的相關調查研究,目前科研人員獲取非實驗數據的信息主要以互聯網搜索引擎為主,專業數據庫和專門數據統計發布等渠道較少,數據獲取渠道的狹窄嚴重制約了科研人員的科研視野并影響了科研開展的深度與成果的可靠性。數據獲取渠道的狹窄,歸根結底是受限于數據意識薄弱與數據獲取能力低下。在大數據獲取能力上,目前科研人員普遍缺乏相應的大數據獲取技能,而具備大數據管理及開發能力的科研人員更是少之又少。科研大數據獲取與開發技能的缺位,使得科研人員在大數據環境下無法在更高的層次自如地應用科研數據并進行深入挖掘。
3.2.3 科研項目過程中面臨挑戰。科研數據對科研項目的重要性不言而喻,科研項目過程與科研數據生命周期緊密相關,數據生命周期的管理質量直接影響了項目實施的進展和效果。大數據獲取能力不足,科研人員不僅面臨著 “無米之炊”的困難,科研管理過程中的數據存儲、數據發布、數據引用、數據共享等也面臨著極大的挑戰,甚至在項目實施完成和項目成果發布過程中,也必須面對數據發現、數據價值挖掘、數據出版等多方面的問題和困難,因此,有學者認為在數據密集型科研環境下,科研人員面臨著科研項目生命周期管理過程中和科研數據生命周期管理過程中的挑戰[25]。而積極培養和提高科研人員科研數據素養,是改善目前科研數據管理與開發困境,將大數據挑戰轉化為機遇的重要途徑。
大數據時代,數據的重要性凸顯,社會對數據素養的重視逐漸加深,國內外高等教育均把數據素養教育納入了必修的基本課程,很多高校在學生入學之初即將數據素養課程作為首要課程,甚至有高校將數據素養相關課程貫穿于整個教學計劃,在不同學習階段設置不同層次的數據素養課程。因此,國內外數據素養教育主要由高校及圖書館開展,基本在高等教育階段完成,但是,數據素養的發展和提高是一個復雜的、動態的過程,不能一蹴而就。
科研人員的數據素養發展不僅僅是個人的問題,科研人員的數據素養培養工作在科研體系的科研能力提升中具有無可比擬的重要性。在過去,科研人員的科研數據素養未得到充分重視,主要靠高校教育和職前培訓,再加上科研人員自身在工作中積累的方式進行培養。隨著科研工作的發展,高校的基礎數據素養教育已經無法適應具體的多變的科研工作需求,而且目前高校科研數據素養開展的方式相對單一、課程數量少、內容簡單,還有極大的發展空間。隨著移動互聯網、MOOC等技術的發展與滲透,科研數據素養教育的方式和內容發生了深刻變革。因此,科研人員的數據素養培養體系應當適應潮流的變化,以系統思維和戰略思維進行科研人員的科研數據素養改革。科研數據素養的培養,主要考慮兩個需求:科研單位的科研發展需求以及科研人員的職業與能力發展需求,一般而言,這兩個需求應當保持相對一致的關系,但是二者的立足點不同,所采取的措施也具有差異。
科研單位基于科研發展的目標,可以根據科研大環境以及自身發展需要,采取宏觀的科研數據素養培養方法,包括:制定適用的科研數據素養培養政策與計劃、完善科研數據素養培養體系內容和差異化培養制度、采取有效的科研數據素養培養方式、根據科研數據素養情況制定相應的專業人才引進等多種方式。
從科研人員職業與能力發展角度看,科研數據素養培養路線應當與科研人員的職業發展相結合,在不同的工作階段開展有差異性的針對培養。根據科研人員的職業發展,可以將科研數據素養的培養歸納為四個關鍵節點和階段:職前培訓——職中培訓(定期與不定期)——工作實踐——補充調整,不同階段的培養重點應有所側重(圖2)。

圖2 基于職業發展的科研數據素養培養框架
4.1.1 職前培訓階段。職前培訓階段,是科研人員從學生到研究人員轉變的重要環節,在這個階段中,科研數據素養的培養和提升的重點在于將科研人員在教育中建立的基礎科研數據素養轉化為適用于本單位或本行業的科研數據素養。相比提高具體科研數據能力,職前培訓更強調行業視野與觀念的建設,因此,職前培訓的著力點,一方面在于提高人員對行業知識的把握,建立對本行業科研數據的宏觀認知;另一方面在于加強科研數據的基本知識,包括必備的提高科研數據類型與來源的認知、了解數據使用的規則與限制、建立科研數據的倫理與態度等。完成培訓后,科研人員基本具備了一定的科研數據認知和倫理,為之后開展工作奠定了良好的認知基礎。
4.1.2 職內培訓階段。在完成職前培訓的“通識教育”后,針對不同崗位和項目需要,通常會展開一系列的定期和不定期的職內培訓。定期的職內培訓主要根據科研環境和技術更新的周期或根據科研單位的發展需要按照一定的時間間隔展開,定期職內培訓的時間間隔一般較長;不定期的職內培訓一般根據科研項目需要開展,如遇需要高新科研數據處理技術的項目,一般會臨時展開相應技術培訓、以專業人才引進或二者相結合(即以專業人才引進帶動團隊科研數據處理技術水平的提升)等解決數據素養不足的困境。職內培訓的重點一般都是指向工作需求的,因此更大程度上著重實踐技能提高培訓,包括科研工作中的數據基本能力、數據獲取能力、數據評估能力、數據管理能力、數據使用能力和表達能力等。
4.1.3 需求反饋與補充提升階段。在職前培訓和職內培訓的基礎上,利用工作實踐對科研人員的數據素養進行檢驗和評價。在工作實踐階段,主要通過開展實際的科研工作,檢驗各種數據素養培訓的效果,從中發現個人或團隊對科研數據素養的需求,可以通過問卷調查、訪談或其他意見反饋方式開展。針對工作實踐階段中獲得的需求及反饋,相關的部門和服務機構需要對此進行研究,一方面對職內培訓的不足進行及時補充和調整,以適應臨時項目的需要;另一方面,根據本期培訓的經驗對下一期培訓的方式和內容等進行相應調整,制定更適用的培訓計劃,以提高科研數據素養培訓的效果。
科研項目生命周期與科研數據生命周期有著密不可分的關系,科研項目的推進過程中涉及了大量的科研數據工作,科研數據工作的遞進又推動了科研項目的進展,可以說二者相互關聯,又相互促進。許多學者基于科研項目生命周期與科研數據生命周期建立了科研人員數據素養培養的框架[26-27],筆者在目前已有的研究基礎上,建立了以科研項目生命周期與科研數據生命周期關聯為基礎的科研數據素養培養框架(圖3),該框架突出了科研項目生命周期與科研數據生命周期相互關聯與促進的關系,并歸納了常見的培養方式以及具體培養內容。
基于項目和數據生命周期的科研數據素養培養首先強調的是弄清科研項目生命周期與科研數據生命周期的關聯,即每一個項目階段對應的數據生命周期階段,在此基礎上,對各階段所需要的科研數據素養及其側重的能力進行研究歸納,做好與項目進程相關的數據素養提升計劃。選用適當的方式開展科研數據素養能力的提升,如通過課件或說明文件、講座或研討會,甚至邀請專業機構開展嵌入式的教育與服務等方式。最后,關于本項目的數據素養培養計劃及材料等文檔可以作為很好的相關技術參考文件,與項目文件進行關聯歸檔保存,或者從科研團隊保存上升到科研機構層面,成為科研機構日后開展數據素養培養與提升的參考資料。

圖3 基于項目和數據生命周期的科研數據素養培養框架
與基于職業發展的科研數據素養培養框架針對的是整個職業生涯發展不同的是,基于項目和數據生命周期的科研數據素養培養框架主要立足于每一個科研項目的開展。前者往往是有計劃地循環往復,不斷提升的,而后者更強調基礎的重要性,并且經常借助外部機構的定制服務,但是兩者在科研數據素養培養過程中具體的開展方式以及內容具有相同和相似的地方。可以說,基于職業發展的科研數據素養培養框架和基于項目和數據生命周期的科研數據素養培養框架是科研單位中總體科研數據素養培養計劃中宏觀和微觀的兩個層面,二者相互補充,在科研人員數據素養提高過程中扮演同樣重要的角色。
在大數據和數據密集型科研范式的環境下,科研數據的價值越來越高,在科研工作中的作用越來越重要,科研數據素養的培養與提高已成當今科研工作開展和科研人才培養中無法規避的問題。盡管目前科研工作者群體中科研數據素養現狀仍存在許多問題,科研數據素養仍未得到足夠的重視,科研數據素養培養方式方法有限,但研究者們通過大量的研究,在科研數據素養的內涵定義、培養模式等方面取得了可觀的研究成果。相信在研究者們以及相關機構的不斷探索下,通過努力營造良好的數據文化環境、提高對科研數據管理的關注度和認同度,通過高校、科研單位、科技服務機構等多方面宣傳、教育和實踐服務,能不斷推動科研數據素養的培養與提高,逐漸提高科研人員的科研數據素養,使之為科研工作的發展和提高做出更大貢獻。
(來稿時間:2017年5月)
1. Landau S. Control use of data to protect privacy[J]. Science,2015, 347(6221):504-506.
2. Hey T, Tansley S and Tolle K . 第四范式:數據密集型科學發現[M]. 潘教峰, 張曉林,譯.北京:科學出版社,2012.
3. 齊俊景. E-Science環境下青年科研人員科研信息素養現狀調查與分析[J]. 圖書情報研究,2016(1):80-85.
4. 焦海霞,葉霞. 研究生學術信息素養與科研創新能力的動態關系分析[J]. 圖書情報導刊,2017(1):59-65.
5. 李振玲,徐萍. 大數據環境下的圖書館員數據素養[J].蘭臺世界,2016(17):84-86.
6. 楊曉菲. 從信息素養到數據素養:內涵、關系及培養途徑[J]. 河北科技圖苑,2015(6):30-32.
7. Zurkowski P G. The information service environment relationships and priorities. [EB /OL].[2016-03-15].http://files.eric.ed.gov/fulltext/ED100391.pdf.
8. ACRL. Framework for information literacy for higher education. [EB /OL]. [2016-03-28]. http://www.ala.org/acrl/standards/ilframework.
9. Herzog D. Data Literacy: A User’ s Guide [M].Missouri:SAGE Publications, 2015:1-224.
10. 郝媛玲,沈婷婷. 數據素養及其培養機制的構建與策略思考[J]. 情報理論與實踐,2016(1):58-63.
11. 胡卉,吳鳴. 國外圖書館數據素養教育最佳實踐研究與啟示[J]. 現代情報,2016(8):66-74, 78.
12. 司莉,邢文明. 國外科學數據管理與共享政策調查及對我國的啟示[J]. 情報資料工作,2013(1):61-66.
13. National Science Board. Long-lived digital data collections:enabling research and education in the 21th century. [EB /OL].[2016-03-27].https://www.nsf.gov/pubs/2005/nsb0540/nsb0540.pdf.
14.沈婷婷. 數據素養及其對科學數據管理的影響[J]. 圖書館論壇,2015(1):68-73.
15. 張進良,李保臻. 大數據背景下教師數據素養的內涵、價值與發展路徑[J]. 電化教育研究,2015(7):14-19,34.
16. Steinhart G, Chen E, Arguillas F, et al. Research data management service group survey of NSF principal investigators at Cornell University. [EB /OL]. [2016-04-03].https://ecommons.cornell.edu/bitstream/handle/1813/25624/RDMSG2011survey.pdf?sequence=2.
17. 胡永生,劉穎. 基于用戶調查的高校科學數據管理需求分析[J]. 圖書情報工作,2013(6):28-32,78.
18. Fecher B, Friesike S, Hebing M. What drives academic data sharing?. [J]. PLo S One,2015.10(2):0118053.
19. 王晰巍,張長亮,蔡佳銘,等. 大數據環境下中美高校信息素養培養模式比較研究[J]. 圖書情報工作,2016(11):29-35.
20. 劉桂鋒,李杰. 國外科研數據管理研究進展——基于CiteSpace和VOSviewer的可視化分析[J]. 圖書情報研究,2016(4):9-23.
21. 黃如花,李白楊. 數據素養教育:大數據時代信息素養教育的拓展[J]. 圖書情報知識,2016(1):21-29.
22. 張靜波. 大數據時代的數據素養教育[J]. 科學,2013(4):29-32,4.
23.張軍. 面向科研第四范式的科研人員數據素養培養研究[J]. 圖書與情報,2016(2):133-136.
24. 陳秀娟,吳鳴. 學科領域科研數據知識庫調研與分析——以化學領域為例[J]. 圖書情報工作,2015(9):111-118,147.
25.宮學慶,金澈清,王曉玲,等. 數據密集型科學與工程:需求和挑戰[J]. 計算機學報,2012(8):1563-1578.
26.李文文,周萍. 基于科研生命周期的科學素養教育研究 [J]. 現代情報,2017(1):156-159.
27. 胡卉,吳鳴. 嵌入科研工作流與數據生命周期的數據素養能力研究[J]. 圖書與情報,2016(4):125-137.