胡 卉(中國科學院文獻情報中心)
繼實驗科學、理論科學、計算科學之后,科學已經進入數據驅動的第四科研范式。[1]其突出特點是科研流程建立在數據基礎之上,給研究人員的數據獲取、分析、管理與共享能力以及數據倫理提出了更高的要求,[2]研究人員的數據素養亟需提升。
良好的科研數據管理實踐具有支持開放科學和開放學術交流體系的重要作用,[3]如果管理得當并以規范形式共享,這些數字資源將有助于研究人員提出新問題、開展新計劃、驗證替代假說、創新研究方法以及部署跨地域和跨學科界限的研究合作。基于此,國家政府與國際組織、科研資助機構、科研教育機構、信息服務機構、期刊出版商、數據知識庫等紛紛發布數據管理與共享政策,用以規范和指導研究人員的數據管理行為。[4]
科學技術的飛速發展給科研環境帶來變革。研究人員利用便捷的網絡和先進的技術發掘新的研究問題,掃除研究障礙,獲得新的研究成果,但也面臨著海量的數據處理、大規模信息分析以及各類工具的操作管理等挑戰。[5]尤其是作為科研成果重要論證的科研數據,對其進行規范管理和長期保存是科研成果完整性、可信度和可驗證性的重要保證。那么科研一線研究人員的數據管理現狀如何?具有哪些數據需求?目前,這些問題已得到業界機構和學者的廣泛關注。在國外,普渡大學圖書館[6]、康奈爾大學圖書館[7]、俄勒岡大學圖書館[8]、明尼蘇達大學圖書館[9]等調研了相應機構研究人員的數據素養現狀和需求,并設計數據素養課程和開展數據管理培訓。國內學者中,郝媛玲等[10]利用調查問卷,從數據態度、數據意識、數據知識、數據技能、對數據服務的需求五方面調研了上海地區高校教師的數據素養現狀,發現高校教師的數據態度和數據意識整體上呈積極樂觀趨勢,但數據知識和數據技能欠缺,同時文理科教師均對數據服務具有強烈需求,但需求存在差異;黃如花等[11]以MOOC課程學員為調查對象,從數據基本意識、數據獲取、數據管理、數據分析、數據存儲與安全、數據倫理六個維度調查其數據素養,調查結果顯示目前學生數據素養欠缺、數據素養開課率較低,但學生對數據素養課程有明顯的需求,開設數據素養相關課程十分必要;曲德強等[12]從數據意識、數據技能與數據倫理三個維度調查分析了上海理工大學本科生與碩士研究生的數據素養特點,認為應重視數據通識教育、加強數據技能培養與建立素養評價體系;隆茜[13]調研了高校不同群體(大學教師、博士生、碩士生、本科生)的數據素養能力現狀,發現不同群體在數據素養能力上具有顯著性差異。上述研究結果均表明,研究人員具有數據素養需求,且不同研究群體的需求存在差異。
圖書館是信息素養教育的主要陣地,而數據素養作為信息素養的重要組成部分,開展數據管理培訓和數據素養教育是未來圖書館支持和服務科研用戶的發展方向。同時,圖書館作為海量資源的集散地和學術信息的交流平臺,以及在服務科研一線的過程中積累了豐富的數據管理經驗,成為了提供數據管理服務和開展數據素養教育的不二人選,搭建起研究人員與科研數據之間的橋梁。
在此背景下,培養研究人員的數據意識和數據管理技能已成為適應變化的科研環境和滿足研究人員迫切數據素養需求的必由之路。數據素養作為一個新興研究領域,在理論研究層面已獲得業界學者的廣泛關注并取得一定的研究成果,研究內容不斷深化和擴展;在實踐層面,各方利益相關機構正積極探索數據素養教育,積累了豐富的實踐經驗。基于此,本研究調研中國科學院大學(以下簡稱“中科院大學”)研究生數據素養現狀,結合圖書館開展數據管理服務和提供數據素養教育的目標與實踐,設計面向中科院大學研究生的數據素養教育體系,制定具體可操作的數據素養教育實施策略和服務模式,為圖書館開展數據管理素養教育服務提出建議和方案。
研究生是未來科研事業的參與者,在知識學習和專業實踐的早期階段培養其數據管理技能和數據素養能力,有利于他們更好地適應學習生活和投身科研實踐。因此,本研究選取中科院大學研究生作為調查對象,設計了《中國科學院大學研究生數據素養現狀與需求調研》問卷,對其數據素養現狀和對數據素養教育的需求展開調查。結果顯示,研究生100%認為接受數據素養教育和培訓重要或非常重要,對數據素養教育具有強烈需求。具體特點表現為:研究生能夠較好地認識到科研數據管理的重要性,并具有強烈的數據素養教育需求;科研數據管理知識基礎薄弱;科研數據管理專業技能欠缺;具有良好的數據倫理與道德意識,但仍需規范和引導。
在文獻調研、案例研究以及需求調研的基礎上,本研究構建了數據素養教育服務模式框架,包含教育受眾、教師隊伍、教育目標、教育內容、教學途徑、教育評估六個要素(見圖1)。

圖1 數據素養教育服務模式框架
(1)教育受眾。數據素養教育主要面向中科院大學一年級研究生,分學科領域實施數據素養課程教學。同時,中科院大學的教職員工、研究人員,以及對數據素養感興趣或希望提升數據素養技能的其他人員也可以參與培訓學習。
(2)教師隊伍。數據素養教育工作專業系統性強、涉及面廣、持續時間長,因此,要求承擔數據素養教學工作的圖書館員具備較高的科研數據管理專業知識和技能水平,具有相應領域背景或學科專業知識,能夠根據科研數據的學科差異性和需求特殊性科學地設計數據素養課程,在課程設計和教學實施過程中,加強與院所專業教師、一線研究人員等學科領域專家之間的溝通合作。同時,承擔數據素養教育和科研數據管理服務的圖書館員還應不斷提升自己的業務能力,將數據素養教育工作同圖書館業已開展的信息素養教育服務有機結合,將科研管理機構、科研資助機構、出版研究機構和行業組織等在科研數據方面的訴求納入數據素養教育內容體系,切實幫助科研用戶應對新型科研工作范式下的數據管理挑戰,提高科研工作效率。
(3)教育目標。開展數據素養教育和培訓的主要目標是培養和提升中科院大學研究生的數據管理意識和數據素養技能。具體包括以下4個方面:① 認識到數據密集型科研環境下數據的重要性和數據管理的必要性,樹立正確的數據意識,遵守科研數據涉及的權益與倫理道德規范;② 掌握所在學科領域圍繞科研數據生命周期的數據發現、數據收集、數據處理、數據保存、數據發表等數據管理技能;③ 遵循新型科研工作范式下的數據管理和共享要求,能夠規范科研數據管理行為,滿足科研資助機構、科研管理機構、期刊出版商、行業組織等所提出的數據管理要求;④ 提高利用科研數據創新的能力和自身進行科研數據管理的能力,培養支持開展多尺度科研協作和新型交叉領域研究的數據素養。
(4)教育評估。教育評估是課程教學的重要環節,包括對教學課程的評估和對學生學習效果的評估。對數據素養課程的評估包括三個階段:① 在課程開始前,需要對學生的知識積累和技能水平進行預測試和檢驗,確保課程內容符合學生需求,學習難度與學生能力相匹配,并允許對學生提供針對性的幫助;② 課程結束時,學生對課程進行評估和反饋,收集學生對課程的意見和建議,以調整和完善課程內容;[14]③ 在課程結束后的一段時間內,對學生進行跟蹤調查和回訪,了解課程學習對學生科研實踐的作用和長期影響,以便未來課程的調整和優化。評估學生學習效果有多種方式,包括學生跟隨課程進度完成相應的實習課題、完成小組課題任務并在課堂交流展示、參加期末考核等。
數據素養教育內容包括基礎學習、進階學習和提升學習3個層次(見圖2),涵蓋數據意識、數據知識、數據能力、數據倫理與道德各方面,具體內容圍繞科研數據生命周期展開,包括7個模塊:數據管理概述、制定數據管理計劃、數據收集與記錄、數據處理與分析、數據管理與保存、數據發表與共享、數據權益與倫理,詳細的數據素養教育內容大綱見下表。

表 數據素養教育內容大綱
(1)基礎學習層。基礎學習,是指學習科研數據管理的基本知識和相關技能。這部分是通識的、適用所有學科的,即所有的研究生都應該了解和學習的內容,包括數據管理概述和數據管理計劃兩個模塊。
(2)進階學習層。進階學習階段,是指在基礎學習的基礎上,學習更多面向學科、面向專業領域的數據管理知識和技能。同時,進階學習圍繞數據生命周期展開,主要包括數據收集與記錄、數據處理與分析、數據管理與保存等階段所需的數據素養技能。

圖2 數據素養教育內容體系
(3)提升學習層。隨著科研數據集的價值被學術界廣泛認可,科研數據也如傳統學術文獻一般通過發表和引用成為學術交流傳播的重要途徑。因此,在開展數據素養教育時,鼓勵并幫助研究生在未來學習和研究工作中發表和共享數據,了解并遵循數據倫理和道德規范,是學生數據素養提升的重要構成。提升學習層包括兩個模塊,即數據發表和共享、數據權益與倫理。
同時,由于科研數據具有學科特性,在設計某一學科的數據素養課程時需要根據學科特點調整課程內容,調查該領域科研用戶的數據素養現狀與需求,以符合該領域的學科特性和數據管理要求。
以中科院大學研究生的數據素養現狀和需求為基礎,結合教育目標、教育對象、教育內容、教育方式以及教育評估,本研究設定了三種數據素養教育的適用場景,包括系統課程場景、專題培訓場景和自主學習場景(見圖3)。

圖3 數據素養教育適用場景
(1)系統課程場景。系統課程場景主要是指根據學院課程設置,以選修課、必修課形式為主的數據素養教學課程,具有“系統全面、定式授課”的特點。作為一種傳統且正式的教學形式,系統課程場景結構嚴謹且內容全面,包含數據意識、數據知識、數據技能和數據倫理道德等多方面。由于課程內容的系統性和課程時間的連續性,因而系統課程場景中的教學對象、授課時間、學習地點等具有定式,老師和學生通過課堂教學環境學習數據素養知識和技能,開展面對面交流和討論,并取得良好的互動效果。
(2)專題培訓場景。專題培訓場景是指圍繞某一特定主題定期或不定期舉辦的講座或專題培訓,具有“聚焦專題,應用廣泛”的特點。“聚焦專題”即圍繞研究所或專業群體的學科特點,截取數據素養教育體系中相應的內容,開展專題培訓,重點突出,具有較強的靈活性和針對性。
(3)自主學習場景。自主學習場景是指學生通過在線課程、信息訂閱、自媒體等方式自主性地學習數據管理知識,其特點是“按需學習,自主靈活”。當學生在科研實踐中面臨數據管理問題時,可以預約講座咨詢,也可以通過中科院大學的“空中課堂”平臺進行學習,或通過訂閱微信公眾號等自媒體方式學習和交流數據管理的知識和技能。在這種模式下,學生具有完全的自主性,不受時間、地域和人數的限制,與系統課程場景和專題培訓場景相比,可以在更廣泛的范圍內靈活地學習數據素養知識,是提升中科院大學研究生數據素養知識和技能的重要方式之一。
圖書館是開展數據素養教育和提供科研數據管理培訓的主要陣地,綜合國內外圖書館數據素養教育實踐經驗以及國內研究生數據素養現狀與需求,本研究為圖書館開展數據素養教育服務提出以下建議。
數據素養是研究人員必備的基本素養,但是在具體處理和分析不同學科的數據時所需的知識和技能差異較大。因此,在開設數據素養課程時要以學科數據的特性和要求為基礎,提供學科化的數據管理培訓服務。以面向生命科學的數據管理課程為例:在數據管理概述課程模塊,應著重介紹生命科學領域科研數據的性質與特點;在數據處理與分析課程模塊,應關注應用于生命科學領域數據處理和分析的工具、軟件及方法;在數據管理和保存課程模塊,重點介紹生命科學領域的數據管理平臺、數據倉儲和數據中心,以及相應的數據存儲和檢索方法。
數據素養教育的目標是幫助研究人員解決研究過程中復雜的數據管理問題,培養良好的數據管理意識和技能。因此,數據素養教育應以問題和需求為導向。在開展數據素養課程和提供數據管理培訓時,應充分考察教學或服務對象的具體需求,即調查服務對象對課程內容、服務方式、授課時間等方面的傾向和偏好,有重點地設計教學內容、選擇教學方式,提供有針對性的數據管理培訓。
開展數據素養教育是一個跨學科、綜合性的重要任務,需要建立一支優秀的數據素養教育團隊來提供師資保障。圖書館有開展信息素養教育、學科咨詢服務以及探索科研數據管理服務的經驗,優秀的專家隊伍、強大的資源優勢、豐富的教育經驗為圖書館開展數據素養教育奠定了基礎。同時,圖書館在設計課程體系、開展教學評估等環節應加強與各學科領域專家的交流合作,嵌入科研過程,共同探索數據素養教育最佳實踐。此外,還可以邀請國際數據素養教育專家開展培訓指導,借鑒國際圖書館界已開展的數據素養教育成果資源,與國際數據素養教育實踐接軌。
面向新型科研工作范式需求,培養研究人員的數據意識與數據管理技能是圖書館的新職責,也是圖書館深化和拓展服務的重要內容。然而,探索數據素養教育實踐不能僅憑圖書館一己之力,需與科研資助機構、圖情領域學/協會、數據管理專業機構、圖情信息學院等通力協作,建設數據素養聯合教育機制。科研資助機構為數據素養教育研究提供支持和保障,學/協會組織指導和引領數據素養教育事業的發展,數據管理專業機構致力于數據素養教育的拓展和延伸,圖情信息學院為數據素養教育和數據管理服務提供人才保障,圖書館則面向一線科研工作者成為數據素養教育實施的主要陣地,數據素養教育的各方參與主體共同致力于數據素養教育事業的發展。