肖婷 陳慧
四川大學華西第二醫院/出生缺陷與相關婦兒疾病教育部重點實驗室 四川 成都 610041
研究數據是指“通常被科學社會所接受的,用于驗證研究發現的被記錄的必要的事實材料”[1]。該定義包括了分析數據和用于描述這些數據是如何產生的元數據。在大數據時代背景下,快速興起的數據密集型科學研究[2],表明巨量科學數據的聚合、分析和探索,已然成為科學研究的新基礎,將加速推動新科學方法的發現。
高校實驗室作為科研活動的重要陣地,是研究數據產生的主要來源,目前大多實驗室仍沿用傳統紙質載體對研究數據進行管理,由于科研參與人員在實驗記錄方面的科學素養主觀差異性較大,從而導致研究項目中的知識傳遞極易出現斷層和偏差,數據監管也暴露出較大疏漏,嚴重影響了科研成果的有效延續和應用。
本文將基于科學素養的視角,探討如何在實現研究數據全周期質量管理的同時,提升研究人員的科學素養,促進科技創新的高速發展。
由于實驗室研究參與人員科學素養的個體化差異,在科研創新大環境下,傳統紙質載體的研究數據管理模式,使得科研團隊不易協作性愈加突出,其劣勢日漸凸顯。
傳統的紙質記錄,偏重于對記錄完成的檢查,而對研究人員過程記錄的細節規范約束性不足。尤其是部分高校實驗室忽視對研究相關工作的要求和管理,當有些研究人員離開實驗室后,其研究成果需要進行深入探究時,其他研究人員無法看懂和理解該實驗記錄,無法重復原來的實驗條件和實驗步驟來得出相同的實驗數據,當已發表的研究成果遭到質疑時,無法提供有效的原始記錄[3]。因研究數據缺乏有效的管理手段,使產生研究數據的記錄的細節規范缺乏約束性,導致研究過程中得出的研究數據存在多種隱患。
對研究數據的實驗記錄規范培養不足,同時,重研究結果輕培養過程的普遍現象使研究人員更關注實驗進度和部分陽性結果,從而導致記錄較為隨意,時間不詳細,沒有條理,書寫混亂或表述不專業,實驗過程和數據記錄不及時,后期憑記憶補記,造成許多細節被遺漏;僅有過程描述,無實驗現象和實驗結果的描述等。以上行為都可能導致無法還原最初的實驗條件和實驗步驟,無法重復實驗結果,使得已產生的實驗數據失去其科學價值。
目前,多數高校實驗室的研究人員是自主管理實驗安排和記錄數據,傳統的紙質記錄產生的研究數據,由于負責人的工作日程安排不固定,難以實現及時有效的進度交流和核對檢查。同時,傳統模式下,紙質記錄具有時間和空間的滯后性,不利于監管,不利于共享和深入開展研究工作,并且導致研究人員往往只關注對自己實驗結果有利的部分數據,缺乏對實驗數據的深層次挖掘,一定程度上造成實驗研究的不全面,降低了研究效率,對于科學研究的投入是極大的浪費。
近年來,在科研活動中,違背科研誠信要求的事件頻發,科研誠信失信行為常見于各類媒體,以國家自然科學基金委員會為例,近年來就查處了多起不端行為案例[4-5]。因傳統管理模式對研究數據缺乏有效監管,使研究人員有機會對研究數據編造,篡改科研活動中產生的元數據,使數據更理想化,以支持所研究的觀點,從而易出現科研誠信問題。
高校的研究項目一般持續時間較長,而實驗室研究人員流動性較大,傳統紙質為主的研究數據的記錄容易造成研究項目的斷層[6],記錄零碎分散,不易保存和不便檢索的弊端不利于實驗室傳承和存儲共享,難以實現知識共享和有效利用。
調查發現[7],個人電腦、光盤、移動硬盤、機構電腦等是科研人員保存數據最主要的方式,此外,也有部分科研人員選擇保存在紙質載體和網絡硬盤上。我國研究數據的保管主要以個人為主(超過80%)[8],這給數據的共享與安全帶來不利影響:一是數據分散在個人手中,導致研究數據管理混亂,零碎分散,不僅規范性差、不易保存,不也無法快速檢索、查看,使數據不會被公開或者共享給其他研究人員作為研究依據,這對于科研經費的投入是極大的浪費。二是分散保管容易造成數據的丟失和損毀,缺乏手段進行數據記錄的規范化管理,數據的安全面臨風險。
高校作為科研活動的重要陣地,擁有巨量的研究數據,同時,高校研究數據的管理也是國家研究數據管理的重要一環。國家對研究數據管理高度重視,為加強我國科研數據管理的規范性,2018年4月國務院辦公廳印發《科學數據管理辦法》[9],規定科學數據管理工作實行國家統籌、各部門與各地區分工負責的體制,并明確規定高等院校是科學數據管理的責任主體,應該建立健全本單位科學數據相關管理制度,同時對我國科學數據管理的數據的采集、記錄、保存與匯交、共享與應用等方面都進行了規范。對推動科研數據管理與共享實踐和促進科技創新具有重要的意義。
近年來,隨著信息技術的快速發展與應用,以及互聯網+時代的到來,信息化建設不斷加強,實現研究數據信息化管理成為必備的工作需求。利用研究數據的信息化管理,可以更加有效地引導研究參與人員完成研究數據的標準化收集、規范性記錄、系統分析、完整保存和無偏差的共享。同時,在確認科學問題、使用證據、深入思考、做出科學結論的反復訓練過程中,強化知識的理解,訓練科學思維以及應用科學知識解決科學問題的能力。
大數據時代,對于科研數據的應用和轉化,如果沒有更加有效的管理手段和途徑,科研創新的進度將被嚴重阻礙和滯后。因此,如何行之有效地進行研究數據管理,在社會發展需求背景下,具有重要的現實意義。
研究數據產生于科學工作流,擁有自己的生命周期。英國DCC將研究數據生命周期分成6個階段,包括創建、處理、分析、保存、獲取、重用,而數據管理是為了以一種有效的方式管理數據生命周期的需要,是一系列架構、政策、實踐和程序的開發和執行活動[10]。
研究數據信息化管理系統主要用于實驗記錄、分析方法庫的建立和實驗數據的規范管理,確保所有的研究數據都能被適當地記錄下來,并在必要時得以使用。實驗記錄中保存的研究數據,須設計含有多個功能模塊的實驗記錄模板,模板中可容納被允許的記錄要求和研究數據保存形式,包含實驗基本信息、記錄正文、元數據保存提交等內容。
良好的數據管理是研究過程各階段的基礎,為了有效推動科研發展,應在實驗室研究工作的開始就著手建立。以實驗記錄為管理基線,規范研究數據記錄流程,提高研究數據利用效率,全面整合資源,以期實現對實驗過程中的記錄、結果分析、儲存、數據監管和應用在一定范圍內共享的研究數據信息化管理,實現數據生命周期內“記錄-保存-監管-應用”的完整鏈條,為科研人員提供一個優質、高效和規范的創新環境,構建規范、高效和適用的研究數據管理系統。
通過對研究數據生命周期管理,將數據采集、數據記錄、數據保存、數據分析與挖掘等過程痕跡化,一方面,在后續實驗過程中重新分析結果時有了更加可靠的數據支持,另一方面,通過研究數據監管信息化,實驗記錄可實現動態管理,隨時檢查,便于負責人員或管理人員及時發現和糾正實驗過程中發生的錯誤或疏漏,在存在異議時給予及時指出,使實驗結果真實、可信,避免學術造假等學術不端行為。
研究數據記錄是研究項目成功的關鍵因素之一,強調對數據過程和結果記錄要及時、真實、清晰、完整和規范,以保證研究數據的真實性和規范性。在研究數據保存方面,強調上傳保存所有的原始數據,使后續研究重新分析研究結果時有數據支撐,也杜絕了學術不端的可能。除上傳原始數據外,還要求研究人員對上傳的數據進行分析說明或歸納總結的詳細而準確的解釋性文檔,以便他人查閱和理解其研究結果,同時也是對研究人員進行科研素質訓練。在數據監管方面,強調研究負責人及時審閱研究人員的研究數據記錄,同時通過信息化管理系統與研究人員進行有效互動,共同分析實驗結果,評價研究項目進展,及時擬定下一步工作計劃,該系統使研究數據在細節方面的管理提供了多樣化的呈現,對科學素養形成進行了強化。
信息化的研究數據管理體系有利于固定化培養研究人員的規范操作、規范記錄、規范分析與研究探討,在研究數據產生、管理和重用的全生命周期各環節,設置質量管理要求,在整理數據、分析數據、得出科學結論的循環中,不斷強化數據意識,提升研究人員歸納、分析、總結、探究的科學思維能力,進而促進科學素養的形成。
信息化手段在研究數據管理過程中的應用,可以更好地實現研究數據的規范化、精細化、動態化、高效化管理。研究數據應該包括所有可以用來驗證結果的,支持研究問題的證據。為了使研究數據在其生命周期中易于發現、使用和管理,研究人員必須確保創建和維護足夠的文檔或元數據,保存更為完整的數據、描述和觀察,通過更為客觀的信息,進而獲得科學規律。
實驗記錄模板的設計應突出以人為本的理念,通過便捷的撰寫錄入,在記錄和保存的過程中逐步落實研究數據的規范化要求,可以有效解決傳統的實驗記錄或紙質書寫錄入報告時可能出現的數據不清楚、格式不規范、難以溯源等問題,避免因科研人員流動、基層管理疏漏及儀器設備更新問題,造成實驗記錄和數據的流失和損壞。
在線化的研究數據管理系統能夠實現快速檢索和回顧查看以往各階段的實驗設計和過程細節,有助于研究者保持清醒的實驗思路,把握實驗執行進度,提高科研效率,抓住關鍵的實驗現象,準確回顧和分析科研實踐中的成敗得失,得出更加可靠的實驗結論。
同時,實驗室研究數據信息結構化,實現了即時互通和交流共享,同時,負責人可通過系統對研究數據進行限時的審核歸檔,使研究數據得到有效監管和及時保存。
信息化管理模式的應用可以高效地提高各種格式的研究數據創建、組織、存儲和分發,有利于研究數據的訪問、整合、發現、共享、長期保存和重用,使研究數據更加具有可讀性和可交流性,提高了知識傳遞的效率,讓研究數據的提取更加直觀和便捷,降低科學研究成本,也切實保障了科學研究過程的可回溯性和驗證。
數據處于研究的核心位置,由研究項目過程創建,擁有比研究項目更長的壽命[11]。有效的研究數據是孕育科研成果的源泉。在科技創新背景下,加強高校實驗室研究數據的信息化建設是必然發展趨勢,也是促進科學素養教育的重要手段。研究數據管理必須貫穿于整個研究數據生命周期,高校實驗室的研究人員應轉變心態,接受和適應信息化轉型,加快科技創新進程,提高研究數據管理能力,規范科學素養的培養過程,孵化更多的研究成果。