文/中國科學院檔案館 李潔
隨著信息技術的深度滲透以及科研活動模式轉型升級,越來越多的科研活動基于信息化平臺開展,產生了大量的科學數據等電子文件。目前,科學數據已經成為我國重要的戰(zhàn)略資源。現階段,科學數據中心、檔案館、圖書館等多種類型的管理機構都對科學數據有所關注,且不同機構在科學數據管理方面存在標準不統一等現象。2020年11月1日起施行的《科學技術研究檔案管理規(guī)定》(國家檔案局、中華人民共和國科學技術部令第15號)中明確規(guī)定,科研檔案包含圖表、數據等各種形式和載體的文件材料。鑒于此,本文從檔案管理視角詳細分析了目前科學數據管理活動中存在的問題并展開思考。
(一)科學數據是科研檔案的重要組成部分。科研檔案是指科研項目在立項論證、研究實施及過程管理、結題驗收及績效評價、成果管理等過程中形成的,具有保存價值的文字、圖表、數據、圖像、音頻、視頻等各種形式和載體的文件材料以及標本、樣本等實物;而科學數據是指在科技活動(實驗、觀測、探測、調查等)中或通過其他方式所獲取的反映客觀世界的本質、特征、變化規(guī)律等原始基本數據,以及根據不同科技活動需要,進行系統加工整理的各類數據集。首先,科研檔案與科學數據都是科技活動中形成的記錄;其次,科研檔案中包含具有保存價值的圖表、數據等文件材料,這里的數據顯然是指科研活動過程中形成的科學數據指等。由此可見,科學數據是科研檔案的重要組成部分。
(二)科學數據管理與科研檔案管理“異曲同工”。科研檔案一經形成,要從真實性、完整性、可用性、安全性(以下簡稱“四性”)4個方面進行維護。科學數據的管理與之具有較高的契合度,科技部辦公廳發(fā)布的《科技計劃項目科學數據匯交工作方案(試行)》指出科學數據的匯交要遵循及時充分、真實可靠、科學規(guī)范三大原則,其中及時充分確保科學數據的及時匯交,保證科學數據的完整性;真實可靠確保科學數據匯交的質量,保證其內容的真實性、可靠性;科學規(guī)范要求科學數據要經過加工處理,保證科學數據可發(fā)現、可獲取、互操作和可重復利用。
(一)科學數據管理制度體系不健全。我國探索科學數據管理已經有20年的發(fā)展歷程,目前已初步形成以《科學數據管理辦法》《國家科技資源共享服務平臺管理辦法》為根本依據的宏觀政策體系,但是從微觀制度出發(fā)還需不斷完善。比如,經對我國國家科學數據中心等科學數據管理機構官方網站展開調研后發(fā)現,關于科學數據的大部分制度的內容側重于數據匯交,主要包括數據匯交目的、匯交意義、匯交范圍、匯交原則、匯交流程、匯交時間等內容。但從管理環(huán)節(jié)上看,科學數據管理與科研檔案的“收、管、存、用”極為相似,基本包括數據匯交、數據分類組織、數據保存、數據共享利用等環(huán)節(jié),覆蓋科學數據的全流程管理,而數據匯交只是科學數據管理的其中一個環(huán)節(jié),關于科學數據的“管”“存”“用”的相關制度缺失,對科學數據的質量檢測、長期保存、開發(fā)利用等方面非常不利。
(二)科學數據價值鑒定過程缺失。數據匯交是科學數據管理的首要環(huán)節(jié),是將數據生產者生成的原始數據、加工數據及其元數據等內容匯聚到科學數據中心、檔案館或其他科學數據管理機構的過程,然而數據匯交環(huán)節(jié)與文件歸檔環(huán)節(jié)有明顯的區(qū)別。文件歸檔前必須經過鑒定,這里的鑒定是指文件保存價值的鑒定以及保管期限的鑒定,經鑒定有必要歸檔保存的文件才會進行歸檔保存,而科學數據的匯交環(huán)節(jié)并未對科學數據的價值展開判定。但隨著信息技術的深度滲透,越來越多的科研項目特別是科技項目基于信息化平臺展開,產生了海量的科學數據,來源范圍廣,若不對其進行價值鑒定,未來將會給科學數據的存儲帶來很大的成本壓力。
(三)科學數據分類與科研檔案分類存在明顯差異。科學數據分類是按照一定的分類方案對科學數據進行加工、整理、歸類的過程,通過分類可以方便用戶快速查找和利用科學數據。經調研發(fā)現,目前我國科學數據中心或其他科學數據管理機構對科學數據的分類主要依據學科分類法。首先,按照科學數據的開放范圍將其分為一級數據、二級數據、三級數據;其次,按數據加工程度將其分為原始數據、衍生數據、加工數據、輔助數據等。而科研檔案的分類方法與之有較大的不同,成套性是科研檔案的重要特點,保持一個科技項目檔案材料的齊全成套是對科研檔案分類整理工作的基本要求。顯然,科學數據的分類與科研檔案的分類存在本質差異,導致科研項目檔案難以集中管理,同時難以確保科研檔案的齊全完整。比如,目前我國重大科技項目“跨學科、跨領域、跨機構”的特點非常突出,科學數據的分類依據顯然會將其產生的項目檔案與科學數據剝離開來,非常不利于科研項目檔案的歸檔保存和開發(fā)利用。
(一)強化科學數據管理政策制度體系建設。宏觀上,國家相關管理部門在制定相關政策時,要提高對科學數據歸檔、數據質量檢測、長期保存、共享利用的要求,同時根據具體情況制定相應政策來加強科學數據管理機構與檔案部門的協同,有效避免科研檔案齊全完整、系統成套的難題。微觀上,各個科學數據管理機構應從“收、管、存、用”4個方面不斷完善科學數據管理制度體系。第一,明確科學數據的匯交范圍及保管期限,“收”哪些,不“收”哪些,其保管期限怎么界定等內容需在制度中予以明確;第二,強化質量控制,應從真實性、完整性、可用性、安全性4個方面制定元數據方案以及“四性”檢測機制來保證科學數據的可發(fā)現、可獲取、互操作和可重復利用;第三,為保證科學數據的長期有效可用,應制定與科學數據的長期保存策略。
(二)完善科學數據管理流程,有效阻止科學數據“泛濫”。數據級增長的科學數據不僅給數據存儲帶來了很大的“沖擊”,令科學數據的質量控制也將面臨極大的挑戰(zhàn)。對于科研檔案而言,鑒定工作為優(yōu)化質量、方便保管和有效利用的重要過程,科學數據管理也應借鑒科研檔案的鑒定工作,主要涉及3個方面的內容:第一,對科學數據的保存價值展開鑒定,鑒定其是否有必要歸檔,對不具備保存價值的科學數據剔除,可適當降低管理成本和存儲壓力;第二,對具有保存價值的科學數據進行保管期限鑒定工作,對于需要永久保存的科學數據必須采取長期保存措施來保證科學數據的長期可獲得;第三,科學數據的開放鑒定是確保科學數據開放共享的重要過程,科學數據管理機構應從共享利用角度,協同數據生產者、檔案部門等機構開展科學數據的開放鑒定工作,確保科學數據能及時、有效地發(fā)揮其科技價值。
(三)加強與檔案部門的協同管理,確保原始數據的集中歸檔保存。科學數據中有大量數據是科研活動中直接形成的原始數據,是科研檔案的重要組成部分。2018年,《中共中央辦公廳國務院辦公廳印發(fā)〈關于進一步加強科研誠信建設的若干意見〉的通知》中指出,要明確科研活動記錄、科研檔案保存等相關制度,確保原始記錄的有效、完整。可見原始數據的重要性;另外,大量科學數據是科研項目的過程產物,是依托于科研項目產生的科研活動原始記錄,基于此產生的科學數據是科研檔案的重要組成部分。因此,科學數據管理機構應加強與檔案部門的協同,一方面,要根據檔案部門的要求明確科學數據歸檔范圍表及保管期限;另一方面,著重強調科學數據中具有保存價值的原始數據的歸檔,科學數據管理機構應按照檔案部門的要求,將原始數據與相關科研項目管理活動所形成的科研檔案集中保存歸檔,確保科研項目中所形成的科研活動原始記錄的齊全完整。
綜上所述,科學數據管理與科研檔案的管理同源同根,但在管理實踐上還將面臨更大的挑戰(zhàn),比如,如何確保科學數據與科研檔案的同步歸檔及科學管理科學數據等問題是未來值得關注的問題,仍需進一步展開研究。