




關鍵詞: 世界一流大學; 開放科學數據; 科學數據政策; 政策體系; 政策內容要素
DOI:10.3969 / j.issn.1008-0821.2024.05.012
〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2024) 05-0001-02
開放科學數據(Open Research Data, ORD)涉及研究參與者、資助機構、科研機構、科研人員、出版機構、數據中心、數據知識庫、數據使用者等為數眾多的利益相關者, 各類利益相關者在科學數據全生命周期內需要遵守個人數據保護、科研檔案管理、科研誠信管理、科研倫理治理、數據安全管理等多種類型的相關政策法規。目前, 美國、英國、澳大利亞和加拿大等發達國家(地區)已經建立起國家政府、資助機構、科研機構、出版機構、數據知識庫等利益相關者相互配合、協調一致的開放科學數據政策體系, 其中科研機構作為參與開放科學數據的重要利益相關者之一, 也已建立了涵蓋科學數據管理、個人數據保護、科研檔案管理、科研誠信管理、知識產權保護等相關政策的開放科學數據政策體系, 如英國倫敦大學學院(UCL)制定的開放科學數據政策體系包括“UCL 科學數據政策”[1]“UCL 數據保護政策”[2] “UCL 記錄管理政策”[3]“UCL 科研誠信聲明”[4] “UCL 知識產權政策”[5]等一系列相關政策, 旨在為其科研人員在科學數據全生命周期內能夠有效管理科學數據和科研記錄提供全面、具體的指導, 以遵守英國《數據保護法》(2018 年)、《信息自由法》(2000 年)、《公共記錄法》(1967 年)等相關法規, 以及英國國家科研與創新署(UKRI)發布的“UKRI 良好科研行為治理政策與指南” (2013 年)[6] 、英國科研誠信辦公室(UKRIO)發布的“科研實踐準則: 促進良好實踐與防范不端行為” (2013 年)[7] 和英國大學聯盟(UUK)發布的“維護科研誠信協議” (2019 年)[8]等相關政策。
目前, 針對開放科學數據政策的相關研究主要以對各個利益相關者發布的開放科學數據政策進行調研分析為主, 如國際組織[9] 、國家政府[10] 、資助機構[11] 、高等院校[12] 、學術期刊[13] 、數據期刊[14] 、機構知識庫[15] 等; 而針對開放科學數據政策體系的國內外相關研究則比較有限。唐義等[16] 、王晴[17] 、周玉琴等[18] 調研了國內外開放科學數據政策法規體系并將其劃分為3 個層面: 宏觀層面(國際組織、國家政府制定的法律和政策)、中觀層面(資助機構制定的政策、指南)和微觀層面(科研機構、學術期刊制定的政策)。衛軍朝等[19] 探討了開放科學數據政策保障體系的概念界定、基本構成及構建思路。Zhang L 等[20] 、Zhu Y[21] 、Shim W[22]分別調研了中國、英國和澳大利亞科學數據共享政策體系的制定現狀。可見, 現有研究主要是圍繞國內外開放科學數據政策體系展開理論探討和調研分析, 缺少針對特定利益相關者制定的開放科學數據政策體系展開的深入、具體研究。本研究選取科研機構制定的開放科學數據政策體系作為研究對象,調研分析世界一流大學最新發布的開放科學數據相關政策, 提煉世界一流大學開放科學數據政策體系框架及內容要素, 以期為我國科研機構制定、調整與完善開放科學數據政策體系提出相關政策建議。
1 世界一流大學開放科學數據政策體系調查
本研究以QS 世界大學排名前100 所世界一流大學作為調研對象[23] , 利用網站調研法調查其最新發布的開放科學數據相關政策文件。選取其中12 所大學發布的開放科學數據相關政策作為主要研究對象, 如表1 所示, 同時參照英國劍橋大學、英國倫敦大學國王學院、美國西北大學、美國布朗大學、澳大利亞阿德萊德大學、加拿大阿爾伯塔大學等發布的開放科學數據相關政策。本研究選取的18 所世界一流大學目前均已制定了涵蓋科學數據管理、個人數據保護、科研檔案管理、科研誠信管理、知識產權管理等相關政策的較為全面、完善的開放科學數據政策體系。
2 世界一流大學開放科學數據政策體系框架
本研究根據世界一流大學制定的開放科學數據相關政策所涉及的主題范圍, 將其劃分為科學數據管理、個人數據保護、科研檔案管理、科研誠信管理、科研倫理治理、知識產權保護和數據安全管理7 個政策類型, 表2 概括了7 個政策類型涉及的各類相關政策法規。
本研究將世界一流大學開放科學數據政策體系框架界定為由上述7 種類型相關政策及其內容要素構成的彼此之間相互配合、互為補充、協調一致的統一整體, 其不同政策類型之間以及所有政策類型內部全部政策內容要素之間構成了彼此關聯、互為呼應、持續調整的動態系統。通過研讀世界一流大學發布的7 種政策類型相關政策文本, 本研究分別提煉各個政策類型的核心政策內容要素如表3 所示。
3 世界一流大學開放科學數據政策內容要素
筆者已在《世界一流大學科學數據開放共享政策研究——基于質性文本分析視角》一文中分析了世界一流大學科學數據管理政策內容要素[24] , 本文側重于提煉世界一流大學制定的個人數據保護、科研檔案管理、科研誠信管理、科研倫理治理、知識產權保護、數據安全管理等開放科學數據相關政策內容要素, 如表3 所示。
3.1 個人數據保護相關政策內容要素
本研究將個人數據保護相關政策中與開放科學數據有關的政策內容要素概括如下:
1) 研究豁免(1-1): 是指為公共利益、科學或歷史研究或統計目的處理的個人數據應獲得豁免,該豁免旨在使研究符合公共利益并保護科學數據集的完整性。世界一流大學通常規定研究豁免適用的條件, 如英國布里斯托大學規定的豁免條件包括:①有適當的技術和組織保障措施來保護個人數據,如數據最小化、假名化或訪問控制; ②數據處理不可能對數據主體造成重大損害或困擾; ③研究不會導致對個人采取措施或作出決定(經倫理批準的介入性醫療目的除外); ④遵守豁免否定要求將妨礙或嚴重損害研究目的。如果符合上述條件, 則可適用如下規則: ①為其他目的收集的個人數據可能會重新用于研究目的; ②用于研究的個人數據可能需要無限期保存; ③如果研究結果將以無法識別個人身份的形式發布, 則個人訪問其個人數據的權利不再適用; ④不適用糾正、刪除、限制和反對的權利[25] 。
2) 知情同意(1-2): 通常要求創建、保存、發布、訪問和重用涉及人類參與者的科學數據集應獲得研究參與者的書面知情同意。英國愛丁堡大學認為: 知情、自愿和公平地同意參與研究是合乎倫理的人類研究的基石, 旨在確保所有參與者的權利得到尊重, 并與參與者信息表(PIS)密切相關, 使參與者能夠在知情的情況下選擇參與或拒絕研究[26] 。英國布里斯托大學認為: 研究參與者的知情同意對研究的完整性至關重要, 除非有充分的法律或合乎倫理的理由不獲得同意[27] 。英國劍橋大學指出: 科研人員通常不應將同意作為處理個人數據的依據, 作為法律依據的同意必須確保能夠隨時撤銷, 如果發生這種情況則需要立即銷毀個人數據, 這將對科研記錄的長期完整性產生重大影響[28] 。
3) 去識別化(1-3): 通常要求發布或共享涉及人類參與者的科學數據集之前應進行去識別化處理(如匿名化和假名化)。匿名化(Anonymisation)是指所有標識符都已從數據主體中不可逆地刪除并且不再以任何方式可識別[29] 。假名化(Pseudonymisa?tion)是指用一個或多個人工標識符或假名(如數字代碼或密鑰)替換直接或間接識別個人的信息, 使得在不將標識符或假名與其他單獨且安全保存的信息相結合的情況下無法識別數據主體[30] 。匿名化的個人數據不再被視為個人數據, 而假名化的個人數據仍然被視為個人數據。英國《數據保護法》(2018 年)規定: 任何人在未經控制者同意的情況下重新識別已經去識別化的個人數據(無論是假名化還是匿名化)均屬刑事犯罪[31] 。
4) 保存期限(1-4): 通常要求個人數據的保存時間不得超過預期處理目所需的必要時間, 同時指出用于科學研究的個人數據的保存時間也可以不受這一限制, 如英國倫敦大學國王學院要求“以允許識別數據主體的形式保存個人數據, 其保存時間不得超過處理個人數據所需的時間。個人數據也可以保存更長的時間, 只要僅用于公共利益、科學或歷史研究或統計目的, 但必須實施《英國通用數據保護條例》要求的適當技術和組織措施, 以保障個人的權利和自由”[32] 。英國劍橋大學指出:用于研究目的的個人數據可能需要保存很長一段時間, 甚至可能需要無限期保存(如臨床試驗或縱向研究), 但如果對個人數據進行去識別化是合理的,則應在切實可行的情況下盡快完成去識別化[28] 。
5) 數據安全(1-5): 世界一流大學通常承諾以安全的方式處理研究參與者的個人數據, 并使用適當的技術或組織措施(如數據加密、訪問控制)來防范未經授權或非法處理, 以防止意外丟失、破壞或損壞。哈佛大學認為: 適當的數據安全對于維護研究參與者的隱私權至關重要, 必須保護在科研項目中收集的敏感的、個人可識別的、機密的或隱私的數據, 以防止未經授權的訪問和意外泄露[33] 。英國劍橋大學指出: 個人數據保護法要求科研人員采取常識性措施, 確保其對個人數據的利用是準確、公平和安全的, 這將包括: ①僅在研究確實需要時收集個人數據; ②盡可能及時對個人數據進行匿名化或假名化處理; ③有效管理個人數據, 以使其適合于研究; ④采用適當的IT、物理和組織安全措施來保護數據[28] 。
3.2 科研檔案管理相關政策內容要素
本研究將科研檔案管理相關政策中與開放科學數據有關的政策內容要素概括如下:
1) 保存范圍(2-1): 通常規定科研人員在研究過程中應保存的科學數據、原始資料(PrimaryMaterials)和科研記錄的類型和形式。澳大利亞墨爾本大學將“科研記錄” 界定為“由組織或個人在其研究過程中創建或接收的包含任何類型和任何形式的信息的文件”[34] 。加拿大阿爾伯塔大學認為: 科研記錄包括科研人員為記錄、重建、評估和驗證研究結果, 以及導致獲得這些結果的事件和過程所需的文件、記錄和資料。科研記錄也包括為分析或取證目的而提供的行政資料和記錄[35] 。英國倫敦大學國王學院認為: 研究相關文件包括已簽署的同意書、患者信息表、研究相關協議、材料轉讓協議、研究倫理委員會申請表、研究倫理委員會贊成意見書、參與者/ 樣本注冊記錄、參與者識別碼表、樣本處理記錄、參與者數據、實驗數據等[36] 。美國布朗大學要求大學檔案管理員應與項目負責人(PI)合作, 幫助評估、選擇對大學和社會具有持久歷史價值的科學數據和研究材料[37] 。
2) 保存期限(2-2): 科研記錄的保存期限會因學科領域、研究目的和所涉及的記錄類型而異。加拿大阿爾伯塔大學規定: ①科研記錄必須保留不少于: (a)科研項目記錄收集和記錄期限結束后5年; (b)提交最終項目報告之日起5 年; (c)項目研究報告發布之日起5 年; (d)授予學生與特定科研項目相關學位之日起5 年。以上述最長期限為準; ②必須保留更長時間的科研記錄應滿足如下條件: (a)需要保護知識產權; (b)被廣泛的研究社群和保存機構視為具有長期價值; (c)保持科學研究的連續性需要保留科研記錄, 或者對項目負責人(PI)或其他科研人員的未來研究可能有用; (d)此類科研記錄受到特定法規約束, 需要更長的保存期限, 如加拿大《食品藥品條例》要求某些臨床試驗記錄必須保存25 年; (e)科研資助協議的條款要求; (f)在科研活動中出現任何關于科研行為的指控, 如學術不端行為或利益沖突的指控[38] 。
3) 分類分級保管(2-3): 通常將科學數據和科研記錄劃分為不同類型和多個級別進行保存、管理、訪問、共享和歸檔。澳大利亞新南威爾士大學將科學數據劃分為4 個等級: ①高度敏感數據, 如包含可識別的個人/ 醫療數據的科學數據; ②敏感數據, 如包含個人數據的科學數據; ③私有數據,如涉及未發布的知識產權的科學數據; ④公開數據, 如已發布的科學數據[39] 。將與科學數據相關的科研記錄劃分為3 個類型: ①研究倫理審查相關記錄, 包括涉及人類倫理、生物安全倫理和/ 或轉基因植物和生物體、動物倫理、投訴和由此產生的調查、實驗動物待遇等相關記錄; ②知識產權所有權相關記錄, 包括涉及組織的知識產權和所有形式的著作權(包含專利、商標和設計)以及知識產權所有權和/ 或使用協議的相關記錄; ③研究報告相關記錄, 包括科研項目成果的最終報告和項目的所有其他報告(如進度報告和檢查報告)[40] 。
4) 歸檔處置(2-4): 通常規定超出保存期限的科學數據與科研記錄的最終處置方案, 如銷毀、刪除或永久保留。英國倫敦大學學院(UCL)認為:科學數據生命周期包括4 個階段: 創建管理階段;活躍研究階段; 歸檔、保存和監管; 發現、訪問和共享[1] 。美國布朗大學要求大學檔案管理員應與項目負責人(PI)合作: ①確定符合和/ 或超過保存期限的科學數據的最合適的處置方案; ②確定應保留的科學數據的任何存儲解決方案[37] 。英國劍橋大學要求: 在符合資助機構政策和適用學科規范的情況下, 科研人員在必要時應銷毀暫時的人工科研記錄, 并應盡可能將需要長期保存的科研記錄數字化。如果人工科研記錄無法數字化, 并且仍然是遵守資助機構政策、法律和/ 或倫理要求所必需的,或者需要保留以證明研究的完整性, 則應按照資助機構、監管機構或紀律規范要求以人工形式保存。有些人工科研記錄(如電子記錄)更適合永久保存至大學檔案館并可用于未來研究[41] 。
3.3 科研誠信管理相關政策內容要素
本研究將科研誠信管理相關政策中與開放科學數據有關的政策內容要素概括如下:
1) 數據誠信(3-1): 科學數據是所有學科領域的研究過程中重要而有價值的產出, 也是評估研究結果和重建研究過程所需證據的重要組成部分,因此世界一流大學通常規定與科學數據相關的科研不端行為, 如英國倫敦政治經濟學院(LSE)界定的科研不端行為包括: ①捏造(Fabrication): 創建虛假的數據或研究文件(如參與者同意書), 并將其視為真實情況進行呈現和/ 或記錄; ②偽造(Falsifi?cation): 對數據、材料、儀器、圖像和/ 或同意書的不當操縱和/ 或選擇; ③剽竊(Plagiarism): 未經許可和適當引用的抄襲或盜用思想(或其表達)、文本、軟件或數據(或其某些組合); ④歪曲(Mis?representation): 對數據的虛假陳述, 包括隱瞞相關結果和/ 或數據, 或由于故意、魯莽、嚴重疏忽,對數據做出有缺陷的解釋[42] 。
2) 數據管理(3-2): 科學數據可以提供研究過程記錄, 形成得出研究結果的證據基礎, 并使研究工作得以重建和復制。因此, 科學數據管理能夠在研究過程中維護科研誠信, 并確保能夠適當保留、維護、訪問和共享科學數據, 使進一步分析、復制、驗證和完善研究成果成為可能。美國布朗大學認為:科學數據管理對于確保遵守規范科研行為的法律和監管要求、數據的準確性和真實性、發現的首要性和結果的可重復性至關重要[37] 。英國倫敦政治經濟學院(LSE)要求科研人員適當地管理與保存科學數據和原始資料, 包括: ①對所遵循的研究程序和取得的結果(包括臨時結果)保持清楚、準確的記錄; ②以紙質或電子形式安全地保存記錄; ③在研究完成后的合理期限內, 使他人可查閱相關的原始資料和研究證據; ④根據研究資助者的科學數據政策和所有相關法規管理數據; ⑤在可能的情況下,將數據永久保存至國家數據存儲庫[42] 。
3.4 科研倫理治理相關政策內容要素
本研究將科研倫理治理相關政策中與開放科學數據有關的政策內容要素概括如下:
1) 倫理審查(4-1): 通常要求涉及人類參與者的研究應獲得大學研究倫理委員會(Research EthicsCommittee, REC)的書面倫理批準。英國倫敦政治經濟學院(LSE)規定: 涉及人類參與者(如訪談、焦點小組、調查、觀察等), 或涉及與直接可識別的人類受試者相關的數據(包括社交媒體平臺上的用戶生成數據)的研究, 都需要完成科研倫理審查。審查的目的是要求科研人員反思其研究的潛在倫理影響和可能對研究參與者(以及科研人員自身)造成的潛在傷害風險。需要研究倫理委員會(REC)批準的高風險申請涉及如下研究: ①將涉及弱勢群體或敏感話題; ②可能引起情緒或心理壓力、焦慮或羞辱; ③涉及對參與者的欺騙, 或在研究進行時未經其充分知情同意而故意進行的欺騙; ④可能對個人或群體產生負面影響; ⑤首次接觸參與者需要獲得監護人的許可(如果監護人的參與可能會引發參與者是否自愿參與的問題); ⑥對參與者或科研人員造成傷害的風險(無論是情感上還是身體上的)將超過最低限度; ⑦科研人員將以口頭形式而非書面形式獲得同意; ⑧外部義務(如資助者要求、數據訪問要求)需要獲得研究倫理委員會的批準[43] 。
2) 隱私保護(4-2): 隱私和保密是科研倫理實踐的關鍵問題。隱私(Privacy)是指個人控制對其個人數據的訪問和管理。保密(Confidentiality)是指僅允許授權用戶訪問在研究中收集的個人數據[44] 。GDPR 引入了“設計和默認的數據保護”要求, 以確保在研究設計過程中考慮到隱私問題。一旦發現并確定了任何隱私問題, 就應采取適當的技術和組織措施, 以確保能夠遵守個人數據保護法, 并將這些保障措施納入研究過程, 確保數據主體的權利得到尊重。數據保護影響評估(DPIA)是“設計和默認的數據保護” 的重要組成部分, 旨在確定如何在任何個人數據處理開始之前緩解或消除任何隱私問題。英國布里斯托大學規定下列研究應始終進行數據保護影響評估(DPIA): ①涉及大量研究參與者和/ 或大量個人數據和/ 或在較長一段時間內和/ 或較大地理區域內收集個人數據的醫學研究; ②涉及處理生物特征數據或基因數據的任何研究; ③涉及弱勢群體的任何研究, 如兒童、老年人、有精神或身體殘障的人[45] 。
3.5 知識產權保護相關政策內容要素
本研究將知識產權保護相關政策中與開放科學數據有關的政策內容要素概括如下:
1) 數據確權(5-1): 由于既不是發明(即可申請專利), 也不是思想的表達(即版權作品), 因此科學數據通常不具有知識產權。世界一流大學通常規定在符合任何法律、倫理、合同或資助機構要求的情況下, 大學主張在大學進行研究過程中產生的科學數據和原始資料的所有權, 如哈佛大學規定:大學對在大學進行的、由大學主持的或利用大學資源的科研項目產生的科學數據擁有所有權[46] ; 耶魯大學規定: 在不違反任何適用法律或與第三方簽署協議的情況下, 科學數據和原始資料的任何知識產權歸大學所有[47] ; 澳大利亞阿德萊德大學指出:雖然大學聲稱擁有科學數據的所有權, 但這并不凌駕于科學數據中可能存在的知識產權的所有權。如果科學數據或原始資料是由大學員工、學生或所有權人與其他高校合作創建的, 大學應與其就科學數據和原始資料的所有權、存儲、訪問和管理達成協議[48] 。
2) 數據許可協議(5-2): 通常要求科研人員共享的科學數據應附有適當的數據許可協議, 通常建議采用支持最大限度重用的知識共享許可協議CC0、CC-BY 或CC-BY-NC, 以使其他科研人員能夠以最少的限制訪問和重用其科學數據。英國曼徹斯特大學規定: 科學數據應按照法律、倫理和合同要求進行存儲、發布并分配許可協議供公開利用, 并且不接受任何資助者、第三方或合同權利禁止[49] 。英國倫敦政治經濟學院(LSE) 規定: ①如果科研人員將其科學數據保存在LSE 數據存儲庫中, 將授予LSE 非排他性的、免版稅的許可協議,以存檔、保存、重新格式化和遷移科學數據, 并根據任何禁錮或限制訪問科學數據的請求進行傳播,以及根據保存過程中指定的任何許可協議提供數據;②研究資助者可能要求將科學數據保存在數據存儲庫中, 或在適當的許可協議下可供重復利用。為了遵守資助條件, LSE 科研人員不得向任何出版商或其他第三方轉讓此類科學數據的知識產權或授予獨家許可, 而不保留根據任何研究資助者的要求將科學數據保存至適當的或LSE 數據存儲庫的權利, 并在適當的許可協議下使科學數據可供重復利用[50] 。
3.6 數據安全管理相關政策
本研究將數據安全管理相關政策中與開放科學數據有關的政策內容要素概括如下:
1) 安全管理(6-1): 通常要求科研人員應確保正確、安全地存儲、維護和存檔科學數據、原始資料和科研記錄, 以期在科學數據和科研記錄生命周期內遵守相關倫理和法律義務。耶魯大學力求安全維護其科學數據以實現如下目標: ①保密性(Confidentiality): 要求保持與維護數據安全, 防止未經授權的披露和訪問; ②完整性(Integrity): 要求保護數據的真實性(Authenticity), 防止數據被不當修改或破壞, 并保持證明能夠重新創建數據; ③可用性(Availability): 要求確保能夠及時、可靠地訪問數據[51] 。澳大利亞伍倫貢大學為確保科學數據和原始資料的安全管理, 對其科研人員提出如下建議: ①將敏感數據和保密協議保存至安全地點;②保護個人數據; ③定期備份數據并將其保存至與原始數據不同的地點; ④確保在數據傳輸至其他授權人員之前得到充分保護; ⑤必須對非數字化科學數據和原始資料提供同樣程度的關注和保護, 如實驗室筆記本、訪談記錄、生物標本和調查回復[52] 。
2) 訪問控制(6-2): 通常規定出于法律、倫理、隱私、合同或保密等原因, 僅允許授權用戶訪問特定科學數據集。英國曼徹斯特大學認為: 公開獲取科學數據并不總是合適的, 有正當理由必須限制訪問科學數據, 包括保持機密性、防范不合理成本、保護個人隱私、尊重同意條款以及管理安全或其他風險。科研人員控制或限制數據訪問必須證明其合理性, 并在數據管理計劃(DMP)中解釋如何限制數據訪問[53] 。澳大利亞阿德萊德大學規定:大學致力于開放獲取其學術成果; 如果大學是科學數據的所有者, 將根據CC-BY 4.0 許可協議提供科學數據集, 除非受到法律法規、大學政策或倫理批準, 以及倫理、文化、合同或保密義務的要求限制, 或科學數據由無法適當地去識別化或處于禁錮狀態的敏感數據組成[48] 。澳大利亞新南威爾士大學要求: 以電子格式存儲其科學數據, 并受到適當的電子保護和/ 或物理訪問控制, 限制只有授權用戶才能訪問, 包括大學或外部數據存儲庫中的科學數據[54] 。
4 結論及建議
本研究針對選取的12 所世界一流大學制定的開放科學數據政策體系, 歸納了其開放科學數據政策體系所包含的政策類型及涉及的相關政策法規,并概括了各個政策類型應涵蓋的與開放科學數據相關的政策內容要素, 結合世界一流大學制定與完善開放科學數據政策體系的先進政策實踐, 針對我國科研機構的政策制定與完善提出如下3 個方面的政策建議:
4.1 構建涵蓋多種類型相關政策的開放科學數據政策體系
目前, 眾多世界一流大學已制定了涵蓋科學數據管理、個人數據保護、科研檔案管理、科研誠信管理、科研倫理治理、知識產權管理、數據安全管理等相關政策的較為全面、完善的開放科學政策體系, 以遵守參與開放科學數據的研究參與者、資助機構、科研人員、出版機構、數據知識庫、數據使用者等多個利益相關者涉及的各類相關政策法規。目前, 國內科研機構尚未有效開展開放科學數據政策實踐, 僅有北京大學、復旦大學、武漢大學等建設了科學數據開放共享平臺, 但至今仍未發布明確的開放科學數據相關政策。近年來, 我國持續制定或修訂了多種類型的開放科學數據相關政策法規,如《中華人民共和國個人信息保護法》(2021 年)、《科學技術研究檔案管理規定》(2020 年)、《中華人民共和國數據安全法》(2021 年)等, 建議國內科研機構借鑒世界一流大學的先進政策實踐, 盡快制定涵蓋個人數據保護、科研檔案管理、科研誠信管理等相關政策的開放科學數據政策體系, 并注重與近年來持續調整的各類相關政策法規協調一致。
4.2 在政策制定層面支持科學數據與科研檔案的協同管理
近年來, 學術出版面臨日益嚴重的“可重復性危機” (Reproducibility Crisis)。一項名為“社會科學復現項目” (Social Science Replication Project)的研究發現: 在2010—2015 年發表于Nature 和Science 期刊的21 項社會科學實驗中僅有13 項可以被復現[55] 。科學數據、原始資料和科研記錄對于驗證和復現研究結果、復制和重建研究過程、保護研究結論免于質疑和挑戰具有不可替代的作用。2020 年9 月, 國家檔案局和科技部聯合發布的《科學技術研究檔案管理規定》將“科學數據” 納入“科研檔案” 的范疇, 并要求科研項目承擔單位應當把科研檔案工作要求納入科研管理制度與工作流程。因此, 建議國內科研機構在“科研項目—科學數據—科研檔案” 3 個生命周期視角下與檔案機構協作開展科學數據與科研檔案的協同管理, 在開放科學數據相關政策中明確要求其科研人員必須保留與維護在科研項目中產生的科學數據、原始資料、科研記錄、研究文件或其他證據, 并確保在科學數據全生命周期內遵守個人數據保護、科研檔案管理、科研誠信管理、科研倫理治理、知識產權管理等相關政策法規。
4.3 關注科研機構與其他利益相關者之間的政策協同問題
世界一流大學較為關注與資助機構、出版機構、數據知識庫等其他利益相關者制定的開放科學數據政策保持協調一致, 如英國倫敦大學國王學院指出:鑒于包括科學數據管理在內的學術交流政策與實踐的演變性質, 預計偶爾會出現一個利益相關者的要求與另一個利益相關者不一致的情況[32] 。建議國內科研機構制定與完善其開放科學數據政策體系,也應注重與其他利益相關者之間的政策協同問題。筆者在《利益相關者視域下科學數據開放政策協同研究——基于NVivo 12 的質性文本分析》一文中探討了資助機構、科研機構、學術期刊、數據期刊和數據知識庫5 類利益相關者之間的政策協同問題[56] 。本研究針對科研機構與其他利益相關者之間加強政策協同值得關注的政策內容要素進行如下概括: ①與資助機構之間: (a)保存范圍(2-1):確定應保存的資助項目產生的科學數據的類型和形式; (b)數據管理(3-2): 要求保存、維護與共享資助項目產生的科學數據; (c)數據確權(5-1):確定資助項目產生的科學數據的知識產權歸屬; ②與出版機構之間: 數據誠信(3-1): 要求記錄、保存與共享支持研究成果的科學數據; ③與數據知識庫之間: (a)分級分類保管(2-3): 要求對科學數據進行分級分類保存、維護與歸檔; (b)歸檔處置(2-4): 確定超出保存期限的科學數據的最終處置方案。
(責任編輯: 楊豐僑)